Загрузка предыдущей публикации...
Загрузка предыдущих новостей...
Интернет-архив (Internet Archive) и его проект Wayback Machine стали новыми жертвами ограничений доступа к данным, введенных Reddit. Компания начала вводить новые ограничения на то, какую информацию Wayback Machine сможет архивировать, что существенно ограничит возможности проекта по сохранению данных с Reddit. Теперь Wayback Machine, проект некоммерческой организации Интернет-архив, сможет сканировать только главную страницу Reddit. Доступ к комментариям, страницам сабреддитов, деталям публикаций, профилям пользователей и другим данным будет закрыт.
Этот шаг является продолжением политики Reddit, направленной на ограничение возможностей компаний, использующих данные платформы для обучения больших языковых моделей без уплаты лицензионных сборов. Это также заметно отличается от позиции компании в прошлом году, когда она заявляла, что не будет ограничивать добросовестных участников, включая Интернет-архив. Неясно, что именно изменилось с тех пор.
Reddit полагает, что компании, занимающиеся разработкой ИИ, обходят установленные правила, собирая данные через Wayback Machine. Мы обратились в Интернет-архив за комментарием.
Лицензирование данных стало значимым источником дохода для Reddit. Компания заключила многомиллионные сделки с OpenAI и Google, разрешающие им использовать публикации Reddit для обучения своих ИИ-моделей. В то же время Reddit занял все более жесткую позицию в отношении компаний, пытающихся использовать его данные без соответствующих соглашений. Ранее в этом году компания подала в суд на Anthropic, обвинив ее в незаконном сборе данных с Reddit в течение нескольких лет.
Загрузка предыдущей публикации...
Загрузка следующей публикации...
Загрузка предыдущих новостей...
Загрузка следующих новостей...