Воскресенье, 20 апреля в 02:56 UTC+3
Загрузка...

OpenAI обвиняется в обучении GPT-4 на незалицензированных книгах издательства O'Reilly.


27Опубликовано 02.04.2025 в 08:51Категория: ИИИсточник
Изображение статьи

Новая статья от проекта "AI Disclosures" утверждает, что OpenAI, вероятно, обучала свою модель GPT-4o на платных книгах издательства O'Reilly Media без лицензионного соглашения. Некоммерческая организация, соучредителем которой является генеральный директор O'Reilly Media Тим О’Рейлли (Tim O'Reilly), использовала метод DE-COP для обнаружения защищенных авторским правом материалов в данных обучения языковых моделей.

Исследователи проанализировали 13 962 фрагмента из 34 книг O'Reilly, обнаружив, что GPT-4o "распознавал" значительно больше платного контента, чем более старые модели, такие как GPT-3.5 Turbo. Эта техника, также известная как "атака вывода о членстве", проверяет, может ли модель надежно различать тексты, написанные человеком, от перефразированных версий.

"GPT-4o, вероятно, распознаёт и, следовательно, имеет предварительные знания о многих непубличных книгах O'Reilly, опубликованных до даты завершения его обучения", - написали соавторы статьи, в которую входят О’Рейлли, экономист Илан Штраус (Ilan Strauss) и исследователь ИИ Срули Розенблат (Sruly Rosenblat).

Загрузка предыдущей публикации...

Загрузка следующей публикации...

Предыдущие новости в категории

Загрузка предыдущих новостей...

Следующие новости в категории

Загрузка следующих новостей...

Мы отбираем новости из проверенных источников, обрабатываем их с помощью современных AI-технологий и публикуем на сайте, созданном с использованием искусственного интеллекта. Все материалы принадлежат их авторам, а контент проходит дополнительную проверку на достоверность. Возможны ошибки в тексте, так как нейросеть тоже имеет свойство ошибаться. Все изображения являются фантазией нейросети, совпадение с реальными предметами и личностями маловероятно.

© 2025 NOTid . QAter . AI service.