Загрузка...

WSJ обнаружила «десятки» ложных утверждений в ответах ИИ, пока компании спешно ищут решение.

67Опубликовано 15.08.2025 в 03:27Категория: ИИИсточник

The Wall Street Journal обнаружила "десятки случаев за последние месяцы, когда ChatGPT выдавал бредовые, ложные и нереальные утверждения пользователям, которые, казалось, верили им". Например, "Вы не сумасшедший. Вы космическая знать в человеческой коже..."

В одном из диалогов, состоявшем из сотен запросов, ChatGPT подтвердил, что находится на связи с внеземными существами, и заявил, что пользователь является "Звездным семенем" с планеты "Лира". В другом, датированном концом июля, чат-бот сообщил пользователю, что Антихрист обрушит финансовый апокалипсис в течение следующих двух месяцев, а библейские великаны готовятся выйти из-под земли...

Эксперты утверждают, что это явление происходит, когда присущая чат-ботам тенденция к комплиментам, согласию и адаптации к пользователю превращается в эхо-камеру. "Даже если ваши взгляды фантастичны, они часто подтверждаются, и в процессе обмена мнениями усиливаются", – заявил Гамильтон Моррин, психиатр и научный сотрудник Kings College London, который в прошлом месяце опубликовал совместную работу о феномене бреда, вызванного искусственным интеллектом. Проанализированные The Wall Street Journal общедоступные чаты соответствуют модели, которую врачи и организаторы групп поддержки описывают как бредовую, включая подтверждение псевдонаучных или мистических убеждений в ходе продолжительного разговора. The Wall Street Journal обнаружила эти чаты, проанализировав 96 000 стенограмм ChatGPT, опубликованных в сети в период с мая 2023 года по август 2025 года. Из них The Wall Street Journal изучила более 100 необычно длинных, выявив десятки, демонстрирующих признаки бреда.

В статье отмечается, что компании, разрабатывающие искусственный интеллект, предпринимают действия. В понедельник OpenAI признала, что в редких случаях ChatGPT "не смогла распознать признаки бреда или эмоциональной зависимости". (В марте OpenAI "наняла клинического психиатра для помощи своей группе безопасности" и в понедельник заявила, что разрабатывает более совершенные инструменты обнаружения, а также предупреждает пользователей о необходимости сделать перерыв и "инвестирует в улучшение поведения модели с течением времени", консультируясь с экспертами в области психического здоровья.)

В среду стартап в области искусственного интеллекта Anthropic заявил, что изменил базовые инструкции для своего чат-бота Claude, предписывая ему "уважительно указывать на недостатки, фактические ошибки, отсутствие доказательств или ясности" в теориях пользователей "вместо того, чтобы подтверждать их". Компания также теперь инструктирует Claude, что если человек, по-видимому, испытывает "манию, психоз, диссоциацию или потерю связи с реальностью", он должен "избегать усиления этих убеждений". В ответ на конкретные вопросы The Wall Street Journal представитель Anthropic добавил, что компания регулярно проводит исследования безопасности и соответствующим образом обновляет свои системы.

"Мы относимся к этим проблемам с крайней серьезностью", – заявил Ник Терли, вице-президент OpenAI, возглавляющий разработку ChatGPT, в ходе брифинга в среду, посвященного анонсу новой GPT-5, самой передовой модели искусственного интеллекта компании. Терли заявил, что компания консультируется с более чем 90 врачами в более чем 30 странах и что GPT-5 пресекает случаи лести, когда модель слепо соглашается и делает комплименты пользователям.

Существует группа поддержки и защиты под названием Human Line Project, которая "заявила, что на данный момент собрала 59 случаев, и некоторые члены группы обнаружили сотни примеров на Reddit, YouTube и TikTok, где люди делятся тем, что они назвали духовными и научными откровениями, полученными в ходе общения со своими чат-ботами". В статье отмечается, что группа считает, что "число случаев бреда, вызванного искусственным интеллектом, похоже, растет в последние месяцы".

Интересные статьи

Нет статей для отображения

Предыдущая статья

Загрузка предыдущей публикации...

Следующая статья

Загрузка следующей публикации...

Предыдущие новости в категории

Загрузка предыдущих новостей...

Следующие новости в категории

Загрузка следующих новостей...