Загрузка предыдущей публикации...
Загрузка предыдущих новостей...
Группа исследователей тайно провела многомесячный "несанкционированный" эксперимент в одном из самых популярных сообществ Reddit, используя сгенерированные ИИ комментарии для проверки убедительности больших языковых моделей. Эксперимент, который был раскрыт на выходных модераторами r/changemyview, описывается модераторами Reddit как "психологическая манипуляция" ничего не подозревающими пользователями.
"Команда модераторов CMV должна проинформировать сообщество CMV о несанкционированном эксперименте, проведенном исследователями из Цюрихского университета над пользователями CMV", – написали модераторы подреддита в длинном посте, уведомляющем реддиторов об исследовании. "Этот эксперимент использовал сгенерированные ИИ комментарии для изучения того, как ИИ можно использовать для изменения мнений."
Исследователи использовали большие языковые модели (LLM) для создания комментариев в ответ на публикации в r/changemyview, подреддите, где пользователи Reddit публикуют (часто противоречивые или провокационные) мнения и запрашивают дебаты с другими пользователями. Сообщество насчитывает 3,8 миллиона участников и часто попадает на главную страницу Reddit.
По словам модераторов подреддита, ИИ принимал множество различных личностей в комментариях в ходе эксперимента, включая выжившую после сексуального нападения, консультанта по травмам, "специализирующегося на насилии", и "чернокожего мужчину, выступающего против Black Lives Matter". Многие из исходных комментариев с тех пор были удалены, но некоторые из них все еще можно просмотреть в архиве, созданном 404 Media.
В черновике своей статьи анонимные исследователи описывают, как они не только использовали ИИ для генерации ответоз, но и пытались персонализировать свои ответы на основе информации, полученной из предыдущей истории публикаций автора исходного поста. "В дополнение к содержанию поста, LLM предоставлялись личные атрибуты автора (пол, возраст, этническая принадлежность, местоположение и политическая ориентация), которые выводились из его истории публикаций с использованием другой LLM", – пишут они.
Модераторы r/changemyview отмечают, что исследователи нарушили несколько правил подреддита, включая политику, требующую раскрытия информации об использовании ИИ для генерации комментариев, и правило, запрещающее ботов. Они заявляют, что подали официальную жалобу в Цюрихский университет и попросили исследователей воздержаться от публикации своей статьи.
Исследователи не ответили на электронное письмо от Engadget. В своих публикациях на Reddit и в черновике своей статьи они утверждают, что их исследование было одобрено университетским этическим комитетом, и что их работа может помочь онлайн-сообществам, таким как Reddit, защитить пользователей от более "злонамереного" использования ИИ.
"Мы признаем позицию модераторов, что это исследование было нежелательным вторжением в ваше сообщество, и мы понимаем, что некоторые из вас могут чувствовать себя некомфортно из-за того, что этот эксперимент был проведен без предварительного согласия", – написали исследователи в комментарии, отвечая модераторам r/changemyview. "Мы считаем, что потенциальные выгоды от этого исследования значительно перевешивают его риски. Наше контролируемое, низкорисковое исследование предоставило ценную информацию о возможностях убеждения LLM в реальном мире – возможностях, которые уже легко доступны любому, и которые злоумышленники могли бы уже использовать в масштабе для гораздо более опасных целей (например, манипулирования выборами или разжигания ненависти)".
Модераторы r/changemyview утверждают, что исследование не было необходимым или новым, отметив, что исследователи OpenAI проводили эксперименты с использованием данных из r/changemyview, но не вмешивались в дискуссии. Они заявляют, что исследователи OpenAI проводили эксперименты с использованием данных из r/changemyview, но не вмешивались в дискуссии.
Модераторы r/changemyview утверждают, что исследование не было необходимым или новым, отметив, что исследователи OpenAI проводили эксперименты с использованием данных из r/changemyview, но не вмешивались в дискуссии.
Люди, посещающие наш подреддит, заслуживают пространства, свободного от этого типа вторжений."
``` **Пояснения:** * Используется тег `` для разделения текста на абзацы. Это обеспечивает читаемость и структуру. * В заголовке `
Загрузка предыдущей публикации...
Загрузка следующей публикации...
Загрузка предыдущих новостей...
Загрузка следующих новостей...