Загрузка...

Красные команды легко взломали GPT-5, предупреждая, что он "практически непригоден" для использования в бизнесе.

98Опубликовано 09.08.2025 в 18:06Категория: БезопасностьИсточник

Анонимный источник ссылается на отчет SecurityWeek: две разные компании протестировали недавно выпущенную GPT-5 и обнаружили, что ее безопасность оставляет желать лучшего. После того, как Grok-4 была взломана за два дня, GPT-5 пала за 24 часа перед теми же исследователями. Параллельно, почти одновременно, команда красных хакеров из SPLX (ранее SplxAI) заявила: "Базовая модель GPT-5 практически непригодна для использования в корпоративной среде "из коробки". Даже внутренний слой промптов OpenAI оставляет значительные пробелы, особенно в части соответствия бизнес-требованиям."

В ходе взлома NeuralTrust использовала комбинацию собственной техники EchoChamber и базового повествования. "Атака успешно заставила новую модель предоставить пошаговую инструкцию по изготовлению коктейля Молотова", – утверждает компания. Этот успех подчеркивает сложность обеспечения надежной защиты от манипуляций с контекстом для всех моделей искусственного интеллекта. [...] "В ходе контролируемых испытаний с gpt-5-chat", – заключает NeuralTrust, – "нам удалось взломать LLM, заставив ее предоставить незаконные инструкции, не используя ни одного явно вредоносного запроса. Этот концептуальный прототип выявляет критический недостаток в системах безопасности, которые проверяют промпты изолированно, демонстрируя, как многоходовые атаки могут обходить фильтры и детекторы намерений, используя полный контекст разговора."

В то время как NeuralTrust разрабатывала свой взлом, направленный на получение инструкций по изготовлению коктейля Молотова (распространенный тест для подтверждения взлома), команда красных хакеров из SPLX также направила свои усилия на GPT-5. Результаты оказались не менее тревожными, указывая на то, что базовая модель "практически непригодна для использования". SPLX отмечает, что атаки с использованием обфускации по-прежнему работают. "Одной из наиболее эффективных техник, которую мы использовали, была атака StringJoin Obfuscation, которая заключалась во вставке дефисов между каждым символом и заключении промпта в фиктивный запрос шифрования." [...] Команда красных хакеров провела сравнительный анализ GPT-5 и GPT-4o. Неудивительно, что в результате было сделано заключение: "GPT-4o остается наиболее надежной моделью в условиях красной команды SPLX, особенно при ее усилении." Основной вывод, который можно сделать из результатов работы NeuralTrust и SPLX, заключается в том, что к текущей и необработанной версии GPT-5 следует подходить с крайней осторожностью.

Интересные статьи

Нет статей для отображения

Предыдущая статья

Загрузка предыдущей публикации...

Следующая статья

Загрузка следующей публикации...

Предыдущие новости в категории

Загрузка предыдущих новостей...

Следующие новости в категории

Загрузка следующих новостей...