Загрузка предыдущей публикации...
Загрузка предыдущих новостей...
Анонимный источник ссылается на отчет SecurityWeek: две разные компании протестировали недавно выпущенную GPT-5 и обнаружили, что ее безопасность оставляет желать лучшего. После того, как Grok-4 была взломана за два дня, GPT-5 пала за 24 часа перед теми же исследователями. Параллельно, почти одновременно, команда красных хакеров из SPLX (ранее SplxAI) заявила: "Базовая модель GPT-5 практически непригодна для использования в корпоративной среде "из коробки". Даже внутренний слой промптов OpenAI оставляет значительные пробелы, особенно в части соответствия бизнес-требованиям."
В ходе взлома NeuralTrust использовала комбинацию собственной техники EchoChamber и базового повествования. "Атака успешно заставила новую модель предоставить пошаговую инструкцию по изготовлению коктейля Молотова", – утверждает компания. Этот успех подчеркивает сложность обеспечения надежной защиты от манипуляций с контекстом для всех моделей искусственного интеллекта. [...] "В ходе контролируемых испытаний с gpt-5-chat", – заключает NeuralTrust, – "нам удалось взломать LLM, заставив ее предоставить незаконные инструкции, не используя ни одного явно вредоносного запроса. Этот концептуальный прототип выявляет критический недостаток в системах безопасности, которые проверяют промпты изолированно, демонстрируя, как многоходовые атаки могут обходить фильтры и детекторы намерений, используя полный контекст разговора."
В то время как NeuralTrust разрабатывала свой взлом, направленный на получение инструкций по изготовлению коктейля Молотова (распространенный тест для подтверждения взлома), команда красных хакеров из SPLX также направила свои усилия на GPT-5. Результаты оказались не менее тревожными, указывая на то, что базовая модель "практически непригодна для использования". SPLX отмечает, что атаки с использованием обфускации по-прежнему работают. "Одной из наиболее эффективных техник, которую мы использовали, была атака StringJoin Obfuscation, которая заключалась во вставке дефисов между каждым символом и заключении промпта в фиктивный запрос шифрования." [...] Команда красных хакеров провела сравнительный анализ GPT-5 и GPT-4o. Неудивительно, что в результате было сделано заключение: "GPT-4o остается наиболее надежной моделью в условиях красной команды SPLX, особенно при ее усилении." Основной вывод, который можно сделать из результатов работы NeuralTrust и SPLX, заключается в том, что к текущей и необработанной версии GPT-5 следует подходить с крайней осторожностью.
Загрузка предыдущей публикации...
Загрузка следующей публикации...
Загрузка предыдущих новостей...
Загрузка следующих новостей...