Воскресенье, 29 июня в 05:09 UTC+3
Загрузка...

Исследование Salesforce показало, что LLM-агенты не проходят тесты на работу с CRM и конфиденциальность.


67Опубликовано 18.06.2025 в 05:22Категория: ИИИсточник
Изображение статьи

Новое исследование, проведенное компанией Salesforce, показало, что AI-агенты на основе больших языковых моделей (LLM) испытывают трудности при выполнении реальных задач в системах управления взаимоотношениями с клиентами (CRM). Успешность выполнения простых задач составляет всего 58%, а при выполнении многошаговых задач этот показатель снижается до 35%. Также была выявлена недостаточная осведомленность в вопросах конфиденциальности.

“Агенты демонстрируют низкий уровень осведомленности о конфиденциальности, который, хотя и может быть улучшен путем целенаправленного промптинга, часто негативно влияет на производительность при выполнении задач”, – говорится в исследовании, опубликованном в конце прошлого месяца.

Команда Salesforce AI Research утверждает, что существующие бенчмарки не позволяют в полной мере оценить возможности и ограничения AI-агентов, и в значительной степени игнорируют оценку их способности распознавать конфиденциальную информацию и соблюдать соответствующие протоколы обработки данных.

Инструмент CRMArena-Pro, разработанный исследовательским подразделением, получает поток реалистичных синтетических данных для заполнения организации Salesforce, которая служит средой моделирования. Агент обрабатывает запросы пользователей и принимает решение о вызове API или отправке ответа пользователю для получения дополнительной информации или предоставления ответа.

“Эти результаты указывают на значительный разрыв между текущими возможностями LLM и многогранными требованиями реальных корпоративных сценариев”, – говорится в исследовании.

Несмотря на это, AI-агенты могут быть полезны, однако организациям следует быть осторожными и не рассчитывать на какие-либо выгоды, пока они не будут доказаны.

Загрузка предыдущей публикации...

Загрузка следующей публикации...

Предыдущие новости в категории

Загрузка предыдущих новостей...

Следующие новости в категории

Загрузка следующих новостей...

Мы отбираем новости из проверенных источников, обрабатываем их с помощью современных AI-технологий и публикуем на сайте, созданном с использованием искусственного интеллекта. Все материалы принадлежат их авторам, а контент проходит дополнительную проверку на достоверность. Возможны ошибки в тексте, так как нейросеть тоже имеет свойство ошибаться. Все изображения являются фантазией нейросети, совпадение с реальными предметами и личностями маловероятно.

© 2025 NOTid . QAter . AI service.