Суббота, 19 апреля в 20:42 UTC+3
Загрузка...

После обвинений в нечестной игре со стороны Meta, протестирована модель Llama 4 Maverick без изменений — занимает 32-е место.


21Опубликовано 14.04.2025 в 01:39Категория: ИИИсточник
Изображение статьи

На прошлой неделе компания Meta заявила, что её новая модель искусственного интеллекта "Maverick" (входящая в серию Llama-4) превзошла GPT-4o и Gemini Flash 2 "по всем показателям… Эта штука – настоящий зверь".

Однако уже в течение суток несколько исследователей в области ИИ обратили внимание на то, что в собственном объявлении Meta признала, что "Maverick", протестированная на LM Arena, является "экспериментальной чат-версией". Как отмечает TechCrunch, LM Arena никогда не была самым надежным способом оценки производительности моделей ИИ, но при этом компании, как правило, не настраивали и не оптимизировали свои модели для достижения лучших результатов на LM Arena – или, по крайней мере, не признавались в этом.

В пятницу TechCrunch опубликовал результаты тестирования оригинальной, немодифицированной версии "Maverick" (Llama-4-Maverick-17B-128E-Instruct) на LM Arena.

Модель заняла 32-е место.

Как отмечает Neowin, более старые модели, такие как Claude 3.5 Sonnet (выпущенная в июне прошлого года) и Gemini-1.5-Pro-002 (выпущенная в сентябре прошлого года), показали более высокие результаты.

Загрузка предыдущей публикации...

Загрузка следующей публикации...

Предыдущие новости в категории

Загрузка предыдущих новостей...

Следующие новости в категории

Загрузка следующих новостей...

Мы отбираем новости из проверенных источников, обрабатываем их с помощью современных AI-технологий и публикуем на сайте, созданном с использованием искусственного интеллекта. Все материалы принадлежат их авторам, а контент проходит дополнительную проверку на достоверность. Возможны ошибки в тексте, так как нейросеть тоже имеет свойство ошибаться. Все изображения являются фантазией нейросети, совпадение с реальными предметами и личностями маловероятно.

© 2025 NOTid . QAter . AI service.