Статьи с тегом: LMArena

Meta уличена в манипуляции результатами тестов искусственного интеллекта
Meta выпустила новые модели AI Llama 4, Scout и Maverick, причём Maverick, по заявлениям компании, превосходит GPT-4o и Gemini 2.0 Flash, но возникли споры из-за использования оптимизированной версии модели для тестирования.

Meta уличили в подтасовке результатов тестов ИИ
Meta выпустила новую модель искусственного интеллекта Llama 4, которая превзошла GPT-4 и Gemini 2.0 в тестах, но позже выяснилось, что публичная версия модели отличается от той, что использовалась в тестах.

ChatGPT 4 стал еще лучше, хотя я пока не заметил разницы.
ChatGPT получил обновление, сделавшее его более интуитивно понятным, творческим и способным решать сложные задачи, включая кодирование.

Google выпускает модель искусственного интеллекта Gemini 2.5 для сложных рассуждений
Google представила новую версию своего ИИ Gemini – Gemini 2.5, которая способна к более глубокому анализу и контекстуальному пониманию, предоставляя более осмысленные ответы.

Google заявляет, что новые модели ИИ Gemini с функцией «логического вывода» являются лучшими на сегодняшний день.
Google представил обновленную модель AI Gemini 2.5, которая превосходит конкурентов по производительности и способна обрабатывать не только текст, но и другие форматы, такие как аудио и видео.

Google представила Gemini 2.5 Pro: новую модель искусственного интеллекта с улучшенными возможностями логического вывода.
Google представила новую модель искусственного интеллекта Gemini 2.5, которая демонстрирует впечатляющие способности к рассуждению и решению технических задач, опережая конкурентов в различных тестах.

Google утверждает, что Gemma 3 достигает точности DeepSeek в 98% с использованием всего одного GPU.
Новая open-source модель искусственного интеллекта от Google, Gemma 3, демонстрирует производительность, близкую к модели DeepSeek R1, но при этом использует всего один GPU Nvidia H100, в отличие от предполагаемых 32 для R1.