Статьи с тегом: LiveCodeBench

Как медалисты олимпиад оценивают большие языковые модели в соревновательном программировании?
Новейшее исследование показывает, что хайп вокруг ИИ-программистов преждевременен: лучшие модели решают лишь половину задач средней сложности и не справляются со сложными, уступая программистам-экспертам. Узнайте, почему текущие ИИ-системы далеки от реального алгоритмического мышления и в чем их слабые места.

Модели Gemini 2.5 от Google получили возможность "глубокого анализа" и рассуждений.
Google значительно улучшила свои AI-модели Gemini 2.5, представив режим "Deep Think" для более точных ответов и Gemini 2.5 Flash для высокой эффективности. Новые модели показывают лидерские результаты в сложных тестах и кодинге, а также поддерживают аудио на 24+ языках – попробуйте Gemini 2.5 Flash уже сейчас и оцените возможности будущего!