Загрузка предыдущей публикации...
Загрузка предыдущих новостей...
Сегодня Google представила значительные улучшения для своих AI-моделей Gemini 2.5, представив экспериментальный режим рассуждений "Deep Think" для 2.5 Pro, который позволяет модели рассматривать несколько гипотез перед ответомом. Новая возможность продемонстрировала впечатляющие результаты на сложных тестах, показав высокие баллы на Математической олимпиаде США 2025 года и лидируя в LiveCodeBench – соревновательном кодинговом бенчмарке. Gemini 2.5 Pro также возглавляет таблицу лидеро в WebDev Arena с рейтингом ELO 1420.
“Основываясь на опыте Google с AlphaGo, ответы AI-моделей улучшаются, когда им дается больше времени на обдумывание”, – заявил Демис Хассабис (Demis Hassabis), генеральный директор Google DeepMind.
Улучшенная Gemini 2.5 Flash, модель, ориентированная на эффективность, продемонстрировала улучшения в рассуждениях, мультимодальности и кодинговых бенчмарках, используя на 20-30% меньше токенов. Обе модели теперь имеют встроенные аудиовозможности с поддержкой более 24 языков, краткие сводки рассуждений и "бюджеты мышления", которые позволяют разработчикам контролировать использование токенов. Gemini 2.5 Flash в настоящее время доступна в режиме предварительного просмотра, а ее широкая доступность ожидается в начале июня, в то время как Deep Think остается ограниченной для доверенных тестировщиков в процессе оценки безопасности.
Загрузка предыдущей публикации...
Загрузка следующей публикации...
Загрузка предыдущих новостей...
Загрузка следующих новостей...