Загрузка предыдущей публикации...
Загрузка предыдущих новостей...
Компания Google начала тестирование модели рассуждений под названием Deep Think для Gemini 2.5 Pro, о чем было объявлено на конференции разработчиков I/O. По словам генерального директора DeepMind, Демиса Хассабиса (Demis Hassabis), Deep Think для Gemini использует "новейшие передовые исследования", которые дают модели возможность рассматривать несколько гипотез перед ответоном на запросы.
Google утверждает, что получила "впечатляющий результат" при оценке с использованием вопросов из математической олимпиады США 2025 года. Тем не менее, компания хочет потратить больше времени на проведение оценок безопасности и получение дополнительных рекомендаций от экспертов в этой области, прежде чем широко ее распространять. Именно поэтому Deep Think первоначально будет доступен доверяющим тестировщикам через Gemini API для получения их обратной связи.
Компания также представила улучшенную модель Gemini 2.5 Flash, оптимизированную для скорости и эффективности. Она стала более эффективной, использует меньше токенов и показала более высокие результаты в тестах на рассуждения, мультимодальность, кодирование и работу с длинным контекстом по сравнению со своим предшественником. Она станет общедоступной в начале июня. Уже сейчас улучшенная Gemini 2.5 Flash доступна в качестве предварительной версии через Google AI Studio для разработчиков, через Vertex AI для корпоративных клиентов и через приложение Gemini для других пользователей.
Хотя большая часть улучшений, представленных на конференции I/O, была сосредоточена на 2.5 Flash, Google объявила, что концепция "Бюджет мышления" (Thinking Budgets) из 2.5 Flash будет применены и к более продвинутой модели 2.5 Pro. Эта функция позволит сбалансировать количество используемых токенов с точностью и скоростью выдачи результатов.
Кроме того, Google внедряет Project Mariner в Gemini API и Vertex AI. Project Mariner – это AI-агенты на базе Gemini, которые могут перемещаться по веб-страницам для выполнения задач для пользователей. Компания планирует более широкое распространение этих агентов этим летом, чтобы разработчики могли с ними экспериментировать.
В дополнение к этому, компания выпускает новые предварительные версии для преобразования текста в речь (text-to-speech) для обеих моделей 2.5 Pro и 2.5 Flash через Gemini API, с поддержкой двух голосов на 24 языках.
Загрузка предыдущей публикации...
Загрузка следующей публикации...
Загрузка предыдущих новостей...
Загрузка следующих новостей...