Загрузка предыдущей публикации...
Загрузка предыдущих новостей...
В среду компания Google DeepMind объявила о двух новых моделях искусственного интеллекта для управления роботами: Gemini Robotics и Gemini Robotics-ER. Компания утверждает, что эти модели помогут роботам различных форм и размеров более эффективно и аккуратно взаимодействовать с физическим миром, чем предыдущие системы. Это может привести к использованию антропоморфных роботов-помощников.
Стоит отметить, что хотя аппаратные платформы для роботов развиваются стабильно (хотя не всегда), создание способной модели искусственного интеллекта, которая могла бы автономно управлять этими роботами в новых ситуациях с безопасностью и точностью, остается сложной задачей. То, что называют "ориентированным на тело ИИ" (embodied AI), является амбициозной целью для таких компаний, как Nvidia, и может превратить робототехнику в универсальный инструмент физического мира.
В рамках этого Google создала новые модели, основываясь на своем языковом модели Gemini 2.0, добавив специальные возможности для робототехнических приложений. Модель Gemini Robotics обладает так называемыми "визуально-лингвистическими и действенными" (VLA) способностями, что позволяет ей обрабатывать визуальную информацию, понимать команды на языке и генерировать физические движения. В свою очередь, модель Gemini Robotics-ER сосредоточена на "ориентированном на тело мышлении" с улучшенным пространственным восприятием, что позволяет робототехникам интегрировать её в существующие системы управления роботами.
Загрузка предыдущей публикации...
Загрузка следующей публикации...
Загрузка предыдущих новостей...
Загрузка следующих новостей...