Загрузка...

Новый робот от Google умеет складывать сложную оригами и аккуратно закрывать zip-пакеты

99Опубликовано 13.03.2025 в 01:22Категория: ИИИсточник

В среду компания Google DeepMind объявила о двух новых моделях искусственного интеллекта для управления роботами: Gemini Robotics и Gemini Robotics-ER. Компания утверждает, что эти модели помогут роботам различных форм и размеров более эффективно и аккуратно взаимодействовать с физическим миром, чем предыдущие системы. Это может привести к использованию антропоморфных роботов-помощников.

Стоит отметить, что хотя аппаратные платформы для роботов развиваются стабильно (хотя не всегда), создание способной модели искусственного интеллекта, которая могла бы автономно управлять этими роботами в новых ситуациях с безопасностью и точностью, остается сложной задачей. То, что называют "ориентированным на тело ИИ" (embodied AI), является амбициозной целью для таких компаний, как Nvidia, и может превратить робототехнику в универсальный инструмент физического мира.

В рамках этого Google создала новые модели, основываясь на своем языковом модели Gemini 2.0, добавив специальные возможности для робототехнических приложений. Модель Gemini Robotics обладает так называемыми "визуально-лингвистическими и действенными" (VLA) способностями, что позволяет ей обрабатывать визуальную информацию, понимать команды на языке и генерировать физические движения. В свою очередь, модель Gemini Robotics-ER сосредоточена на "ориентированном на тело мышлении" с улучшенным пространственным восприятием, что позволяет робототехникам интегрировать её в существующие системы управления роботами.

Google DeepMind искусственный интеллект робототехника Gemini Robotics антропоморфные роботы embodied AI визуально-лингвистические и действенныe способности ориентированное на тело мышление