Воскресенье, 20 апреля в 02:56 UTC+3
Загрузка...

Новые модели ИИ от Google DeepMind помогают роботам выполнять физические задачи, даже без обучения


25Опубликовано 12.03.2025 в 22:01Категория: РобототехникаИсточник
Изображение статьи

Компания Google DeepMind запускает две новые модели искусственного интеллекта, предназначенные для того, чтобы роботы могли выполнять более широкий спектр реальных задач. Первая модель, названная Gemini Robotics, представляет собой модель, сочетающую в себе обработку изображений, язык и действия, способную понимать новые ситуации, даже если она не обучалась на них. Gemini Robotics построена на основе последней версии флагманской модели AI Google — Gemini 2.0.

Во время пресс-брифинга Каролина Парада (Carolina Parada), старший директор и руководитель направления робототехники в Google DeepMind, отметила, что модель "использует многомодальную понимание мира Gemini и переносит его в реальный мир, добавляя физические действия как новую модальность". Новая модель делает значительные шаги в трех ключевых областях, которые Google DeepMind считает важными для создания полезных роботов: универсальности, интерактивности и ловкости. Помимо способности обобщать новые сценарии, Gemini Robotics лучше взаимодействует с людьми и их окружением. Она также может выполнять более точные физические задачи, такие как складывание бумаги или отвинчивание пробки.

"Хотя мы уже делали прогресс в каждой из этих областей по отдельности ранее при работе с общими роботами, теперь с одной моделью мы значительно повышаем производительность во всех трёх направлениях", — отметила Парада. "Это позволяет нам создавать более способных, отзывчивых и устойчивых к изменениям в окружающей среде роботов".

Кроме того, Google DeepMind запускает модель Gemini Robotics-ER (или embodied reasoning), которую компания описывает как продвинутую модель обработки изображений и языка, способную "понимать наш сложный и динамичный мир". Как пояснила Парада, когда вы упаковываете обеденный контейнер, имея предметы на столе перед собой, вам нужно знать, где находится каждый предмет, как открыть контейнер, как захватить эти предметы и куда их положить. Именно такой тип рассуждений предполагается выполнить моделью Gemini Robotics-ER. Она предназначена для интеграции с существующими низкоуровневыми контроллерами — системой управления движениями робота, что позволит разработчикам включать новые функции на основе модели Gemini Robotics-ER.

В области безопасности исследователь Google DeepMind Викас Синдванхи (Vikas Sindhwani) сообщил журналистам, что компания разрабатывает "многослойный подход", добавив, что модели Gemini Robotics-ER обучены оценивать безопасность выполнения потенциальных действий в заданной ситуации. Компания также выпускает новые метрики и рамки для дальнейших исследований безопасности в сфере ИИ.

В прошлом году Google DeepMind представила свой "Роботический Устав", набор правил, вдохновленных законами Айзека Азимова, которые роботы должны соблюдать. В настоящее время компания сотрудничает с Apptronik для создания следующего поколения антропоморфных роботов. Google DeepMind предоставляет доступ к своей модели Gemini Robotics-ER "доверенным тестировщикам", включая Agile Robots, Agility Robotics, Boston Dynamics и Enchanted Tools.

"Мы очень сосредоточены на создании искусственного интеллекта, который сможет понимать физический мир и действовать в нем", — сказала Парада. "Нас очень радует возможность использовать это для множества различных применений".

Загрузка предыдущей публикации...

Загрузка следующей публикации...

Предыдущие новости в категории

Загрузка предыдущих новостей...

Следующие новости в категории

Загрузка следующих новостей...

Мы отбираем новости из проверенных источников, обрабатываем их с помощью современных AI-технологий и публикуем на сайте, созданном с использованием искусственного интеллекта. Все материалы принадлежат их авторам, а контент проходит дополнительную проверку на достоверность. Возможны ошибки в тексте, так как нейросеть тоже имеет свойство ошибаться. Все изображения являются фантазией нейросети, совпадение с реальными предметами и личностями маловероятно.

© 2025 NOTid . QAter . AI service.