Google DeepMind News · 13.04.2026 ·Память и RAG

Gemini Robotics-ER 1.6: новый уровень автономной робототехники

DeepMind представила обновлённую версию своей системы Gemini Robotics-ER 1.6, которая значительно улучшает пространственное мышление и многоканальное восприятие роботов. Новая версия позволяет роботам лучше понимать и взаимодействовать с физическим миром, что критически важно для создания автономных агентов.

Gemini Robotics-ER 1.6 использует продвинутые алгоритмы обработки визуальной информации и пространственного анализа, что позволяет роботам выполнять сложные задачи, такие как навигация в неструктурированных средах и манипуляция объектами. Это особенно важно для разработки ИИ-агентов, которые должны работать в реальном мире, где условия могут быть непредсказуемыми.

Одним из ключевых улучшений является способность системы анализировать несколько видов данных одновременно, включая визуальные, аудио и тактильные данные. Это позволяет роботам более точно понимать контекст и принимать обоснованные решения. Например, робот может использовать визуальные данные для определения положения объекта, а тактильные данные — для оценки его текстуры и веса.

Для команды, разрабатывающей ИИ-агента Jarv, эти технологии могут быть полезны в создании агентов, способных взаимодействовать с физическим миром. В частности, улучшенное пространственное мышление и многоканальное восприятие могут быть использованы для разработки агентов, которые могут выполнять задачи в реальных условиях, таких как логистика, производство и обслуживание.

Gemini Robotics-ER 1.6 демонстрирует, как продвинутые алгоритмы ИИ могут быть интегрированы в робототехнические системы для создания более автономных и эффективных агентов. Это важный шаг в направлении создания ИИ-агентов, которые могут работать в реальном мире, и команда Jarv может извлечь из этого опыт для своих разработок.

Источник: Google DeepMind News

Обсудить с ИИ

Похожие материалы

Google DeepMind News · Модели и релизы Gemini 3.5 от DeepMind: интеллект с возможностью действия DeepMind представила новую модель Gemini 3.5, которая отличается от предыдущих версий способностью выполнять сложные, агентские рабочие процессы. Это значительный шаг вперёд, так как модель не только понимает контекст, но и может активно взаимодействовать с окружающей средой для достижения целей. Gemini 3.5 построена на архитектуре, которая позволяет ей интегрироваться с различными инструментами и системами, что делает её полезной для автоматизации сложных задач. Google DeepMind News · Модели и релизы Google представила Gemini Robotics 2 для управления роботами Google DeepMind анонсировала Gemini Robotics 2 — специализированную модель, обеспечивающую «целостный интеллект» для робототехники. Система объединяет визуальное восприятие, понимание естественного языка и моторное управление, позволяя роботам выполнять сложные задачи в реальном времени. Технология значительно повышает адаптивность машин к динамическим условиям среды, сокращая время на обучение новым манипуляциям и повышая точность взаимодействия с объектами. Google DeepMind News · Модели и релизы Gemini 3.1 Pro от DeepMind для сложных задач DeepMind представила новую модель Gemini 3.1 Pro, ориентированную на решение сложных задач, где требуется не просто ответ, а глубокий анализ и понимание контекста. Модель демонстрирует улучшенные способности в обработке сложных запросов, что делает её перспективной для применения в различных областях, включая разработку ИИ-агентов. Google DeepMind News · Оркестрация агентов Google представила Gemini Robotics ER 2 для управления роботами Google DeepMind анонсировала Gemini Robotics ER 2 — специализированную платформу для управления робототехническими системами. Решение объединяет продвинутое понимание видеопотока, оркестрацию сложных задач и механизмы взаимодействия между несколькими роботами. Система позволяет автономным устройствам эффективнее интерпретировать визуальную информацию из реального мира и координировать действия для выполнения многоэтапных операций в динамических условиях. Hacker News · Модели и релизы Google представила Gemini Robotics 2.0 для управления роботами Google анонсировала Gemini Robotics 2.0 — специализированную версию своей мультимодальной модели, предназначенную для управления робототехникой. Новая архитектура значительно повышает точность манипуляций и уровень безопасности при взаимодействии с физическими объектами. Решение направлено на интеграцию продвинутого ИИ-мышления в автономные системы, позволяя роботам лучше понимать контекст среды и выполнять сложные задачи с высокой степенью автономности. MarkTechPost · Модели и релизы Google DeepMind представила семейство моделей Gemini Robotics 2 для управления роботами Google DeepMind выпустила Gemini Robotics 2 — комплексную интеллектуальную платформу для управления робототехникой. Релиз включает три специализированные модели, отвечающие за координацию движений всего тела гуманоидов, логическое планирование задач и адаптацию к различным аппаратным конфигурациям. Технология уже успешно протестирована на промышленных роботах, демонстрируя способность к быстрой настройке под новые физические платформы. The Verge · Модели и релизы Google DeepMind представила Gemini Robotics 2 для управления всем телом робота Google DeepMind анонсировала обновление своей специализированной модели Gemini Robotics 2, которая теперь способна управлять движениями всего тела гуманоидных роботов. В отличие от предыдущей версии, сфокусированной на манипуляциях верхней частью корпуса, новая разработка обеспечивает координацию конечностей от стоп до кончиков пальцев, позволяя роботам выполнять сложные перемещения и взаимодействия с окружающим пространством. Google DeepMind News · Исследования и наука Gemini for Science: инструменты для научных открытий DeepMind представила Gemini for Science — набор инструментов и экспериментов, направленных на расширение масштабов и точности научных исследований. Этот проект включает в себя модели, способные обрабатывать и анализировать большие объемы научных данных, а также инструменты для автоматизации экспериментов и моделирования. Google DeepMind News · Модели и релизы DeepMind представила Gemini Omni DeepMind анонсировала новую модель Gemini Omni, которая позиционируется как универсальное решение для широкого спектра задач. Gemini Omni отличается улучшенной производительностью и способностью работать с мультимодальными данными, включая текст, изображения и видео. Это важный шаг в развитии ИИ, так как модель демонстрирует высокий уровень адаптивности и точности в различных сценариях. Google DeepMind News · Модели и релизы Gemini 3.1 Flash-Lite от DeepMind: скорость и эффективность DeepMind представила новую модель Gemini 3.1 Flash-Lite, которая позиционируется как самая быстрая и экономически выгодная в серии Gemini 3. Эта модель разработана для работы в условиях масштабируемой интеллектуальной обработки, что делает её особенно привлекательной для разработчиков ИИ-агентов и сервисов.

← Все материалы