Hacker News · 22.06.2026 ·Исследования и наука

NVIDIA представила метод самообучения роботов Enpire

Исследователи NVIDIA представили Enpire — новый метод, позволяющий роботам самостоятельно улучшать свои действия в реальных физических условиях. В отличие от традиционных подходов, требующих длительного обучения с учителем или огромных массивов размеченных данных, система использует агентный подход для итеративной корректировки стратегий поведения. Робот анализирует результаты своих попыток выполнения задачи, выявляет ошибки и автоматически генерирует новые сценарии для их исправления.

Технология опирается на использование больших языковых моделей для интерпретации визуальных данных и оценки успешности выполнения манипуляций. Система формирует обратную связь, которая позволяет роботу адаптироваться к изменениям в окружающей среде без участия человека. В ходе экспериментов Enpire продемонстрировал способность к быстрому обучению сложным навыкам, таким как точное перемещение объектов и взаимодействие с инструментами, значительно сокращая время, необходимое для подготовки робота к работе в новых условиях.

Разработка решает одну из ключевых проблем современной робототехники — нехватку данных для обучения в непредсказуемых сценариях. Метод позволяет перенести процесс «обучения на ошибках» из виртуальных симуляций в реальный мир, где физические ограничения и случайные факторы играют решающую роль. Это приближает создание автономных систем, способных самостоятельно осваивать новые бытовые или производственные задачи в динамически меняющейся обстановке.

Источник: Hacker News

Похожие материалы

Ars Technica - All content · ИИ в бизнесе NVIDIA использует ИИ-агентов для автономного обучения роботов Компания NVIDIA представила новую методику подготовки робототехнических систем, в которой ключевую роль играют автономные ИИ-агенты, специализирующиеся на написании кода. Вместо ручного программирования каждого движения или алгоритма, система использует группы агентов для самостоятельной корректировки и оптимизации обучающих сценариев. Это позволяет роботам быстрее адаптироваться к выполнению сложных задач в динамических условиях. The Decoder · ИИ в бизнесе Nvidia и университеты США обучили роботов навыкам захвата через ИИ-агентов Исследователи из Nvidia, Университета Карнеги — Меллона и Калифорнийского университета в Беркли представили метод обучения робототехники с помощью автономных ИИ-агентов. Система использует возможности генеративного кода для самостоятельной корректировки движений роботов в реальных условиях. Вместо классического программирования каждого действия, агенты анализируют неудачные попытки и автоматически переписывают алгоритмы управления, чтобы повысить точность выполнения сложных манипуляций. Hacker News · Машинное обучение EgoInfinity: масштабный датасет для обучения роботов действиям на основе видео Исследователи представили EgoInfinity — специализированный датасет и вычислительный движок, предназначенный для обучения роботов выполнению задач на основе анализа видеоданных. Проект направлен на решение одной из ключевых проблем современной робототехники: нехватки качественных данных, связывающих визуальное восприятие с конкретными физическими действиями. В отличие от стандартных наборов данных, EgoInfinity использует масштабные видеоархивы для генерации траекторий, которые роботы могут использовать для имитационного обучения. arXiv · ИИ в бизнесе Новый фреймворк VERITAS для обучения роботов на основе визуальной проверки Исследователи предложили новый подход к обучению роботов, который позволяет им улучшать свои навыки в реальном времени. В статье на arXiv представлен фреймворк VERITAS, сочетающий генератор и верификатор для корректировки политик роботов и их самостоятельного улучшения. arXiv · Машинное обучение Улучшение игрового ИИ с помощью глубокого обучения с подкреплением Исследователи представили новый подход к созданию игровых персонажей, основанный на методах глубокого обучения с подкреплением (Deep Reinforcement Learning). Традиционные системы, опирающиеся на жестко прописанные сценарии и правила, часто не справляются с задачей создания естественного и непредсказуемого поведения NPC. Это ограничивает глубину погружения игроков и делает действия виртуальных агентов однообразными. arXiv · Память и RAG Как улучшить надёжность ИИ-агентов в робототехнике Исследователи из MIT и других ведущих университетов предложили новый подход к улучшению надёжности ИИ-агентов в робототехнике. В своей работе, опубликованной на arXiv, они рассматривают проблему обнаружения аномалий в поведении роботов, управляемых генеративными моделями. arXiv · Память и RAG Geometric Action Model для обучения политик роботов Исследователи из MIT и Google DeepMind представили новый подход к обучению политик роботов, который учитывает геометрию физического мира. В статье, опубликованной на arXiv, авторы предлагают Geometric Action Model (GAM), который позволяет роботам не только следовать инструкциям пользователей, но и учитывать взаимодействие объектов, камер и действий робота в 3D пространстве. arXiv · Машинное обучение Модельно-ориентированный подход к созданию сред для обучения с подкреплением Исследователи представили новый подход к разработке виртуальных сред, предназначенных для обучения агентов с подкреплением (RL). Традиционно создание таких систем требует значительных затрат времени, так как для успешной сходимости алгоритмов агентам необходимо тренироваться в множестве схожих, но вариативных условий. Авторы работы предлагают использовать модельно-ориентированную методологию, которая позволяет автоматизировать генерацию семейств сред, сохраняя при этом их функциональную близость. arXiv · Память и RAG LaWAM: моделирование будущего для роботов с помощью ИИ Исследователи из MIT и других ведущих университетов представили новый подход к созданию роботов, способных предсказывать последствия своих действий. В статье LaWAM: Latent World Action Models for Efficient Dynamics-Aware Robot Policies авторы предлагают использовать модели, которые учитывают, как действия робота изменят окружающую среду. Это позволяет роботам принимать более осознанные решения, что критически важно для автономных агентов. arXiv · Память и RAG RoboPIN: новый подход к визуальному мышлению для ИИ-агентов Исследователи из MIT и других ведущих университетов представили RoboPIN — метод, который улучшает способность ИИ-агентов к визуальному мышлению в физических средах. Текущие модели часто используют текстовые или координатные цепочки мыслей, что приводит к разрыву между визуальными данными и логическим выводом. RoboPIN предлагает решение, фиксируя визуальные объекты в процессе рассуждений, что делает их более точными и последовательными.

← Все материалы