Исследователи NVIDIA представили Enpire — новый метод, позволяющий роботам самостоятельно улучшать свои действия в реальных физических условиях. В отличие от традиционных подходов, требующих длительного обучения с учителем или огромных массивов размеченных данных, система использует агентный подход для итеративной корректировки стратегий поведения. Робот анализирует результаты своих попыток выполнения задачи, выявляет ошибки и автоматически генерирует новые сценарии для их исправления.

Технология опирается на использование больших языковых моделей для интерпретации визуальных данных и оценки успешности выполнения манипуляций. Система формирует обратную связь, которая позволяет роботу адаптироваться к изменениям в окружающей среде без участия человека. В ходе экспериментов Enpire продемонстрировал способность к быстрому обучению сложным навыкам, таким как точное перемещение объектов и взаимодействие с инструментами, значительно сокращая время, необходимое для подготовки робота к работе в новых условиях.

Разработка решает одну из ключевых проблем современной робототехники — нехватку данных для обучения в непредсказуемых сценариях. Метод позволяет перенести процесс «обучения на ошибках» из виртуальных симуляций в реальный мир, где физические ограничения и случайные факторы играют решающую роль. Это приближает создание автономных систем, способных самостоятельно осваивать новые бытовые или производственные задачи в динамически меняющейся обстановке.