arXiv · 16.06.2026 ·ИИ в бизнесе

Новый фреймворк VERITAS для обучения роботов на основе визуальной проверки

Исследователи предложили новый подход к обучению роботов, который позволяет им улучшать свои навыки в реальном времени. В статье на arXiv представлен фреймворк VERITAS, сочетающий генератор и верификатор для корректировки политик роботов и их самостоятельного улучшения.

VERITAS использует предобученную политику робота в качестве генератора и дополняет её верификатором, который проверяет действия робота и корректирует их на основе визуальной информации. Это позволяет роботам учиться на своих ошибках и адаптироваться к новым условиям.

Авторы провели эксперименты, демонстрирующие эффективность VERITAS в различных сценариях. Роботы, обученные с использованием этого фреймворка, показали значительное улучшение своих навыков по сравнению с традиционными методами обучения.

Технология может найти применение в промышленности, логистике и других областях, где роботы работают в динамичной среде и требуют постоянного обучения и адаптации.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

arXiv · Исследования и наука FAR: новый метод обучения роботов на собственных ошибках в реальном времени Исследователи представили фреймворк Failure-Aware Retry (FAR), позволяющий робототехническим системам самостоятельно адаптироваться к сбоям во время выполнения задач. В отличие от стандартных методов повтора действий, которые часто приводят к зацикливанию на ошибках, FAR анализирует причины неудачи и корректирует стратегию поведения в процессе работы, исключая необходимость вмешательства человека для восстановления работоспособности. arXiv · Исследования и наука Роботы учатся общаться через визуальные проекции и тени Исследователи представили новый метод обучения роботов невербальной коммуникации с помощью визуальных абстракций, таких как тени и силуэты. Вместо того чтобы полагаться исключительно на физические движения корпуса, система учит роботов проецировать свои намерения во внешнюю среду. Это позволяет машинам взаимодействовать с людьми более интуитивно, используя привычные для человека способы передачи информации через визуальные проекции. arXiv · Машинное обучение Метод VLK для обучения человекоподобных роботов сложным манипуляциям Исследователи представили фреймворк VLK (Vision-Language-Kinematics), решающий проблему нехватки данных для обучения человекоподобных роботов одновременному перемещению и манипуляции объектами. Система генерирует синтетические наборы данных, объединяющие эгоцентрические изображения, текстовые инструкции и кинематические траектории, что позволяет роботам эффективнее связывать визуальное восприятие с физическими действиями в сложных сценариях. arXiv · Машинное обучение Метод UR-VC для автоматической коррекции сигналов прогресса в обучении роботов Исследователи представили метод UR-VC (Unsupervised Robotic Value Correction), который решает проблему неточных сигналов прогресса при обучении роботов. Вместо использования упрощенной временной нормализации, алгоритм автоматически корректирует значения ценности состояний, опираясь на визуальные данные. Это позволяет агентам точнее оценивать промежуточные этапы выполнения задач и успешность их завершения без необходимости в ручной разметке данных. arXiv · Исследования и наука Новый метод обучения роботов RECALL сокращает затраты на демонстрации Исследователи представили метод RECALL (Recovery Experience Collection for Active Lifelong Learning), предназначенный для оптимизации обучения моделей Vision-Language-Action (VLA). Традиционный подход к дообучению роботов основан на пассивном имитационном обучении: система собирает новые данные только после того, как модель совершила ошибку. Это приводит к неэффективному использованию ресурсов, так как экспертам приходится тратить время на демонстрации в ситуациях, которые не всегда критически важны для улучшения навыков робота. Hacker News · Исследования и наука NVIDIA представила метод самообучения роботов Enpire Исследователи NVIDIA представили Enpire — новый метод, позволяющий роботам самостоятельно улучшать свои действия в реальных физических условиях. В отличие от традиционных подходов, требующих длительного обучения с учителем или огромных массивов размеченных данных, система использует агентный подход для итеративной корректировки стратегий поведения. Робот анализирует результаты своих попыток выполнения задачи, выявляет ошибки и автоматически генерирует новые сценарии для их исправления. arXiv · Машинное обучение Новый метод обучения роботов через использование априорных знаний о движении Исследователи представили метод обучения роботов, который решает проблему нехватки физических навыков у моделей Vision-Language-Action (VLA). Вместо обучения управлению движением с нуля, авторы внедрили механизм априорных знаний об действиях (action priors). Это позволяет модели эффективнее переносить навыки между различными типами робототехнических платформ, значительно ускоряя процесс адаптации к новым задачам манипуляции объектами. MarkTechPost · Исследования и наука NVIDIA представила ASPIRE: фреймворк для самообучения роботов Исследователи NVIDIA разработали фреймворк ASPIRE, предназначенный для автоматического создания и оптимизации программ управления роботами. Система самостоятельно исправляет ошибки в коде и формирует библиотеку навыков, что позволяет роботам успешно выполнять сложные последовательные задачи. В тестах на бенчмарке LIBERO-Pro решение продемонстрировало 31% точности в режиме zero-shot, значительно повышая эффективность выполнения длинных сценариев. arXiv · Машинное обучение Новый метод оптимизации функций вознаграждения в обучении с подкреплением Исследователи представили фреймворк для настройки функций вознаграждения в обучении с подкреплением без модели (model-free RL), решающий проблему «паралича политики» и избыточной осторожности агентов. На примере задачи автоматической парковки автомобилей с нехолономными ограничениями метод демонстрирует, как параметризованное формирование вознаграждения и регуляризация переключения направлений движения позволяют агентам избегать локальных минимумов и эффективно достигать целевых состояний. arXiv · Исследования и наука TACTFUL: новый фреймворк для тактильного распознавания объектов роботами Исследователи представили TACTFUL — фреймворк, позволяющий многопальцевым роботам идентифицировать и локализовать предметы в ограниченном пространстве исключительно с помощью осязания. В отличие от традиционных систем, опирающихся на компьютерное зрение, этот метод имитирует человеческую способность распознавать объекты на ощупь, что критически важно для работы в условиях плохой видимости или полной темноты, где визуальные сенсоры оказываются неэффективными.

← Все материалы