Исследователи предложили новый подход к обучению роботов, который позволяет им улучшать свои навыки в реальном времени. В статье на arXiv представлен фреймворк VERITAS, сочетающий генератор и верификатор для корректировки политик роботов и их самостоятельного улучшения.

VERITAS использует предобученную политику робота в качестве генератора и дополняет её верификатором, который проверяет действия робота и корректирует их на основе визуальной информации. Это позволяет роботам учиться на своих ошибках и адаптироваться к новым условиям.

Авторы провели эксперименты, демонстрирующие эффективность VERITAS в различных сценариях. Роботы, обученные с использованием этого фреймворка, показали значительное улучшение своих навыков по сравнению с традиционными методами обучения.

Технология может найти применение в промышленности, логистике и других областях, где роботы работают в динамичной среде и требуют постоянного обучения и адаптации.