Разработчики представили DOS — инструмент для управления жизненным циклом ИИ-агентов, который решает проблему преждевременного завершения задач. Система выступает в роли независимого арбитра, который проверяет результаты работы агента, не полагаясь на его собственные отчеты о выполнении. Это позволяет избежать ситуаций, когда модель «галлюцинирует» о завершении процесса, фактически не достигнув поставленной цели.

В основе решения лежит механизм верификации, который принудительно возвращает агента к работе, если итоговый результат не соответствует заданным критериям качества или полноты. Система анализирует состояние среды и промежуточные артефакты, обеспечивая более надежное выполнение многошаговых инструкций. Такой подход снижает вероятность ошибок при автоматизации сложных процессов, где требуется строгая последовательность действий.

Инструмент ориентирован на интеграцию в агентные пайплайны, где критически важна автономность и точность исполнения. Использование внешнего «судьи» позволяет строить более устойчивые системы, способные самостоятельно исправлять свои ошибки в процессе выполнения задачи без участия человека-оператора.