Исследователи из MIT и Университета Карнеги-Меллона предложили новый подход к выявлению ошибок в цепочках рассуждений языковых моделей (LLM) без использования меток. Их метод, основанный на операдной теории, позволяет обнаруживать несоответствия в логических цепочках, которые модели строят при решении сложных задач.
Традиционные методы, такие как self-consistency и semantic entropy, требуют многократного сэмплирования и самооценки. Новый подход предлагает более эффективный способ диагностики, анализируя структуру ответов модели без необходимости в дополнительных вычислениях.
Операдная теория, используемая в работе, позволяет моделировать системы, построенные на основе итеративной подстановки. Это делает её особенно полезной для анализа составных задач, где ошибки могут накапливаться на разных уровнях. Исследователи показали, что их метод может выявлять ошибки, которые остаются незамеченными традиционными подходами.
Для разработчиков ИИ-агентов этот метод может стать важным инструментом для повышения надёжности и точности. Возможность обнаруживать ошибки в цепочках рассуждений на этапе инференса без дополнительных вычислений может значительно улучшить производительность агентов в сложных сценариях.