Anthropic представила новый подход к обучению своей модели Fable 5, который может оказаться важным для развития ИИ-агентов. В отличие от традиционных методов, команда использовала анализ «трасс разума» — последовательностей логических шагов, которые модель делает при решении задач. Это позволило улучшить способность модели к обоснованному принятию решений и снизить вероятность ошибок.

Трасса разума — это последовательность промежуточных выводов, которые модель делает на пути к окончательному ответу. Например, если модель решает математическую задачу, её трасса разума может включать промежуточные вычисления и логические шаги. Anthropic собрала огромный корпус таких трасс, чтобы обучать модель не только на правильных ответах, но и на процессе их достижения.

Этот метод может быть особенно полезен для ИИ-агентов, так как они часто работают в условиях неопределённости и должны принимать решения на основе частичной информации. Анализ трасс разума позволяет моделям лучше понимать свои собственные ошибки и корректировать поведение. Кроме того, такой подход может улучшить интерпретируемость ИИ, что важно для доверия пользователей.

Anthropic также отметила, что Fable 5 показала значительные улучшения в тестах на логическое мышление и решение сложных задач. Это может быть важным шагом в развитии ИИ-агентов, которые должны не только выполнять команды, но и объяснять свои действия и принимать обоснованные решения.