Hacker News · 15.06.2026 ·Обучение и дообучение

Как Anthropic обучала Fable 5 через анализ трасс разума

Anthropic представила новый подход к обучению своей модели Fable 5, который может оказаться важным для развития ИИ-агентов. В отличие от традиционных методов, команда использовала анализ «трасс разума» — последовательностей логических шагов, которые модель делает при решении задач. Это позволило улучшить способность модели к обоснованному принятию решений и снизить вероятность ошибок.

Трасса разума — это последовательность промежуточных выводов, которые модель делает на пути к окончательному ответу. Например, если модель решает математическую задачу, её трасса разума может включать промежуточные вычисления и логические шаги. Anthropic собрала огромный корпус таких трасс, чтобы обучать модель не только на правильных ответах, но и на процессе их достижения.

Этот метод может быть особенно полезен для ИИ-агентов, так как они часто работают в условиях неопределённости и должны принимать решения на основе частичной информации. Анализ трасс разума позволяет моделям лучше понимать свои собственные ошибки и корректировать поведение. Кроме того, такой подход может улучшить интерпретируемость ИИ, что важно для доверия пользователей.

Anthropic также отметила, что Fable 5 показала значительные улучшения в тестах на логическое мышление и решение сложных задач. Это может быть важным шагом в развитии ИИ-агентов, которые должны не только выполнять команды, но и объяснять свои действия и принимать обоснованные решения.

Источник: Hacker News

Обсудить с ИИ

Похожие материалы

Hacker News · Исследования и наука Anthropic представила обновленную модель Fable 5 для анализа безопасности ИИ Компания Anthropic выпустила обновленную версию модели Fable 5, предназначенную для автоматизированного тестирования безопасности ИИ-систем. Инструмент имитирует сложные сценарии атак, позволяя исследователям выявлять уязвимости в поведении моделей до их публичного релиза. Обновление направлено на повышение устойчивости ИИ к попыткам обхода этических ограничений и вредоносному использованию в реальных условиях. Simon Willison's Weblog · Модели и релизы Claude Fable 5: мощь и вызов для разработчиков Simon Willison, известный разработчик и эксперт в области ИИ, поделился своими впечатлениями от новой модели Claude Fable 5, выпущенной компанией Anthropic. Он отмечает, что модель демонстрирует выдающиеся способности, но при этом обладает значительными ограничениями, такими как высокая стоимость и медленная скорость работы. Simon Willison's Weblog · Модели и релизы Claude Fable 5: проактивность как ключевая черта ИИ-агента Claude Fable 5 демонстрирует необычайную проактивность в достижении целей, что делает его интересным примером для разработчиков ИИ-агентов. По словам Simon Willison, модель активно использует множество трюков и стратегий, чтобы решить поставленные задачи. Например, при работе с Datasette Agent он самостоятельно выявил и предложил решение для бага с горизонтальной прокруткой в чат-интерфейсе. Hacker News · Модели и релизы Anthropic представила модель Claude Fable 5 Компания Anthropic официально анонсировала запуск Claude Fable 5, новой итерации своих языковых моделей, доступной пользователям платных тарифных планов. Обновление направлено на повышение точности рассуждений, улучшение работы с контекстом и оптимизацию выполнения сложных многошаговых задач, что делает модель более эффективной для профессионального использования в аналитике и программировании. Lobsters · Модели и релизы Anthropic представила Claude Fable 5 и Mythos 5 Anthropic анонсировала новые версии своих моделей — Claude Fable 5 и Mythos 5. Эти модели позиционируются как более мощные и точные по сравнению с предыдущими версиями, с улучшенными способностями к обработке сложных запросов и генерации текста. Hacker News · Оценка и бенчмарки Система Fable достигла 84% успеха в публичном бенчмарке ARC-AGI Система Fable, работающая в связке с механизмом управления (harness), успешно решила 84% задач из публичного набора ARC-AGI 3 за одну попытку. Этот результат демонстрирует значительный прогресс в способности ИИ-агентов к абстрактному мышлению и решению логических задач, которые ранее считались труднопреодолимыми для стандартных языковых моделей без специализированной доработки. The Decoder · Разработка и инструменты Anthropic сократила системный промпт Claude Code на 80% Компания Anthropic оптимизировала работу Claude Code, сократив объем системного промпта на 80%. Переход на новые модели семейства Fable 5 позволил отказаться от избыточных инструкций и примеров. Разработчики выяснили, что жесткие ограничения сдерживают творческий потенциал моделей, поэтому теперь управление поведением агента осуществляется преимущественно через контекст, а не через детальные правила. Hacker News · Машинное обучение Fable достигла SOTA в CIFAR Speedrun: уроки автоматизации R&D в ИИ Компания Fable установила новый стандарт в задаче CIFAR Speedrun, продемонстрировав эффективность автоматизированных систем в исследовательских процессах машинного обучения. Команда использовала специализированную инфраструктуру для ускорения итераций, что позволило достичь рекордных показателей точности при минимальных временных затратах. Этот кейс иллюстрирует переход от ручного подбора гиперпараметров к полностью автоматизированным циклам разработки моделей. The Decoder · Оркестрация агентов Anthropic предложила паттерн «менеджер-исполнитель» для оптимизации затрат на LLM Anthropic представила стратегию оптимизации расходов при работе с флагманской моделью Claude Fable 5. Вместо использования дорогостоящей модели для каждой задачи компания рекомендует применять её в роли «менеджера» или планировщика, который делегирует выполнение конкретных операций более доступной модели Claude Sonnet 5. Такой подход позволяет сохранить высокую эффективность при значительном снижении операционных затрат на инференс. Simon Willison's Weblog · Безопасность и алайнмент Claude Fable: почему вы можете не узнать о блокировке запросов Jonathon Ready обратил внимание на важный момент из 319-страничного системного карточки Fable 5 и Mythos 5. В документе упоминается, что новые модели могут ускорять собственное развитие, и поэтому введены меры, ограничивающие эффективность Claude для определённых запросов.

← Все материалы