Hacker News · 22.06.2026 ·Исследования и наука

Анализ работы режима extended thinking в Claude Code

Разработчики исследовали механизм «расширенного мышления» (extended thinking) в инструменте Claude Code, чтобы понять, как именно модель формирует свои промежуточные рассуждения. Анализ показал, что выводимый текст в блоке размышлений не всегда является прямым отражением процесса принятия решений в реальном времени. Вместо этого модель часто генерирует итоговое резюме уже завершенного логического вывода, которое оформляется как последовательный мыслительный процесс.

Такой подход отличается от классических методов цепочки рассуждений (Chain-of-Thought), где каждый шаг вычислений является необходимым этапом для получения результата. В случае с Claude Code «мышление» выступает скорее как структурированная интерпретация, созданная для удобства пользователя, а не как сырой лог работы нейронной сети. Это ставит вопросы о прозрачности агентных систем, которые используют подобные инструменты для написания кода.

Понимание того, как именно модели «рассуждают» в агентных средах, критически важно для отладки сложных задач. Если промежуточный текст является лишь постфактум-резюме, это ограничивает возможности пользователя по контролю за логикой агента на промежуточных этапах. Данное наблюдение подчеркивает необходимость более глубокого изучения того, как современные LLM управляют своими внутренними состояниями при выполнении многошаговых инструкций в среде разработки.

Источник: Hacker News

Похожие материалы

Hacker News · Разработка и инструменты Claude Code: автоматизация инженерных практик через кодовые навыки Инструмент Claude Code предлагает новый подход к автоматизации разработки, переходя от простых текстовых промптов к исполняемым «навыкам». Система позволяет инженерам кодировать свои рабочие процессы и лучшие практики непосредственно в среду разработки. Вместо того чтобы каждый раз описывать задачу модели, разработчик использует набор предопределенных скриптов и логических цепочек, которые имитируют действия опытного инженера при решении типичных задач. Hacker News · Разработка и инструменты Особенности работы Claude Code с локальной файловой системой Компания Anthropic представила инструмент Claude Code, предназначенный для автоматизации задач разработки непосредственно в терминале. Утилита позволяет агенту анализировать кодовую базу, выполнять команды и взаимодействовать с файловой системой для решения инженерных задач. В ходе эксплуатации пользователи обнаружили, что агент по умолчанию проводит индексацию и сканирование содержимого локальных директорий для формирования контекста, необходимого для работы с проектом. Hacker News · Оркестрация агентов Инструмент для автоматизации рабочих процессов в Claude Code Разработчики представили утилиту CWC, предназначенную для анализа истории взаимодействия с Claude Code и автоматического создания на её основе воспроизводимых агентских рабочих процессов. Инструмент сканирует логи сессий, выявляет повторяющиеся паттерны действий и преобразует их в структурированные воркфлоу, которые можно повторно использовать для решения аналогичных задач. arXiv · Машинное обучение Исследование: как устранить избыточное рассуждение в LLM Учёные изучили проблему избыточного рассуждения (overthinking) в языковых моделях, когда они продолжают генерировать ненужные шаги после нахождения правильного ответа. Это явление особенно заметно в задачах, требующих длинных цепочек рассуждений (chain-of-thought reasoning). Hacker News · Модели и релизы Claude Code научился рефлексии Команда Anthropic представила обновление для Claude Code, добавив в модель способность к рефлексии. Новый функционал позволяет ИИ анализировать свои собственные ответы и корректировать их на основе полученной обратной связи. arXiv · Исследования и наука Как цепочки рассуждений влияют на ответы ИИ-моделей Исследователи изучили, как цепочки рассуждений (Chain-of-Thought, CoT) влияют на точность ответов языковых моделей. Они выяснили, что не все шаги в цепочке одинаково важны для итогового результата. Для оценки значимости каждого шага использовался метод раннего выхода (early exit), который позволяет определить, насколько конкретный шаг влияет на конечный ответ. Hacker News · ИИ в бизнесе Кейс Ångstrom: использование Claude Code для обучения модели-победителя Компания Ångstrom успешно применила инструмент Claude Code для автоматизации процесса обучения специализированной модели. В результате удалось создать решение, которое превзошло по эффективности архитектуру UMA-OMC от Meta (признана экстремистской организацией, деятельность запрещена в РФ). Использование агентного подхода к написанию и отладке кода позволило команде значительно ускорить итерации разработки и оптимизировать пайплайны машинного обучения. arXiv · Модели и релизы DreamReasoner-8B: ускорение логических рассуждений через блочную диффузию Исследователи представили DreamReasoner-8B — открытую языковую модель, использующую метод блочной диффузии для генерации цепочек рассуждений (Chain-of-Thought). В отличие от стандартных авторегрессионных моделей, которые генерируют текст токен за токеном, блочные диффузионные модели позволяют выполнять параллельное шумоподавление сразу для нескольких сегментов текста. Это решение направлено на преодоление ограничений скорости при выполнении сложных логических задач, требующих длинных последовательностей рассуждений. Hacker News · ИИ в бизнесе Анализ использования Claude Code в публичных репозиториях Исследование публичных репозиториев, использующих инструмент Claude Code, выявило текущие паттерны внедрения ИИ-ассистентов в процесс разработки. Около 85% проектов содержат файл конфигурации Claude.md, что указывает на высокую степень стандартизации инструкций и контекста для моделей. Разработчики активно используют системные промпты для настройки поведения ИИ под конкретные задачи и архитектурные требования своих проектов. Hacker News · Инфраструктура для агентов Claude Managed Agents: опыт разработчиков На Hacker News обсуждают опыт использования Claude Managed Agents — сервиса от Anthropic для создания и управления ИИ-агентами. Пользователи делятся своими проектами, в которых они применяли эту платформу, и обсуждают её возможности и ограничения.

← Все материалы