arXiv · 11.06.2026 ·Исследования и наука

Как цепочки рассуждений влияют на ответы ИИ-моделей

Исследователи изучили, как цепочки рассуждений (Chain-of-Thought, CoT) влияют на точность ответов языковых моделей. Они выяснили, что не все шаги в цепочке одинаково важны для итогового результата. Для оценки значимости каждого шага использовался метод раннего выхода (early exit), который позволяет определить, насколько конкретный шаг влияет на конечный ответ.

Эксперименты проводились на различных задачах и моделях, включая GPT-3.5, GPT-4, PaLM 2 и другие. Учёные обнаружили, что в некоторых случаях даже удаление части шагов не сильно влияет на точность ответа. Это указывает на то, что модели могут использовать избыточные или несущественные шаги, которые не влияют на итоговый результат.

Для разработчиков ИИ-агентов это исследование важно, потому что оно показывает, как можно оптимизировать цепочки рассуждений. Например, можно удалять ненужные шаги, чтобы ускорить работу модели без потери точности. Это особенно актуально для агентов, которые должны работать в реальном времени и обрабатывать большие объёмы данных.

Также исследование подчёркивает необходимость более глубокого понимания того, как модели принимают решения. Это может помочь в создании более прозрачных и надёжных ИИ-агентов, которые будут не только эффективными, но и понятными для пользователей.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

arXiv · Исследования и наука Исследование: как языковые модели теряют логику при замене переменных Учёные из MIT и других институтов обнаружили любопытный феномен в языковых моделях: при замене переменных в задачах на каузальное рассуждение на нейтральные маркеры (например, «X» вместо «Джон») модели начинают давать разные ответы, хотя структура вопроса и правильный ответ остаются неизменными. Это указывает на то, что модели либо теряют часть информации при такой замене, либо не могут корректно интерпретировать сохранённую информацию. Lobsters · Исследования и наука ИИ-модели передают поведенческие черты через скрытые сигналы в данных Недавнее исследование, опубликованное в журнале Nature, показало, что языковые модели могут передавать поведенческие черты через скрытые сигналы в данных. Ученые обнаружили, что модели, обученные на данных, содержащих определенные поведенческие паттерны, могут воспроизводить эти паттерны даже в новых, ранее не встречавшихся контекстах. Hacker News · Оценка и бенчмарки Исследование влияния системных инструкций на поведение ИИ-агентов Исследователи проанализировали, как добавление специфических инструкций в системный промпт (Claude.md) меняет логику принятия решений ИИ-агентами. Используя метод «деревьев триггеров», авторы оценили, насколько агент отклоняется от базового поведения при изменении контекста. Результаты показывают, что даже незначительные правки в системных указаниях могут существенно влиять на цепочку рассуждений и итоговый выбор модели в сложных задачах. Hacker News · Оценка и бенчмарки Производительность топовых LLM падает вдвое при усложнении цепочки рассуждений Исследование показало критическое снижение эффективности современных больших языковых моделей при решении задач, требующих последовательных рассуждений в разных предметных областях. Если в простых сценариях точность моделей достигает 83%, то при необходимости связывать знания из нескольких доменов показатель падает до 43%. Это подчеркивает фундаментальные ограничения текущих архитектур в задачах многошагового логического вывода. arXiv · Исследования и наука Исследование: LLM используют «пустые» токены для скрытых вычислений Исследователи обнаружили, что современные языковые модели способны выполнять сложные многошаговые рассуждения, используя «пустые» токены, такие как многоточия или последовательности чисел. В таких случаях модель выдает правильный ответ без видимой цепочки рассуждений (CoT) в тексте. Это создает серьезную проблему для контроля поведения ИИ, так как внешне токены не содержат информации о логике процесса. arXiv · Память и RAG Исследование: ИИ и люди используют схожие механизмы мышления Новое исследование, опубликованное на arXiv, бросает вызов распространённому мнению о том, что люди и ИИ используют принципиально разные механизмы мышления. Авторы сравнили способность людей и больших языковых моделей (LLM) к обобщению и логическому выводу. Они обнаружили, что и те, и другие часто полагаются на сопоставление шаблонов, а не на строгие абстрактные модели мира. Hacker News · Исследования и наука Исследование: языковые модели и человеческий мозг используют схожие концептуальные пространства Новое исследование, опубликованное на arXiv, показывает, что языковые модели (LLMs) и человеческий мозг используют схожие концептуальные пространства для обработки информации, даже если они работают на разных языках. Это открытие может иметь значительные последствия для разработки ИИ-агентов, так как оно подтверждает, что языковые модели способны моделировать когнитивные процессы, аналогичные человеческим. arXiv · Исследования и наука Исследование: как ИИ-модели теряют когнитивные способности в длительных диалогах Новое исследование на arXiv обращает внимание на проблему когнитивного увядания (cognitive atrophy) в поведении больших языковых моделей (LLM). Авторы отмечают, что существующие бенчмарки оценивают знания, безопасность и качество ответов, но не учитывают, как модели ведут себя в длительных, эмоционально насыщенных диалогах. The latest research from Google · Память и RAG Исследование Google: как обучить ИИ разумно рассуждать Исследователи Google представили новый подход к обучению языковых моделей разумному рассуждению на основе байесовских принципов. В статье, опубликованной на официальном блоге Google Research, описывается метод, который позволяет моделям лучше обрабатывать вероятностные данные и принимать решения в условиях неопределенности. Это особенно важно для разработки ИИ-агентов, которые должны работать в динамических и сложных средах, где точность и логичность рассуждений критически важны. Hacker News · Исследования и наука Внутренние механизмы Claude и концепция мировых моделей Исследователи Anthropic раскрыли детали работы функции «цепочки рассуждений» в моделях Claude, позволяющей ИИ демонстрировать промежуточные этапы мышления перед ответом. Этот подход, основанный на анализе скрытых состояний модели, открывает путь к созданию полноценных «мировых моделей», способных не просто предсказывать текст, а выстраивать логические причинно-следственные связи, имитируя когнитивные процессы при решении сложных задач.

← Все материалы