Hacker News · 25.06.2026 ·Модели и релизы

Анализ процесса «мышления» моделей Gemini

Исследователи получили доступ к скрытым этапам рассуждения моделей Gemini, которые обычно остаются скрытыми от пользователя. Анализ показал, что модель выполняет серию промежуточных шагов перед выдачей финального ответа, что проливает свет на внутренние механизмы обработки запросов и логику принятия решений в современных мультимодальных системах Google.

Доступ к этим «мыслительным процессам» позволяет лучше понять, как именно модель структурирует сложные задачи, выявляет противоречия и корректирует свои ответы в процессе генерации. Это подтверждает гипотезу о том, что современные LLM используют скрытые цепочки рассуждений (Chain-of-Thought), даже если интерфейс не отображает их явно.

Подобная прозрачность критически важна для отладки моделей и понимания их ограничений. Наблюдение за тем, как ИИ переходит от анализа условий задачи к синтезу ответа, помогает разработчикам выявлять этапы, на которых возникают галлюцинации или логические ошибки. Это открывает новые возможности для интерпретируемости нейросетей и их более точной настройки.

Ключевые факты

Исследование сфокусировано на скрытых этапах рассуждения (hidden reasoning traces) моделей семейства Gemini.
Процесс «мышления» включает промежуточную генерацию токенов, которые не выводятся в стандартный чат-интерфейс.
Анализ подтверждает использование внутренних механизмов самокоррекции и поэтапного планирования при решении сложных логических задач.
Полученные данные позволяют исследователям проводить более глубокий аудит безопасности и надежности моделей Google.

Источник: Hacker News

Обсудить с ИИ

Похожие материалы

Hacker News · Оценка и бенчмарки Проблемы с логическими циклами в моделях Gemini Пользователи и разработчики отмечают рост числа случаев, когда модели семейства Gemini от Google попадают в бесконечные циклы «мышления» при обработке сложных запросов. Проблема проявляется в ситуациях, требующих многошагового рассуждения или анализа больших объемов данных, где модель начинает повторять одни и те же логические операции или выводы, не переходя к финальному ответу. The latest research from Google · Исследования и наука Исследование Google: как цепочки рассуждений улучшают извлечение знаний из LLM Исследователи Google представили метод, который значительно повышает точность извлечения фактов из внутренней памяти больших языковых моделей. Вместо прямого запроса модель сначала генерирует цепочку рассуждений, что позволяет ей эффективнее активировать параметрические знания. Этот подход помогает преодолеть ограничения стандартных моделей при ответе на вопросы, требующие глубокого контекстного понимания или редких данных. arXiv · Исследования и наука Исследование прозрачности логических выводов модели DiffusionGemma Исследователи проанализировали прозрачность процесса принятия решений в модели DiffusionGemma. Основной вопрос работы заключается в том, как архитектурные особенности модели, выполняющей значительную часть вычислений в непрерывном латентном пространстве, влияют на интерпретируемость её логических выводов. Понимание того, как именно нейросеть приходит к конкретному результату, критически важно для отладки поведения системы, предотвращения ошибок и минимизации рисков нецелевого использования технологий. Google DeepMind News · Исследования и наука Gemini for Science: инструменты для научных открытий DeepMind представила Gemini for Science — набор инструментов и экспериментов, направленных на расширение масштабов и точности научных исследований. Этот проект включает в себя модели, способные обрабатывать и анализировать большие объемы научных данных, а также инструменты для автоматизации экспериментов и моделирования. arXiv · Исследования и наука Как цепочки рассуждений влияют на ответы ИИ-моделей Исследователи изучили, как цепочки рассуждений (Chain-of-Thought, CoT) влияют на точность ответов языковых моделей. Они выяснили, что не все шаги в цепочке одинаково важны для итогового результата. Для оценки значимости каждого шага использовался метод раннего выхода (early exit), который позволяет определить, насколько конкретный шаг влияет на конечный ответ. The latest research from Google · Память и RAG Исследование Google: как обучить ИИ разумно рассуждать Исследователи Google представили новый подход к обучению языковых моделей разумному рассуждению на основе байесовских принципов. В статье, опубликованной на официальном блоге Google Research, описывается метод, который позволяет моделям лучше обрабатывать вероятностные данные и принимать решения в условиях неопределенности. Это особенно важно для разработки ИИ-агентов, которые должны работать в динамических и сложных средах, где точность и логичность рассуждений критически важны. MarkTechPost · Модели и релизы Google представил Gemini-SQL2 с точностью 80.04% на BIRD leaderboard Google Research анонсировал Gemini-SQL2 — модель для преобразования текста в SQL-запросы, основанную на Gemini 3.1 Pro. Она показала 80.04% точность выполнения на BIRD single-model leaderboard, что делает её одной из лучших в своей категории. Этот показатель измеряет способность модели генерировать SQL-запросы, которые корректно выполняются на базе данных, и соответствует лучшим результатам в отрасли. Google DeepMind News · Модели и релизы Gemini 3.1 Pro от DeepMind для сложных задач DeepMind представила новую модель Gemini 3.1 Pro, ориентированную на решение сложных задач, где требуется не просто ответ, а глубокий анализ и понимание контекста. Модель демонстрирует улучшенные способности в обработке сложных запросов, что делает её перспективной для применения в различных областях, включая разработку ИИ-агентов. Google DeepMind News · Модели и релизы Gemini 3.5 от DeepMind: интеллект с возможностью действия DeepMind представила новую модель Gemini 3.5, которая отличается от предыдущих версий способностью выполнять сложные, агентские рабочие процессы. Это значительный шаг вперёд, так как модель не только понимает контекст, но и может активно взаимодействовать с окружающей средой для достижения целей. Gemini 3.5 построена на архитектуре, которая позволяет ей интегрироваться с различными инструментами и системами, что делает её полезной для автоматизации сложных задач. Hacker News · Инфраструктура для агентов Google представила возможность управления компьютером для модели Gemini 2.0 Flash Google интегрировала в модель Gemini 2.0 Flash функцию компьютерного взаимодействия (computer use), позволяющую ИИ автономно управлять интерфейсом ОС. Система способна воспринимать экран как последовательность скриншотов, анализировать элементы управления и выполнять действия: перемещать курсор, кликать, вводить текст и запускать приложения для решения многошаговых задач в реальном времени.

← Все материалы