Пользователи и разработчики отмечают рост числа случаев, когда модели семейства Gemini от Google попадают в бесконечные циклы «мышления» при обработке сложных запросов. Проблема проявляется в ситуациях, требующих многошагового рассуждения или анализа больших объемов данных, где модель начинает повторять одни и те же логические операции или выводы, не переходя к финальному ответу.

Подобное поведение существенно влияет на предсказуемость работы систем, интегрирующих данные модели через API. В отличие от стандартных ошибок генерации текста, «зацикливание» приводит к неоправданному расходу токенов и увеличению времени ожидания ответа, что критично для автоматизированных процессов и агентных систем, работающих в режиме реального времени.

На текущий момент сообщество связывает эти сбои с особенностями настройки системных промптов и механизмов цепочки рассуждений (Chain-of-Thought), внедренных в последние версии моделей. Разработчики рекомендуют пересматривать структуру запросов и вводить дополнительные ограничения на количество итераций, чтобы минимизировать риск зависания системы при выполнении задач, требующих глубокой аналитики.