Профессор Мелани Митчелл в своей статье для Yale Review анализирует феномен «зубчатого интеллекта» (jagged intelligence) у современных языковых моделей. Автор отмечает, что ИИ демонстрирует крайне неравномерные способности: системы могут блестяще справляться со сложными логическими задачами или написанием кода, но при этом совершать элементарные ошибки в простых вопросах, требующих здравого смысла или понимания физического мира.

Основная проблема заключается в отсутствии у моделей устойчивой внутренней модели реальности. Поведение нейросетей часто оказывается непредсказуемым: небольшое изменение в формулировке запроса может привести к кардинально иному результату. Это делает текущие методы оценки производительности, основанные на средних показателях по бенчмаркам, недостаточно надежными для понимания реальных возможностей систем в критических сценариях.

Исследование подчеркивает, что текущий прогресс в области LLM опирается на статистические закономерности в огромных массивах данных, а не на формирование глубокого концептуального понимания. Такая архитектура создает риски при внедрении ИИ в сферы, где требуется стабильность и предсказуемость. Митчелл призывает к пересмотру подходов к тестированию моделей, чтобы выявлять не только их сильные стороны, но и скрытые пробелы в логике, которые могут проявляться в неожиданных ситуациях.