Исследователи предложили модель «синтаксического обновления убеждений» для объяснения трудностей, возникающих у людей при чтении предложений типа «garden path». В отличие от традиционной метрики лексического удивления (lexical surprisal), которая часто ошибается в таких случаях, новый подход учитывает динамическую переоценку синтаксической структуры при получении новой информации, что повышает точность моделирования когнитивных процессов.
Предложения типа «garden path» создают ложные ожидания: читатель выбирает одну интерпретацию фразы, но критическое слово в конце опровергает её, заставляя перестраивать понимание на лету. Стандартные методы оценки сложности текста, основанные на вероятности появления следующего слова, не учитывают этот механизм «пересмотра убеждений», из-за чего их предсказательная способность в сложных синтаксических конструкциях ограничена.
Авторы работы доказывают, что именно процесс обновления синтаксических гипотез является ключевым драйвером когнитивной нагрузки. Интеграция этого механизма в архитектуры языковых моделей позволяет лучше имитировать человеческое восприятие языка и точнее предсказывать, какие именно участки текста вызывают у людей наибольшее замедление при чтении или непонимание.
Ключевые факты
- Традиционная метрика лексического удивления (lexical surprisal) демонстрирует низкую точность при анализе предложений с ложными синтаксическими ожиданиями.
- Предложенный метод «синтаксического обновления убеждений» (Syntactic Belief Update) моделирует процесс пересмотра структуры предложения при встрече с дезориентирующим словом.
- Исследование подтверждает, что когнитивная сложность обработки текста напрямую зависит от необходимости радикальной смены синтаксической интерпретации, а не только от вероятности появления конкретных лексем.
- Работа вносит вклад в понимание механизмов психолингвистики и совершенствование методов оценки качества генерации и понимания естественного языка современными моделями.