Исследователи предложили метод повышения качества творческих текстов, генерируемых большими языковыми моделями, с помощью управления энтропией распределения вероятностей токенов. Вместо стандартного жадного поиска или случайного сэмплирования, подход динамически регулирует «непредсказуемость» выбора слов, что позволяет моделям избегать клише и создавать более выразительные, разнообразные и стилистически связные повествования в задачах креативного письма.

Традиционные методы декодирования часто приводят либо к повторам, либо к потере логики при попытке сделать текст более «творческим». Новый подход анализирует энтропию на каждом шаге генерации, позволяя модели переключаться между более консервативными и более рискованными вариантами выбора токенов. Это помогает удерживать баланс между грамматической корректностью и лексическим разнообразием, что критически важно для художественных текстов.

Метод не требует дообучения (fine-tuning) весов модели, что делает его легко применимым к существующим LLM через изменение параметров инференса. Эксперименты показывают, что такой контроль энтропии позволяет значительно снизить количество «галлюцинаций» в стиле и повысить вовлеченность читателя за счет более точного подбора метафор и описательных конструкций.

Ключевые факты

  • Метод использует динамическую настройку энтропии для управления вероятностным распределением токенов при генерации.
  • Подход позволяет избежать деградации текста, характерной для стандартных методов повышения креативности, таких как чрезмерное увеличение температуры.
  • Техника не требует изменения архитектуры или весов нейросети, работая на уровне алгоритмов декодирования.
  • Применение метода повышает лексическое разнообразие текстов без потери логической связности повествования.