Новое исследование показало, что языковые модели (LLM) демонстрируют уникальные «предпочтения» в генерации контента, когда им не дают конкретных указаний. Учёные обнаружили, что модели из разных семейств по-разному заполняют пробелы в информации.
GPT-модели склонны генерировать код и математические примеры. Llama, напротив, предпочитает создавать нарративы и истории. DeepSeek часто выводит религиозный контент, а Qwen — экзаменационные вопросы. Эти различия связаны с особенностями обучения и данных, на которых тренировались модели.
Исследование также выявило, что модели могут демонстрировать неожиданные знания, даже если их не обучали на соответствующих данных. Например, некоторые модели способны генерировать технические термины или философские рассуждения без явного обучения в этих областях.
Результаты подчёркивают важность понимания внутренних механизмов языковых моделей и их потенциальных применений. Разработчики могут использовать эти знания для улучшения качества генерации и снижения рисков нежелательного контента.
