Авторы статьи в Nature Communications проанализировали проблему «загрязнения» данных в онлайн-опросах, вызванного использованием LLM участниками исследований. Использование ИИ для генерации ответов искажает результаты поведенческих экспериментов, делая их менее достоверными. Исследователи предложили методы обнаружения и фильтрации таких ответов, чтобы сохранить целостность научных данных в эпоху повсеместного доступа к генеративным моделям.

Проблема заключается в том, что респонденты всё чаще делегируют заполнение анкет нейросетям, что приводит к появлению статистических аномалий и потере естественной вариативности человеческих ответов. Это ставит под угрозу валидность психологических и социологических исследований, которые традиционно опираются на краудсорсинговые платформы. Авторы работы подчеркивают, что без внедрения новых инструментов верификации результаты многих текущих исследований могут оказаться нерепрезентативными.

Для борьбы с этим явлением предложен комплексный подход, включающий как технические методы анализа текста, так и изменения в дизайне самих опросников. Использование специфических типов вопросов, на которые LLM отвечают предсказуемо или, наоборот, ошибочно, позволяет эффективно выявлять нечестных участников. Эти рекомендации направлены на повышение прозрачности и воспроизводимости научных работ в условиях стремительной автоматизации интеллектуального труда.

Ключевые факты

  • Исследование опубликовано в журнале Nature Communications и сфокусировано на рисках искажения данных в поведенческих науках.
  • Авторы выявили, что ответы, сгенерированные LLM, демонстрируют высокую степень лингвистической однородности, что позволяет отличать их от человеческих.
  • Предложенные методы включают использование «контрольных вопросов» и анализ метаданных сессий для выявления автоматизированного ввода.
  • Работа подчеркивает необходимость пересмотра стандартов сбора данных на платформах для краудсорсинга в связи с доступностью ИИ-инструментов.