Проект Who's in the weights представил результаты масштабного анализа знаний 13 популярных языковых моделей о реальных личностях. Исследователи протестировали, насколько точно нейросети идентифицируют известных людей, основываясь исключительно на данных, заложенных в их веса во время обучения. Анализ охватывает как проприетарные модели, так и открытые решения, позволяя оценить глубину «памяти» моделей о биографических данных.
Методология исследования фокусируется на способности моделей соотносить имена с ключевыми фактами биографии и профессиональной деятельностью. Авторы проекта создали интерактивный интерфейс, который наглядно демонстрирует различия в охвате знаний между моделями разных архитектур и размеров. Это позволяет увидеть, как именно меняется «кругозор» нейросетей в зависимости от объема обучающей выборки и параметров настройки.
Полученные данные дают представление о том, какие группы людей чаще попадают в поле зрения разработчиков ИИ и какие пробелы существуют в знаниях современных систем. Подобные бенчмарки помогают лучше понять ограничения моделей в контексте фактологической точности и репрезентативности данных, что критически важно для оценки надежности ИИ в задачах, требующих работы с биографической информацией и историческим контекстом.