Бывшие сотрудники OpenAI запустили платформу In the Weights, которая позволяет оценить, насколько глубоко информация о конкретных людях «зашита» в веса популярных языковых моделей. Инструмент анализирует способность нейросетей воспроизводить факты о личностях, основываясь исключительно на данных, полученных в процессе обучения. Пользователи могут проверить, как модель «помнит» того или иного человека, и увидеть соответствующий показатель силы связи.

Система присваивает каждой личности балл, отражающий степень представленности данных в обучающей выборке. Максимальное значение достигает 996 пунктов. В топе рейтинга ожидаемо оказались исторические фигуры и мировые знаменитости, такие как Вольфганг Амадей Моцарт, Уильям Шекспир и Тейлор Свифт. Высокие показатели у этих персон объясняются огромным объемом упоминаний в текстах, на которых обучались современные модели.

Этот проект наглядно демонстрирует, как именно распределяются знания внутри нейросетей и какие пласты информации становятся доминирующими в процессе обучения. Подобные инструменты помогают лучше понять природу «памяти» моделей и то, как частота упоминаний в исходных датасетах напрямую влияет на точность и полноту ответов ИИ при запросах о конкретных людях.