Исследование, опубликованное в журнале PNAS, показало, что крупные языковые модели успешно проходят стандартный трёхсторонний тест Тьюринга. В эксперименте участвовали 1600 человек, которые общались с ИИ-моделями и людьми, а затем пытались определить, кто из собеседников — человек, а кто — ИИ. Результаты показали, что участники не смогли надёжно различить ИИ и человека, что свидетельствует о высоком уровне человеко-подобности современных языковых моделей.

Тест Тьюринга, предложенный в 1950 году, изначально был разработан для оценки способности машины имитировать человеческое мышление. В данном исследовании использовался трёхсторонний вариант теста, где участники общались с двумя собеседниками — одним человеком и одной ИИ-моделью. Участники должны были определить, кто из них кто. Результаты показали, что люди не смогли надёжно различить ИИ и человека, что указывает на значительный прогресс в развитии языковых моделей.

Этот результат имеет важные последствия для восприятия ИИ обществом. Если люди не могут надёжно различить ИИ и человека, это может повлиять на доверие к ИИ-технологиям и их использование в различных сферах, включая образование, здравоохранение и бизнес. Кроме того, это исследование подчёркивает необходимость разработки более прозрачных и этичных подходов к созданию и использованию ИИ-моделей.

Для разработчиков ИИ-агентов этот результат также важен, так как он показывает, что современные языковые модели могут успешно имитировать человеческое поведение. Это открывает новые возможности для создания более естественных и эффективных ИИ-агентов, которые могут взаимодействовать с людьми в различных контекстах. Однако это также поднимает вопросы о необходимости разработки более сложных методов оценки и контроля ИИ, чтобы обеспечить их безопасное и этичное использование.