Компания Anthropic опубликовала отчет о втором этапе проекта Fetch, посвященного изучению способности языковых моделей к автономному поиску и извлечению информации из интернета. Исследователи сосредоточились на том, как модели справляются с многоэтапными задачами, требующими навигации по веб-страницам, анализа неструктурированного контента и принятия решений в условиях меняющейся среды.
В ходе экспериментов оценивалась эффективность агентов при выполнении сложных поисковых запросов, где недостаточно простого обращения к поисковой системе. Модели должны были самостоятельно определять релевантность ссылок, обходить элементы интерфейса и адаптироваться к различным структурам сайтов. Основное внимание уделили минимизации ошибок при навигации и повышению точности извлечения данных из динамических источников.
Результаты показывают, что текущие архитектуры демонстрируют прогресс в понимании контекста веб-страниц, однако все еще сталкиваются с трудностями при работе с глубокими иерархиями сайтов. Исследование подчеркивает важность разработки более надежных механизмов планирования для ИИ-агентов, которые взаимодействуют с внешними цифровыми инструментами. Полученные данные станут основой для дальнейшего совершенствования способности моделей к автономному взаимодействию с глобальной сетью.