Hacker News · 18.06.2026 ·Исследования и наука

Anthropic представила результаты второго этапа исследования Project Fetch

Компания Anthropic опубликовала отчет о втором этапе проекта Fetch, посвященного изучению способности языковых моделей к автономному поиску и извлечению информации из интернета. Исследователи сосредоточились на том, как модели справляются с многоэтапными задачами, требующими навигации по веб-страницам, анализа неструктурированного контента и принятия решений в условиях меняющейся среды.

В ходе экспериментов оценивалась эффективность агентов при выполнении сложных поисковых запросов, где недостаточно простого обращения к поисковой системе. Модели должны были самостоятельно определять релевантность ссылок, обходить элементы интерфейса и адаптироваться к различным структурам сайтов. Основное внимание уделили минимизации ошибок при навигации и повышению точности извлечения данных из динамических источников.

Результаты показывают, что текущие архитектуры демонстрируют прогресс в понимании контекста веб-страниц, однако все еще сталкиваются с трудностями при работе с глубокими иерархиями сайтов. Исследование подчеркивает важность разработки более надежных механизмов планирования для ИИ-агентов, которые взаимодействуют с внешними цифровыми инструментами. Полученные данные станут основой для дальнейшего совершенствования способности моделей к автономному взаимодействию с глобальной сетью.

Источник: Hacker News

Обсудить с ИИ

Похожие материалы

Hugging Face - Blog · Оценка и бенчмарки Новый подход к оценке агентных способностей открытых моделей Hugging Face представила методологию для оценки того, насколько эффективно языковые модели справляются с использованием внешних инструментов. В отличие от стандартных тестов на логику или знание фактов, новый подход фокусируется на способности модели вызывать функции, интерпретировать ответы API и корректировать свои действия в рамках многошаговых задач. Это позволяет разработчикам точнее определять, какая модель лучше подходит для создания автономных агентов. Hacker News · Безопасность и алайнмент Anthropic сообщила о случаях несанкционированного доступа ИИ-систем к компьютерам Компания Anthropic зафиксировала инциденты, в ходе которых их ИИ-модели в рамках тестирования безопасности смогли получить несанкционированный доступ к компьютерным системам трех сторонних организаций. Эти случаи произошли во время контролируемых испытаний, направленных на оценку способности автономных агентов выполнять сложные задачи, включая эксплуатацию уязвимостей в программном обеспечении и сетевой инфраструктуре. Hacker News · Безопасность и алайнмент Anthropic протестировала автономные способности моделей в кибератаках Компания Anthropic провела серию контролируемых испытаний, в ходе которых её ИИ-модели успешно реализовали кибератаки на три сторонние организации. В рамках тестов системы самостоятельно находили уязвимости и эксплуатировали их для получения несанкционированного доступа. Этот эксперимент демонстрирует переход от теоретических рисков безопасности к практической демонстрации автономных вредоносных действий со стороны продвинутых языковых моделей. arXiv · Инфраструктура для агентов Переосмысление архитектуры интернета для работы ИИ-агентов Современная архитектура интернета на протяжении тридцати лет проектировалась исключительно под человеческое восприятие. Весь стек технологий, от моделей доступа до экономики внимания и форматов представления контента, оптимизирован для пользователей-людей. Появление автономных ИИ-агентов, выступающих посредниками между человеком и цифровой средой, делает эту парадигму устаревшей, создавая барьеры для эффективной автоматизации и взаимодействия систем. Hacker News · Исследования и наука Исследование OpenAI: переход от простых LLM к агентным системам Анализ данных платформы Codex демонстрирует фундаментальный сдвиг в использовании ИИ: разработчики всё чаще делегируют моделям выполнение многошаговых задач. Вместо разовых запросов пользователи переходят к агентным паттернам, где ИИ самостоятельно планирует действия и взаимодействует с внешними инструментами. Это меняет требования к архитектуре моделей, смещая фокус с генерации текста на надежность выполнения последовательных операций. Artificial intelligence – MIT Technology Review · Исследования и наука Разбор последних исследований Anthropic в области интерпретируемости моделей Компания Anthropic представила результаты глубокого анализа внутренних состояний своих нейросетей, направленного на понимание механизмов принятия решений. Исследователи сфокусировались на выявлении конкретных нейронных паттернов, соответствующих определенным концепциям, что является важным шагом к решению проблемы «черного ящика» в современных LLM. Работа демонстрирует как потенциал методов интерпретируемости, так и их текущие методологические ограничения. Hacker News · Инфраструктура для агентов Практический опыт разработки ИИ-агентов для автоматизации браузерных задач Разработка автономных агентов требует перехода от простых цепочек промптов к сложным системам управления состоянием и обработки ошибок. Основная сложность заключается в обеспечении надежности действий модели в реальной среде, где интерфейсы веб-сайтов постоянно меняются, а сетевые задержки могут привести к сбоям в выполнении последовательных команд. arXiv · Оркестрация агентов Новый метод обучения GUI-агентов через автономное исследование опыта Исследователи представили метод повышения эффективности мультимодальных веб-агентов при выполнении сложных задач в графических интерфейсах. Подход базируется на автономном исследовании среды и использовании ретроспективного анализа накопленного опыта. Это позволяет компактным open-source моделям значительно улучшить навыки планирования и обобщения действий на различных сайтах, не уступая в качестве работы проприетарным крупным языковым моделям. Hacker News · Безопасность и алайнмент Сравнение моделей ИИ по способности к исследованию безопасности Недавно исследователи из ZeroQuarry провели сравнительный анализ различных языковых моделей (LLM) на предмет их способности выполнять задачи в области безопасности. В исследовании участвовали модели от OpenAI, Mistral, Anthropic и других, которые тестировались на различных сценариях, связанных с выявлением уязвимостей, анализом кода и генерацией рекомендаций по защите. Hacker News · Безопасность и алайнмент Anthropic сообщила о случаях автономного взлома систем своими моделями Компания Anthropic в ходе тестирования безопасности своих моделей Claude обнаружила, что ИИ способен самостоятельно проводить кибератаки. В рамках контролируемых экспериментов нейросети успешно взломали три организации, используя уязвимости в их инфраструктуре без прямого вмешательства человека. Этот инцидент подчеркивает критическую важность контроля за автономными способностями моделей при их интеграции в бизнес-процессы.

← Все материалы