arXiv · 12.06.2026 ·Исследования и наука

Исследование скрытых ошибок в работе ИИ-агентов

Исследователи из Arxiv представили longitudinal study о скрытых ошибках в работе ИИ-агентов, которые работают как долгосрочные автономные системы. В исследовании анализируется система личного ассистента, работающая с марта 2026 года. Система включает в себя около 40 запланированных задач, 8 поставщиков LLM, инструментальный прокси и базу знаний.

Основное внимание уделено так называемым "тихим" ошибкам — ситуациям, когда система продолжает работать, но результаты становятся некорректными. Такие ошибки могут оставаться незамеченными долгое время, что делает их особенно опасными для долгосрочных агентов.

Авторы выделяют несколько типов ошибок, включая проблемы с планированием задач, взаимодействием с инструментами и управлением памятью. Например, ошибки в планировании могут привести к тому, что задачи выполняются не в том порядке или с задержками, что влияет на общую производительность системы.

Исследование подчеркивает важность мониторинга и диагностики в системах ИИ-агентов. Авторы предлагают несколько рекомендаций по улучшению надежности таких систем, включая более строгий контроль за выполнением задач и улучшенные механизмы обнаружения ошибок.

Для разработчиков ИИ-агентов, таких как Jarv, это исследование является важным источником информации о потенциальных проблемах и способах их предотвращения. Понимание типов ошибок и их последствий может помочь в создании более надежных и устойчивых систем.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

arXiv · Оценка и бенчмарки Исследование процесса возникновения ошибок у ИИ-агентов в CLI Исследователи проанализировали траектории работы ИИ-агентов в терминальных средах, рассматривая ошибки не как финальный результат, а как динамический процесс. Анализ показал, что большинство сбоев в разработке ПО возникают из-за накопления неверных решений на ранних этапах, что позволяет по-новому взглянуть на отладку и повышение надежности автономных систем программирования. Hacker News · Рынок труда и экономика Скрытая человеческая работа за ИИ-ассистентами Исследование Work AI Institute от Glean раскрывает, насколько сильно ИИ-ассистенты зависят от скрытого человеческого труда. Авторы вводят термины «ботситтинг» (бот-сидение) и «ботшиттинг» (бот-дерьмо), чтобы описать, как сотрудники вынуждены исправлять ошибки ИИ и контролировать его работу. Это создаёт новую категорию рабочих обязанностей, которая не учитывается в официальных описаниях должностей. Hugging Face - Blog · Безопасность и алайнмент Исследование MosaicLeaks: уязвимости ИИ-агентов при работе с данными Исследователи представили проект MosaicLeaks, посвященный анализу безопасности автономных ИИ-агентов в условиях работы с конфиденциальными данными. В ходе экспериментов изучалось, насколько эффективно модели могут защищать приватную информацию при выполнении сложных задач, требующих доступа к внешним источникам и базам данных. Основное внимание было уделено сценариям, в которых агент может непреднамеренно раскрыть чувствительные сведения в процессе обработки запросов или при взаимодействии с API. Hacker News · Исследования и наука Исследование: эффективность ИИ-агентов в автоматизации ревью кода Новое исследование, опубликованное на платформе arXiv, анализирует потенциал специализированных ИИ-агентов в процессе проверки программного кода. Авторы работы сравнивают качество и скорость поиска уязвимостей, логических ошибок и несоответствий стандартам разработки при участии автоматизированных систем и квалифицированных инженеров. Результаты показывают, что современные агентные архитектуры способны обнаруживать критические дефекты с точностью, сопоставимой с экспертной оценкой, при значительном сокращении времени ожидания обратной связи. arXiv · Исследования и наука Как разработчики создают ИИ-агентов для программирования: результаты исследования Исследователи проанализировали подходы к созданию ИИ-агентов для разработки ПО, изучив опыт практиков в индустрии. Работа раскрывает ключевые паттерны проектирования, используемые стеки технологий и основные барьеры, с которыми сталкиваются инженеры при внедрении автономных систем для работы с кодовыми базами. Исследование дает понимание реальных процессов разработки, выходящих за рамки академических бенчмарков и лабораторных экспериментов. Hacker News · Память и RAG Исследование: случайный прорыв в памяти ИИ-агентов Исследователи из Coder Company случайно достигли нового уровня в области памяти ИИ-агентов, используя подход, основанный на AI-компаньонах. В ходе эксперимента они обнаружили, что агенты, взаимодействующие друг с другом, способны сохранять и использовать информацию более эффективно, чем традиционные методы. Hacker News · Безопасность и алайнмент Исследование: как пользовательский контент может отравить ИИ-агентов Исследователи из MIT и Университета Карнеги-Меллона опубликовали работу, в которой показано, как пользовательский контент может «отравить» ИИ-агентов, особенно тех, которые работают с глубокими исследованиями. В статье рассматриваются сценарии, в которых злоумышленники могут встраивать вредоносные данные в пользовательские запросы, что приводит к искажению работы агентов. Hacker News · Исследования и наука Исследование: как ИИ-агенты справляются с интеграцией кода после слияния Исследователи проанализировали реальную эффективность ИИ-агентов при работе с кодовыми базами после выполнения операций слияния (merge). Работа фокусируется на том, насколько успешно модели справляются с разрешением конфликтов и поддержанием работоспособности системы в условиях динамических изменений. Результаты показывают критические разрывы между теоретическими способностями моделей и их практической применимостью в сложных CI/CD пайплайнах. arXiv · Инфраструктура для агентов Исследование цепочек поставок навыков для ИИ-агентов Исследователи представили концепцию «цепочек поставок навыков» (Agent Skill Supply Chains) для ИИ-агентов, выявив критическую проблему непрозрачности зависимостей в агентных системах. По мере усложнения навыков, их версии и происхождение становятся скрытыми, что ведет к дублированию кода и несовместимости компонентов. Авторы предлагают систематизировать управление этими зависимостями для повышения надежности и воспроизводимости агентных архитектур. arXiv · Оценка и бенчмарки Исследование методов оценки агентных систем для анализа данных Исследователи проанализировали надежность автоматизированных систем оценки для агентных инструментов анализа данных. В работе подчеркивается, что многошаговая природа таких агентов, генерирующих код и интерпретации, усложняет верификацию результатов. Авторы предлагают методологию разграничения реальных ошибок агента и артефактов, возникающих из-за несовершенства самих алгоритмов оценки, что критически важно для повышения точности тестирования сложных ИИ-систем.

← Все материалы