Исследователи проанализировали 87 существующих серверов протокола Model Context Protocol (MCP), оценив их на предмет безопасности и корректности взаимодействия с ИИ-агентами. Проект представил публичный лидерборд, который ранжирует инструменты по уровню «агентной гигиены», помогая разработчикам выбирать надежные компоненты для интеграции в свои системы и минимизировать риски при предоставлении агентам доступа к внешним данным и функциям.

Протокол MCP становится стандартом для подключения LLM к локальным и удаленным источникам данных, однако отсутствие единых стандартов безопасности создает уязвимости. Авторы исследования сфокусировались на том, как именно серверы обрабатывают запросы и какие права доступа они запрашивают у модели. Лидерборд классифицирует инструменты по их способности безопасно делегировать задачи, что критически важно для предотвращения несанкционированных действий агентов в инфраструктуре пользователя.

Данная инициатива направлена на создание прозрачной экосистемы, где разработчики могут видеть, какие MCP-серверы следуют лучшим практикам, а какие требуют доработки. Оценка учитывает не только функциональность, но и то, насколько предсказуемо серверы реагируют на команды, что является ключевым фактором для стабильной работы агентных систем в продакшене.

Ключевые факты

  • Проанализировано 87 различных MCP-серверов, доступных в открытом доступе.
  • Основной метрикой оценки стала «агентная гигиена» (agent-authority hygiene), определяющая безопасность взаимодействия модели с внешним инструментом.
  • Лидерборд предоставляет сравнительную таблицу с ранжированием серверов по качеству реализации протокола.
  • Исследование направлено на выявление потенциальных векторов атак при использовании стандартных интеграций в агентных архитектурах.