Компания Anthropic заявила о крупнейшей в индустрии атаке методом дистилляции, в ходе которой через платформу Alibaba Cloud было совершено около 28,8 млн мошеннических запросов к API Claude. Злоумышленники использовали эти данные для обучения собственных моделей, нарушая правила использования сервиса и условия интеллектуальной собственности, что привело к значительным финансовым потерям и угрозе безопасности проприетарных технологий.

Атака была направлена на извлечение «знаний» из ответов Claude для последующего копирования поведения модели. Подобные действия, известные как дистилляция, позволяют сторонним разработчикам создавать конкурентные продукты, используя результаты работы чужих дорогостоящих систем. Anthropic утверждает, что масштаб операции указывает на целенаправленную стратегию по обходу ограничений доступа к API.

Инцидент подчеркивает уязвимость современных LLM перед автоматизированным сбором данных. Разработчики моделей вынуждены усиливать системы мониторинга трафика и внедрять более строгие протоколы верификации пользователей, чтобы предотвратить несанкционированное использование результатов инференса для обучения конкурирующих нейросетей.

Ключевые факты

  • Объем несанкционированных запросов к API Claude составил 28,8 млн обращений.
  • Anthropic классифицирует инцидент как крупнейшую в истории атаку методом дистилляции.
  • Злоумышленники использовали инфраструктуру Alibaba Cloud для обхода ограничений.
  • Основная цель атаки — получение данных для обучения собственных моделей на основе ответов Claude.
  • Инцидент привел к необходимости пересмотра политик безопасности и мониторинга API-трафика.