Компания Anthropic заявила о крупнейшей в истории атаке типа «дистилляция», проведенной Alibaba. По данным разработчика, китайская корпорация использовала API для систематического сбора ответов моделей Claude, чтобы обучить на этих данных собственные нейросети. Это создает серьезные риски для интеллектуальной собственности и безопасности проприетарных технологий, вынуждая отрасль пересматривать правила доступа к API.

Суть атаки заключается в том, что злоумышленник отправляет огромное количество запросов к мощной модели, а затем использует полученные ответы для дообучения или «дистилляции» более компактной и дешевой модели. В результате копия имитирует поведение оригинала, перенимая его способности, но при этом обходя лицензионные ограничения и затраты на разработку фундаментальной архитектуры.

Anthropic утверждает, что кампания Alibaba была беспрецедентной по своим масштабам и интенсивности. Подобные действия ставят под угрозу бизнес-модели компаний, инвестирующих миллиарды долларов в создание передовых LLM. В ответ на инцидент разработчики ужесточают мониторинг трафика и внедряют новые методы обнаружения паттернов, характерных для автоматизированного сбора данных через API.

Ключевые факты

  • Anthropic официально обвинила Alibaba в использовании API для кражи знаний через метод дистилляции моделей.
  • Атака признана крупнейшей в индустрии по объему скомпрометированных данных и количеству запросов.
  • Метод дистилляции позволяет создавать эффективные аналоги моделей, используя ответы более мощных систем для обучения собственных нейросетей.
  • Инцидент спровоцировал пересмотр протоколов безопасности и условий использования API для предотвращения подобных утечек интеллектуальной собственности.
  • Alibaba пока не предоставила развернутых комментариев по поводу обвинений в неправомерном использовании технологий Anthropic.