Hacker News · 26.06.2026 ·Безопасность и алайнмент

Anthropic обвинила Alibaba в масштабном использовании данных для обучения моделей

Компания Anthropic заявила о крупнейшей в индустрии атаке методом дистилляции, в ходе которой через платформу Alibaba Cloud было совершено около 28,8 млн мошеннических запросов к API Claude. Злоумышленники использовали эти данные для обучения собственных моделей, нарушая правила использования сервиса и условия интеллектуальной собственности, что привело к значительным финансовым потерям и угрозе безопасности проприетарных технологий.

Атака была направлена на извлечение «знаний» из ответов Claude для последующего копирования поведения модели. Подобные действия, известные как дистилляция, позволяют сторонним разработчикам создавать конкурентные продукты, используя результаты работы чужих дорогостоящих систем. Anthropic утверждает, что масштаб операции указывает на целенаправленную стратегию по обходу ограничений доступа к API.

Инцидент подчеркивает уязвимость современных LLM перед автоматизированным сбором данных. Разработчики моделей вынуждены усиливать системы мониторинга трафика и внедрять более строгие протоколы верификации пользователей, чтобы предотвратить несанкционированное использование результатов инференса для обучения конкурирующих нейросетей.

Ключевые факты

Объем несанкционированных запросов к API Claude составил 28,8 млн обращений.
Anthropic классифицирует инцидент как крупнейшую в истории атаку методом дистилляции.
Злоумышленники использовали инфраструктуру Alibaba Cloud для обхода ограничений.
Основная цель атаки — получение данных для обучения собственных моделей на основе ответов Claude.
Инцидент привел к необходимости пересмотра политик безопасности и мониторинга API-трафика.

Источник: Hacker News

Обсудить с ИИ

Похожие материалы

Hacker News · Безопасность и алайнмент Anthropic обвинила Alibaba в масштабном копировании своих моделей Компания Anthropic заявила о крупнейшей в истории атаке типа «дистилляция», проведенной Alibaba. По данным разработчика, китайская корпорация использовала API для систематического сбора ответов моделей Claude, чтобы обучить на этих данных собственные нейросети. Это создает серьезные риски для интеллектуальной собственности и безопасности проприетарных технологий, вынуждая отрасль пересматривать правила доступа к API. Ars Technica - All content · Безопасность и алайнмент Anthropic обвинила Alibaba в масштабном копировании модели Claude Компания Anthropic подала иск против Alibaba, обвинив китайского гиганта в организации крупнейшей атаки по извлечению данных из модели Claude. По данным истца, для обхода ограничений и кражи интеллектуальной собственности использовалось 25 000 учетных записей, совершивших более 28,8 миллиона запросов. Инцидент ставит под угрозу безопасность проприетарных технологий и поднимает вопросы защиты моделей от промышленного шпионажа. Hacker News · Безопасность и алайнмент Anthropic обвинила операторов, связанных с Alibaba, в краже данных Claude для обучения Qwen Компания Anthropic заявила о масштабной операции по сбору данных, в ходе которой злоумышленники использовали более 25 000 аккаунтов для автоматизированного взаимодействия с чат-ботом Claude. Целью действий, предположительно связанных с операторами из Alibaba, была «дистилляция» ответов модели для последующего обучения и улучшения китайской языковой модели Qwen. Hacker News · Безопасность и алайнмент Зафиксированы первые случаи атак через косвенные промпт-инъекции в реальных ИИ-агентах Исследователи Unit 42 зафиксировали реальные случаи использования косвенных промпт-инъекций (indirect prompt injection) против ИИ-агентов. Злоумышленники внедряют скрытые инструкции в веб-контент, который затем считывается агентами, заставляя их выполнять несанкционированные действия. Это подтверждает переход теоретических уязвимостей в плоскость практических угроз для автоматизированных систем, использующих LLM для обработки внешних данных. Hacker News · Инфраструктура для агентов Масштабный сбой в работе API моделей Claude Компания Anthropic зафиксировала серьезные технические неполадки, затронувшие работу API для большинства моделей семейства Claude. Пользователи столкнулись с резким ростом количества ошибок при выполнении запросов, что привело к временной деградации сервисов, использующих данные модели для автоматизации и обработки контента. Hacker News · Безопасность и алайнмент Уязвимость медицинских ИИ-моделей: утечка данных через атаки на обучение Исследователи обнаружили критическую уязвимость в медицинских диагностических моделях, позволяющую злоумышленникам извлекать информацию о пациентах из обучающих выборок. С помощью атак типа «инверсия модели» и «извлечение данных» ИИ можно принудить раскрыть конфиденциальные записи, которые использовались при его создании. Это ставит под угрозу приватность данных в здравоохранении и требует пересмотра подходов к защите моделей. Hacker News · Безопасность и алайнмент Использование ИИ-моделей в кибератаках на корпоративные сети Исследователи зафиксировали серию успешных взломов 14 компаний, совершенных злоумышленником с низким уровнем технической подготовки. В ходе атак использовались возможности больших языковых моделей, включая Claude и Codex, для написания вредоносного кода и автоматизации этапов проникновения в инфраструктуру. Использование ИИ позволило атакующему компенсировать недостаток глубоких экспертных знаний, эффективно генерируя эксплойты и обходя стандартные меры защиты. AI News & Artificial Intelligence | TechCrunch · Регулирование и политика Правительство отключило мощную модель Anthropic из-за рисков безопасности Anthropic столкнулась с серьёзными последствиями после обнаружения потенциальной уязвимости в своей модели. Компания выразила недовольство решением регуляторов, которые отозвали модель, развёрнутую для сотен миллионов пользователей. В блоге Anthropic подчеркнули, что риск связан с узкой уязвимостью, а не с системной проблемой. Hacker News · Модели и релизы Сбои в работе моделей Claude: повышенный уровень ошибок Компания Anthropic зафиксировала технические неполадки, приведшие к росту частоты ошибок при обработке запросов к моделям Claude 3 Opus (версии 4.6, 4.7 и 4.8) и Claude 3.5 Sonnet (версия 4.6). Проблема затронула стабильность ответов API и веб-интерфейса, что привело к временным сбоям в работе сервисов, использующих данные нейросети. Hacker News · Безопасность и алайнмент Хакеры используют Claude и Codex для взлома компаний Исследователи обнаружили, что злоумышленники применяют модели Claude и Codex для взлома корпоративных систем. В утечках логов зафиксированы случаи, когда хакеры использовали эти ИИ-модели для генерации вредоносного кода и автоматизации атак.

← Все материалы