Hacker News · 25.06.2026 ·Безопасность и алайнмент

Anthropic обвинила Alibaba в масштабном копировании своих моделей

Компания Anthropic заявила о крупнейшей в истории атаке типа «дистилляция», проведенной Alibaba. По данным разработчика, китайская корпорация использовала API для систематического сбора ответов моделей Claude, чтобы обучить на этих данных собственные нейросети. Это создает серьезные риски для интеллектуальной собственности и безопасности проприетарных технологий, вынуждая отрасль пересматривать правила доступа к API.

Суть атаки заключается в том, что злоумышленник отправляет огромное количество запросов к мощной модели, а затем использует полученные ответы для дообучения или «дистилляции» более компактной и дешевой модели. В результате копия имитирует поведение оригинала, перенимая его способности, но при этом обходя лицензионные ограничения и затраты на разработку фундаментальной архитектуры.

Anthropic утверждает, что кампания Alibaba была беспрецедентной по своим масштабам и интенсивности. Подобные действия ставят под угрозу бизнес-модели компаний, инвестирующих миллиарды долларов в создание передовых LLM. В ответ на инцидент разработчики ужесточают мониторинг трафика и внедряют новые методы обнаружения паттернов, характерных для автоматизированного сбора данных через API.

Ключевые факты

Anthropic официально обвинила Alibaba в использовании API для кражи знаний через метод дистилляции моделей.
Атака признана крупнейшей в индустрии по объему скомпрометированных данных и количеству запросов.
Метод дистилляции позволяет создавать эффективные аналоги моделей, используя ответы более мощных систем для обучения собственных нейросетей.
Инцидент спровоцировал пересмотр протоколов безопасности и условий использования API для предотвращения подобных утечек интеллектуальной собственности.
Alibaba пока не предоставила развернутых комментариев по поводу обвинений в неправомерном использовании технологий Anthropic.

Источник: Hacker News

Обсудить с ИИ

Похожие материалы

Hacker News · Безопасность и алайнмент Anthropic обвинила операторов, связанных с Alibaba, в краже данных Claude для обучения Qwen Компания Anthropic заявила о масштабной операции по сбору данных, в ходе которой злоумышленники использовали более 25 000 аккаунтов для автоматизированного взаимодействия с чат-ботом Claude. Целью действий, предположительно связанных с операторами из Alibaba, была «дистилляция» ответов модели для последующего обучения и улучшения китайской языковой модели Qwen. AI News & Artificial Intelligence | TechCrunch · Регулирование и политика Правительство отключило мощную модель Anthropic из-за рисков безопасности Anthropic столкнулась с серьёзными последствиями после обнаружения потенциальной уязвимости в своей модели. Компания выразила недовольство решением регуляторов, которые отозвали модель, развёрнутую для сотен миллионов пользователей. В блоге Anthropic подчеркнули, что риск связан с узкой уязвимостью, а не с системной проблемой. Hacker News · Регулирование и политика Агентство национальной безопасности США потеряло доступ к модели Anthropic Агентство национальной безопасности (АНБ) США лишилось доступа к передовой ИИ-модели компании Anthropic из-за возникших разногласий по условиям использования. Конфликт возник на фоне ужесточения политики разработчиков ИИ в отношении государственных структур, что ставит под вопрос возможности спецслужб по интеграции коммерческих нейросетей в разведывательные операции и аналитические процессы, требующие высокого уровня безопасности и контроля данных. Hacker News · Безопасность и алайнмент Результаты тестирования ИИ-моделей Anthropic в закрытых системах АНБ В ходе недавних испытаний по методу red-teaming модель Mythos от компании Anthropic продемонстрировала способность к обходу систем защиты, используемых Агентством национальной безопасности США. В рамках контролируемого эксперимента ИИ-система за несколько часов получила доступ к значительному объему классифицированных данных, имитируя действия злоумышленника внутри защищенного периметра. Эти результаты стали одним из ключевых факторов, повлиявших на решение правительства США ограничить доступ к наиболее мощным версиям моделей Anthropic для широкого круга пользователей. Hacker News · Бизнес и инвестиции Anthropic отключила Mythos после письма инвестора Anthropic временно отключила доступ к своей модели Mythos после того, как получила письмо от одного из инвесторов, Джоэла Лутника. В письме Лутник выразил обеспокоенность тем, что модель может быть использована для генерации дезинформации и манипуляций. Hacker News · Безопасность и алайнмент Использование ИИ-моделей в кибератаках на корпоративные сети Исследователи зафиксировали серию успешных взломов 14 компаний, совершенных злоумышленником с низким уровнем технической подготовки. В ходе атак использовались возможности больших языковых моделей, включая Claude и Codex, для написания вредоносного кода и автоматизации этапов проникновения в инфраструктуру. Использование ИИ позволило атакующему компенсировать недостаток глубоких экспертных знаний, эффективно генерируя эксплойты и обходя стандартные меры защиты. The Verge · Регулирование и политика Anthropic ограничила доступ к новым моделям из-за экспортного контроля Компания Anthropic была вынуждена временно приостановить доступ к своим новейшим моделям Fable 5 и Mythos 5 для широкого круга пользователей. Причиной стало внезапное распоряжение администрации США, связанное с ужесточением правил экспортного контроля в сфере технологий искусственного интеллекта. Требования регулятора распространяются не только на зарубежных клиентов, но и на иностранных граждан, находящихся на территории Соединенных Штатов, включая сотрудников самой компании. The Verge · Регулирование и политика Anthropic блокирует доступ к новым моделям Fable 5 и Mythos 5 по требованию Белого дома Anthropic столкнулась с новым конфликтом с правительством США. После запуска моделей Fable 5 и Mythos 5, которые компания назвала самыми мощными на рынке, Белый дом потребовал ограничить доступ к ним для иностранных пользователей. Это требование было предъявлено всего через три дня после релиза моделей, 12 июня. arXiv · Безопасность и алайнмент Исследование уязвимости моделей Anthropic к автоматическим атакам Учёные провели масштабное исследование устойчивости моделей Fable 5 и Opus 4.8 от Anthropic к автоматическим атакам. В ходе работы использовались четыре типа атак, направленных на 7 826 вредоносных намерений, охватывающих десять категорий потенциального вреда.

← Все материалы