Компания Anthropic заявила о масштабной операции по сбору данных, в ходе которой злоумышленники использовали более 25 000 аккаунтов для автоматизированного взаимодействия с чат-ботом Claude. Целью действий, предположительно связанных с операторами из Alibaba, была «дистилляция» ответов модели для последующего обучения и улучшения китайской языковой модели Qwen.
Инцидент подчеркивает растущую проблему защиты интеллектуальной собственности в эпоху больших языковых моделей. Компании-разработчики всё чаще сталкиваются с попытками конкурентов использовать их продукты в качестве «учителей» для тренировки собственных нейросетей. Anthropic утверждает, что подобные действия нарушают условия использования сервиса, так как направлены на извлечение данных для создания конкурирующих решений.
Для предотвращения подобных атак разработчики внедряют более строгие системы мониторинга трафика и поведенческого анализа. В данном случае выявление аномальной активности позволило заблокировать тысячи аккаунтов, которые имитировали поведение реальных пользователей, но при этом систематически запрашивали специфические данные для обучения сторонних моделей.
Ключевые факты
- Anthropic зафиксировала использование более 25 000 аккаунтов для автоматизированного сбора данных.
- Целью операции было получение ответов от Claude для последующего обучения модели Qwen от Alibaba.
- Метод «дистилляции» моделей используется для передачи знаний от более мощных нейросетей к менее ресурсоемким аналогам.
- Компания Anthropic классифицировала данные действия как нарушение правил использования платформы и предприняла меры по блокировке учетных записей.