Исследователи обнаружили, что инструмент Claude Code от Anthropic добавляет скрытые стеганографические метки в системные промпты при взаимодействии с API. Эти маркеры позволяют компании идентифицировать запросы, исходящие от конкретных экземпляров CLI-инструмента, что вызывает вопросы о прозрачности работы проприетарных агентных решений и методах отслеживания пользовательской активности в рамках экосистемы Claude.
Стеганография в данном контексте реализована через внедрение специфических токенов или паттернов в структуру запроса, которые не влияют на логику выполнения задачи, но служат уникальным идентификатором. Подобная практика позволяет разработчикам моделей собирать детальную телеметрию о том, как именно инструменты автоматизации используют API, какие последовательности команд вызывают ошибки или приводят к наиболее эффективным результатам.
Для пользователей и разработчиков это означает, что взаимодействие с агентными инструментами становится менее анонимным, чем кажется на первый взгляд. Хотя подобные методы часто используются для отладки и предотвращения злоупотреблений, их скрытый характер подчеркивает растущую тенденцию к усилению контроля над тем, как сторонние приложения взаимодействуют с крупными языковыми моделями.
Ключевые факты
- Claude Code использует скрытые маркеры в системных промптах для идентификации запросов.
- Метод основан на стеганографии, позволяющей встраивать данные без изменения функционального смысла запроса.
- Идентификация позволяет Anthropic отслеживать поведение конкретных инстансов CLI-инструмента.
- Исследование указывает на потенциальные риски для приватности и прозрачности при использовании агентных инструментов с закрытым исходным кодом.