Исследователи представили метод обнаружения скрытых процессов обучения нейросетей, основанный на анализе аппаратной телеметрии графических процессоров. В основе подхода лежит использование данных NVML, которые позволяют отслеживать физические параметры работы GPU без доступа к содержимому обрабатываемых данных. Это обеспечивает конфиденциальность вычислений, одновременно позволяя классифицировать характер нагрузки на оборудование.

Текущие инициативы по контролю за вычислительными мощностями часто опираются на мониторинг рабочих нагрузок, однако эффективность таких систем зависит от их устойчивости к попыткам обхода. Авторы работы протестировали надежность классификации задач в условиях состязательных атак, когда разработчики пытаются скрыть факт обучения модели. Анализ показал, что даже при попытках маскировки, физические эффекты вычислений, такие как энергопотребление и паттерны использования памяти, создают устойчивые сигналы, которые невозможно полностью скрыть без существенного снижения производительности.

Данное исследование демонстрирует возможность создания систем контроля за использованием ИИ-инфраструктуры, которые не требуют глубокого вмешательства в программную среду. Метод позволяет выявлять масштабные вычислительные процессы, потенциально нарушающие политики безопасности или регуляторные требования, используя лишь базовые показатели работы оборудования. Это открывает новые возможности для аудита крупных кластеров и обеспечения прозрачности в использовании высокопроизводительных вычислительных ресурсов.