Исследователи представили новый подход к обеспечению безопасности машинного обучения, направленный на выявление вредоносного кода, скрытого внутри весов и архитектур предобученных моделей. Традиционные методы защиты, основанные на статическом анализе форматов файлов и поиске известных сигнатур атак, часто оказываются неэффективными против современных угроз, способных обходить стандартные фильтры.

Предложенная методика фокусируется на динамическом анализе поведения модели на протяжении всего её жизненного цикла. Система отслеживает выполнение операций в процессе инференса, выявляя аномалии, которые могут указывать на внедренные вредоносные инструкции. Такой подход позволяет обнаруживать скрытые угрозы, даже если они не соответствуют ранее зафиксированным шаблонам атак, обеспечивая более глубокий уровень проверки целостности моделей перед их развертыванием в производственных средах.

Разработка решает проблему доверия к сторонним ML-артефактам, которые становятся всё более распространенными в корпоративных инфраструктурах. Внедрение динамического контроля позволяет минимизировать риски эксплуатации уязвимостей, встроенных в модели на этапе обучения или передачи, и создает основу для более надежных пайплайнов использования ИИ-решений в критически важных бизнес-процессах.