Исследователи представили Blackknife — метод «черного ящика» для проведения состязательных атак на гетерогенные графовые нейронные сети (HGNN). В отличие от существующих подходов, требующих доступа к градиентам или полным данным, Blackknife эффективно работает в условиях ограниченного числа запросов и отсутствия информации о структуре графа, что критически важно для оценки устойчивости сложных систем.

Гетерогенные графовые нейросети активно используются для анализа данных с различными типами узлов и связей, например, в рекомендательных системах или при выявлении мошенничества. Однако их уязвимость к целенаправленным искажениям данных до сих пор оставалась малоизученной. Новый метод позволяет злоумышленникам находить критические точки воздействия, даже если они имеют доступ только к финальным меткам классов, а не к вероятностным предсказаниям модели.

Алгоритм Blackknife минимизирует количество необходимых запросов к целевой модели, что делает атаку практически незаметной для систем мониторинга. Это исследование подчеркивает необходимость разработки более надежных механизмов защиты для графовых архитектур, работающих с реальными, часто неполными или зашумленными данными в условиях ограниченного доступа к внутренним параметрам системы.

Ключевые факты

  • Blackknife ориентирован на атаку «черного ящика» (black-box), где злоумышленник не знает архитектуру модели или веса.
  • Метод работает в режиме hard-label, то есть использует только итоговые предсказания модели без доступа к «мягким» оценкам (вероятностям).
  • Алгоритм оптимизирован для работы в условиях ограниченного количества запросов (query-limited), что повышает скрытность атаки.
  • Исследование сфокусировано на гетерогенных графовых нейросетях (HGNN), которые сложнее стандартных графовых моделей из-за разнообразия типов узлов и связей.
  • Работа направлена на выявление уязвимостей в системах, где требуется высокая устойчивость к состязательным атакам на графовые структуры.