Исследователи представили подход XGBoost-Forget, предназначенный для удаления влияния конкретных записей из уже обученных моделей градиентного бустинга. В отличие от большинства существующих методов машинного обучения, которые ориентированы на нейронные сети и работу с изображениями, данная разработка сфокусирована на табличных данных. Это критически важно для систем обнаружения сетевых вторжений, где оперативное обновление моделей без необходимости их полного переобучения является ключевым требованием.
Технология позволяет эффективно «забывать» информацию о конкретных инцидентах или пользователях, что помогает соблюдать требования конфиденциальности и актуализировать модели безопасности в режиме реального времени. Авторы протестировали метод на специализированных наборах данных для анализа сетевого трафика, подтвердив возможность корректного удаления данных при сохранении общей точности предсказаний модели.
Данное решение закрывает пробел в области машинного обучения, где доминировали методы для глубокого обучения. Применение XGBoost-Forget позволяет оптимизировать процессы поддержки моделей в корпоративных средах, где часто требуется удаление устаревших или скомпрометированных данных из обучающих выборок без затратных вычислительных операций по повторному обучению с нуля.