arXiv · 17.06.2026 ·Машинное обучение

Метод удаления данных из обученных моделей XGBoost

Исследователи представили подход XGBoost-Forget, предназначенный для удаления влияния конкретных записей из уже обученных моделей градиентного бустинга. В отличие от большинства существующих методов машинного обучения, которые ориентированы на нейронные сети и работу с изображениями, данная разработка сфокусирована на табличных данных. Это критически важно для систем обнаружения сетевых вторжений, где оперативное обновление моделей без необходимости их полного переобучения является ключевым требованием.

Технология позволяет эффективно «забывать» информацию о конкретных инцидентах или пользователях, что помогает соблюдать требования конфиденциальности и актуализировать модели безопасности в режиме реального времени. Авторы протестировали метод на специализированных наборах данных для анализа сетевого трафика, подтвердив возможность корректного удаления данных при сохранении общей точности предсказаний модели.

Данное решение закрывает пробел в области машинного обучения, где доминировали методы для глубокого обучения. Применение XGBoost-Forget позволяет оптимизировать процессы поддержки моделей в корпоративных средах, где часто требуется удаление устаревших или скомпрометированных данных из обучающих выборок без затратных вычислительных операций по повторному обучению с нуля.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

arXiv · Обучение и дообучение InstantForget удаляет вредоносные данные без переобучения модели Исследователи из MIT и других университетов представили метод InstantForget, который позволяет удалять вредоносные данные (backdoors) из обученных моделей без переобучения. Это особенно важно для ИИ-агентов, которые могут сталкиваться с подозрительными или вредоносными данными в процессе работы. Hacker News · Исследования и наука Исследование механизмов забывания в ИИ-моделях при обучении на одном GPU Исследователи проанализировали феномен «забывания» в ИИ-моделях, разделив процесс на работу «мировой модели» (world model), которая сохраняет знания, и «актора» (actor), который их теряет. Работа демонстрирует, как оптимизация на одном GPU позволяет эффективно отслеживать динамику потери информации, предлагая новые методы контроля стабильности обучения и предотвращения катастрофического забывания в агентных системах. Hacker News · Машинное обучение XGBoost превзошел LLM в классификации данных о гражданских потерях в Telegram Исследователи Bellingcat сравнили эффективность классических алгоритмов машинного обучения и больших языковых моделей при анализе Telegram-каналов в условиях конфликта. Оказалось, что модель XGBoost значительно превосходит современные LLM в точности поиска сообщений о вреде гражданскому населению, демонстрируя более высокую скорость обработки данных при кратно меньших вычислительных затратах и стоимости эксплуатации. arXiv · Машинное обучение Метод MAST для точечного удаления нежелательных навыков рассуждения в LLM Исследователи представили метод MAST (Mechanism-Aligned Selective Targeting), предназначенный для избирательного удаления специфических паттернов рассуждения, привитых моделям через обучение с подкреплением (RLVR). Традиционные подходы к «забыванию» (unlearning) часто приводят к деградации общих способностей модели из-за полнопараметрических обновлений. Новый метод позволяет изолировать и корректировать только те веса, которые отвечают за конкретные логические цепочки, минимизируя побочный ущерб для базовых знаний модели. arXiv · Безопасность и алайнмент Метод защиты LLM от отравления данных при дообучении Исследователи представили метод «Detect, Unlearn, Restore» для защиты моделей суммаризации текста от атак типа data poisoning. Техника позволяет выявлять вредоносные примеры в обучающей выборке, удалять их влияние на веса модели и восстанавливать исходную производительность системы. Это критически важно для защиты специализированных LLM, которые подвержены манипуляциям через небольшие наборы данных при дообучении. arXiv · Память и RAG ReGrad: постобучение без потери знаний Исследователи из MIT и Google Research предложили новый подход к постобучению моделей, который решает проблему накопления весового дрейфа. В работе «Retrievable Gradients: Continual Post-Training Without Cumulative Weight Drift» авторы вводят концепцию ReGrad — метода, позволяющего моделям обновляться после развертывания без потери ранее усвоенных знаний. Hacker News · Исследования и наука Автоматизированный поиск алгоритмов удаления концепций в LLM Исследователи представили новый подход к автоматическому поиску алгоритмов для удаления нежелательных концепций из весов нейронных сетей. Используя агентную систему, авторы смогли обнаружить эффективные методы «стирания» знаний, которые превосходят существующие ручные подходы. Это позволяет точечно корректировать поведение моделей, минимизируя побочные эффекты для общей производительности и сохраняя функциональность системы после удаления конкретных данных или концепций. arXiv · Машинное обучение Новый подход к устранению предвзятости в моделях машинного обучения Исследователи представили методологию борьбы с предвзятостью в алгоритмах, которая учитывает пересечение нескольких защищаемых атрибутов, таких как раса и гендер. Традиционные методы часто не справляются с ситуациями, когда дискриминация проявляется только при сочетании нескольких факторов, что приводит к снижению точности моделей для определенных групп населения. Основная проблема заключается в нехватке репрезентативных данных для таких подгрупп и отсутствии четких математических метрик для оценки справедливости. arXiv · Машинное обучение Повышение устойчивости диффузионных моделей к зашумленным данным Исследователи предложили новый метод обучения диффузионных моделей, который делает их более устойчивыми к загрязненным обучающим выборкам. Традиционный подход, основанный на минимизации среднеквадратичной ошибки (MSE), часто оказывается чувствительным к выбросам и некачественным данным, что снижает итоговое качество генерации контента. arXiv · Машинное обучение Метод TILDE для удаления концептов из диффузионных моделей Исследователи представили TILDE (TILt-based Distributional Erasure) — новый метод «забывания» концептов в диффузионных моделях генерации изображений. Технология позволяет эффективно удалять нежелательные объекты или стили из обученных моделей, сохраняя при этом общее качество генерации и избегая деградации весов, что критически важно для соблюдения авторских прав, защиты приватности и соответствия стандартам безопасности при развертывании систем.

← Все материалы