Исследователи из MIT и Google Research предложили новый подход к постобучению моделей, который решает проблему накопления весового дрейфа. В работе «Retrievable Gradients: Continual Post-Training Without Cumulative Weight Drift» авторы вводят концепцию ReGrad — метода, позволяющего моделям обновляться после развертывания без потери ранее усвоенных знаний.

Проблема весового дрейфа возникает при многократном обновлении параметров модели, что приводит к катастрофическому забыванию. Существующие решения, такие как RAG (Retrieval-Augmented Generation), избегают этого, но при этом уступают в глубине интеграции знаний. ReGrad предлагает компромиссное решение: он сохраняет градиенты обновлений в виде извлекаемых векторов, что позволяет модели адаптироваться к новым данным без изменения исходных параметров.

Авторы провели эксперименты на различных наборах данных, включая MMLU и TriviaQA, и показали, что ReGrad сохраняет общие способности модели при одновременном усвоении новых знаний. Это особенно важно для ИИ-агентов, которым необходимо постоянно обновляться без потери ключевых навыков.

Подход ReGrad может быть полезен для разработки агентов с долговременной памятью и адаптивными способностями. Он позволяет моделям оставаться актуальными, не жертвуя стабильностью и надежностью. В будущем этот метод может стать основой для более продвинутых систем постобучения, которые будут способны эффективно интегрировать новые данные без потери ранее усвоенных знаний.