arXiv · 14.06.2026 ·Память и RAG

ReGrad: постобучение без потери знаний

Исследователи из MIT и Google Research предложили новый подход к постобучению моделей, который решает проблему накопления весового дрейфа. В работе «Retrievable Gradients: Continual Post-Training Without Cumulative Weight Drift» авторы вводят концепцию ReGrad — метода, позволяющего моделям обновляться после развертывания без потери ранее усвоенных знаний.

Проблема весового дрейфа возникает при многократном обновлении параметров модели, что приводит к катастрофическому забыванию. Существующие решения, такие как RAG (Retrieval-Augmented Generation), избегают этого, но при этом уступают в глубине интеграции знаний. ReGrad предлагает компромиссное решение: он сохраняет градиенты обновлений в виде извлекаемых векторов, что позволяет модели адаптироваться к новым данным без изменения исходных параметров.

Авторы провели эксперименты на различных наборах данных, включая MMLU и TriviaQA, и показали, что ReGrad сохраняет общие способности модели при одновременном усвоении новых знаний. Это особенно важно для ИИ-агентов, которым необходимо постоянно обновляться без потери ключевых навыков.

Подход ReGrad может быть полезен для разработки агентов с долговременной памятью и адаптивными способностями. Он позволяет моделям оставаться актуальными, не жертвуя стабильностью и надежностью. В будущем этот метод может стать основой для более продвинутых систем постобучения, которые будут способны эффективно интегрировать новые данные без потери ранее усвоенных знаний.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

arXiv · Модели и релизы Почему самоулучшающиеся модели могут деградировать на новых задачах Исследователи из Arxiv выявили проблему в популярном подходе к самоулучшению визуально-языковых моделей (VLM), основанном на DPO (Direct Preference Optimization). В таких системах «верфикатор» оценивает генерации модели, а на основе лучших и худших примеров происходит обучение. Авторы показали, что этот метод может привести к деградации модели на новых задачах, несмотря на улучшение на обучающих данных. arXiv · Память и RAG Исследование геометрии памяти в непрерывном обучении Учёные изучили структуру памяти в непрерывном обучении, чтобы понять, как ИИ-агенты могут сохранять знания без катастрофического забывания. Исследование основано на фреймворке Accessibility Collapse и анализирует, как модели, такие как ResNet-18, теряют и восстанавливают информацию при обучении на последовательных задачах. Hacker News · Исследования и наука Исследование механизмов забывания в ИИ-моделях при обучении на одном GPU Исследователи проанализировали феномен «забывания» в ИИ-моделях, разделив процесс на работу «мировой модели» (world model), которая сохраняет знания, и «актора» (actor), который их теряет. Работа демонстрирует, как оптимизация на одном GPU позволяет эффективно отслеживать динамику потери информации, предлагая новые методы контроля стабильности обучения и предотвращения катастрофического забывания в агентных системах. arXiv · Память и RAG Новый подход к редактированию знаний в ИИ-агентах Исследователи из MIT и Университета Карнеги-Меллона представили новый метод редактирования знаний в ИИ-моделях, который позволяет обновлять конкретные факты, не затрагивая близлежащие, но нерелевантные данные. В статье, опубликованной на arXiv, авторы предлагают использовать память, которая извлекается во время инференса, и адаптеры для коррекции предпочтений модели. arXiv · Обучение и дообучение InstantForget удаляет вредоносные данные без переобучения модели Исследователи из MIT и других университетов представили метод InstantForget, который позволяет удалять вредоносные данные (backdoors) из обученных моделей без переобучения. Это особенно важно для ИИ-агентов, которые могут сталкиваться с подозрительными или вредоносными данными в процессе работы. arXiv · Машинное обучение Метод адаптации моделей к меняющимся данным без доступа к исходному набору Исследователи представили новый метод непрерывной адаптации моделей во время инференса (CTTA), позволяющий нейросетям эффективно подстраиваться под меняющиеся домены данных без доступа к обучающей выборке. Подход использует архитектуру «учитель-ученик» с контролируемой коррекцией весов, что предотвращает деградацию модели при длительной работе в условиях динамически изменяющейся среды и повышает точность предсказаний в реальных сценариях эксплуатации. arXiv · Память и RAG Как RAG помогает ИИ-агентам решать сложные задачи через аналогии Исследователи из MIT и Google Research предложили новый подход к улучшению способности языковых моделей решать сложные задачи через аналогии. В работе, опубликованной на arXiv, они демонстрируют, как Retrieval-Augmented Generation (RAG) может быть адаптирован для более эффективного решения задач, требующих нестандартного мышления. arXiv · Машинное обучение Оптимизация визуальных генеративных моделей через распределенные награды Исследователи представили новый метод дообучения генеративных моделей, использующий распределенные награды вместо традиционных пообразных функций. Подход позволяет избежать «взлома наград» (reward hacking), при котором модели теряют разнообразие контента и создают визуальные артефакты. Новый фреймворк обеспечивает более точное соответствие целевым характеристикам, сохраняя при этом высокое качество и вариативность генерируемых изображений в процессе обучения. arXiv · Машинное обучение Повышение устойчивости диффузионных моделей к зашумленным данным Исследователи предложили новый метод обучения диффузионных моделей, который делает их более устойчивыми к загрязненным обучающим выборкам. Традиционный подход, основанный на минимизации среднеквадратичной ошибки (MSE), часто оказывается чувствительным к выбросам и некачественным данным, что снижает итоговое качество генерации контента. arXiv · Машинное обучение Новый подход к обучению агентов пониманию и генерации движений Исследователи представили метод адаптации моделей для непрерывного обучения агентов, работающих с человеческими движениями. Решение использует модификации LoRA для последовательного освоения новых концепций — от спортивных стилей до специфических жестов — без потери ранее накопленных знаний. Это позволяет ИИ-агентам эффективно адаптироваться к динамическим средам, сохраняя двунаправленную способность к преобразованию текста в движение и обратно.

← Все материалы