arXiv · 11.06.2026 ·Модели и релизы

Influcoder: новый метод атрибуции данных для улучшения качества датасетов

Исследователи представили метод Influcoder, который позволяет оценивать влияние отдельных данных на обучение языковых моделей. Это важно для создания качественных датасетов, так как позволяет выявлять и удалять вредоносные или нерелевантные данные.

Influcoder использует метод дистилляции градиентов декодеров для оценки их влияния на энкодер. Это позволяет более точно определять, какие данные в обучающей выборке наиболее значимы для генерации определённых выходов модели.

Для разработчиков ИИ-агентов, таких как Jarv, этот метод может быть полезен при создании и улучшении датасетов для обучения моделей. Качественные датасеты являются ключевым фактором в повышении точности и эффективности ИИ-агентов.

Исследование было опубликовано на arXiv и доступно по ссылке: https://arxiv.org/abs/2606.13668v1. Это ещё один шаг в направлении более прозрачного и контролируемого обучения языковых моделей.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

arXiv · Машинное обучение Повышение устойчивости диффузионных моделей к зашумленным данным Исследователи предложили новый метод обучения диффузионных моделей, который делает их более устойчивыми к загрязненным обучающим выборкам. Традиционный подход, основанный на минимизации среднеквадратичной ошибки (MSE), часто оказывается чувствительным к выбросам и некачественным данным, что снижает итоговое качество генерации контента. arXiv · Обучение и дообучение Новый датасет для улучшения аудио-языковых моделей Исследователи представили AudioDER — новый датасет, предназначенный для улучшения способностей аудио-языковых моделей (LALMs) к сложному аудио-рассуждению. LALMs уже демонстрируют высокие результаты в различных задачах понимания аудио, но их возможности в области сложного анализа и интерпретации звуковых данных остаются ограниченными. arXiv · Машинное обучение On-Policy Delta Distillation: новый метод обучения моделей с подкреплением Исследователи представили метод On-Policy Delta Distillation, направленный на оптимизацию процесса пост-тренировки языковых моделей. Новый подход позволяет использовать токенизированный надзор от «учителя» для обучения «ученика», обходя ограничения традиционных моделей вознаграждения. Техника повышает эффективность обучения с подкреплением, обеспечивая более точную передачу знаний между моделями при сохранении стабильности процесса. arXiv · Модели и релизы Почему самоулучшающиеся модели могут деградировать на новых задачах Исследователи из Arxiv выявили проблему в популярном подходе к самоулучшению визуально-языковых моделей (VLM), основанном на DPO (Direct Preference Optimization). В таких системах «верфикатор» оценивает генерации модели, а на основе лучших и худших примеров происходит обучение. Авторы показали, что этот метод может привести к деградации модели на новых задачах, несмотря на улучшение на обучающих данных. arXiv · Машинное обучение Итеративная самофильтрация данных для обучения мультимодальных моделей Качество обучающих выборок остается критическим фактором при создании эффективных мультимодальных нейросетей. В условиях работы с массивами данных гигантского объема ручная проверка становится невозможной, что приводит к накоплению значительного количества «шумных» и нерелевантных примеров. Традиционные методы очистки данных, основанные на эвристиках или использовании сторонних предобученных моделей, часто оказываются недостаточно гибкими или требуют больших вычислительных затрат. arXiv · Исследования и наука Метод Introspective Coupling улучшает интерпретируемость языковых моделей Исследователи представили метод Introspective Coupling, позволяющий языковым моделям генерировать более точные объяснения своих решений. В отличие от стандартного обучения, где модель имитирует поверхностные паттерны, новый подход использует контрфактуальные данные для проверки того, какие именно признаки входных данных действительно влияют на поведение системы, обеспечивая более глубокую связь между логикой модели и её итоговым ответом. arXiv · Безопасность и алайнмент Inoculation Adapters: новый метод предотвращения нежелательного поведения LLM Исследователи представили метод Inoculation Adapters (IA) — технику дообучения через LoRA, направленную на борьбу с эмерджентным нежелательным поведением моделей. Метод позволяет избирательно подавлять опасные способности ИИ, укрепляя «иммунитет» модели к нежелательным чертам еще на этапе обучения, что снижает риск появления скрытых бэкдоров и непредсказуемых реакций при масштабировании систем. arXiv · Машинное обучение Исследование переосмысливает методы сжатия датасетов в машинном обучении Учёные пересмотрели подходы к dataset distillation (DD) — методу, который позволяет создавать компактные обучающие наборы данных, сохраняя ключевую информацию из больших датасетов. Исследование, опубликованное на arXiv, выявило несоответствия в оценке эффективности DD-методов, которые часто тестируются по разным протоколам, от стандартного ERM до использования одного или нескольких учителей. NVIDIA Technical Blog · Обучение и дообучение NVIDIA FLARE Auto-FL ускоряет исследования федеративного обучения с помощью ИИ-агентов NVIDIA представила новую систему Auto-FL в рамках своего фреймворка Federated Learning and Analytics Research (FLARE). Эта система использует ИИ-агентов для автоматизации и ускорения исследований в области федеративного обучения (FL). Федеративное обучение позволяет обучать модели на распределённых данных без их централизации, что особенно важно для задач, связанных с конфиденциальностью и безопасностью данных. arXiv · Машинное обучение Новый метод глубокой непараметрической регрессии при сдвиге ковариат Исследователи представили новый подход к обучению глубоких нейронных сетей для задач квантильной и Huber-регрессии в условиях сдвига ковариат и зависимых данных. Метод позволяет эффективно адаптировать модели, когда распределения обучающей и целевой выборок различаются, что является критической проблемой для надежности ИИ-систем в реальных прикладных задачах, где данные поступают из нестационарных источников.

← Все материалы