arXiv · 26.06.2026 ·Машинное обучение

Новые подходы к обучению моделей на данных только с положительными примерами

Исследователи представили работу, пересматривающую классическую задачу обучения бинарного классификатора на основе данных, содержащих только положительные примеры (Positive-Only Learning). Авторы выявили неожиданные теоретические ограничения и свойства этого метода, которые ранее оставались вне поля зрения, предложив более точную математическую характеристику процесса обучения в условиях отсутствия размеченных отрицательных данных.

Задача обучения по положительным примерам (PU-learning) критически важна для сценариев, где получение отрицательных меток затруднено или невозможно. В данной работе авторы анализируют разрыв между тем, как модель обучается на ограниченной выборке, и тем, как она оценивается на исходном распределении данных. Исследование уточняет условия, при которых возможно достижение оптимальной точности классификации без явного наличия негативных примеров в обучающем наборе.

Полученные результаты ставят под сомнение некоторые устоявшиеся представления о сложности обучения в рамках PAC-модели (Probably Approximately Correct). Работа предлагает новые теоретические рамки для оценки того, насколько эффективно алгоритмы могут восстанавливать целевую концепцию, опираясь исключительно на положительные сигналы, что имеет прямое значение для разработки систем с частичным обучением.

Ключевые факты

Исследование опирается на классическую модель обучения Натараджана, предложенную в 1987 году.
Авторы доказали, что при определенных условиях «неправильное» (improper) обучение может быть более эффективным, чем предполагалось ранее.
Работа формализует разницу между обучением на подмножестве положительных данных и оценкой модели на полном распределении.
Выводы статьи позволяют оптимизировать пайплайны обучения для задач, где разметка отрицательных классов экономически невыгодна или невозможна.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

arXiv · Машинное обучение Новый подход к устранению предвзятости в моделях машинного обучения Исследователи представили методологию борьбы с предвзятостью в алгоритмах, которая учитывает пересечение нескольких защищаемых атрибутов, таких как раса и гендер. Традиционные методы часто не справляются с ситуациями, когда дискриминация проявляется только при сочетании нескольких факторов, что приводит к снижению точности моделей для определенных групп населения. Основная проблема заключается в нехватке репрезентативных данных для таких подгрупп и отсутствии четких математических метрик для оценки справедливости. arXiv · Машинное обучение Новый метод оценки обобщающей способности моделей через PAC-Bayes Исследователи представили новый подход к дерандомизации PAC-Bayes оценок для функций потерь с высокой степенью гладкости. Традиционные методы оценки обобщающей способности моделей часто опираются на вероятностные предсказатели, что затрудняет их прямое применение к детерминированным алгоритмам. Авторы работы предлагают математический аппарат, позволяющий переносить теоретические гарантии с ансамблей типа Gibbs на конкретные детерминированные модели, используя свойства гладкости функции потерь и класса предсказателей. arXiv · Машинное обучение Математические риски нелинейной агрегации градиентов в обучении моделей Исследователи проанализировали влияние нелинейной агрегации градиентов на сходимость и обобщающую способность моделей. В современных пайплайнах, включающих адаптивность, приватность и робастность, стандартные гарантии выпуклого обучения часто нарушаются из-за потери монотонности оператора обновления. Работа доказывает, что нелинейные методы агрегации могут приводить к нестабильности обучения, что требует пересмотра подходов к оптимизации сложных систем. arXiv · Машинное обучение Новый метод обучения с подкреплением на основе предпочтений UBP2 Исследователи представили алгоритм UBP2 (Uncertainty-Balanced Preference Planning), направленный на повышение эффективности обучения с подкреплением на основе предпочтений (Preference-based RL). Традиционные подходы в этой области часто зависят от пассивного сбора данных, что приводит к низкой скорости обучения, особенно на начальных этапах, когда системе не хватает информации о предпочтениях пользователя. arXiv · Исследования и наука PAC-байесовские гарантии для управления замкнутыми системами Исследователи представили новый метод получения теоретических гарантий для систем управления с обучением, использующих квадратичные функции потерь. Традиционные PAC-байесовские подходы сталкивались с трудностями из-за неограниченного характера таких функций, однако использование параметризации System Level Synthesis (SLS) позволило эффективно оценить поведение системы и обеспечить надежность предсказаний на ограниченных выборках данных. arXiv · Машинное обучение Новый метод обучения классификаторов в условиях стратегического поведения пользователей Исследователи представили метод обучения нелинейных классификаторов, устойчивых к стратегическим манипуляциям со стороны пользователей. Ранее подобные задачи ограничивались линейными моделями из-за высокой вычислительной сложности. Новый подход позволяет эффективно оптимизировать классификаторы, когда пользователи пытаются изменить свои данные, чтобы повлиять на решение системы, сохраняя при этом точность и предсказуемость модели в динамической среде. arXiv · Безопасность и алайнмент Исследование влияния примеров на поведение безопасных LLM Исследователи проанализировали, как модели с настроенными механизмами безопасности реагируют на смешанные примеры в контекстном обучении. В ходе эксперимента в промпты добавляли как безобидные диалоги, так и демонстрации выполнения вредоносных запросов. Цель работы — понять, как именно нейросети интерпретируют противоречивые инструкции и в какой момент «безопасное» поведение начинает уступать место выполнению опасных команд. The Decoder · Безопасность и алайнмент Новый метод обучения ИИ через внедрение полезных поведенческих черт Исследователи OpenAI представили подход к обучению моделей, основанный на закреплении конкретных поведенческих паттернов, таких как правдивость и готовность к исправлению ошибок. Вместо использования конституционных ограничений, как это делает Anthropic, авторы применяют метод обучения с подкреплением на небольших наборах данных, содержащих примеры желаемого поведения. Такой подход позволяет модели переносить усвоенные принципы на различные предметные области, делая систему более устойчивой к попыткам манипуляции. arXiv · Машинное обучение Исследование влияния позиционного смещения в методах дистилляции моделей Исследователи проанализировали эффективность метода On-Policy Distillation (OPD), который используется для ускорения обучения моделей с подкреплением через пошаговый контроль со стороны «учителя». Стандартный подход предполагает равномерное распределение весов для всех токенов при расчете функции потерь, однако новая работа доказывает, что такой метод не учитывает накопленные ошибки в длинных последовательностях. arXiv · Машинное обучение Итеративная самофильтрация данных для обучения мультимодальных моделей Качество обучающих выборок остается критическим фактором при создании эффективных мультимодальных нейросетей. В условиях работы с массивами данных гигантского объема ручная проверка становится невозможной, что приводит к накоплению значительного количества «шумных» и нерелевантных примеров. Традиционные методы очистки данных, основанные на эвристиках или использовании сторонних предобученных моделей, часто оказываются недостаточно гибкими или требуют больших вычислительных затрат.

← Все материалы