Исследователи представили методологию распределения наград в кооперативных ИИ-системах, где агенты действуют от лица пользователей. Новый подход внедряет механизм «ценностно-обусловленной фильтрации градиентов», который позволяет учитывать индивидуальные этические ограничения каждого участника при обновлении глобальных моделей. Это обеспечивает прозрачность вклада данных и гарантирует, что обучение системы соответствует заданным профилям ценностей всех вовлеченных сторон.
В условиях делегированного обучения, когда агенты участвуют в коллективном обновлении моделей, возникает проблема справедливого распределения кредита за вклад. Традиционные методы часто игнорируют разнородные предпочтения пользователей, что может приводить к конфликтам интересов. Предложенный алгоритм оценивает каждое обновление модели на предмет допустимости, отсеивая те изменения, которые противоречат ценностным установкам конкретных принципалов, участвующих в кооперации.
Система решает задачу кредитного распределения (credit assignment) в динамической среде, где данные поступают от множества независимых источников. Использование фильтрации градиентов в режиме реального времени позволяет системе адаптироваться к меняющимся требованиям пользователей, сохраняя при этом эффективность обучения. Такой подход открывает возможности для создания более безопасных и персонализированных децентрализованных систем машинного обучения, где интересы человека остаются приоритетными на каждом этапе обновления весов модели.
Ключевые факты
- Разработан фреймворк для распределения вознаграждений в кооперативах, где агенты представляют интересы людей.
- Внедрена технология ценностно-обусловленной фильтрации градиентов (value-conditioned gradient filtering).
- Система автоматически блокирует обновления модели, не соответствующие заданным профилям ценностей участников.
- Метод позволяет эффективно управлять вкладом данных в условиях гетерогенных ограничений пользователей.
- Решение направлено на повышение прозрачности и этичности в процессах коллективного обучения ИИ.