Исследователи представили BetXplain — специализированный датасет с аннотациями для обучения моделей автоматическому обнаружению манипулятивной рекламы букмекерских контор. Набор данных содержит примеры контента, использующего психологические триггеры для вовлечения пользователей в рискованные ставки, что позволяет ИИ-системам эффективнее модерировать рекламные потоки в социальных сетях и защищать аудиторию от деструктивного влияния.
Проблема распространения агрессивного маркетинга азартных игр в социальных сетях, включая Instagram (принадлежит Meta, признанной экстремистской и запрещённой в РФ), стала критической из-за сложности выявления скрытых манипулятивных техник. Традиционные методы фильтрации часто пропускают контент, который формально не нарушает правила площадок, но использует эмоциональное давление, обещания «гарантированного выигрыша» или эксплуатацию уязвимых состояний пользователей.
Датасет BetXplain включает не только сами рекламные креативы, но и детальные объяснения, почему конкретный текст или изображение классифицируются как манипулятивные. Такой подход позволяет обучать модели не просто бинарной классификации, а интерпретируемому анализу, что критически важно для прозрачности систем модерации и снижения количества ложноположительных срабатываний при автоматической проверке рекламных объявлений.
Ключевые факты
- Датасет BetXplain содержит аннотированные примеры рекламных объявлений, сфокусированных на продвижении приложений для ставок.
- Основная цель проекта — автоматизация обнаружения контента, который поощряет рискованное поведение и негативно влияет на психологическое благополучие пользователей.
- В состав данных включены пояснительные аннотации, описывающие конкретные манипулятивные приемы, использованные в рекламных сообщениях.
- Исследование направлено на решение проблемы нехватки размеченных данных для обучения систем модерации в индустрии азартных игр.