arXiv · 25.06.2026 ·Машинное обучение

BetXplain: датасет для выявления манипулятивной рекламы ставок в соцсетях

Исследователи представили BetXplain — специализированный датасет с аннотациями для обучения моделей автоматическому обнаружению манипулятивной рекламы букмекерских контор. Набор данных содержит примеры контента, использующего психологические триггеры для вовлечения пользователей в рискованные ставки, что позволяет ИИ-системам эффективнее модерировать рекламные потоки в социальных сетях и защищать аудиторию от деструктивного влияния.

Проблема распространения агрессивного маркетинга азартных игр в социальных сетях, включая Instagram (принадлежит Meta, признанной экстремистской и запрещённой в РФ), стала критической из-за сложности выявления скрытых манипулятивных техник. Традиционные методы фильтрации часто пропускают контент, который формально не нарушает правила площадок, но использует эмоциональное давление, обещания «гарантированного выигрыша» или эксплуатацию уязвимых состояний пользователей.

Датасет BetXplain включает не только сами рекламные креативы, но и детальные объяснения, почему конкретный текст или изображение классифицируются как манипулятивные. Такой подход позволяет обучать модели не просто бинарной классификации, а интерпретируемому анализу, что критически важно для прозрачности систем модерации и снижения количества ложноположительных срабатываний при автоматической проверке рекламных объявлений.

Ключевые факты

Датасет BetXplain содержит аннотированные примеры рекламных объявлений, сфокусированных на продвижении приложений для ставок.
Основная цель проекта — автоматизация обнаружения контента, который поощряет рискованное поведение и негативно влияет на психологическое благополучие пользователей.
В состав данных включены пояснительные аннотации, описывающие конкретные манипулятивные приемы, использованные в рекламных сообщениях.
Исследование направлено на решение проблемы нехватки размеченных данных для обучения систем модерации в индустрии азартных игр.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

Hacker News · ИИ в маркетинге Как устранить галлюцинации ИИ в маркетинговых кампаниях Генеративные модели, используемые в маркетинге, часто допускают фактические ошибки при анализе рекламных кампаний из-за отсутствия доступа к актуальным данным из рекламных кабинетов. Основная проблема заключается в том, что стандартные LLM обучаются на статичных наборах данных, которые не отражают динамику текущих показателей эффективности, таких как CTR, стоимость клика или конверсия в реальном времени. arXiv · Машинное обучение Новый датасет CATCH-ME для борьбы с ненавистью и дезинформацией в ИИ Исследователи представили датасет CATCH-ME (Contextually Annotated multi-Turn Counterspeech), предназначенный для улучшения навыков языковых моделей в противодействии враждебным высказываниям и дезинформации. Проблема текущих систем заключается в том, что при работе в режиме zero-shot модели часто выдают шаблонные, расплывчатые или повторяющиеся ответы, которые неэффективны в реальных диалогах. Новый набор данных сфокусирован на многоходовых контекстных ответах, что позволяет лучше обучать ИИ-агентов вести аргументированную дискуссию. arXiv · Исследования и наука RSPC: новый датасет для анализа психического здоровья в цифровых отношениях Исследователи представили RSPC — корпус данных из 1799 постов Reddit, размеченных профессиональными психиатрами для оценки психологического состояния пользователей. В отличие от предыдущих работ, рассматривающих ментальное здоровье изолированно, этот бенчмарк фокусируется на взаимосвязи психических расстройств и стрессовых триггеров, возникающих в контексте цифровых отношений, что позволяет моделям NLP лучше учитывать межличностный контекст при анализе текстов. arXiv · Безопасность и алайнмент Уязвимости конфиденциальности в табличных foundation-моделях Исследователи выявили критические риски конфиденциальности в табличных foundation-моделях, использующих механизм внимания. Несмотря на обучение на синтетических данных, модели подвержены утечкам чувствительной информации при инференсе. В процессе in-context learning данные, передаваемые в качестве размеченных примеров, могут быть восстановлены через анализ весов внимания, что ставит под угрозу безопасность высокорисковых запросов в корпоративных системах. arXiv · Безопасность и алайнмент Метод AIMS: повышение точности классификации безопасности LLM через анализ намерений Исследователи представили подход AIMS, который повышает эффективность классификации безопасности LLM за счет явного моделирования намерений пользователя. Внедрение описания намерений в процесс обучения позволяет моделям точнее различать вредоносные запросы и безопасные взаимодействия. Новый датасет из 1724 сложных примеров помогает оценивать работу систем безопасности в различных режимах обучения, включая SFT и обучение с подкреплением на основе предпочтений. Hacker News · Оценка и бенчмарки AdvertBench: новый бенчмарк для оценки рекламного креатива LLM Исследователи представили AdvertBench — специализированный набор тестов для оценки способности больших языковых моделей генерировать визуальную рекламу. Инструмент фокусируется на ключевых аспектах маркетингового контента: соответствии заданным визуальным стилям, точности передачи рекламного посыла и способности моделей следовать сложным инструкциям при создании изображений. arXiv · Исследования и наука TailorMind: адаптивная генерация контента под предпочтения пользователя Исследователи представили метод TailorMind, направленный на создание персонализированного мультимодального контента без необходимости в предварительно накопленных пользовательских данных. Современные системы рекомендаций часто зависят от наличия пользовательского контента (UGC), что создает сложности при его отсутствии или высокой стоимости производства. Новый подход позволяет переводить поведенческие паттерны пользователя в конкретные параметры для генеративных моделей в режиме реального времени. Hacker News · ИИ в бизнесе Бренды переходят на использование ИИ-инфлюенсеров в маркетинге Крупные компании все чаще заменяют реальных блогеров виртуальными персонажами, созданными с помощью генеративного ИИ. Такие цифровые аватары используются для продвижения товаров в социальных сетях, включая Instagram (принадлежит Meta, признанной экстремистской и запрещённой в РФ). Виртуальные инфлюенсеры доступны 24/7, не требуют перерывов на отдых и позволяют брендам полностью контролировать имидж и транслируемые сообщения, исключая репутационные риски, связанные с поведением живых людей. Hacker News · Данные и инжиниринг Pay-per-Crawl: новая модель монетизации веб-данных для обучения ИИ Проект Pay-per-Crawl предлагает рыночный подход к проблеме сбора данных, позволяя владельцам сайтов монетизировать контент через микроплатежи за каждый успешный запрос от краулеров. Эта модель призвана сбалансировать потребности разработчиков ИИ в качественных обучающих выборках и права владельцев ресурсов, которые сейчас массово блокируют доступ к своим данным из-за неконтролируемого парсинга. Google DeepMind News · Безопасность и алайнмент Исследование DeepMind о рисках манипуляции через ИИ Google DeepMind опубликовал исследование, посвящённое рискам манипуляции людьми с помощью искусственного интеллекта. В работе рассматриваются различные сферы, включая финансы и здравоохранение, где ИИ может быть использован для вредоносных целей. Исследователи выделили ключевые механизмы манипуляции, такие как подталкивание к нежелательным решениям, создание ложных убеждений и эксплуатация когнитивных искажений.

← Все материалы