Исследователи изучили возможности применения больших языковых моделей для выявления телефонного мошенничества в турецком языке. В условиях дефицита размеченных данных для низкоресурсных языков авторы работы проанализировали эффективность аудио-анализа и текстовой обработки, предложив методы адаптации современных ИИ-систем для защиты уязвимых групп населения от киберпреступлений, которые ранее оставались вне фокуса глобальных технологических решений.

Традиционные системы защиты от мошенничества исторически ориентированы на английский и другие широко распространенные языки, что оставляет пользователей других регионов без адекватной технической поддержки. Работа фокусируется на преодолении барьера нехватки обучающих выборок, характерного для турецкого языка, и демонстрирует, как архитектуры LLM могут быть дообучены для распознавания паттернов социальной инженерии в аудиопотоках.

Авторы подчеркивают, что интеграция ИИ в системы фильтрации вызовов требует не только высокой точности распознавания речи, но и глубокого понимания контекстуальных нюансов мошеннических сценариев. Исследование предлагает методологию, позволяющую масштабировать подобные решения на другие языки с ограниченным доступом к качественным наборам данных, что является критически важным для глобальной безопасности коммуникаций.

Ключевые факты

  • Исследование сфокусировано на детекции мошеннических звонков в турецком языке, который относится к категории низкоресурсных в контексте ИИ-обучения.
  • Работа решает проблему нехватки размеченных данных, препятствующую созданию эффективных автоматизированных систем защиты.
  • Предложенный подход опирается на возможности LLM для анализа аудио-контента и выявления признаков социальной инженерии.
  • Методология направлена на устранение разрыва в технологической защищенности между пользователями английского языка и носителями других языковых групп.