Исследователи представили новый подход к аннотированию текстов песен, объединяющий человеческую экспертизу и возможности больших языковых моделей. Авторы создали специализированный датасет с разметкой на уровне предложений, чтобы решить проблему расхождения между эмоциональным содержанием текста и общим настроением музыкальной композиции, что ранее оставалось «слепой зоной» в задачах автоматического анализа контента.
Основная сложность анализа лирики заключается в её метафоричности и контекстуальной зависимости, где слова могут противоречить аудиоряду. Использование LLM в связке с человеческой оценкой позволяет повысить точность классификации эмоциональных состояний. Разработанный фреймворк демонстрирует, как итеративное согласование оценок модели и экспертов помогает минимизировать субъективность и повысить качество разметки для обучения специализированных нейросетевых моделей.
Методология включает создание эталонного набора данных, который учитывает специфические лингвистические особенности песенного творчества. Это исследование открывает новые возможности для автоматизации анализа музыкальных библиотек, улучшения рекомендательных систем и более глубокого понимания эмоциональной структуры аудиоконтента через текстовую составляющую.
Ключевые факты
- Разработан новый датасет с аннотациями на уровне предложений для анализа эмоций в лирике.
- Предложен гибридный метод, сочетающий человеческую оценку и предсказания LLM для повышения точности разметки.
- Исследование сфокусировано на решении проблемы несоответствия эмоционального фона текста и музыки.
- Результаты работы способствуют развитию систем автоматического анализа контента и музыкальных рекомендаций.