arXiv · 23.06.2026 ·Оценка и бенчмарки

Представлен CN-NewsTTS Bench для оценки качества синтеза речи в китайских новостях

Исследователи выпустили CN-NewsTTS Bench v0.1 — специализированный бенчмарк для оценки систем преобразования текста в речь (TTS) при работе с китайским новостным контентом. Набор данных фокусируется на сложных лингвистических конструкциях, таких как аббревиатуры, смешанные буквенно-цифровые обозначения и специфические символы, которые часто вызывают ошибки в произношении у современных моделей синтеза.

Китайские новостные тексты отличаются высокой плотностью формализованных данных: диапазонов значений, процентов, названий моделей и единиц измерения. Стандартные TTS-системы нередко сохраняют исходное написание символов, игнорируя их правильное фонетическое прочтение в контексте дикторской речи. Новый бенчмарк позволяет количественно измерить точность интерпретации таких «сырых» входных данных, что критически важно для автоматизации радиовещания и создания новостных аудио-агрегаторов.

Инструмент предлагает методологию оценки, ориентированную на целевой уровень произношения, где система должна не просто озвучить текст, а корректно трансформировать письменные формы в естественную устную речь. Это помогает разработчикам выявлять слабые места в пайплайнах нормализации текста и улучшать качество синтеза в профессиональных медийных задачах.

Ключевые факты

CN-NewsTTS Bench v0.1 разработан для тестирования систем TTS на сложных новостных текстах.
Основной фокус сделан на обработке смешанных данных: процентов, диапазонов, английских аббревиатур и цифровых обозначений.
Бенчмарк направлен на устранение разрыва между написанием текста и его корректным озвучиванием в новостном стиле.
Релиз включает открытый набор данных для оценки точности произношения в реальных рабочих процессах.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

← Все материалы