Исследователи выпустили CN-NewsTTS Bench v0.1 — специализированный бенчмарк для оценки систем преобразования текста в речь (TTS) при работе с китайским новостным контентом. Набор данных фокусируется на сложных лингвистических конструкциях, таких как аббревиатуры, смешанные буквенно-цифровые обозначения и специфические символы, которые часто вызывают ошибки в произношении у современных моделей синтеза.

Китайские новостные тексты отличаются высокой плотностью формализованных данных: диапазонов значений, процентов, названий моделей и единиц измерения. Стандартные TTS-системы нередко сохраняют исходное написание символов, игнорируя их правильное фонетическое прочтение в контексте дикторской речи. Новый бенчмарк позволяет количественно измерить точность интерпретации таких «сырых» входных данных, что критически важно для автоматизации радиовещания и создания новостных аудио-агрегаторов.

Инструмент предлагает методологию оценки, ориентированную на целевой уровень произношения, где система должна не просто озвучить текст, а корректно трансформировать письменные формы в естественную устную речь. Это помогает разработчикам выявлять слабые места в пайплайнах нормализации текста и улучшать качество синтеза в профессиональных медийных задачах.

Ключевые факты

  • CN-NewsTTS Bench v0.1 разработан для тестирования систем TTS на сложных новостных текстах.
  • Основной фокус сделан на обработке смешанных данных: процентов, диапазонов, английских аббревиатур и цифровых обозначений.
  • Бенчмарк направлен на устранение разрыва между написанием текста и его корректным озвучиванием в новостном стиле.
  • Релиз включает открытый набор данных для оценки точности произношения в реальных рабочих процессах.