Mistral представила Voxtral TTS — открытую модель синтеза речи с открытыми весами. Она предназначена для создания реалистичного голоса для голосовых агентов. Voxtral работает быстро и может адаптироваться к новым голосам за считанные секунды.

Модель поддерживает более 30 языков и диалектов, включая английский, французский, немецкий, испанский, китайский и арабский. Voxtral TTS может быть использована для создания голосовых помощников, аудиокниг, подкастов и других приложений, требующих синтеза речи.

Voxtral TTS доступна под лицензией Apache 2.0, что позволяет разработчикам свободно использовать и модифицировать модель. Mistral также предоставила примеры кода и документацию для облегчения интеграции модели в различные приложения.

Модель была обучена на большом количестве данных, что позволяет ей производить высококачественный синтез речи. Voxtral TTS может быть использована как локально, так и в облаке, что делает её универсальным решением для различных сценариев использования.