Представлена Inflect-Nano — специализированная модель для преобразования текста в речь (TTS), насчитывающая всего 4,63 миллиона параметров. Благодаря экстремально малому размеру, архитектура способна работать локально на устройствах с ограниченными вычислительными ресурсами, сохраняя при этом функциональность полноценного вокодера. Это решение позволяет интегрировать качественный голосовой вывод непосредственно в агентные системы и локальные приложения без необходимости обращения к облачным API.

Разработка ориентирована на сценарии, где критически важны низкая задержка и автономность работы. Малый вес модели минимизирует потребление оперативной памяти и нагрузку на процессор, что делает её подходящей для встраиваемых систем и клиентских интерфейсов, работающих в режиме реального времени. В отличие от крупных нейросетевых решений, Inflect-Nano не требует значительных аппаратных мощностей для генерации аудиопотока.

Модель доступна для развертывания в составе локальных пайплайнов обработки данных. Использование подобных легковесных решений упрощает создание независимых от внешних сервисов ИИ-агентов, способных взаимодействовать с пользователем голосом в условиях отсутствия стабильного интернет-соединения или строгих требований к приватности данных.