Команда Whissle представила Whissle Gateway — локальный Docker-контейнер для мультимодального голосового ИИ. Размер образа составляет всего 500 МБ, что делает его одним из самых компактных решений для локального развёртывания.
Контейнер поддерживает обработку речи, текста и аудио, а также интеграцию с различными сервисами. Это позволяет использовать его для создания голосовых ассистентов, транскрибации и других задач, связанных с обработкой речи.
Whissle Gateway работает на основе моделей, оптимизированных для работы в ограниченных ресурсах. Это делает его подходящим для использования на ноутбуках и других устройствах с ограниченной вычислительной мощностью.
Проект доступен на GitHub, и его можно развернуть с помощью стандартных инструментов Docker. Это делает его доступным для разработчиков, которые хотят интегрировать голосовые технологии в свои приложения без необходимости использования облачных сервисов.