Together AI представила решение для распознавания речи (ASR), которое, по их заявлению, является самым быстрым в мире. Компания подчеркивает, что подход к ASR рассматривался как задача полного пути системы, а не только как проблема инференса на GPU.
Ключевым аспектом разработки стало оптимизация всех этапов обработки речи, включая предварительную обработку, инференс и постобработку. Это позволило достичь рекордной скорости и точности распознавания.
Стек Together AI включает в себя собственные модели и алгоритмы, а также оптимизированные подходы к развертыванию на GPU. Компания отмечает, что их решение может быть использовано в различных сценариях, от транскрибации до реального времени.
Разработчики подчеркивают, что их подход может быть применен и к другим задачам обработки речи, что открывает новые возможности для интеграции ИИ в различные приложения и сервисы.
.png)