Проект Apache TVM представил TIRx — специализированный стек компиляторов, предназначенный для работы с быстро меняющимися ML-ядрами (kernels). Инструмент решает проблему фрагментации при разработке высокопроизводительного кода для современных нейросетевых архитектур, позволяя автоматизировать генерацию и оптимизацию низкоуровневых операций под специфическое «железо».
Основная задача TIRx заключается в упрощении процесса адаптации моделей к новым вычислительным ускорителям. В отличие от традиционных подходов, требующих ручного написания кода под каждый тип процессора или графического чипа, новый стек предоставляет унифицированный интерфейс для описания тензорных вычислений. Это позволяет разработчикам инфраструктуры быстрее внедрять поддержку новых типов слоев и операций, сохраняя при этом высокую эффективность исполнения на уровне железа.
Система ориентирована на поддержку «граничных» (frontier) моделей, архитектура которых постоянно усложняется. Благодаря модульной структуре, TIRx позволяет интегрировать новые методы оптимизации без переписывания базового компилятора. Это критически важно для масштабирования инференса и обучения крупных моделей, где производительность каждого отдельного ядра напрямую влияет на общую скорость работы системы и затраты на вычислительные ресурсы.