AMD анонсировала новую технологию 4-Wave Interleave FP8 GEMM, направленную на ускорение вычислений в ИИ. Решение оптимизирует работу с тензорными ядрами, что позволяет значительно повысить производительность при инференсе моделей.
Технология использует формат FP8 (8-битный с плавающей запятой), который обеспечивает баланс между точностью и скоростью. Это особенно важно для задач, требующих высокой производительности, таких как обработка больших языковых моделей и компьютерное зрение.
AMD утверждает, что новая технология может ускорить вычисления до 4 раз по сравнению с традиционными методами. Это достигнуто за счёт оптимизации параллельной обработки данных и уменьшения накладных расходов на вычисления.
Технология 4-Wave Interleave FP8 GEMM уже доступна в рамках экосистемы ROCm, что позволяет разработчикам интегрировать её в свои решения для ускорения ИИ-вычислений. Это важный шаг в развитии аппаратного обеспечения для ИИ, который может повлиять на производительность и эффективность многих приложений.