Компания AMD представила оптимизации для вычислений матричных операций (GEMM) в формате FP8 на архитектуре CDNA4. Это позволит ускорить работу ИИ-моделей на графических процессорах Instinct серии MI300X.
Оптимизации включают новые ядра для ускорения матричных операций, которые являются ключевыми для работы нейросетей. Разработчики утверждают, что новые решения обеспечивают высокую производительность при низком энергопотреблении.
CDNA4 — это архитектура, специально разработанная для вычислений в области искусственного интеллекта. Она поддерживает работу с моделями большого языка и другими сложными алгоритмами. Новые оптимизации могут быть полезны для разработчиков, работающих с локальным развёртыванием ИИ-моделей.
AMD продолжает развивать свои решения для ИИ, предлагая альтернативу продуктам NVIDIA. Компания делает ставку на открытые стандарты и совместимость с различными фреймворками.