Meta (признана экстремистской организацией, деятельность запрещена в РФ) внедрила технологию CXL для повторного использования модулей памяти DDR4 из устаревших серверов в новых вычислительных узлах. Использование специализированных ASIC-чипов позволило компании объединять ресурсы памяти, что привело к сокращению затрат на развертывание инференс-инфраструктуры на 25% и значительному продлению жизненного цикла аппаратного обеспечения.
Традиционные архитектуры серверов жестко ограничивают объем оперативной памяти, привязывая её к конкретному процессору. Технология Compute Express Link (CXL) позволяет отвязать память от CPU, создавая пулы ресурсов, доступных для различных вычислительных узлов. Это решение критически важно для задач инференса LLM, где потребность в объеме памяти часто превышает возможности стандартных конфигураций серверов.
Разработка собственного ASIC-контроллера позволила инженерам компании эффективно управлять задержками при обращении к «старой» памяти, интегрируя её в современные высокопроизводительные кластеры. Такой подход не только снижает капитальные затраты на закупку новых модулей DDR5, но и решает проблему утилизации огромного парка оборудования, который ранее подлежал списанию из-за морального устаревания вычислительных ядер.
Ключевые факты
- Meta (признана экстремистской организацией, деятельность запрещена в РФ) сократила расходы на инференс-инфраструктуру на 25%.
- Технология CXL используется для создания пулов памяти, объединяющих модули DDR4 из списанных серверов.
- Внедрение кастомных ASIC-чипов позволило нивелировать разницу в производительности между старой памятью и современными системами.
- Решение позволяет масштабировать объем доступной памяти для моделей без необходимости полной замены серверного парка.
- Технология направлена на оптимизацию TCO (совокупной стоимости владения) при развертывании крупномасштабных ИИ-сервисов.