Специалисты представили архитектурный подход к проектированию серверных стоек, оптимизированных для запуска множества ИИ-агентов на базе центральных процессоров. В отличие от систем, ориентированных исключительно на GPU, данная конфигурация сфокусирована на высокой плотности вычислительных ядер и эффективном управлении памятью, что критически важно для параллельной работы большого количества агентных систем с разной нагрузкой.

В основе решения лежит использование серверных платформ Dell с процессорами AMD EPYC, которые обеспечивают баланс между пропускной способностью памяти и количеством потоков. Такой подход позволяет эффективно распределять задачи между агентами, требующими частого переключения контекста и работы с RAG-системами, где задержки при обращении к оперативной памяти играют ключевую роль. Архитектура поддерживает масштабирование вычислительных мощностей без необходимости полной замены аппаратного обеспечения при росте сложности агентных сценариев.

Данная инфраструктура ориентирована на задачи, где требуется высокая степень параллелизма, а не только чистая производительность инференса. Использование CPU-ориентированных стоек позволяет снизить стоимость владения при развертывании агентных платформ, требующих значительных объемов оперативной памяти для хранения состояний и истории взаимодействий. Это решение демонстрирует переход от универсальных серверных конфигураций к специализированным «агентным» узлам, спроектированным для обеспечения стабильной работы автономных систем в корпоративной среде.