OpenAI в партнерстве с Broadcom разрабатывает специализированный чип под кодовым названием Jalapeño, предназначенный для оптимизации инференса больших языковых моделей. Проект направлен на создание собственной аппаратной инфраструктуры, которая позволит компании масштабировать вычислительные мощности и снизить зависимость от сторонних поставщиков графических процессоров. Ожидается, что чипы будут введены в эксплуатацию к концу 2026 года.
Разработка собственного «железа» является частью стратегии OpenAI по вертикальной интеграции стека технологий. Использование кастомных решений позволяет более эффективно распределять ресурсы при выполнении сложных задач генеративного ИИ, где стандартные GPU могут быть избыточными или недостаточно оптимизированными под специфические архитектуры трансформеров. Сотрудничество с Broadcom обеспечивает доступ к экспертизе в проектировании высокопроизводительных полупроводников.
Переход на собственные чипы — это попытка решить проблему дефицита вычислительных мощностей и высокой стоимости обслуживания инфраструктуры, необходимой для работы моделей уровня GPT-4 и выше. Оптимизация на уровне кремния позволяет добиться более высокой энергоэффективности и пропускной способности при обработке запросов пользователей, что критически важно для масштабирования сервисов в условиях растущего спроса.
Ключевые факты
- Название проекта: чип Jalapeño, ориентированный на инференс LLM.
- Партнер: Broadcom, специализирующаяся на проектировании полупроводниковых решений.
- Сроки внедрения: запуск в промышленную эксплуатацию запланирован на конец 2026 года.
- Цель: снижение зависимости от внешних поставщиков GPU и оптимизация затрат на вычислительную инфраструктуру.
