Стартап Etched вышел из режима скрытности, объявив о привлечении $120 млн инвестиций для разработки специализированного процессора Sohu, предназначенного исключительно для архитектуры Transformer. В отличие от универсальных GPU, чип Etched аппаратно реализует операции, лежащие в основе LLM, что обещает кратное увеличение производительности инференса и снижение энергопотребления при работе с крупными языковыми моделями.
Разработчики делают ставку на отказ от программируемых ядер общего назначения в пользу жестко заданных вычислительных блоков для матричных операций. Такой подход позволяет исключить оверхед, связанный с управлением памятью и инструкциями, характерный для архитектур NVIDIA. По заявлению компании, их решение способно обрабатывать запросы к моделям масштаба Llama-3 или GPT-4 значительно быстрее и дешевле существующих рыночных аналогов.
Проект нацелен на сегмент высоконагруженных систем, где стоимость инференса становится критическим фактором для масштабирования агентных платформ и корпоративных ИИ-сервисов. Производство чипов доверено TSMC, что подтверждает готовность компании к переходу на стадию серийного выпуска аппаратного обеспечения для нужд генеративного ИИ.
Ключевые факты
- Объем раунда финансирования составил $120 млн, среди инвесторов — Jane Street и венчурные фонды, связанные с TSMC.
- Процессор Sohu спроектирован как ASIC (специализированная интегральная схема) исключительно для архитектуры Transformer.
- Компания полностью исключает поддержку других типов нейросетей, фокусируясь на максимальной оптимизации для LLM.
- Производственным партнером выступает TSMC, что обеспечивает доступ к передовым техпроцессам для выпуска чипов.
- Основная цель разработки — радикальное снижение стоимости и задержек при выполнении инференса в сравнении с GPU общего назначения.