Стартап Etched вышел из режима скрытности, объявив о привлечении $120 млн инвестиций для разработки специализированного процессора Sohu, предназначенного исключительно для архитектуры Transformer. В отличие от универсальных GPU, чип Etched аппаратно реализует операции, лежащие в основе LLM, что обещает кратное увеличение производительности инференса и снижение энергопотребления при работе с крупными языковыми моделями.

Разработчики делают ставку на отказ от программируемых ядер общего назначения в пользу жестко заданных вычислительных блоков для матричных операций. Такой подход позволяет исключить оверхед, связанный с управлением памятью и инструкциями, характерный для архитектур NVIDIA. По заявлению компании, их решение способно обрабатывать запросы к моделям масштаба Llama-3 или GPT-4 значительно быстрее и дешевле существующих рыночных аналогов.

Проект нацелен на сегмент высоконагруженных систем, где стоимость инференса становится критическим фактором для масштабирования агентных платформ и корпоративных ИИ-сервисов. Производство чипов доверено TSMC, что подтверждает готовность компании к переходу на стадию серийного выпуска аппаратного обеспечения для нужд генеративного ИИ.

Ключевые факты

  • Объем раунда финансирования составил $120 млн, среди инвесторов — Jane Street и венчурные фонды, связанные с TSMC.
  • Процессор Sohu спроектирован как ASIC (специализированная интегральная схема) исключительно для архитектуры Transformer.
  • Компания полностью исключает поддержку других типов нейросетей, фокусируясь на максимальной оптимизации для LLM.
  • Производственным партнером выступает TSMC, что обеспечивает доступ к передовым техпроцессам для выпуска чипов.
  • Основная цель разработки — радикальное снижение стоимости и задержек при выполнении инференса в сравнении с GPU общего назначения.