Команда PyTorch представила новый подход к автоматической настройке (autotuning) вычислительных ядер Helion, используемых в высокопроизводительных вычислениях. Ранее процесс подбора оптимальных параметров для этих ядер занимал минуты из-за необходимости перебора огромного пространства конфигураций. Использование языковых моделей позволило сократить время оптимизации до нескольких секунд, сохраняя при этом высокую эффективность выполнения операций.

Суть метода заключается в интеграции LLM в процесс поиска оптимальных параметров. Модель анализирует структуру ядра и предсказывает наиболее перспективные конфигурации, минуя стадию полного перебора. Это позволяет значительно быстрее находить настройки, которые обеспечивают максимальную производительность на конкретном аппаратном обеспечении, что критически важно для обучения и инференса масштабных нейросетевых моделей.

Данное решение демонстрирует практический пример применения ИИ для оптимизации низкоуровневого программного обеспечения. Переход от ручного или переборного подбора параметров к интеллектуальному прогнозированию позволяет разработчикам быстрее адаптировать вычислительные библиотеки под новые архитектуры графических процессоров, снижая затраты ресурсов на этапе подготовки инфраструктуры для глубокого обучения.