Разработчики представили подход к автоматизированному поиску архитектур нейронных сетей (NAS), оптимизированный для работы на устройствах с ограниченными вычислительными ресурсами. Технология позволяет автоматически подбирать структуру модели так, чтобы она сохраняла высокую точность при минимальных требованиях к оперативной памяти и энергопотреблению. Это решает проблему переноса тяжелых моделей на оборудование уровня Edge AI, где использование стандартных архитектур часто невозможно из-за жестких ограничений по железу.
В основе метода лежит алгоритм, который ищет баланс между производительностью модели и её аппаратной эффективностью. Вместо ручного проектирования слоев и параметров, система анализирует целевую платформу и генерирует конфигурацию, максимально использующую доступные ресурсы процессора и ускорителя. Такой подход сокращает время разработки специализированных моделей для интернета вещей, мобильных систем и автономных датчиков, позволяя внедрять глубокое обучение там, где раньше требовались упрощенные алгоритмы.
Автоматизация проектирования архитектур становится ключевым инструментом для масштабирования ИИ-решений вне облачных дата-центров. Переход от универсальных моделей к специализированным, созданным под конкретное «железо», позволяет повысить скорость инференса и снизить задержки в реальном времени. Данная методология упрощает цикл создания нейросетей, делая процесс адаптации моделей для граничных устройств более предсказуемым и менее ресурсозатратным для инженерных команд.