Разработчики представили Tokdiet — прокси-сервер для локального запуска языковых моделей, который сокращает расход токенов на 70% без потери качества. Решение работает как промежуточный слой между пользователем и моделью, оптимизируя запросы и уменьшая объём передаваемых данных.
Tokdiet поддерживает популярные модели, включая Mistral и Llama, и совместим с различными фреймворками. Проект открыт для внесения изменений и доступен на GitHub. Разработчики отмечают, что решение может значительно снизить затраты на инференс, особенно при работе с большими моделями.
Прокси-сервер использует алгоритмы сжатия и оптимизации, которые позволяют уменьшить нагрузку на вычислительные ресурсы без ухудшения качества ответов. Это делает его полезным инструментом для разработчиков, которые хотят снизить затраты на использование языковых моделей.
Tokdiet может быть полезен как для локального использования, так и для интеграции в облачные сервисы. Разработчики планируют дальнейшее развитие проекта, включая добавление поддержки новых моделей и улучшение алгоритмов оптимизации.