Разработчики DeepSeek анонсировали запуск модели V4, который сопровождается внедрением системы динамического ценообразования. Новая модель тарификации предполагает разделение стоимости запросов на «пиковые» и «внепиковые» периоды, что позволяет оптимизировать затраты на инференс. Это решение направлено на более эффективное распределение вычислительных мощностей и снижение финансовой нагрузки на пользователей в периоды низкой активности сети.
Переход к модели «пик-долина» отражает общую тенденцию на рынке облачных ИИ-сервисов, где компании стремятся максимизировать утилизацию GPU-кластеров. Внедрение подобных механизмов позволяет разработчикам гибко управлять спросом, предлагая более выгодные условия для выполнения задач, не требующих мгновенного отклика в часы максимальной нагрузки.
Для бизнеса такая стратегия открывает возможности для снижения операционных расходов при интеграции LLM в производственные процессы. Компании, использующие API для пакетной обработки данных или фоновых задач, смогут переносить выполнение запросов на ночное время или периоды спада активности, существенно сокращая бюджет на использование инфраструктуры.
Ключевые факты
- Модель DeepSeek V4 официально выходит в середине июля.
- Вводится дифференцированная система оплаты: стоимость API зависит от времени суток и текущей нагрузки на серверы.
- Динамическое ценообразование направлено на балансировку вычислительных мощностей между пиковыми и внепиковыми часами.
- Механизм позволяет пользователям снижать затраты при выполнении задач, не критичных по времени отклика.