Исследователи представили новый подход к автоматизации стратегий ставок в дискриминационных аукционах с учетом бюджетных ограничений. Модель оптимизирует совокупную полезность участника на протяжении T раундов, учитывая стоимость капитала и жесткие лимиты расходов. Решение преодолевает вычислительную сложность экспоненциального пространства действий, предлагая эффективные методы для динамического управления ставками в условиях неопределенности и конкурентной среды.
Задача построения оптимальной стратегии в аукционах типа «pay-as-bid» осложняется необходимостью балансировать между текущей выгодой и долгосрочным сохранением бюджета. В работе рассматривается сценарий, где полезность игрока зависит от разницы между ценностью лота и стоимостью платежа, скорректированной на коэффициент стоимости капитала. Авторы предлагают алгоритмический фреймворк, который позволяет агенту обучаться оптимальному поведению, минимизируя потери от неэффективного распределения средств.
Предложенный метод опирается на теоретико-игровой анализ и методы обучения с подкреплением, адаптированные для работы в условиях ограниченных ресурсов. Исследование демонстрирует, как агент может адаптироваться к меняющимся рыночным условиям, сохраняя при этом высокую эффективность торгов. Полученные результаты имеют практическое значение для автоматизированных систем закупок, рекламных аукционов в реальном времени и других рыночных механизмов, где требуется принятие решений в условиях жестких финансовых рамок.
Ключевые факты
- Исследование сфокусировано на дискриминационных аукционах (pay-as-bid), где участник платит предложенную им цену.
- Модель учитывает коэффициент стоимости капитала α, варьирующийся в диапазоне от 0 до 1.
- Алгоритм решает проблему максимизации полезности при наличии фиксированного общего бюджета B на весь период торгов T.
- Предложенный подход эффективно справляется с экспоненциальной размерностью пространства действий, характерной для многолотовых аукционов.