arXiv · 02.07.2026 ·Исследования и наука

Оптимизация распределения ресурсов в условиях неопределенности

Исследователи представили математическую модель для управления распределением ресурсов в режиме реального времени, когда запросы поступают последовательно, а их ценность и объем потребления являются случайными величинами. Работа фокусируется на минимизации «сожаления» (regret) при принятии необратимых решений об отклонении или принятии запросов в условиях ограниченных мощностей и потенциальной вырожденности данных.

Авторы анализируют сценарии, в которых запросы классифицируются по типам, но параметры каждого конкретного обращения распределены непрерывно. Основная сложность заключается в динамическом выборе стратегии, которая максимизирует суммарную выгоду, не превышая при этом жесткие лимиты доступных ресурсов. Математический аппарат исследования позволяет лучше понять границы эффективности алгоритмов в задачах планирования и управления нагрузкой.

Данный подход применим к широкому спектру задач, от управления облачными вычислительными мощностями до динамического ценообразования и распределения рекламного инвентаря. Использование вероятностных моделей для оценки потребления ресурсов помогает снизить риски перерасхода и повысить общую доходность систем, работающих в условиях высокой волатильности входящего трафика.

Ключевые факты

Исследование посвящено задаче онлайн-распределения ресурсов с непрерывным распределением наград и объемов потребления.
Разработанный алгоритм направлен на минимизацию показателя «сожаления» (regret) при принятии решений в условиях ограниченных мощностей.
Модель учитывает наличие конечного числа наблюдаемых типов запросов, для каждого из которых параметры потребления являются случайными величинами.
Работа предлагает решение проблемы вырожденности (degeneracy), возникающей при оценке эффективности стратегий распределения в динамических системах.

Источник: arXiv

Обсудить с ИИ

Похожие материалы

The latest research from Google · Оркестрация агентов Новые алгоритмы планирования для динамических систем Исследователи Google представили новый подход к планированию задач в условиях изменяющейся пропускной способности. В статье рассматриваются алгоритмы, которые оптимизируют распределение ресурсов в системах с переменной нагрузкой, что особенно актуально для распределённых вычислений и оркестрации ИИ-агентов. arXiv · Исследования и наука Новые теоретические границы для задачи мульти-секретаря Исследователи представили работу, устанавливающую строгие нижние границы для аддитивного сожаления (regret) в задаче мульти-секретаря. Авторы доказали, что для распределений с разрывами в поддержке достижение границы O(log T) невозможно, что закрывает давний вопрос о сложности алгоритмов принятия решений в условиях неопределенности и ограниченной информации при выборе оптимальной стратегии. arXiv · Инференс и железо Оптимизация визуального инференса через проактивную маршрутизацию запросов Исследователи предложили метод повышения эффективности мультимодальных моделей при выполнении сложных визуальных задач. Система использует связку из компактной «черновой» модели и крупной целевой модели, применяя адаптивный механизм маршрутизации. В зависимости от сложности запроса, система автоматически определяет, какая модель должна обрабатывать данные, что позволяет сократить избыточные вычисления и ускорить процесс рассуждения. Hacker News · Машинное обучение Оптимизация процесса оценки моделей через эволюционные алгоритмы Вместо классического дообучения нейросетей исследователи предлагают сосредоточиться на эволюции «обвязки» (harness) — набора промптов, параметров и стратегий оценки. Такой подход позволяет значительно повысить производительность моделей на конкретных задачах без изменения весов самой нейросети, используя автоматизированный поиск оптимальных конфигураций для достижения целевых метрик качества в реальных бизнес-сценариях. arXiv · Машинное обучение Мультиагентные системы для многокритериальной оптимизации в динамических средах Исследователи представили новый подход к решению задач оптимизации в вычислительных и сетевых системах с помощью мультиагентных систем. Традиционные методы обучения с подкреплением часто сводят сложные задачи к минимизации единого скалярного вознаграждения, используя штрафные коэффициенты для учета ограничений. Однако такой подход оказывается недостаточно гибким в динамических условиях, где требования к производительности и затратам постоянно меняются. arXiv · Машинное обучение Новый метод оптимизации вычислений для медленно меняющихся последовательностей Исследователи предложили новый подход к аппроксимации функций в последовательностях, где значения элементов изменяются незначительно от шага к шагу. В таких задачах разница между соседними элементами остается малой, что позволяет оптимизировать вычислительные затраты при обработке данных. Авторы работы опираются на методы неявной оценки следа (implicit trace estimation), которые позволяют эффективно переиспользовать результаты запросов к предыдущим элементам последовательности. Hacker News · Машинное обучение Новый математический подход снижает требования к «железу» для ИИ Исследователи предложили новый математический метод оптимизации вычислений, который позволяет значительно снизить нагрузку на аппаратное обеспечение при работе с нейросетями. Замена стандартных операций с плавающей запятой на альтернативные вычисления позволяет сократить потребление ресурсов GPU без потери точности моделей, что открывает путь к более эффективному инференсу на менее мощном оборудовании. arXiv · Машинное обучение Алгоритмическое обучение стратегиям ставок в аукционах с бюджетными ограничениями Исследователи представили новый подход к автоматизации стратегий ставок в дискриминационных аукционах с учетом бюджетных ограничений. Модель оптимизирует совокупную полезность участника на протяжении T раундов, учитывая стоимость капитала и жесткие лимиты расходов. Решение преодолевает вычислительную сложность экспоненциального пространства действий, предлагая эффективные методы для динамического управления ставками в условиях неопределенности и конкурентной среды. arXiv · Машинное обучение Новый метод обучения генеративных моделей с учетом стоимости принятия решений Исследователи представили метод Decision-Aware Training, который оптимизирует генеративные модели для задач вероятностного прогнозирования с учетом реальных экономических затрат. В отличие от стандартных подходов, фокусирующихся на плотности данных, новый алгоритм перераспределяет обучающий сигнал, минимизируя риски и издержки, связанные с ошибками прогноза в критически важных бизнес-процессах и управленческих решениях. arXiv · Машинное обучение Оптимизация сенсоров в MARL для управления сложными физическими системами Исследователи представили метод оптимизации расположения датчиков для управления конвекцией Рэлея-Бенара с помощью многоагентного обучения с подкреплением (MARL). Авторы обучают плотные экспертные политики на основе оконных наблюдений, а затем дистиллируют их в разреженные «ученические» модели. Использование групповой регуляризации весов входа энкодера позволяет значительно сократить количество необходимых сенсоров при сохранении высокой эффективности управления системой.

← Все материалы