Исследователи представили новый подход к распознаванию целей в мультиагентных средах, сочетающий обучение с подкреплением и метод ветвей и границ. Алгоритм позволяет эффективно определять состав команд и их намерения на основе анализа траекторий движения, решая проблему комбинаторного взрыва гипотез, характерную для сложных систем с большим количеством участников и динамическими задачами.

Задача распознавания целей в мультиагентных системах осложняется тем, что наблюдателю часто доступна только информация о перемещениях объектов. В условиях дронов-наблюдателей или совместной робототехники количество возможных комбинаций команд и целей растет экспоненциально. Авторы предложили факторизованный подход, который разбивает пространство поиска на управляемые подзадачи, что значительно ускоряет процесс вывода при сохранении высокой точности предсказаний.

Метод использует обучение с подкреплением, обусловленное как составом команды, так и конкретной целью. Это позволяет модели учитывать специфические паттерны поведения, характерные для групп, работающих над общим результатом. Использование метода ветвей и границ для оптимизации поиска позволяет отсекать неперспективные гипотезы на ранних этапах, что делает систему пригодной для работы в режиме реального времени в задачах мониторинга и координации автономных агентов.

Ключевые факты

  • Алгоритм решает проблему комбинаторного роста пространства гипотез при увеличении числа агентов и целей.
  • Метод опирается на анализ траекторий движения, что критически важно для систем, где скрыты внутренние коммуникации агентов.
  • Использование факторизованного метода ветвей и границ позволяет эффективно ранжировать гипотезы о целях команд.
  • Технология применима в таких областях, как мониторинг с помощью БПЛА и промышленная коллаборативная робототехника.