Исследователи предложили новый подход RubricsTree для масштабируемой и эволюционирующей оценки персональных медицинских агентов. Система направлена на преодоление текущих ограничений в оценке таких агентов, которые используют данные о здоровье пользователей и медицинские навыки.

Проблема заключается в том, что традиционные методы оценки, основанные на аннотациях врачей, надежны, но дороги и не масштабируемы. В то же время оценщики на основе LLM, хотя и масштабируемы, часто субъективны и неконсистентны.

RubricsTree предлагает решение, сочетая преимущества обоих подходов. Система позволяет оценивать агентов по различным критериям, включая память о здоровье пользователя и медицинские навыки, обеспечивая при этом масштабируемость и консистентность.

Исследование опубликовано на arXiv и может стать важным шагом в развитии персональных медицинских агентов, что в перспективе поможет снизить глобальные различия в доступе к медицинским услугам.