Исследователи предложили новый подход RubricsTree для масштабируемой и эволюционирующей оценки персональных медицинских агентов. Система направлена на преодоление текущих ограничений в оценке таких агентов, которые используют данные о здоровье пользователей и медицинские навыки.
Проблема заключается в том, что традиционные методы оценки, основанные на аннотациях врачей, надежны, но дороги и не масштабируемы. В то же время оценщики на основе LLM, хотя и масштабируемы, часто субъективны и неконсистентны.
RubricsTree предлагает решение, сочетая преимущества обоих подходов. Система позволяет оценивать агентов по различным критериям, включая память о здоровье пользователя и медицинские навыки, обеспечивая при этом масштабируемость и консистентность.
Исследование опубликовано на arXiv и может стать важным шагом в развитии персональных медицинских агентов, что в перспективе поможет снизить глобальные различия в доступе к медицинским услугам.