Исследователи выявили критическую проблему в работе больших языковых моделей при медицинской сортировке: ИИ демонстрирует предвзятость, оценивая срочность помощи для пациентов с одинаковыми симптомами в зависимости от их пола. Анализ показал, что модели систематически занижают приоритет лечения для женщин, что создает серьезные риски для точности диагностики и безопасности пациентов в клинических сценариях.
В ходе эксперимента ученые использовали стандартизированные клинические виньетки, где единственным переменным фактором был пол пациента. Несмотря на идентичность описанных жалоб, модели чаще присваивали женщинам более низкие уровни неотложности по сравнению с мужчинами. Это указывает на то, что алгоритмы наследуют и воспроизводят исторические стереотипы, присутствующие в обучающих медицинских данных, где симптомы определенных заболеваний у женщин часто недооцениваются или интерпретируются как менее критические.
Результаты исследования подчеркивают необходимость внедрения строгих механизмов контроля качества и калибровки для систем ИИ, внедряемых в здравоохранение. Без специальной коррекции предвзятости такие инструменты могут привести к неравенству в доступе к своевременной медицинской помощи и повышению уровня врачебных ошибок при автоматизированной первичной обработке обращений.
Ключевые факты
- ИИ-модели систематически присваивают женщинам более низкий приоритет при одинаковых симптомах.
- Исследование базируется на анализе ответов LLM при обработке стандартизированных медицинских кейсов.
- Выявленная предвзятость напрямую влияет на оценку уровня неотложности медицинской помощи.
- Результаты указывают на наличие скрытых гендерных стереотипов в обучающих выборках медицинских данных.