Исследователи провели комплексный бенчмарк, сравнивающий эффективность современных foundation-моделей и классических методов радиомики при анализе компьютерной томографии легких. Работа выявляет вклад отдельных компонентов — экстракторов признаков, классификаторов и методов сегментации — в точность диагностики, а также оценивает устойчивость моделей при работе с данными из разных медицинских когорт, что критически важно для клинического внедрения ИИ.
Традиционно радиомика считалась стандартом для фенотипирования рака легких на основе КТ-снимков. Однако появление универсальных визуальных моделей поставило вопрос об их преимуществе перед специализированными подходами. Авторы работы систематизировали архитектурные различия, протестировав пять типов экстракторов признаков, включая DINOv3 и специализированные радиомические модели, в сочетании с семью различными классификационными «головами», такими как TabPFN и XGBoost.
Результаты исследования подчеркивают важность выбора архитектуры классификатора и стратегии сегментации для достижения высокой точности. Особое внимание уделено кросс-когортной надежности алгоритмов: способность модели сохранять предсказательную силу на данных, полученных в других клиниках или на другом оборудовании, остается главным барьером для широкого применения ИИ в онкологии.
Ключевые факты
- Протестировано 5 типов экстракторов признаков: Curia, Curia-2, DINOv3, Radiomics2D и Radiomics3D.
- Оценено 7 классификационных архитектур, включая TabPFN, TabICL, XGBoost и CatBoost.
- Исследование сфокусировано на изоляции вклада каждого компонента (экстрактор, классификатор, сегментация) в итоговую точность.
- Проведен стресс-тест моделей на кросс-когортную устойчивость для проверки применимости в реальных клинических условиях.