Исследователи адаптировали архитектуру трансформеров для анализа спектров комбинационного рассеяния (Рамана) бактерий. В работе проведено систематическое сравнение новой модели с классическими методами машинного обучения, такими как SVM, Random Forest и LDA в связке с методами снижения размерности PCA и ICA. Использование трансформеров позволило повысить точность классификации микроорганизмов в рамках строгой процедуры кросс-валидации.
Трансформеры, изначально разработанные для обработки естественного языка, демонстрируют высокую эффективность в задачах анализа временных рядов и спектральных данных благодаря механизму внимания. В данном исследовании модель обучалась на специфических наборах данных бактериальных спектров, где критически важно распознавать тонкие различия в интенсивности сигналов. Применение метода leave-one-replicate-out cross-validation (LOOCV) обеспечило надежную оценку обобщающей способности алгоритма, исключая утечку данных между обучающей и тестовой выборками.
Результаты показывают, что трансформеры превосходят традиционные пайплайны, основанные на методах главных компонент (PCA) или независимых компонент (ICA). Это открывает новые возможности для автоматизации микробиологической диагностики, где скорость и точность идентификации патогенов имеют решающее значение. Метод демонстрирует потенциал для внедрения в лабораторные системы анализа, требующие высокой точности при работе с зашумленными спектральными данными.
Ключевые факты
- Исследование сфокусировано на классификации бактериальных спектров Рамана с использованием архитектуры трансформеров.
- Проведено сравнение с классическими алгоритмами: SVM (метод опорных векторов), Random Forest и LDA (линейный дискриминантный анализ).
- Использована методика вложенной кросс-валидации leave-one-replicate-out (LOOCV) для предотвращения переобучения.
- Трансформеры показали более высокую точность по сравнению с комбинациями PCA/ICA и стандартными классификаторами.
- Работа подтверждает эффективность глубокого обучения в задачах биомедицинской спектроскопии.