Исследователи адаптировали архитектуру трансформеров для анализа спектров комбинационного рассеяния (Рамана) бактерий. В работе проведено систематическое сравнение новой модели с классическими методами машинного обучения, такими как SVM, Random Forest и LDA в связке с методами снижения размерности PCA и ICA. Использование трансформеров позволило повысить точность классификации микроорганизмов в рамках строгой процедуры кросс-валидации.

Трансформеры, изначально разработанные для обработки естественного языка, демонстрируют высокую эффективность в задачах анализа временных рядов и спектральных данных благодаря механизму внимания. В данном исследовании модель обучалась на специфических наборах данных бактериальных спектров, где критически важно распознавать тонкие различия в интенсивности сигналов. Применение метода leave-one-replicate-out cross-validation (LOOCV) обеспечило надежную оценку обобщающей способности алгоритма, исключая утечку данных между обучающей и тестовой выборками.

Результаты показывают, что трансформеры превосходят традиционные пайплайны, основанные на методах главных компонент (PCA) или независимых компонент (ICA). Это открывает новые возможности для автоматизации микробиологической диагностики, где скорость и точность идентификации патогенов имеют решающее значение. Метод демонстрирует потенциал для внедрения в лабораторные системы анализа, требующие высокой точности при работе с зашумленными спектральными данными.

Ключевые факты

  • Исследование сфокусировано на классификации бактериальных спектров Рамана с использованием архитектуры трансформеров.
  • Проведено сравнение с классическими алгоритмами: SVM (метод опорных векторов), Random Forest и LDA (линейный дискриминантный анализ).
  • Использована методика вложенной кросс-валидации leave-one-replicate-out (LOOCV) для предотвращения переобучения.
  • Трансформеры показали более высокую точность по сравнению с комбинациями PCA/ICA и стандартными классификаторами.
  • Работа подтверждает эффективность глубокого обучения в задачах биомедицинской спектроскопии.