Исследователи представили метод KnowsTFM, который улучшает работу малых табличных моделей (TFM) за счет интеграции внешних реляционных знаний. В условиях нехватки данных или их высокого смещения относительно обучающей выборки, подход позволяет моделям превосходить специализированные методы, эффективно используя структурированную информацию из предметных областей для повышения качества предсказаний в сложных задачах.
Табличные модели стали стандартом для работы с данными среднего размера, однако они часто сталкиваются с трудностями в узкоспециализированных нишах. Проблема заключается в том, что стандартные архитектуры плохо адаптируются к данным, которые сильно отличаются от исходного распределения, на котором происходило предобучение. Новый метод решает эту задачу, внедряя механизм дообучения, учитывающий внешние знания, что позволяет модели лучше интерпретировать связи между признаками.
Интеграция знаний происходит на этапе дообучения, что позволяет сохранить преимущества предобученных весов, добавляя при этом контекст конкретной доменной области. Это делает подход применимым в таких сферах, как медицина или финансы, где доступ к размеченным данным ограничен, а наличие экспертных баз знаний является ключевым фактором для точности моделей.
Ключевые факты
- Метод KnowsTFM ориентирован на дообучение малых табличных моделей (TFM) с использованием внешних реляционных данных.
- Подход эффективно работает в условиях дефицита данных и высокой размерности, где стандартные модели показывают низкую точность.
- Технология позволяет преодолеть проблему смещения данных (data shift), характерную для узких предметных областей.
- Метод демонстрирует превосходство над специализированными алгоритмами за счет объединения глубокого обучения с экспертными знаниями.