Исследователи представили новый метод глубокого обучения для оценки растворимости химических соединений в воде, критически важного параметра в ранней разработке лекарств. В отличие от стандартных моделей, объединяющих данные в единый вектор, предложенная архитектура разделяет физико-химические дескрипторы и информацию о молекулярных графах, что позволяет интерпретировать вклад каждого компонента в итоговый прогноз.

Традиционные подходы к моделированию молекулярных свойств часто работают как «черные ящики», смешивая глобальные химические характеристики с топологией молекул. Новый фреймворк использует аддитивный подход, где MLP (многослойный перцептрон) обрабатывает дескрипторы, а GNN (графовая нейронная сеть) анализирует структурные связи. Это разделение потоков данных помогает исследователям понять, что именно определяет растворимость конкретного вещества — его функциональные группы или пространственная конфигурация.

Такая архитектура повышает прозрачность предсказаний, что особенно ценно при поиске новых фармацевтических субстанций. Возможность отслеживать вклад каждого источника данных позволяет точнее калибровать модели и снижать количество ошибок при виртуальном скрининге библиотек соединений. Метод демонстрирует эффективность в задачах, где важна не только точность результата, но и понимание физической природы молекулярных взаимодействий.

Ключевые факты

  • Фреймворк разделяет обработку физико-химических дескрипторов и молекулярных графов на всех этапах обучения.
  • Использование аддитивной структуры MLP-GNN позволяет изолировать влияние глобальной химии от структурных особенностей молекулы.
  • Модель предназначена для оптимизации ранних этапов разработки лекарств, где растворимость является ключевым фактором биодоступности.
  • Метод решает проблему интерпретируемости, характерную для комплексных моделей, объединяющих разнородные типы молекулярных данных.