Featured image for issledovateli mit sozdali model mashinnogo obucheniya dlya tochnogo predskazaniya rastvorimosti molekul

Исследователи MIT создали модель машинного обучения для точного предсказания растворимости молекул

Химические инженеры MIT разработали вычислительную модель, которая с помощью машинного обучения предсказывает, насколько хорошо любая молекула будет растворяться в органических растворителях. Это критически важный этап в синтезе практически любого фармацевтического препарата, сообщает MIT News.

Практическое значение открытия

Новая модель, предсказывающая количество растворенного вещества в конкретном растворителе, поможет химикам выбирать оптимальные растворители для синтеза. Как отмечает Лукас Аттия, аспирант MIT и соавтор исследования: «Предсказание растворимости действительно является ограничивающим этапом в синтетическом планировании и производстве химикатов, особенно лекарств».

Исследователи сделали свою модель общедоступной, и многие компании и лаборатории уже начали её использовать. Особенно полезной модель может оказаться для идентификации менее опасных растворителей по сравнению с commonly используемыми промышленными аналогами.

Это классический пример того, как машинное обучение решает задачи, которые десятилетиями оставались сложными для традиционных методов. Точность предсказаний в 2-3 раза выше классической модели Абрахама — это не incremental improvement, а качественный скачок для фармацевтической индустрии.

Технические детали подхода

Модель была обучена на dataset BigSolDB, который содержит данные из nearly 800 публикаций с информацией о растворимости approximately 800 молекул в более чем 100 органических растворителях. Исследователи использовали два типа моделей:

  • FastProp — использует статические embeddings молекул
  • ChemProp — обучает embeddings одновременно с предсказанием растворимости

Обе модели были обучены на более чем 40,000 точек данных, включая влияние температуры. При тестировании на 1,000 solutes, не участвовавших в обучении, модели показали точность в 2-3 раза выше традиционной модели Абрахама.

Исследование опубликовано в Nature Communications под руководством Уильяма Грина, профессора химического инженеринга MIT.

Похожие записи