Мы применяем куки на сайте, вы соглашаетесь на использование файлов cookie. Подробнее
OK
Подразделение: блог KOLERSKYAI

Новый генеративный метод прогнозирования химических реакций с помощью ИИ

Система, разработанная в Массачусетском технологическом институте, может обеспечивать реалистичные прогнозы для широкого спектра реакций при сохранении реальных физических ограничений.
Картинка сгенерирована в Midjourney KolerskyAI
Было предпринято множество попыток использовать возможности нового искусственного интеллекта и больших языковых моделей (LLM) для прогнозирования результатов новых химических реакций. Они имели ограниченный успех, отчасти потому, что до сих пор не были основаны на понимании фундаментальных физических принципов, таких как законы сохранения массы. Теперь команда исследователей Массачусетского технологического института придумала способ включить эти физические ограничения в модель прогнозирования реакций и, таким образом, значительно повысить точность и достоверность ее результатов.

О новой работе было сообщено 20 августа в журнале Nature в статье недавнего постдока Джунен Джунг (ныне доцент Университета Кукмин, Южная Корея); бывшего инженера-программиста Мун Хонг Фонга (ныне Университет Дьюка); аспиранта химической инженерии Николаса Казетти; постдока Джордана Лайлса; студента бакалавриата физики Не Дассанаяке; и старшего автора Коннора Коули, который является профессором по развитию карьеры в 1957 году в Университете Дьюка. Факультеты химической инженерии, электротехники и компьютерных наук Массачусетского технологического института.

“Прогнозирование результатов реакции - очень важная задача”, - объясняет Джонг. Например, если вы хотите создать новое лекарство, “вам нужно знать, как его производить. Итак, для этого нам нужно знать, какой продукт, вероятно, ”получится в результате данного набора химических веществ, вводимых в реакцию. Но большинство предыдущих попыток осуществить такие прогнозы касались только набора входных данных и набора выходных данных, без учета промежуточных этапов или учета ограничений, связанных с обеспечением отсутствия увеличения или потери массы в процессе, что невозможно в реальных реакциях.

Джунг отмечает, что, хотя большие языковые модели, такие как ChatGPT, были очень успешными во многих областях исследований, эти модели не обеспечивают способа ограничить их результаты физически реалистичными возможностями, например, требуя от них соблюдения принципа сохранения массы. В этих моделях используются вычислительные "токены”, которые в данном случае представляют отдельные атомы, но “если вы не сохраняете токены, модель LLM начинает создавать новые атомы или удаляет атомы в реакции”.

Вместо того, чтобы основываться на реальном научном понимании, “это что-то вроде алхимии”, - говорит он. Хотя многие попытки предсказания реакций касаются только конечных продуктов, “мы хотим отслеживать все химические вещества и то, как они трансформируются” на протяжении всего процесса реакции от начала до конца, - говорит он.

Чтобы решить проблему, команда использовала метод, разработанный еще в 1970-х годах химиком Иваром Уги, который использует электронную матрицу связь-электрон для представления электронов в реакции. Они использовали эту систему в качестве основы для своей новой программы под названием FlowER (Flow matching for Electron Redistribution), которая позволяет им явно отслеживать все электроны в реакции, чтобы гарантировать, что ни один из них не был случайно добавлен или удален в процессе.

Система использует матрицу для представления электронов в реакции и использует ненулевые значения для представления связей или пар одиночных электронов и нули для обозначения их отсутствия. “Это помогает нам сохранять и атомы, и электроны одновременно”, - говорит Фонг. Такое представление, по его словам, было одним из ключевых элементов включения сохранения массы в их систему прогнозирования.

По словам Коули, разработанная ими система все еще находится на ранней стадии. “Система в ее нынешнем виде является демонстрацией — доказательством концепции того, что этот генеративный подход согласования потоков очень хорошо подходит для задачи прогнозирования химических реакций”. Хотя команда в восторге от этого многообещающего подхода, он говорит: “мы осознаем, что у него есть определенные ограничения в том, что касается широты применения различных химических технологий”.
Мы невероятно рады тому факту, что можем получать такие надежные прогнозы химических механизмов” с помощью существующей системы, - говорит он. “Он сохраняет массу, он сохраняет электроны, но мы, безусловно, признаем, что в ближайшие годы предстоит работать над гораздо большим расширением и надежностью
Но даже в его нынешнем виде, который доступен в свободном доступе через онлайн-платформу GitHub, “мы думаем, что он будет давать точные прогнозы и будет полезен как инструмент для оценки реакционной способности и определения путей реакции”, - говорит Коули. “Если мы смотрим в будущее, действительно продвигая современное механистическое понимание и помогая изобретать новые реакции, мы не совсем там. Но мы надеемся, что это станет ступенькой на пути к этому ”.

“Все это с открытым исходным кодом”, - говорит Фонг. “Модели, данные - все это есть”, включая предыдущий набор данных, разработанный Джунгом, в котором исчерпывающе перечислены механические стадии известных реакций. “Я думаю, что мы являемся одной из групп-первопроходцев, создающих этот набор данных, делающих его доступным с открытым исходным кодом и делающих его доступным для всех”, - говорит он.

По словам команды, модель FlowER соответствует или превосходит существующие подходы к нахождению стандартных механических путей и позволяет обобщать ранее невиданные типы реакций. Говорят, что модель потенциально может быть полезна для прогнозирования реакций в медицинской химии, при открытии материалов, при горении, химии атмосферы и в электрохимических системах.
Сравнивая их с существующими системами прогнозирования реакций, Коули говорит: “используя выбранные нами архитектурные решения, мы получаем значительное повышение достоверности и сохранности данных, а также сопоставимую или немного лучшую точность с точки зрения производительности”.

Он добавляет, что “уникальность нашего подхода заключается в том, что, хотя мы используем понимание механизмов из учебников для создания этого набора данных, мы привязываем реагенты и продукты общей реакции к экспериментально подтвержденным данным из патентной литературы”. По его словам, они делают выводы о лежащих в основе механизмах, а не просто выдумывают их. “Мы вменяем их в вину экспериментальным данным, и это не то, что раньше делалось и распространялось в таких масштабах”.
Следующий шаг, по его словам, заключается в том, что “мы весьма заинтересованы в расширении понимания моделью металлов и каталитических циклов. В этой первой статье мы только что коснулись поверхности:”и большинство включенных на данный момент реакций не включают металлы или катализаторы “, так что это направление нас очень интересует ”.

В долгосрочной перспективе, по его словам, “большой интерес вызывает использование такого рода систем для обнаружения новых сложных реакций и выяснения новых механизмов. Я думаю, что долгосрочное потенциальное воздействие велико, но это, конечно, только первый шаг. ”