Было предпринято множество попыток использовать возможности нового искусственного интеллекта и больших языковых моделей (LLM) для прогнозирования результатов новых химических реакций. Они имели ограниченный успех, отчасти потому, что до сих пор не были основаны на понимании фундаментальных физических принципов, таких как законы сохранения массы. Теперь команда исследователей Массачусетского технологического института придумала способ включить эти физические ограничения в модель прогнозирования реакций и, таким образом, значительно повысить точность и достоверность ее результатов.
О новой работе было
сообщено 20 августа в журнале Nature в статье недавнего постдока Джунен Джунг (ныне доцент Университета Кукмин, Южная Корея); бывшего инженера-программиста Мун Хонг Фонга (ныне Университет Дьюка); аспиранта химической инженерии Николаса Казетти; постдока Джордана Лайлса; студента бакалавриата физики Не Дассанаяке; и старшего автора Коннора Коули, который является профессором по развитию карьеры в 1957 году в Университете Дьюка. Факультеты химической инженерии, электротехники и компьютерных наук Массачусетского технологического института.
“Прогнозирование результатов реакции - очень важная задача”, - объясняет Джонг. Например, если вы хотите создать новое лекарство, “вам нужно знать, как его производить. Итак, для этого нам нужно знать, какой продукт, вероятно, ”получится в результате данного набора химических веществ, вводимых в реакцию. Но большинство предыдущих попыток осуществить такие прогнозы касались только набора входных данных и набора выходных данных, без учета промежуточных этапов или учета ограничений, связанных с обеспечением отсутствия увеличения или потери массы в процессе, что невозможно в реальных реакциях.
Джунг отмечает, что, хотя большие языковые модели, такие как ChatGPT, были очень успешными во многих областях исследований, эти модели не обеспечивают способа ограничить их результаты физически реалистичными возможностями, например, требуя от них соблюдения принципа сохранения массы. В этих моделях используются вычислительные "токены”, которые в данном случае представляют отдельные атомы, но “если вы не сохраняете токены, модель LLM начинает создавать новые атомы или удаляет атомы в реакции”.
Вместо того, чтобы основываться на реальном научном понимании, “это что-то вроде алхимии”, - говорит он. Хотя многие попытки предсказания реакций касаются только конечных продуктов, “мы хотим отслеживать все химические вещества и то, как они трансформируются” на протяжении всего процесса реакции от начала до конца, - говорит он.
Чтобы решить проблему, команда использовала метод, разработанный еще в 1970-х годах химиком Иваром Уги, который использует электронную матрицу связь-электрон для представления электронов в реакции. Они использовали эту систему в качестве основы для своей новой программы под названием FlowER (Flow matching for Electron Redistribution), которая позволяет им явно отслеживать все электроны в реакции, чтобы гарантировать, что ни один из них не был случайно добавлен или удален в процессе.
Система использует матрицу для представления электронов в реакции и использует ненулевые значения для представления связей или пар одиночных электронов и нули для обозначения их отсутствия. “Это помогает нам сохранять и атомы, и электроны одновременно”, - говорит Фонг. Такое представление, по его словам, было одним из ключевых элементов включения сохранения массы в их систему прогнозирования.
По словам Коули, разработанная ими система все еще находится на ранней стадии. “Система в ее нынешнем виде является демонстрацией — доказательством концепции того, что этот генеративный подход согласования потоков очень хорошо подходит для задачи прогнозирования химических реакций”. Хотя команда в восторге от этого многообещающего подхода, он говорит: “мы осознаем, что у него есть определенные ограничения в том, что касается широты применения различных химических технологий”.