КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 22-73-10124

НазваниеУсовершенствование надёжности методов моделирования химических реакций

РуководительМедведев Михаил Геннадьевич, Кандидат физико-математических наук

Организация финансирования, регион Федеральное государственное бюджетное учреждение науки Институт органической химии им. Н.Д. Зелинского Российской академии наук, г Москва

Период выполнения при поддержке РНФ 07.2022 - 06.2025 

Конкурс№71 - Конкурс 2022 года «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными.

Область знания, основной код классификатора 03 - Химия и науки о материалах, 03-501 - Квантовая химия, математические методы в химии

Ключевые словамеханизмы химических реакций, квантовая химия, теория функционала плотности, конформационный поиск, оценка надёжности

Код ГРНТИ31.21.18


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Квантовая химия является важным инструментом в современной экспериментальной химии, позволяющим изучать химические процессы на молекулярном уровне, а также проводить оптимизацию их условий и катализаторов in silico – экономя реактивы и растворители. Однако на настоящий момент она остаётся очень «тонким» инструментом, так что её результаты очень сильно зависят от выбора используемых в ходе моделирования допущений. Для того, чтобы сделать квантовохимическое моделирование более надёжным, необходима комплексная работа над ключевыми приближениями, использующимися при квантовохимическом моделировании. В рамках данного проекта мы планируем провести такую работу, что в итоге позволит нам предложить универсальный подход к моделированию химических процессов. Основными направлениями работы станут: 1. Разработка надёжных методов конформационного поиска для сложных химических систем и переходных состояний. 2. Тестирование точности существующих квантовохимических методов (в первую очередь, полуэмпирических и методов теории функционала плотности). 3. Разработка новых методов теории функционала плотности, в том числе, на базе нейронных сетей. 4. Разработка подходов к оценке надёжности полученных в ходе расчёта результатов. Все решаемые в рамках данного проекта задачи в настоящий момент являются нерешёнными и в общем случае препятствуют практическому приложению методов квантовой химии к решению химических задач.

Ожидаемые результаты
В рамках данного проекта нами будут: 1. Разработан надёжный алгоритм конформационного поиска для сложных химических систем и переходных состояний. Для этого будет разработан ряд методов: a. конформационный поиск на основании подхода inverse kinematics, обеспечивающий глобальное сэмплирование конфигурационного пространства системы, b. конформационный поиск на основании подхода Hamiltonian replica-exchange, обеспечивающий локальный поиск наиболее энергетически выгодных конформаций, c. метод построения многомерного профиля потенциальной энергии по небольшому количеству рассчитанных конфигураций на основании подхода Bayesian optimization, который позволит оценивать вероятность нахождения низкоэнергетических конформаций, а также их координаты в конфигурационном пространстве. d. На основании этих трёх методов нами будет создан надёжный итеративный подход к конформационному поиску сложных химических систем и переходных состояний. 2. Разработаны новые подходы к созданию методов теории функционала плотности, для чего: a. точные условия (exact constraints), которые сейчас применяются для выбора функционального вида (формулы) будущего функционала, будут переформулированы в виде функций ошибки, что позволит использовать их при обучении нейронных сетей, b. будут выявлены основные причины переобучения многопараметрических функционалов и предложены подходы к устранению этой проблемы. c. Разработанные подходы будут использованы для создания новых методов теории функционала плотности, как имеющих стандартную математическую форму, так и построенных на нейронных сетях. 3. Протестированы точности существующих квантовохимических методов (в первую очередь, полуэмпирических и методов теории функционала плотности) в задачах расчёта ключевых характеристик химических реакций (скорость, соотношение продуктов), а также свойств химических соединений (цвет, химические сдвиги атомов и т.д.). Особое внимание будет уделено анализу переобученности существующих и разработанных в ходе работы над проектом методов, для чего будет изучаться их способность к воспроизведению электронной плотности, которая ранее была предложена нами в качестве надёжного критерия переобучения. 4. Разработан подход «согласованного функционала», в рамках которого результаты нескольких дешёвых методов теории функционала плотности будут комбинироваться для получения более точных результатов, чем мог бы обеспечить один из этих функционалов в отдельности. 5. Разработан подход к оценке точности полученных в ходе расчёта результатов на основе подхода Монте-Карло к распространению ошибок. Все предполагаемые результаты находятся на переднем крае современной мировой науки. Решаемые в рамках данного проекта задачи являются насущными для квантовой химии, поэтому разработанные методы и полученные результаты будут широко востребованы в научном сообществе. Они позволят исследователям получать более точные результаты при моделировании химических реакций, а значит помогут и развитию химии в целом, в которой предварительное моделирование играет всё большую роль. Созданные в рамках данного проекта методы и подходы упростят разработку новых поколений промышленных катализаторов и лекарственных препаратов, что, несомненно, будет иметь положительный экономический эффект.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2022 году
Точность результатов в квантовой химии очень сильно зависит от используемых приближений, поэтому в рамках данного проекта мы работаем над увеличением точности всех ключевых приближений, что позволит нам приблизиться к созданию универсального подхода к моделированию химических реакций. Моделирование химических реакций состоит, упрощённо, из пяти этапов: (1) определение возможных путей протекания процесса; (2) построение конформационных ансамблей для ключевых соединений и переходных состояний; (3) выбор уровня теории и приближений, вычисление относительных энергий для всех или некоторых структур в построенных конформационных ансамблях; (4) выводы и предсказания на основе полученных результатов, а так же оценка надёжности сделанных выводов и предсказаний; (5) изучение ключевых эффектов, определяющих поведение системы. Сколь бы надёжными ни были методы, использующиеся на последующих этапах, ошибка на одном из первых этапов может привести к очень большим ошибкам в предсказаниях. Так, отсутствие наиболее выгодного конформера в конформационном ансамбле ключевого переходного состояния может привести к ошибке в несколько ккал/моль. А погрешность даже в 1 ккал/моль, может привести к ошибке в прогнозе соотношениях продуктов на более чем 50%. 1. В 2022/2023 году нами была решена проблема глобального сэмплирования конфигурационного пространства полициклических систем. Для этого был разработан и протестирован метод конформационного поиска, основанный на подходе inverse kinematics, обеспечивающий ресурсоэффективный глобальный поиск стабильных конформаций сложных полициклических систем, что являлось очень сложной задачей для имевшихся ранее методов конформационного поиска. 2. Также, нами разработан и протестирован метод конформационного поиска, основанный на подходе Hamiltonian replica-exchange. Данный метод базируется на молекулярной динамике, однако, в нём устранена основная проблема подобных методов – трудность преодоления больших энергетических барьеров, приводящая к потере целых классов конформеров. 3. Подвижность молекулы выражается не только в конформационной свободе, поэтому для корректной оценки энергии необходимо учитывать все её степени свободы. Нами было изучено влияние клеточного эффекта растворителя на трансляционную подвижность и установлено, что он является причиной нетипичного фотоиндуцированного трансфера цимантренильного фрагмента с сохранением в продукте всех трёх карбонилов. После построения конформационных ансамблей рассчитываются энергии всех или нескольких конформаций из каждого ансамбля на более точном уровне теории. Оптимальными с точки зрения цены-качества и потому наиболее популярными методами для большинства задач оценки энергий являются DFT функционалы. 4. Как известно, эмпирическая параметризация может приводить к переобучению функционалов. Проведённое нами тестирование популярных на сегодняшний день функционалов на силах Гельмана-Фейнмана позволило найти ещё один критерий переобученности. Таким критерием оказалась разность квантовохимических сил (производная энергии по координатам ядер) и сил Гельмана-Фейнмана (производная Гамильтониана по координатам ядер). Для надежного функционала разница между этими силами, именуемая также силой Пулая, должна стремиться к нулю. Однако, было обнаружено, что ненадёжные функционалы могут использовать силы Пулая для компенсации искажения электронной плотности. Условие близости сил Пулая к 0 при параметризации новых функционалов может сыграть ключевую роль при решении проблемы переобучения новых функционалов, в том числе нейросетевых. 5. Был разработан и протестирован подход к обучению многопараметрических функционалов DFT на несамосогласованной плотности. Обнаружено, что использование локальной плотности энергии при обучении функционалов DFT позволяет значительно улучшить качество электронной плотности функционала M06-2X несмотря на то, что он принадлежит к группе функционалов, для которых характерны большие ошибки в электронной плотности. 6. Начата работа над нейросетевым функционалом DFT, в котором нейронная сеть подбирает оптимальный набор констант для физичного функционала. Было показано, что такой подход помогает улучшить точность функционалов в 2.5-2.7 раз, не теряя их форму и не жертвуя построенной на основании наших знаниях о точном функционале физической моделью. Полученные на этапе (3) энергии позволяют сделать вывод касательно механизма изучаемой реакции и предсказать соотношение продуктов. Часто игнорируемым, однако немаловажным этапом является оценка надёжности полученных результатов и точности сделанных предсказаний, на основании которой стоит делать вывод о необходимости дальнейших исследований. В рамках решения этой задачи нами: 7. Был разработан подход к оценке точности полученных в ходе расчёта результатов на основе метода распространению ошибок Монте-Карло и продемонстрирована его работоспособность на модельной задаче оптимизации катализатора. 8. Разработан подход к построению кластерных моделей активных центров белков, возволяющий моделировать относительные активности биоизостеров, высокая схожесть которых делает биоизостерические замены почти неразрешимыми для вычислительных методов, использующих стандартные силовые поля. Разработанный метод был применён для расчёта изменения биологической активности при замене H→F на тестовой выборке из 16 различных комплексов белок-лиганд и показал среднеквадратическое отклонение в 0.60 ккал/моль, что сравнимо с погрешностью экспериментальных измерений в ~0.42 ккал/моль. В дополнение к его точности скорость метода (~5 часов на ноутбуке на структуру) и отсутствие изменяемых параметров делают его применимым в современной разработке лекарственный средств.

 

Публикации

1. Лосев Т.В., Герасимов И.С., Панова М.В., Лисов А.А., Абдюшева Я.Р., Русина П.В., Залецкая Е., Строганов О.В., Медведев М.Г., Новиков Ф.Н. Quantum Mechanical-Cluster Approach to Solve the Bioisosteric Replacement Problem in Drug Design Journal of Chemical Information and Modeling, Journal of Chemical Information and Modeling, 2023, 63, 4, 1239-1248 (год публикации - 2023) https://doi.org/10.1021/acs.jcim.2c01212

2. Чалый В.А., Келбышева Е.С., Езерницкая М.Г., Стрелкова Т.В., Боченкова А.В., Медведев М.Г., Телегина Л.Н. CO-preserving Photoinduced Transfer of Cymantrenyl Moiety: a Tandem Experimental and Computational Investigation Chemistry – A European Journal, Chemistry – A European Journal, e202203949 (год публикации - 2023) https://doi.org/10.1002/chem.202203949