КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 19-73-20115

НазваниеРазработка нового полуэмпирического квантово-химического подхода для моделирования соединений актиноидов

РуководительКалмыков Степан Николаевич, Доктор химических наук

Организация финансирования, регион Федеральное государственное бюджетное образовательное учреждение высшего образования «Московский государственный университет имени M.В.Ломоносова», г Москва

Период выполнения при поддержке РНФ 2019 г. - 2022 г. 

Конкурс№31 - Конкурс 2019 года по мероприятию «Проведение исследований на базе существующей научной инфраструктуры мирового уровня» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными.

Объект инфраструктуры Центр коллективного пользования сверхвысокопроизводительными вычислительными ресурсами Московского университета.

Область знания, основной код классификатора 03 - Химия и науки о материалах, 03-501 - Квантовая химия, математические методы в химии

Ключевые словаквантовая химия, актиноиды, теория функционала плотности, машинное обучение

Код ГРНТИ31.15.03


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Современные методы вычислительной химии (квантовой химии, хемоинформатики и т.д.) позволяют значительно сокращать время дизайна новых лигандов для комплексообразования металлов, в том числе для решения задач дизайна лекарств или разделения близких по химическим свойствам элементов. С использованием компьютерного моделирования можно сделать предварительную теоретическую оценку селективности библиотек потенциально интересных органических молекул. На основании подобного скрининга можно в значительной степени сократить количество молекул-претендентов и, таким образом, уменьшить трудо- и ресурсо-затраты. Однако, если объектом применения являются комплексы тяжелых металлов, сложность задачи моделирования увеличивается в разы за счет необходимости учета релятивистских эффектов и эффектов, связанных с электронной корреляцией и вырожденностью электронных уровней. Используемые в настоящее время теоретические методы являются или недостаточно точными, или требуют использования значительных вычислительных ресурсов, что исключает их использование для предсказания свойств комплексов. Разработка нового метода является сложным процессом, требующим одновременной экспериментальной работы и проведения большого числа теоретических расчетов. Все это дополнительно осложняется необходимостью возможностью работы с источниками ионизирующего излучения с одной стороны, и наличия доступа к суперкомпьютерным ресурсам с другой. Целью данного проекта является разработка нового полуэмпирического квантовохимического метода моделирования соединений актиноидов на основе теории функционала плотности и методов машинного обучения. Разработанный метод можно будет использовать при дизайне радиофармпрепаратов, лигандов для комплексообразования и разделения f-элементов и моделирования их фундаментальных термодинамических свойств.

Ожидаемые результаты
На текущий момент, теория функционала плотности, активно используемая в квантовой химии, не адаптирована для соединений актиноидов. Работы в области релятивистской квантовой химии связаны в основном с использованием пост-хатри-фоковских методов, требующих значительных затрат времени на расчет. В данном проекте предлагается разработать первый метод полуэмпирической квантовой химии, адаптированный для 5f-элементов. Его использование позволит заметно сократить время дизайна новых соединений и расширить представление о химии актиноидов.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2019 году
Работы проводились по двум основным направлениям: наработка базы данных соединений актиноидов и написание программного кода для создания полуэмпирического метода моделирования их свойств. В рамках первой задачи была создана база данных, с рассчитанными на уровне теории связанных кластеров энергиями (dH) более чем 350 реакций с участием актиноидов от актиния до берклия. Однако, для повышения числа и разнообразия возможных структур, работы по расширению базы данных продолжаются. Все теоретические данные валидировались с использованием найденных в литературе экспериментальных данных, отвечающих газофазным процессам. В рамках второй задачи было разработано и реализовано два подхода к созданию полуэмпирических моделей. Для первого из них, был использован байесовский формализм для оптимизации процесса параметризации гибридного DFT-функционала под конкретную химическую задачу. Программное решение написано и опубликовано в свободном доступе. Для тестирования подхода, была использована известная БД GMTKN55. При этом, представленное решение показало способность за разумное время создавать новые функционалы, превосходящие по точности популярные на ряде сложных для теории функционала плотности задач. Для второго подхода, была разработана новая универсальная архитектура графовых сверточных нейронных сетей, сопособная использовать в качестве входных данных как молекулярные, так и кристаллические данные. Помимо универсальности, данная архитектура позволила построить модели, сопоставимые по точности с лучшими моделями структура-свойство. В том числе, была построена модель устойчисвости актинид-содержащих кристаллических соединений. Кроме того часть расчетного кода используемых в данной работе (и не только) библиотек была перенесена на графические ускорители, что позволило существенно сократить время расчета для больших систем.

 

Публикации

1. Королев В.В, Митрофанов А.А., Коротков А, Ткаченко В.Е. Graph convolutional neural networks as "general-purpose" property predictors: the universality and limits of applicability Journal of Chemical Information and Modelling, - (год публикации - 2020)

2. Митрофанов А.А., Королев В.В., Андреади Н.Г., Петров В.Г., Калмыков С.Н A simple automatized tool for exchange-correlation functional fitting Journal of Physical Chemistry A, - (год публикации - 2020)


Аннотация результатов, полученных в 2020 году
В рамках выполнения проекта, была создана и опубликована база данных HERDB (Heavy-Element Reactions DataBase). База данных содержит информацию о структуре, электронных свойствах и полной внутренней энергии 104 химических соединений (87 атомов, ионов, неорганических и органических солей актинидов и 17 вспомогательных легких соединений) в газовой фазе. При этом, сравнение с существующими экспериментальными данными для соединений актиноидов в газовой фазе показало, что погрешности полученных структур и энергий сопоставимы с экспериментальными. База данных доступна для общего пользования по ссылке https://github.com/mitrofjr/HERDB, а описывающая ее статья по ссылке https://pubs.acs.org/doi/10.1021/acs.inorgchem.0c01746. Процесс построения HERDB включал в себя двухстадийный процесс оптимизации геометрии, определение электронного терма и расчет полной внутренней энергии для каждого соединения. Для квантово-химических расчетов систем с тяжелыми атомами потребовались большие вычислительные ресурсы: только лишь для последнего шага (расчет полной внутренней энергии на уровне теории связанных кластеров) было затрачено 11890 ЦПУ-часов расчетного времени. На основании соединений из опубликованной базы данных был подобран тренировочный набор реакций для создания нового полуэмпирического метода теории функционала плотности. В качестве базового метода использовался известный функционал PBE0 при оптимизации параметров включенного градиент-корректировочного функционала PBE, а также долей LDA/GGA корректировки и хартри-фоковского обмена. Релятивистские эффекты учитывались на уровне скалярно-релятивстского гамильтониана Дугласа-Кролла-Гесса и соответствующих полноэлектронных трехэкспоненциальных базисных наборов. Эффекты, связанные с потенциальным многодетерминантным характером волновой функции, на данном этапе не учитывались. Вместо этого, на основе T1-диагностики референсных CCSD(T) расчетов, для создания предварительного функционала были выбраны соединения с пренебрежимо малым многодетерминантным вкладом. По итогам тренировки, был получен новый функционал, точность работы которого (как по расчету энергий, так и по оптимизации геометрии) согласно кросс-валидации находятся в пределах погрешностей референсной базы данных. То есть, согласно первым оценкам, является заметно более точным при работе с соединениями актиноидов, чем все существующие. При этом, расчет происходи на порядок быстрее, чем при использовании наиболее точных пост-хартри-фоковских-методов.

 

Публикации

1. Андреади Н.Г., Митрофанов А.А., Матвеев П.И., Волкова А.В., Калмыков С.Н. Heavy-Element Reactions Database (HERDB): Relativistic ab Initio Geometries and Energies for Actinide Compounds Inorganic Chemistry, 59, 18, 13383–13389 (год публикации - 2020) https://doi.org/10.1021/acs.inorgchem.0c01746


Аннотация результатов, полученных в 2021 году
В ранее созданную в рамках проекта базу данных HERDB (Heavy-Element Reactions DataBase) было добавлено 63 соединения лантаноидов, что существенно расширило её область применения. На данный момент опубликована информация об оптимизированных структурах соединений в газовой фазе, база данных доступна для общего пользования по ссылке https://github.com/SmartChemDesign/HERDB. Помимо добавления новых соединений в базу данных, были определены спектральные термы основного состояния для всех новых соединений и рассчитаны полные внутренние энергии на уровне теории связанных кластеров CCSD(T) для 45 веществ с поправкой на бесконечный базисный набор. Опубликованная на текущий момент в открытом доступе версия базы данных включает информацию о 176 атомах, ионах и солях лантаноидов и актиноидов. Для каждого соединения представлены данные о геометрии, рассчитанной на уровне теории Меллера-Плессе (MP2) с учетом скалярных релятивистских поправок, заряде и электронном терме. Для большинства соединений так же присутствуют данные о полной внутренней энергии и электронной структуре (в виде molden-файла, содержащего рассчитанные орбитали) рассчитанные на уровне теории связанных кластеров CCSD(T). С использованием базы данных был получен новый гибридный DFT функционал relPBE0, позволяющий проводить расчеты энергии с точностью, сравнимой с референсной точностью самой базы данных (порядка 9 ккал/моль).

 

Публикации

1. Митрофанов А.А., Андреади Н.Г., Королев В.В., Калмыков С.Н. A search for a DFT functional for actinide compounds The Journal of Chemical Physics, 155, 161103 (год публикации - 2021) https://doi.org/10.1063/5.0067631

2. Митрофанов А.А., Андреади Н.Г., Матвеев П.И., Закирова Г.Г., Борисова Н.Е., Калмыков С.Н., Петров В.Г. An(III)/Ln(III) solvent extraction: Theoretical and experimental investigation of the role of ligand conformational mobility Journal of Molecular Liquids, Volume 325, p. 115098 (год публикации - 2021) https://doi.org/10.1016/j.molliq.2020.115098


Аннотация результатов, полученных в 2022 году
Полученные в рамках расчета геометрии, значения энергий и файлы содержащие электронную структуру были опубликованы в новой версии базы данных, доступной по адресу https://github.com/SmartChemDesign/HERDB. Можно отметить, что за заключительный этап выполнения проекта, база данных расширилась почти в полтора раза за счет соединений 4f-элементов и теперь включает почти 250 атомов, ионов и солей f-элементов. Сравнение с экспериментальными данными показало хорошее воспроизведение длин связей металл-неметалл. Среднеквадратичная погрешность составила 0.06 А, при заявленной экспериментальной погрешности 0.05 А, и меньше 0.01 А при заявленной экспериментальной погрешности 0.01 А для данных, полученных методами ИК (первые четыре соединения) и микроволновой (последнее соединение) спектроскопии. Таким образом, можно считать, что во всей базе данных корректно (с погрешностью, не превышающей экспериментальную) воспроизводятся значения длин связи металл-неметалл. Средняя погрешность CCSD(T) расчета энтальпии реакций с участием лантаноидов составила 27.6 ккал/моль, что более чем в два раза хуже, чем точность аналогичных расчетов для соединений актиноидов, полученных ранее. С учетом новых данных, погрешность в среднем по базе данных можно оценить как 20 ккал/моль, при этом расчеты соединений актиноидов оказались точнее аналогичных расчетов, проведенных для 4f-элементов. Однако, точность расчетов энтальпий реакций с участием соединений лантаноидов аналогичным методом оказалось определить существенно сложнее ввиду нехватки разнообразия данных о летучих соединениях лантаноидов, вычислительно пригодных для использования метода связанных кластеров. Погрешность может обуславливаться не только несовершенством вычислительного подхода, но и экспериментальной погрешностью и участием в реакциях галогенидов лантаноидов в нестабильных степенях окисления +1 и +2. Расширенная база данных использовалась для тестирования нового функционала. Тестирование показало, что разработанный функционал воспроизводит энтальпии реакций с погрешностью 13 ккал/моль, что заметно превосходит точность расчетов тех же реакций методом CCSD(T), приведенную выше. При этом, средняя точность функционала (с описанными выше гамильтонианом и базисным набором) составляет 12 ккал/моль, что также близко к экспериментальной точности (10 ккал/моль). Также можно отметить, что функционал PBE0 показал хорошую точность на данном наборе данных (погрешность 11 ккал/моль), что согласуется с литературными данными об успешных расчетах соединений лантаноидов с его помощью. Однако, средняя погрешность с учетом данных, полученных при расчетах 5f элементов, составляет 15 ккал/моль, что не позволяет рекомендовать его для точных расчетов, где требуется сравнивать свойства актиноидов и лантаноидов. Функционал TPSSh, в свою очередь, позволяющий правильно воспроизводить геометрии соединений f-элементов, и хорошо рассчитывать соединений актиноидов, на данном этапе показал наихудшие результаты. Даже с учетом выброса результатов, полученных с ошибкой более 200 ккал/моль, средняя точность составляет 17 ккал/моль. В итоге, можно заключить, что полученный нами ранее функционал является, на текущий момент, наилучшим расчетным методом для моделирования соединений f-элементов. При этом, несмотря на отказ от его дообучения на второй части базы данных, вторую задачу, как и основную цель проекта можно считать выполненной.

 

Публикации


Возможность практического использования результатов
-