КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 22-74-10098

НазваниеКомпьютерный дизайн белков с новыми свойствами методами глубокого обучения

РуководительДеревянко Георгий Александрович, кандидат наук (признаваемый в РФ PhD)

Прежний руководитель Попов Петр Анатольевич, дата замены: 13.12.2023

Организация финансирования, регион Автономная некоммерческая образовательная организация высшего образования «Сколковский институт науки и технологий», г Москва

Период выполнения при поддержке РНФ 07.2022 - 06.2025 

Конкурс№71 - Конкурс 2022 года «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными.

Область знания, основной код классификатора 04 - Биология и науки о жизни, 04-207 - Системная биология; биоинформатика

Ключевые словакомпьютерный дизайн белков, GPCR, глубокое обучения, генеративно-состязательные нейронные сети, молекулярное моделирование

Код ГРНТИ34.03.23


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Белки выполняют широкий спектр задач, включая передачу клеточных сигналов, ферментативные реакции и многие другие функции жизнедеятельности клеток различных организмов. Проектирование белков с новыми свойствами и структурными особенностями позволяет не только расширить наше понимание молекулярных механизмов работы белков, но и использовать их в биотехнологии и медицине. Например, вирусы и опухолевые клетки имеют специфические белки на своей поверхности, следовательно, разработанные белки, которые связывают целевые белки с высокой аффинностью и специфичностью, могут быть применимы как для терапии, так и для диагностики различных заболеваний; разработка новых ферментов позволяет открывать и катализировать химические реакции, не доступные известным природным ферментам; разработка стабильных форм белка, в частности мембранных белков, часто является необходимой для получения пространственной структуры и поиска новых лекарственных соединений. Благодаря прогрессу в области структурной биологии, каждый год появляется более 10 000 новых структур белков и белковых комплексов; регулярное пополнение базы данных белковых комплексов, а также развитие методов молекулярного моделирования, открывают возможности для применений методов обработки больших данных и искусственного интеллекта для разработки более эффективных методов компьютерного дизайна белков. Данный проект направлен на создание вычислительных методов проектирования белков с новыми структурными и функциональными свойствами на основе последних достижений в области глубокого обучения. Так генеративные архитектуры глубокого обучения позволяют создавать новые объекты, которые по свойствам отличаются от обучающего набора данных, что уже было продемонстрировано для низкомолекулярных химических соединений. Для применения генеративного моделирования для белковых макромолекул необходимо эффективное численное представление белков. В данном проекте мы используем тензорное представление белковых структур, используя эффективные алгоритмы обработки тензорных данных, а также методы молекулярного моделирования для аугментации структурных данных. В качестве строительных блоков генеративных нейронных сетей предлагается использовать 3D сверточные нейронные сети, которые позволяют анализировать пространственные структуры белков в тензорном представлении, переходя от по-атомных свойств аминокислотных остатков до общих свойств и геометрической формы белка и позволяя создавать более эффективные модели машинного обучения. Таким образом, в ходе выполнения данного проекта будут разработаны методики проектирования белков с новыми структурными и функциональными свойствами. В качестве объекта исследования, мы рассмотрим G protein-coupled receptors (GPCR), которые являются одними из важнейших молекулярных машин человека. До 40% современных лекарственных средств действуют именно на GPCR рецепторы, т.к. нарушение в работе этих белков приводит к серьезным заболеваниям. Определение структуры GPCR помогает в проектировании более специфичных лекарств, однако получение структур крайне затруднено из-за низких уровней экспрессии и стабильности этих белков, поэтому используют методы белкового дизайна для модификации рецептора с целью улучшения его свойств и возможности получить атомарную структуру. В данном проекте мы применим разрабатываемые методы для рационализации дизайна GPCR конструкций. Результаты выполнения этого проекта откроют новые возможности для белкового дизайна в биотехнологии и биомедицине и будут способствовать минимизации затрат на проведение дорогостоящих работ белковой инженерии.

Ожидаемые результаты
При успешном выполнении проекта будут созданы вычислительные протоколы для генеративного моделирования белков с новыми структурными и функциональными свойствами. В частности, будут разработаны 1) эффективные тензорные представления пространственных структур белков 2) модели глубокого обучения для проектирования новых аминокислотных последовательностей, используя генеративно-состязательные архитектуры нейронных сетей и 3D сверточные нейронные сети 3) скоринг функции для оценки оптимальности аминокислотной последовательности для заданного белкового каркаса 4) специализированные модели машинного обучения и протоколы молекулярного моделирования для поиска стабилизирующих замен аминокислотных остатков в целевом семействе белков Мы применим разработанные методы для дизайна белков с новыми структурными и функциональными особенностями. В частности, полученные результаты помогут в рационализации дизайна GPCR конструкций для структурных исследований. Полученные результаты будут опубликованы в рецензируемых научных журналах мирового уровня и будут представлять интерес для практического использования, как метод оптимизации белковой инженерии.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2022 году
Методы машинного обучения, в частности, глубокого обучения, позволяют проектировать белки с уникальными свойствами. Для разработки таких методов необходимо уметь представлять белок в виде численного описания. Мы разработали численные представления, такие как многомерный вектор и 4D тензор, для глобального и локального описаний белков. Локальные описания полезны при поиске минимальных отличий в белке, например, точечной замене аминокислотного остатка, которые приводят к изменению его свойств. Благодаря разработанным подходам мы смогли 1) спроектировать каппа-опиоидный рецептор с повышенной термостабильностью и 2) найти микробный родопсин с уникальной функцией.

 

Публикации

1. Амал Ел Дайбани, Жозеф М. Пагги, Куглае Ким, Янни Д. Лалудакис, Петр Попов, Сара М. Бернард, Брайна Е. Крум, Рейд Х. Дж. Олсен, Джеффри Диберто, Ф. Иви Карролл, Всеволод Катрич, Бернард Вунс, Рон О. Дрор, Тао Че Molecular mechanism of biased signaling at the kappa opioid receptor Nature Communications, 14, Article number: 1338 (год публикации - 2023)

2. Охрименко И., Ковалев К., Петровская Л., Ильинский Н., Алексеев А., Марин Е., Рокитская Т., Антоненко Ю., Силетский С., Попов П., ..., Горделий В. Mirror proteorhodopsins Communications Chemistry, 6, Article number: 88 (год публикации - 2023)