КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 18-14-00098

НазваниеПривнесение информационных технологий в гликомику и гликобиологию

РуководительТоукач Филипп Владимирович, Доктор химических наук

Организация финансирования, регион Федеральное государственное бюджетное учреждение науки Институт органической химии им. Н.Д. Зелинского Российской академии наук, г Москва

Период выполнения при поддержке РНФ 2021 г. - 2022 г. 

Конкурс Конкурс на продление сроков выполнения проектов, поддержанных грантами Российского научного фонда по приоритетному направлению деятельности Российского научного фонда «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами» (28).

Область знания, основной код классификатора 04 - Биология и науки о жизни, 04-207 - Системная биология; биоинформатика

Ключевые словагликоинформатика, база данных, предсказание свойств, предсказание структуры, веб-платформа, углевод, биогликан, гликозилтрансфераза, микроорганизм, О-антиген, молекулярная геометрия, моделирование, стандартизация

Код ГРНТИ34.03.23, 31.23.15, 20.23.25


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Углеводы играют фундаментальную роль в многочисленных биологических процессах, таких как установление межмолекулярных взаимодействий и межклеточных контактов, развитие иммунного ответа и иммунологической памяти и защита клеток микроорганизмов от окружающей среды. Несмотря на то, что работа коллектива проекта РНФ 18-14-00098 за три года существенно улучшила информационное обеспечение гликомики, в ней, в отличие от геномики и протеомики, все еще остаются пробелы в обеспечении ученым доступа к накопленной информации и возможности ориентироваться в ней. До сих пор не до конца решена проблема систематизации данных по углеводам и аппарату их биосинтеза у различных организмов, в первую очередь – микроорганизмов и растений. Также не до конца решенными проблемами гликобиологии остаются недостаточная интеграция проектов и низкое качество данных. По этим причинам первостепенную важность имеет продолжение работ по развитию универсальной платформы гликоинформатики Carbohydrate Structure Database (CSDB), которые велись в рамках проекта РНФ 18-14-00098. В настоящий момент CSDB включает базу данных исследованных природных углеводов бактерий, грибов, простейших и растений и углевод-активных ферментов, участвующих в их синтезе, а также углеводную онтологию, инструменты предсказания свойств биогликанов и статистической обработки накопленных углеводных данных, семантические связи с другими значимыми проектами гликоинформатики. Как и любой информационный продукт, платформа CSDB непрерывно дополняется новыми данными и сервисами. В результате реализации проекта, подаваемого на продление, CSDB будет включать актуальные на момент окончания проекта данные по структурам исследованных природных углеводов бактерий, грибов, растений и простейших, дополненные аналитической, таксономической, библиографической, конформационной и другой информацией, а также данные по ферментативному аппарату их биосинтеза. Платформа CSDB будет оснащена новыми функциями, такими как построение конформационных карт олигосахаридов с высокой лабильностью, поиск гликоэпитопов для иммунной системы человека и др. Другие веб-сервисы (работа с конформационными картами) будут дополнены и улучшены. Помимо разработанных в 2018-2020 гг. сервисов платформа CSDB будет оснащена новыми модулями предсказания свойств биогликанов (в первую очередь, молекулярной геометрии), а также новыми инструментами ввода, визуализации и обработки данных.

Ожидаемые результаты
Результатом продолжения проекта станет дальнейшее развитие новой области знания – гликоинформатики – и совершенствование первой в мире универсальной междисциплинарной платформы Carbohydrate Structure Database (CSDB). Как и любой информационный продукт, платформа гликоинформатики непрерывно дополняется новыми данными и сервисами, актуальность которых осознается по мере получения результатов запланированных исследований и совершенствования конечного продукта. Доработанная платформа будет включать актуализированные до 2022 г. данные по структурам исследованных природных углеводов бактериального, грибного и растительного происхождения и их производных, дополненные аналитической, таксономической, библиографической, конформационной и другой информацией, и данные по ферментативному аппарату, участвующему в биосинтезе углеводов и гликоконъюгатов. Часть функций (конформационные карты олигосахаридов с высокой подвижностью, гликоэпитопы для иммунной системы человека, и другие) появится в проекте CSDB впервые; остальные данные (структура полисахаридных и гликозидных продуктов охваченных таксономических групп, а также простейших; активности гликозилтрансфераз значимых с медицинской точки зрения патогенов; и другие) и веб-сервисы (работа с конформационными картами) будут дополнены. Эти инструменты востребованы в современной биологии, химии и медицине, особенно в исследовании механизмов иммунного ответа на молекулярном уровне и при разработке методов синтеза гликоконъюгатных продуктов (например, вакцин). Помимо разработанных в 2018-2020 гг. сервисов, платформа CSDB будет оснащена новыми модулями предсказания свойств биогликанов (в первую очередь, молекулярной геометрии), а также новыми инструментами ввода, визуализации и статистической обработки данных, специфичных для гликобиологии. Будут расширены стандарты и протоколы обмена углеводными данными, позволяющие реализовать семантические связи с другими значимыми проектами гликоинформатики. Вышеперечисленное является важным шагом на пути информационного обеспечения гликомики, который позволит снизить стоимость и повысить эффективность работы ученых как в фундаментальном, так и в прикладном аспектах широкой области знания – науки об углеводах.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2021 году
За 2021-й год в базу данных углеводных структур Carbohydrate Structure Database (CSDB, http://csdb.glycoscience.ru) внесено около 3300 структур углеводов и гликозидов бактерий, грибов и растений (включая ~2230 спектров ЯМР). Текущее покрытие базы позволяет считать её полной по прокариотам и грибам до 2020 года включительно. Полнота покрытия является одним из главных научных преимуществ базы CSDB перед другими мировыми проектами гликоинформатики, поскольку позволяет пользователям оценить новизну исследуемых объектов. Качество данных в CSDB обеспечивается ручным аннотированием и верификацией записей, что также выделяет CSDB на фоне конкурентов. Благодаря поддержке РНФ неизбежный временной лаг между покрытием курируемой базы и текущей датой сокращён до одного года для бактериальных и грибных структур. База конформационных данных гликозидных связей в сахаридах расширена как по покрытию, так и по функциональным возможностям; сейчас она включает данные о конформациях ~2600 наиболее распространенных структурных фрагментов биогликанов, в том числе молекулярно-динамические траектории, положения минимумов, двумерные и трёхмерные карты Рамачандрана и мета-данные. Данные высокотемпературной молекулярной динамики получены из базы GlycoMaps. Данные молекулярной динамики с явным учетом растворителя генерируются на вычислительном сервере проекта с помощью автоматической процедуры и непрерывно пополняют конформационную часть CSDB. Благодаря новым инструментам, развернутым в этом году на платформе CSDB, гликохимики и гликобиологи получили возможность удобной онлайн-работы с углеводными структурами на уровне, недоступном ранее. Это включает создание, отрисовку, импорт, экспорт, визуализацию, 3D-моделирование углеводных структур с поддержкой всех известных структурных особенностей биогликанов и гликозидов. Гликоинформатики имеют возможность использовать новый инструмент и в своих проектах. Полуавтоматическое установление первичной структуры на основании данных ЯМР, хроматографии и других экспериментов с привлечением инструментов CSDB успешно применено в структурных исследованиях лошадиного бактериофага и бактериальных полисахаридов, обеспечивающих иммуноспецифичность конкретных штаммов Pseudomonas donghuensis и Enterobacter cloacae. Предсказательная сила ЯМР-спектроскопических модулей CSDB была подтверждена независимыми методами и использована для выяснения структурных особенностей, плохо поддающихся классическому анализу. Результаты работ по проекту за 2021-й год опубликованы в пяти статьях, включая три статьи в журналах первого квартиля (суммарный импакт-фактор 17.5).

 

Публикации

1. Бочков А.Ю., Тоукач Ф.В. CSDB/SNFG structure editor: an online glycan builder with 2D and 3D structure visualization Journal of Chemical Information and Modeling, Journal of Chemical Information and Modeling, 2021, 61:4940-4948 (год публикации - 2021) https://doi.org/10.1021/acs.jcim.1c00917

2. Здоровенко Э.Л., Дмитренок А.С., Маси М., Кастальди С., Муцио Ф.М., Валверде К., Книрель Ю.А., Эвиденте А. Structural studies on the O-specific polysaccharide and biological activity of the lipopolysaccharide from Pseudomonas donghuensis strain SVPB6, with antifungal activity against the phytopathogenic fungus Macrophomina phaseolina International Journal of Biological Macromolecules, International Journal of Biological Macromolecules 2021, 182: 2019-2023 (год публикации - 2021) https://doi.org/10.1016/j.ijbiomac.2021.05.187

3. Куликов Е.Е., Голомидова А.К., Ефимов А.Д., Белалов И.С., Летарова М.А., Здоровенко Э.Л., Книрель Ю.А., Дмитренок А.С., Летаров А.В. Equine intestinal O-seroconverting temperate coliphage Hf4s: genomic and biological characterization Applied and Environmental Microbiology, Applied and Environmental Microbiology, 2021, 87(21):e0112421 (год публикации - 2021) https://doi.org/10.1128/AEM.01124-21

4. Перепелов А.В., Филатов А.В., Жу У., Шашков А.С., Ванг М., Гуо З. Structure and gene cluster of the O-antigen of Enterobacter cloacae G3422 Carbohydrate Research, Carbohydrate Research, 2021, ID 108440 (год публикации - 2021) https://doi.org/10.1016/j.carres.2021.108440

5. Филатов А.В., Перепелов А.В., Шашков А.С., Бурыгин Г.Л., Гоголева Н.Е., Хлопко Ю.А., Гринев В.С. Structure and genetics of the O-antigen of Enterobacter cloacae K7 containing di N acetylpseudaminic acid Carbohydrate Research, Carbohydrate Research, 2021, ID 108392 (год публикации - 2021) https://doi.org/10.1016/j.carres.2021.108392


Аннотация результатов, полученных в 2022 году
За второй год проекта в базу данных углеводных структур Carbohydrate Structure Database (CSDB, http://csdb.glycoscience.ru) внесено около 3410 структур природных гликанов, гликополимеров и гликоконъюгатов: ~1030 бактериальных, ~570 грибных, ~1520 растительных и ~550 из простейших. Данные дополнены ~1950 отнесенными спектрами ЯМР. Текущее покрытие базы позволяет считать её полной по всем микроорганизмам до 2021 года включительно, а также полной по многоклеточным грибам. Полнота покрытия является одним из главных научных преимуществ базы CSDB перед другими мировыми проектами гликоинформатики, поскольку позволяет пользователям оценить новизну исследуемых объектов. Качество данных в CSDB обеспечивается ручным аннотированием и верификацией записей, что также выделяет CSDB на фоне конкурентов. Благодаря поддержке РНФ неизбежный временной лаг между покрытием курируемой базы и текущей датой сокращён до одного года для бактериальных и грибных структур. В рамках систематического расширения покрытия по гликозилтрансферазам, база данных CSDB_GT дополнена ~360 записями о ферментативных активностях штаммов возбудителя внутрибольничных инфекций рода Acinetobacter. Созданы и развернуты инструменты гликоинформатики, повышающие функциональные возможности портала CSDB: модуль фрагментации произвольных структур для последующего предсказания атомарных свойств (химических сдвигов ЯМР и др.); и база данных гликоэпитопов иммунного ответа, включающая 1890 объектов, их связи со структурами в основной части CSDB, инструменты поиска структур и эпитопов. Полуавтоматическое установление первичной структуры на основании данных ЯМР, хроматографии и других экспериментов с привлечением инструментов CSDB успешно применено в структурных исследованиях полисахаридных биопленок бактерий Micrococcus luteus. Предсказательная сила ЯМР-спектроскопических модулей CSDB была подтверждена независимыми методами и использована для выяснения структурных особенностей, плохо поддающихся классическому анализу. Базы данных и сервисы гликоинформатики, входящие в CSDB, остаются одними из наиболее востребованных компьютерных инструментов для работы с информацией о природных гликанах и родственных соединениях, включая как поиск и комбинирование известных знаний по множеству критериев, так и получение новых знаний с помощью моделирования, предсказаний и статистического анализа. Результаты работ по проекту за второй год опубликованы в пяти статьях, из которых четыре - в журналах первого квартиля (суммарный импакт-фактор - 27), а пятая является обзором в российском журнале.

 

Публикации

1. Ганнесен А.В., Зиганшин Р.Х., Здоровенко Э.Л., Климко А.И., Януцевич Е.А., Данилова О.А., Терешина В.М., Горбачевский М.В. Овчарова М.А., Неволина Е.Д., (и другие, включая Тоукач Ф.В.) Epinephrine extensively changes the biofilm matrix composition in Micrococcus luteus C01 isolated from human skin Frontiers in Microbiology, 13:1003942 (год публикации - 2022) https://doi.org/10.3389/fmicb.2022.1003942

2. Тоукач Ф.В., Егорова К.С. Examining the diversity of structural motifs in fungal glycome Computational and Structural Biotechnology Journal, 20:5466-5476 (год публикации - 2022) https://doi.org/10.1016/j.csbj.2022.09.040

3. Тоукач Ф.В., Егорова К.С. Source files of the Carbohydrate Structure Database: the way to sophisticated analysis of natural glycans Scientific Data, 9:131 (год публикации - 2022) https://doi.org/10.1038/s41597-022-01186-9

4. Щербинина С.И., Франк М., Тоукач Ф.В. Carbohydrate Structural Database (CSDB) oligosaccharide conformation module Glycobiology, 32(6):460-468 (год публикации - 2022) https://doi.org/10.1093/glycob/cwac011

5. Тоукач Ф.В., Ширковская А.И. Carbohydrate Structure Database and Other Glycan Databases as an Important Element of Glycoinformatics Russian Journal of Bioorganic Chemistry, 48(3):457-466 (год публикации - 2022) https://doi.org/10.1134/S1068162022030190


Возможность практического использования результатов
Пользовательские инструменты и базы данных, созданные параллельно с фундаментальными исследованиями в рамках проекта, востребованы широким кругом учёных, в том числе разработчиками вакцин, человеческих и ветеринарных лекарств, агрономических препаратов. Таким образом они косвенно используются в создании или усовершенствовании продуктов и технологий, использующих информацию об углеводах, т.е. в области практической биотехнологии, медицины, сельского хозяйства.