КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 19-14-00305

НазваниеАнализ микробиома человека с помощью метаболического профилирования

РуководительРодионов Дмитрий Александрович, Кандидат биологических наук

Организация финансирования, регион Федеральное государственное бюджетное учреждение науки Институт проблем передачи информации им. А.А. Харкевича Российской академии наук, г Москва

Период выполнения при поддержке РНФ 2019 г. - 2021 г. 

Конкурс№35 - Конкурс 2019 года «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами».

Область знания, основной код классификатора 04 - Биология и науки о жизни, 04-207 - Системная биология; биоинформатика

Ключевые словаМикробиота желудочно-кишечного тракта, метаболическая реконструкция, сравнительная геномика, биосинтез витаминов, катаболизм углеводов, синтез короткоцепочечных жирных кислот, метаболический потенциал микробного сообщества, метагеномныe данныe, функциональная классификация метагеномов

Код ГРНТИ34.03.23


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Микробиота человека представляет собой совокупность всех микроорганизмов, обитающих в человеческом теле. Преимущественное количество микробов обитает в желудочно-кишечном тракте (ЖКТ). Видовое разнообразие микробиоты человека достигает 10 тысяч. В ряде исследований была показана исключительная роль кишечной микробиоты для состояния здоровья человека. Основные функции кишечной микробиоты включают усвоение сложных полисахаридов, которые не могут быть расщеплены ферментами человека, синтез витаминов и других важных для человека метаболитов и регуляторных молекул, защита от патогенов, регуляция иммунитета, эндокринной системы и высшей нервной деятельности. Расщепление сложных полисахаридов и последующий метаболизм продуктов этого расщепления, простых сахаров, обеспечивает питательными веществами не только представителей кишечной микробиоты, но и клетки организма человека, в частности, вырабатываемый бактериями бутират обеспечивает до 70% энергетических потребностей колоноцитов. Поэтому исследование утилизации сахаров и полисахаридов и синтеза биологически активных метаболитов микробиотой человека имеет огромное значение для биологии и медицины. Однако, наличие большого числа различных бактерий, обитающих в ЖКТ человека, делает почти невозможным экспериментальное исследование всех представителей микробиоты. В то же время, наличие большого количества геномных данных позволяет проводить массовые исследования методами геномного анализа. Сравнительный анализ геномов дает значительное преимущество для массовой реконструкции бактериальных регулонов и метаболических путей компьютерными методами. Данный проект направлен на полногеномную реконструкцию метаболизма бактерий микробиоты человека, создание базы данных генов и метаболических путей микробиоты человека и разработку биоинформатических программ для автоматического предсказания суммарных фенотипических свойств образцов микробиоты человека по данным секвенирования генов 16S рРНК или полных метагеномов. Геномный анализ с целью реконструкции метаболизма углеводов, витаминов, аминокислот, и других биологически активных соединений продуцируемых микробиотой человека позволит собрать базу данных метаболических генов и разнообразных вариантов метаболических путей, а также фенотипических правил, что послужит основой для разработки нового программного конвейер для метаболического профилирования метагеномных образцов в в виде 16S РНК и полногеномном формате. Разработанный программный конвейер будет применен для анализа и функциональной классификации реальных метагеномных образцов микробиоты кишечника и других частей тела человек из России и других стран. Полученные наборы фенотипических индексов для различных микробных сообществ будут статистически обработаны для определения ассоциаций между отдельными фенотипами (метаболитами) и параметрами из метаданных образцов, что даст возможность выдвинуть гипотезы о связи метаболических потенциалов микробиоты с определенными хроническими заболеваниями человека. Сравнение полученных фенотипических индексов с референсным набором (базой данных), полученным в ходе обработки конвейером образцов для большого количества здоровых и больных людей, может быть использовано для профилактики заболеваний с помощью коррекции диеты и использования витаминных и других добавок к пище. Также будет изучено влияние пребиотиков на стандартизированную кишечную микробиоту из опубликованных экспериментов по in vitro ферментированию и разработан программный модуль для оптимизации состава микробиоты через модификацию диеты пребиотиками, витаминами и другими стимулирующими рост бактерий нутриентами. Полученные таким образом подробные метаболические описания микробных сообществ позволят: (1) осуществлять функциональную (вдобавок к таксономической) классификацию большого набора образцов микробиоты; (2) проводить корреляционный анализ с использованием метаданных (данные по болезням, диетам и добавкам к пище, географии и образу жизни); (3) выявлять метаболические фенотипы ассоциированные с определенными признаками и участками тела. В ходе выполнения данного проекта будут получены новые данные о метаболических путях и фенотипах в микробных сообществах человеческого тела, которые будут иметь большое практическое и фундаментальное значение как для микробиологии, так и для персонализированной медицины, в частности для диагностики и предотвращения заболеваний.

Ожидаемые результаты
Планируется провести сравнительно-геномный анализ не менее 5000 геномов бактерий ассоциированных с микробиомом человека с целью реконструкции их метаболических путей, формулировки логических правил и назначения бинарных метаболических фенотипов для отдельных видов микробов. В частности, будут получены следующие новые биологические результаты. 1) Реконструкции метаболических путей для фенотипов-эффекторов микробиоты, включающих в себя синтез биологически активных веществ, оказывающих нейроэндокринные, иммунологические и противовоспалительные эффекты на организм человека (короткоцепочечные жирные кислоты, триптамин, имидазол-пропионат, кинуренин, катехоламин, триметиламин, кардиолипин, полифенолы, полиамины), а также метаболические пути трансформации ксенобиотиков, желчных кислот и гормонов. 2) Реконструкция путей для фенотипов-модуляторов микробиоты, включающих в себя деградацию и утилизацию пребиотиков микрофлорой кишечника, в том числе поли-, олиго- и моносахаридов, пептидов и аминокислот, муцина. Будет собрана и проаннотирована геномная коллекция гликозил гидролаз и лиаз, проведено предсказание их клеточной локализации, обнаружены транспортеры для олигосахаридов и составляющих их сахаров, а также будут проаннотированы все локальные транскрипционные факторы, входящих в системы утилизации сахаров, для части из которых будут получены функциональные описания регулонов. На основе накопленных в результате данного анализа уникальных данных по метаболическим путям, правилам и фенотипам планируется разработать комплекс биоинформатических алгоритмов и программ для метаболического профилирования метагеномных образцов микробиома человека. Программный комплекс будет доведен до состояния окончательного продукта, доступного и пригодного для использования другими научными группами. В разработанном программном комплексе будут реализованы следующие основные обязательные функции: загрузка и первичная обработка метагеномных данных для больших наборов образцов (соответствующим отдельным научным исследованиям) в формате 16S РНК и полногеномном (WGS) формате, вычисление, кластеризация и визуализация таксономических и фенотипических профилей, определение таксонов-драйверов фенотипов, вычисление корреляции между отдельными фенотипами, альфа-разнообразием и геномным потенциалом сообщества, обработка произвольных групп метагеномных образцов с доступными метаданными, межгрупповое сравнение полученных профилей, поиск ассоциаций между фенотипами и метаданными. Будет собрана обширная коллекция метагеномных данных ЖКТ и метаданных (не менее 50 исследований и 50000 образцов) для когорт здоровых людей из России и других стран, а также людей страдающих определенными хроническими заболеваниями, такими как воспалительные заболевания кишечника (ВЗК), ожирение, сахарный диабет 2-го типа и других. Программный конвейер будет последовательно применен к когортам людей из разных исследований, а полученные данные будут обработаны и визуализированы в контексте референсной базы данных фенотипических профилей кишечной микробиоты. Будут изучены ассоциации между фенотипами и признаками определенных болезней из метаданных (в первую очередь, для ВЗК). Фенотипические индексы для некоторых когорт будут проанализированы в контексте доступных метаболомных данных. Будет реализован алгоритм для автоматического расширения референсной базы данных реконструированных метаболических путей, генов и фенотипов на новые бактериальные геномы. Будет проведен поисковый анализ метагеномов других частей тела человека (пищевода, ротовой полости, кожи, вагинального микробиома) с помощью метаболического профилирования, в том числе как здоровых доноров, так и людей, страдающих специфическими заболеваниями и дисбиозами (гастроэзофагеальная рефлюксная болезнь, дисбактериоз ротовой полости, дерматозы и дерматиты, вагинальные инфекции). Будет составлена карта распределения метаболических потенциалов микробиоты здоровых людей, а также найдены новые ассоциации между между метаболическими фенотипами микробиоты и патологическими дисбиозами. Будет изучено влияния пребиотиков на стандартизированную кишечную микробиоту из опубликованных экспериментов по in vitro ферментированию с использованием метаболического профилирования. Будет разработан вычисительный модуль для оптимизации состава микробиоты через модификацию диеты пребиотиками, витаминами и другими стимулирующими рост бактерий нутриентами. Модуль будет представлять собой рекомендательную систему, разработанную на основе методов машинного обучения (нейронные сети, решающие деревья). В частности, модуль будет находить специфические добавки к диете, которые способствуют сдвигу ее таксономического состава в сторону определенного микробиома, например усредненного микробиома здоровых людей из определенной когорты. Конкретные результаты настоящего проекта за 2019-2021 годы включают в себя опубликование не менее 10 научных статей в высоко цитируемых международных журналах на английском языке.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2019 году
В 2019 году были получены следующие уникальные научные результаты. Была проведена метаболическая реконструкция и функциональная аннотация с помощью методов сравнительной геномики, что позволило значительно расширить базу данных метаболизма бактерий, представляющих микробиоту желудочно-кишечного тракта (ЖКТ) человека. За отчётный год проанализировано 2662 бактериальных геномов, среди них был проведен поиск ферментов метаболических путей катаболизма и утилизации моносахаридов, олиго- и полисахаридов обладающих пребиотическими свойствами. В результате проведенного анализа была получена расширенная коллекция метаболических фенотипов для утилизации следующих углеводов (фенотипы-модуляторы): лактулоза, раффиноза, аллоза, арабинан и арабиноолигосахариды (АОС), ксилан и ксилоолигосахариды (КОС), пектин, фруктан и фруктоолигосахариды (ФОС), а также олигосахариды грудного молока (ОГМ). Были реконструированы новые метаболические пути и регулоны для утилизации метаболитов процессирования пищевых белков кишечными бактериями. Обнаружено новое семейство фруктозолизин-специфичных транскрипционных факторов (FrlR), участвующих в утилизации фруктозолизина у различных таксономических групп бактерий. С помощью методов сравнительной геномики были обнаружены ДНК сайты связывания для FrlR регуляторов. Реконструированы разнообразные пути деградации аминокислот и мочевины, получены функциональные аннотации соответствующих катаболических ферментов в референсной коллекции кишечных бактерий, назначены метаболические фенотипы, которые были использованы для оценки метаболического потенциала метагеномных сообществ кишечных бактерий к деградации следующих аминокислот: триптофан, гистидин, лизин, изолейцин, лейцин, валин, метионин, треонин, пролина. Проведено полногеномное исследование глобальных регулонов AraQ и MalR1, контролирующих утилизацию и метаболизм сахаров в 70 геномах бифидобактерий, относящихся к доминантным видам кишечной микробиоты детей первого года жизни. Получен полногеномный набор углевод-активных катаболических ферментов (УАКФ) кодируемых в референсной коллекции геномов ЖКТ бактерий. В него вошли всего 109 тысяч УАКФ ферментов, которые были классифицированы на 229 семейств гликозил гидролаз и на 57 семейств полисахарид лиаз. Закончен сравнительно-геномный анализ и метаболическая реконструкция путей утилизации короткоцепочечных жирных кислот (бутирата, лактата, этаноламина и пропандиола) бактериями кишечной микробиоты. Продолжена разработка программного пакета Phenotype Profiler для автоматизированного анализа метагеномных образцов кишечника человека с целью предсказания их суммарных метаболических фенотипов. Были разработаны и внедрены следующие программные модули: 1) модуль мультитаксономического профилирования, который осуществляет детальное назначение таксономий для метагеномных образцов ампликонного формата секвенирования; 2) модуль перенормировки таксономических представленностей на число копий гена 16S рРНК; 3) модуль вычисления таксономического и фенотипического альфа-разнообразия на основании таксономических и фенотипических профилей бактериальных сообществ. Был проведен обширный сбор данных секвенирования и метаданных по доступным наборам метагеномных образцов ЖКТ микробиоты из релевантных опубликованных исследований, имеющих интерес для последующего таксономического и фенотипического профилирования. Для отобранных исследований первичные данные секвенирования были загружены с публичных баз данных и нуклеотидных архивов. Создана база данных PhenoBase для систематизации и стандартизированного описания метагеномных данных из различных исследований. Собранные метаданные позволяют разбивать образцы по различным классификациям, например по географии, полу и физиологическим характеристикам доноров микробиоты, по группам больных и здоровых людей, страдающих определенной болезнью, а также по различному образу жизни, диетическим особенностям, употреблению антибиотиков, витаминов и т.п. С помощью разработанного программного пакета для метаболического профилирования был проведен анализ для семи отобранных в Phenobase метагеномных исследований, а также для двух исследований по культивации фекальной микробиоты в лабораторных условиях in vitro. Полученные таксономические и фенотипические профиля были обработаны статистически, проверены ассоциации между фенотипами и признаками болезней и/или концентрациями метаболитов из метаданных с применением методов машинного обучения. Полученные фенотипические профиля позволили классифицировать обработанные образцы по метаданным и обнаружить фенотипы дающие максимальный вклад в классификацию. Был разработан первый прототип алгоритма Phenotype Predictor для метаболической аннотации новых бактериальных геномов с использованием собранной в рамках выполнения данного проекта геномной энциклопедии метаболических путей, правил и фенотипов, который позволит быстро расширять базу данных фенотипов на новые полностью секвенированные геномы. Алгоритм был протестирован на текущей референсной коллекции геномов, а затем применен к двум обширным коллекциям кишечных микроорганизмов, которые появились в 2019 году. Всего было проанализировано более 2250 новых бактериальных геномов. Полученные метаболические фенотипы для путей биосинтеза витаминов и аминокислот в новых геномах были использованы для оценки внутривидовой и внутриродовой вариабельности фенотипов в полной расширенной коллекции геномов кишечных бактерий (около 5000 геномов).

 

Публикации

1. Вульф А.Р., Весенер Д.А., Ченг Д., Хьюстон-Лудлам А.Н., Беллер З.В., Набберд М.С., Джанонне Р.Д., Петерс С.Л., Хеттиш Р.Л., Лейн С.А., Родионов Д.А., Остерман А.Л., Гордон Д.И. Bioremediation of a common product of food processing by a human gut bacterium Cell Host & Microbe, 26(4):463-477.e8 (год публикации - 2019) https://doi.org/10.1016/j.chom.2019.09.001

2. Ланиган Л., Келли Е., Арзамасов А.А., Слантон К., Родионов Д.А, Ван Синдерен Д. Transcriptional control of central carbon flux in Bifidobacterium breve UCC2003 by two functionally similar, yet distinct LacI-type regulators Scientific Reports, 9(1):17851 (год публикации - 2019) https://doi.org/10.1038/s41598-019-54229-4

3. Петерсон К.Т., Родионов Д.А., Яблоков С.Н., Пунг М., Чопра Д., Милс П.Д., Петерсон С.Н. Prebiotic potential of culinary spices used to support digestion and bioabsorption Evidence-Based Complementary and Alternative Medicine, ID 8973704, 11 pages (год публикации - 2019) https://doi.org/10.1155/2019/8973704

4. Раман А.С., Гериг Д.Л., Венкатеш С., Чанг Х.В., Хаббард М., A sparse co-varying unit of the human gut microbiota that describes healthy and impaired community development. Science, 365(6449). pii: eaau4735 (год публикации - 2019) https://doi.org/10.1126/science.aau4735

5. Арзамасов А., Родионов Д.А. Genomic encyclopedia of bifidobacterial carbohydrates utilization Proceedings of 9th Moscow Conference on Computational Molecular Biology MCCMB'19, - (год публикации - 2019)

6. Ашниев Г.А., Яблоков С.Н., Родионов Д.А. Genomics-based inference of metabolic capabilities for biosynthesis and degradation of amino acids in the human gut microbiome Proceedings of 9th Moscow Conference on Computational Molecular Biology MCCMB'19, - (год публикации - 2019)


Аннотация результатов, полученных в 2020 году
Продолжена разработка программных модулей для системы автоматизированного анализа метагеномных образцов с целью вычисления их таксономических и метаболических/фенотипических характеристик (метрик). Были разработаны и внедрены следующие программные модули: 1) модуль для картирования ампликонов 16S на референсную коллекцию организмов по их последовательностям; 2) модули для подсчета фенотипических альфа-разнообразия и бета-разнообразия; 3) модуль для визуализации полученных таксономических и метаболических метрик для метагеномных образцов; 4) модуль для экспорта таксономических профилей, полученных на основе метагеномного анализа данных WGS секвенирования. Разработанная усовершенственная версия конвейера была успешно применена для анализа 16S образцов кишечной микробиоты из множества экспериментальных исследований, как из ранее опубликованных другими группами научных работ с доступными данными 16S секвенирования, так и в сотрудничестве с экспериментальными группами, что позволило ввести классификацию метагеномных образцов по их фенотипическим профилям. Разработан набор алгоритмов для метаболической аннотации новых бактериальных геномов и Метагеномно-Собранных Геномов с использованием собранной в рамках выполнения данного проекта геномной энциклопедии метаболических путей, правил и фенотипов, позволяющих быстро и надежно расширять базу данных фенотипов на новые геномы. Собранный програмный конвейер для распространения фенотипов на новые геномы состоит из двух смысловых частей: 1) поиск ортологов генов/белков из текущей энциклопедии метаболических путей с помощью алгоритма поиска гомологий DIAMOND и ряда проверочных модулей для корректного определения функций многодоменных белков и отсева перепредсказаний; и 2) набор алгоритмов для назначения бинарного фенотипа для каждого паттерна встречаемости генов в рамках одной метаболической подсистемы (с использованием моделей машинного обучения и формальных правил фенотипов, определенных на обучающей выборке 2600 эталонных геномов и их фенотипов с помощью деревьев решений). Разработанный программный конвейер был использован для анализа метаболических фенотипов в геномах из двух недавних наборов из > 2300 бактериальных геномов представителей кишечного тракта, охватывающих широкое филогенетическое пространство видов бактерий, а также для фенотипической аннотации набора из 300 новых геномов, полученных в результате метагеномной сборки кишечных образцов. Был разработан новый программный комплекс для функционального анализа метаболизма в метагеномных образцах представленных в полногеномном формате (whole genome sequencing, WGS). Разработанные алгоритмы используют информацию о метаболических путях и генах полученную в ходе сравнительно-геномной реконструкции для более 2600 эталонных геномов бактерий из кишечной микроботы человека. Были разработаны два программных конвейера для функционально-метаболического описания микробных сообществ в формате WGS. Первый конвейер основан на использовании данных таксономического профилирования WGS образца. Второй конвейер использует методы de-novo аннотации для выявления в образце функционально значимых генов и seed-extend-based методы картирования для оценки покрытия этих образцов. Разработанные конвейеры были применены для анализа и функциональной классификации метагеномных образцов микробиоты кишечника в формате WGS взятых из опубликованного исследования HMP2 по воспалительным заболеваниям кишечника. Таккже с помощью первого конвейера был проведен анализ обширного WGS датасета детей 1-3 года жизни, для которого были доступны одновременно данные секвенированиея одних и тех же образцов двумя методами метагеномного анализа – WGS и 16S. Была показана высокая корреляция между результатами метаболического профилирования для исходных метагеномов в форматах WGS и 16S. Продолжена работа по расширению метаболических реконструкций и функциональной аннотации новых метоболических путей и фенотипов в геномах 2662 бактерий, представляющих микробиоту кишечника человека. Получены метаболические геномные реконструкции для следующих новых фенотипов: 1) трансформация коньюгированных желчных кислот; 2) деградация полисахаридов, с использованием расширенной коллекции углевод-активных катаболических ферментов, в том числе деградация целлодекстрина, целлюлозы, крахмала, галактана/арабиногалактана, арабиноксилана, бета-маннана, рамногалактуронана, муцина, N- и O-гликанов, а также деградации олигосахаридов грудного молока и полисахаридов содержащих сиаловую кислоту. Также был проведен анализ ранее пронализированных метаболических путей для 200 новых бактериальных геномов с целью расширения эталонной коллекции кишечного микробиома для увеличения покрытия метагеномных образцов. Был проведен биоинформатический анализ с применением разработанной технологии и програмных конвейеров по метаболическому профилированию для большого количества метагеномных датасетов (формат 16S) из ранее опубликованных исследований кишечной микробиоты людей страдающих различными хроническими заболеваниями. Для отобранных исследований первичные данные секвенирования были загружены с публичных баз данных и нуклеотидных архивов. Программный конвейер фенотипического профилирования был использован для анализа полученных датасетов, а собранные метаданные позволили разбивать образцы по группам больных и здоровых людей, и проводить их сравнительный анализ и классификацию. В том числе были проанализированы метагеномы когорт людей страдающих сахарным диабета 1-ого типа, колоректальным раком, болезнью Паркинсона и воспалительными заболеваниями кишечника. В каждом из датасетов, были выявлены потенциально ассоциированные с развитием болезни метаболические фенотипы. На основе метаболических фенотипов также было проведено машинное обучение с использованием решающих деревьев. Наиболее важные фенотипические предикторы были дополнительно подвергнуты t-тесту на значимость различий средних значений КФИ между группой больных и контрольной группой. Отобранные фенотипические классификаторы были сопоставимы по качеству с обычными классификаторами на основе таксономии, но предоставили новые результаты, дающие представление о возможных механизмах патогенеза. Был проведен анализ потенциала продукции короткоцепочечных жирных кислот и лактата в кишечном микробиоме. Для каждого продукта ферментации и каждого генома были присвоены бинарные фенотипы, кодирующие способность или неспособность данного организма к продукции соответствующего метаболита. Фенотипы были использованы для метаболическиго профилирования метагеномных образцов кишечной микрофлоры. В частности, были рассчитаны Кумулятивные Фенотипические Индексы, фенотипическое альфа-разнообразие бета-разнообразие. Был проведен анализ всех трех метаболических метрик для большого количества метагеномных образцов кишечной микробиоты в формате 16S, в том числе в популяциях здоровых людей из двух обширных западных когорт, одной когорты людей охотников-собирателей из Танзании, и нескольких когорт людей с хроническими заболеваниями. Полученные данные свидельствуют о широком диапазоне метаболических потенциалов продукции короткоцепочечных жирных кислот кишечной микробиотой в популяциях здоровых людей. Для валидации нашей модели были обработаны несколько десятков опубликованных датасетов кишечной микробиоты взятых из исследований по оценке влияния диет на кишечную микробиоту in vivo, так и работ по in vitro ферментации микробиоты в присутствии различных пребиотиков. Полученные метаболические потенциалы синтеза пропионата и бутирата в кишечных образцах, полученными после ферментации фекального инокулята in vitro, хорошо коррелируют с экспериментальными данными по измеренным концентрациям данных метаболитов.

 

Публикации

1. Джонс Р.Б., Бергер П.К., Плоус Д.Ф., Альдерет Т.Л., Миллштайн Д., Фогел Д., Яблоков С.Н., Родионов Д.А., Остерман А.Л., Боде Л., Горан М.И. Lactose-reduced infant formula with added corn syrup solids is associated with a distinct gut microbiota in Hispanic infants Gut Microbes, 12(1):1813534 (год публикации - 2020) https://doi.org/10.1080/19490976.2020.1813534

2. Петерсон К.Т., Яблоков С.Н., Учитель С., Чопра Д., Перец-Сантьяго Д., Родионов Д.А., Петерсон С.Н. Community Metabolic Interactions, Vitamin Production and Prebiotic Potential of Medicinal Herbs used for Immunomodulation Frontiers in Genetics, - (год публикации - 2020) https://doi.org/10.3389/fgene.2020.584197

3. Яблоков С.Н., Клименко Н.С., Ефимова Д.А., Шашкова Т., Новичков П.С., Родионов Д.А., Тяхт А.В. Metabolic phenotypes as potential biomarkers for linking gut microbiome with inflammatory bowel diseases Frontiers in Molecular Biosciences, - (год публикации - 2020) https://doi.org/10.3389/fmolb.2020.603740


Аннотация результатов, полученных в 2021 году
В 2021 году были получены следующие уникальные научные результаты. Закончена разработка программных модулей для системы автоматизированного анализа метагеномных образцов в формате ампликонного секвенирвания гена 16S rRNA с целью вычисления их таксономических и метаболических/фенотипических характеристик (метрик). Таксономические профиля выдаются на различных таксономических уровнях, и содержат таблицы относительной представленности обнаруженных таксономических единиц на уровне вида, рода, семейства, порядка, класса и типа бактерий. Метаболические профиля выдаются в виде таблиц кумулятивных фенотипических индексов (КФИ) для каждого изученного метаболита. Были разработаны и внедрены следующие программные модули: 1) модуль для вычисления кумулятивной встречаемости ферментов катаболизма полисахаридов согласно классификации из базы данных CAZy; 2) модуль для вычисления резистомного потенциала метагеномного образца для известных семейств белков лекарственной устойчивости относящихся к 13 функциональным категориям из базы данных Resfams; 3) модуль для выявления таксономических групп, которые создают наибольший количественный вклад в метаболический КФИ метагеномного образца, модуль позволяет прогнозировать направленные изменения состава микробиоты посредством добавления определенных пребиотиков и витаминов; 4) модуль для поиска дискриминаторных метаболических фенотипов между группами метагеномных образцов, определенными с использованием различных внешних метаданных исследования, и позволяющий выделять фенотипы, которые наилучшим образом объясняют отличия между группами образцов. Разработанные программные модули были применены для фенотипического профилирования нескольких больших наборов 16S метагеномных образцов кишечной микробиоты. Программный конвейер по фенотипическому профилированию был применен для анализа 16S метагеномных образцов из 10 различных иследований по ин витро ферментации фекальной микробиоты. Полученные профиля проанализированы в контексте доступных для образцов метаданных (концентрация и тип пребиотика, КЖК или других метаболитов, добавленных в ростовую среду), обработаны статистически, и выявлены фенотипы потенциально ассоциированые с свойствами экспериментальных пребиотиков/метаболитов. Также были найдены фенотипы продукции КЖК в кишечных образцах из метагеномного исследования младенцев 1-3 лет с генетической предрасположенностью к сахарному диабету. Закончена разработка и отладка двух программных конвейеров для таксономического и функционального анализа метагеномных образцов в полногеномном формате (WGS). Первый конвейер позволяет получать таксономический и КФИ профиля для WGS образцов с использованием референсной базы данных 2856 кишечных геномов, для которых имеются метаболические реконструкции и фенотипы в виде Бинарной Фенотипической Матрицы (БФМ). Второй конвейер позволяет получить оценку представленности отдельных метаболических генов (сигнатурных генов) и биохимических путей в целом с использованием метаболических реконструкций из референсной базы данных. Конвейеры были применены для профилирования образцов из нескольких метагеномных исследований и позволили выявить взаимосвязь между представленными в образцах таксонами, биохимическими путями и метаболическими фенотипами. Были установлены метаболические фенотипы и отдельные биохимические пути, которые предположительно ассоциированны с болезнью Крона. Закончена разработка и тестирование комплексного программного комплекса для автоматического расширения референсной БФМ на новые бактериальные геномы и метагеномно-собранные геномы (МСГ). Конвейер позволяет функционально проаннотировать геном или МСГ и определить его метаболические бинарные фенотипы с использованием трех методов назначения фенотипов, а именно правил фенотипов, моделей машинного обучения и определение референсного фенотипа в группах близкородственных геномов; а затем назначить консенсусный фенотип. Проведено масштабное тестирование програмного комплекса на более чем 20 тысяч геномов из трех геномных коллекций изолятов и МСГ, что показало точность определения фенотипов более 99%. Полученные расширенные БФМ были проанализированы, подсчитаны метрики вариабельности метаболических фенотипов в группах близкородственных геномов, относящихся к одному виду. Полученные результаты позволили обнаружить наиболее вариабельные таксономические виды и метаболические фенотипы в расширенной коллекции кишечных геномов и МСГ. С помощью сравнительно-геномного анализа и метаболической реконструкции получены расширенные БФМ для около 2 тысяч референсных бактериальных геномов вагинального микробиома человека. Обновленные БФМ позволили определить распределения метаболических потенциалов в вагинальной микробиоте здоровых женщин, и связать их с основными типами вагинальных микробиомов, ранее обнаруженными с помощью таксономических профилей. Проведена метаболическая реконструкция и функциональная аннотация путей и регулонов утилизации углеводов у кишечных бактерий относящихся к роду Collinsella. Для сравнительного анализа было отобрано 136 геномов коллинсел, которые были разделены на 18 групп близкородственных штаммов. В результате были предсказаны метаболические фенотипы катаболизма простых сахаров и олигосахаридов у коллинсел, выявлены консервативные и видо- и штаммо-специфичные фенотипы. Консервативными у коллинсел фенотипами оказались утилизация фруктозы, маннозы, ацетилгалактозамина, мальтозы и сиаловой кислоты. Обнаружены новые потенциальные транспортеры углеводов и сахар-специфичные транскрипционные факторы, для которых были обнаружены ДНК сайты связывания и реконструированы соответствующие регулоны.

 

Публикации

1. Яблоков С.Н., Новичков П.С., Остерман А.Л., Родионов Д.А Binary Metabolic Phenotypes and Phenotype Diversity Metrics for the Functional Characterization of Microbial Communities Frontiers in Microbiology, 12:653314 (год публикации - 2021) https://doi.org/10.3389/fmicb.2021.653314

2. Ашниев Г.А., Сернова Н.В., Шевкопляс А.Е., Родионов И.Д., Родионова И.А., Витрещак А.Г., Гельфанд М.С., Родионов Д.А. Evolution of Transcriptional Regulation of Histidine Metabolism in Grampositive Bacteria Proceedings of 10th Moscow Conference on Computational Molecular Biology MCCMB'21, 2021(34) (год публикации - 2021)

3. Казанов М.Д., Лейн С.А., Родионов Д.А, Computational inference of metabolic phenotypes for new bacterial isolate and metagenome-assembled genomes Proceedings of 10th Moscow Conference on Computational Molecular Biology MCCMB'21, 2021(35) (год публикации - 2021)

4. Яблоков С.Н., Родионов Д.А. Binary metabolic phenotypes and phenotype diversity metrics for functional characterization of microbial communities Proceedings of 10th Moscow Conference on Computational Molecular Biology MCCMB'21, 2021(36) (год публикации - 2021)


Возможность практического использования результатов
Полученные в результате выполнения данного проекта уникальные данные по метаболическим фенотипам бактерий из микробных сообществ кишечника человека и автоматизированные биоинформатические конвейеры для подсчета кумулятивных фенотипических индексов микробиомных сообществ и для аннотации новых геномов метаболическими фенотипами позволят: (1) осуществлять функциональную (вдобавок к таксономической) классификацию большого набора образцов микробиоты используя метагеномные данные; (2) проводить корреляционный анализ с использованием метаданных (данные по болезням, диетам и добавкам к пище, географии и образу жизни); (3) выявлять метаболические фенотипы ассоциированные с определенными признаками и участками тела.