КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 19-74-00112

НазваниеФункции топологически ассоциированных доменов в хроматине

РуководительХрамеева Екатерина Евгеньевна, Кандидат биологических наук

Организация финансирования, регион Автономная некоммерческая образовательная организация высшего образования «Сколковский институт науки и технологий», г Москва

Период выполнения при поддержке РНФ 07.2019 - 06.2021 

Конкурс№40 - Конкурс 2019 года «Проведение инициативных исследований молодыми учеными» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными.

Область знания, основной код классификатора 04 - Биология и науки о жизни, 04-207 - Системная биология; биоинформатика

Ключевые словапространственная структура хроматина, Hi-C, топологически ассоциированные домены (ТАДы), эпигеномика, дифференциальная экспрессия генов, сайты связывания транскрипционных факторов

Код ГРНТИ34.03.23


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Понимание того, как хроматин организован внутри ядра и как трехмерная структура хроматина влияет на регуляцию экспрессию генов, – это главные вопросы современной клеточной биологии. За последние несколько лет в ведущих мировых журналах были опубликованы сотни работ, посвященных изучению различных аспектов пространственной организации хроматина (см. обзор в Bonev&Cavalli, 2016). В настоящем проекте будут изучены Топологически Ассоциированные Домены (ТАДы), недавно открытые пространственные и функциональные единицы хроматина, поскольку их функции и механизм формирования изучены недостаточно, и являются самыми интересными и обсуждаемыми вопросами в области изучения трехмерной структуры хроматина в настоящее время. Наибольший прогресс в понимании механизма формирования ТАДов достигнут для генома человека (Dixon et al., 2012). Границы ТАДов у человека обогащены инсуляторными белками (когезин и CTCF), которые считаются основными факторами, обеспечивающими поддержание структуры ТАДов (Zuin et al., 2014). Поскольку в настоящем проекте мы ставим перед собой задачу изучить функции и механизм формирования ТАДов как можно более глубоко и всесторонне, мы исследуем ТАДы не только у человека, но и у популярных модельных организмов (Drosophila melanogaster и других). В каждом из изучаемых организмов мы совместим пространственную структуру хроматина с функциональными характеристиками генома, и попытаемся установить механизм формирования ТАДов. Это представляется важным, поскольку в разных организмах, по всей видимости, работают разные механизмы формирования ТАДов (Ulianov et al., 2016). Изучение ТАДов в разных организмах поможет установить общие принципы поддержания структуры ТАДов, и лучше понять их глобальную роль в функционировании генома. Для максимально полного и всестороннего изучения функциональной роли и механизма формирования ТАДов будет решено несколько задач и проверено несколько гипотез. Прежде всего, мы напрямую проверим зависимость активности экспрессии генов от частоты контактов участков хромосом, на полногеномном уровне, а также изучим контакты генов и энхансеров в пространстве ядра и их связь с болезнями, так как ранее было показано, что разрушение ТАДов приводит к нарушениям в экспрессии генов, и, как следствие, к тяжелым заболеваниям человека (Kaiser et al., 2017). Затем, с использованием современных методы машинного обучения, мы сравним пространственную структуру хроматина в целом и ТАДы в частности на разных стадиях развития организма, и сопоставим найденные отличия с данными об изменениях уровня экспрессии генов и модификаций гистонов на тех же стадиях, чтобы понять степень влияния пространственной структуры хроматина на регуляцию работы генов. Bonev, B. & Cavalli, G. Organization and function of the 3D genome. Nat. Rev. Genet. 17, 661–678 (2016). Dixon, J. R. et al. Topological domains in mammalian genomes identified by analysis of chromatin interactions. Nature 485, 376–80 (2012). Zuin, J. et al. Cohesin and CTCF differentially affect chromatin architecture and gene expression in human cells. Proc. Natl. Acad. Sci. U. S. A. 111, 996–1001 (2014). Ulianov, S.V., Khrameeva, E.E., et al. Active chromatin and transcription play a key role in chromosome partitioning into topologically associating domains. Genome Res 26(1), 70-84 (2016). Kaiser, V. B. & Semple, C. A. When TADs go bad: chromatin structure and nuclear organisation in human disease. F1000Research 6, (2017).

Ожидаемые результаты
Будут установлены функции и механизм формирования ТАДов у человека и у популярных модельных организмов (Drosophila melanogaster и других) путем совмещения пространственной структуры хроматина с функциональными характеристиками генома. Мы напрямую проверим зависимость активности экспрессии генов от частоты контактов участков хромосом, на полногеномном уровне, а также изучим контакты генов и энхансеров в пространстве ядра и их связь с болезнями. Будут найдены отличия в пространственной структуре хроматина и в ТАДах на разных стадиях развития организма. Будет установлена степень влияния пространственной структуры хроматина на регуляцию работы генов, путем сопоставления найденных отличий с данными об изменениях уровня экспрессии генов и модификаций гистонов на тех же стадиях. Все результаты будут получены вычислительными (биоинформатическими) методами, которые гораздо дешевле альтернативных экспериментальных методов, что важно с точки зрения экономики. Потребуется лишь экспериментальная проверка ключевых выводов. Кроме того, нарушения экспрессии генов, связанных с разрушением различных ТАДов, приводят к тяжелым заболеваниям человека, и их изучение необходимо для разработки новых методов лечения и диагностики. Полученные результаты будут соответствовать мировому уровню и будут опубликованы в ведущих научных журналах. В ходе выполнения квалификационных работ по тематике проекта, студенты и аспиранты получат большой опыт проведения разнообразных исследований, и станут таким образом современными, разносторонними специалистами, способными к самостоятельной работе над новыми задачами. Будет защищена одна кандидатсткая диссертация (А.А.Галицына), а также одна дипломная работа (С.С.Стариков).


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2019 году
Понимание того, как хроматин организован внутри ядра и как трехмерная структура хроматина влияет на регуляцию экспрессию генов, – это главные вопросы современной клеточной биологии. За последние несколько лет в ведущих мировых журналах были опубликованы сотни работ, посвященных изучению различных аспектов пространственной организации хроматина (см. обзор в Bonev&Cavalli, 2016). Настоящий проект посвящен изучению Топологически Ассоциированных Доменов (ТАДов), недавно открытых пространственных и функциональных единиц хроматина, поскольку их функции и механизм формирования изучены недостаточно, и являются самыми интересными и обсуждаемыми вопросами в области изучения трехмерной структуры хроматина в настоящее время. Наибольший прогресс в понимании механизма формирования ТАДов достигнут для генома человека (Dixon et al., 2012). Границы ТАДов у человека обогащены инсуляторными белками (когезин и CTCF), которые считаются основными факторами, обеспечивающими поддержание структуры ТАДов (Zuin et al., 2014). Поскольку в настоящем проекте мы ставим перед собой задачу изучить функции и механизм формирования ТАДов как можно более глубоко и всесторонне, мы исследовали ТАДы не только у человека, но и у популярных модельных организмов: дрозофилы и мыши. В каждом из изучаемых организмов мы совместили пространственную структуру хроматина с функциональными характеристиками генома, и установили характер взаимосвязи между уровнями экспрессии генов и частотой контактов в хроматине по данным Hi-C. Кроме того, нам удалось выявить наследование предпочтений в частоте контактов при геномных перестройках в эволюции. Изучение разнообразия и эволюции упаковки хроматина представляется важным, поскольку в разных организмах, по всей видимости, работают разные механизмы формирования ТАДов (Ulianov et al., 2016). Изучение особенностей организации хроматина в разных организмах позволяет установить общие принципы поддержания структуры ТАДов, и лучше понять их глобальную роль в функционировании генома. Для максимально полного и всестороннего изучения функциональной роли ТАДов, мы также изучили контакты генов и энхансеров в пространстве ядра и их связь с болезнями, так как ранее было показано, что разрушение ТАДов приводит к нарушениям в экспрессии генов, и, как следствие, к тяжелым заболеваниям человека (Kaiser et al., 2017), в том числе к онкологическим – нейробластоме (Peifer et al., 2015; Valentijn et al., 2015), лейкемии (Gröschel et al., 2014; Hnisz et al., 2016), медуллобластоме (Northcott et al., 2014), глиоме (Flavahan et al., 2016), раку прямой кишки (Weischenfeldt et al., 2017). Эти онкологические заболевания являются многофакторными, и у каждого пациента могут быть вызваны поломками в разных местах генома. Поэтому особый интерес представляют онкологические заболевания, которые, при одинаковой клинической картине, могут иметь разные молекулярные механизмы, что может проявляться как разный ответ на одно и то же лечение. Изучение таких заболеваний особенно важно для развития персональной медицины. Анализ данных РНК-секвенирования в образцах рака головы и шеи, которые по-разному отвечали на лечение, выявил значительные изменения в экспрессии генов и показал, что механизм различного ответа на лечение является регуляторным (Yegodaev et al., 2020). В рамках исследования возможной регуляции, мы изучили связь найденных отличий в экспрессии генов с данными о положении энхансеров в геноме человека, данными Hi-C по частоте контактов хроматина, по положению ТАДов в геноме человека, и проверили частоту контактов энхансер-промотор для генов с изменениями экспрессии. Мы нашли слабые, но статистически значимые отличия частот контактов по данным Hi-C для взаимодействий ген-ген, ген-энхансер, энхансер-энхансер, опосредованных структурой ТАДов. Кроме того, мы исследовали однонуклеотидные полиморфизмы, ассоциированные с раком головы и шеи, и их возможную связь с различным ответом на лечение. На втором этапе реализации проекта, мы планируем дальнейшее, более детальное изучение найденных нами изменений. Bonev, B. & Cavalli, G. Organization and function of the 3D genome. Nat. Rev. Genet. 17, 661–678 (2016). Dixon, J. R. et al. Topological domains in mammalian genomes identified by analysis of chromatin interactions. Nature 485, 376–80 (2012). Zuin, J. et al. Cohesin and CTCF differentially affect chromatin architecture and gene expression in human cells. Proc. Natl. Acad. Sci. U. S. A. 111, 996–1001 (2014). Filion, G. J. et al. Systematic protein location mapping reveals five principal chromatin types in Drosophila cells. Cell 143, 212–24 (2010). Ulianov, S.V., Khrameeva, E.E., et al. Active chromatin and transcription play a key role in chromosome partitioning into topologically associating domains. Genome Res 26(1), 70-84 (2016). Kaiser, V. B. & Semple, C. A. When TADs go bad: chromatin structure and nuclear organisation in human disease. F1000Research 6, (2017). Peifer M, Hertwig F, Roels F, et al.: Telomerase activation by genomic rearrangements in high-risk neuroblastoma. Nature. 2015; 526(7575): 700–4. Valentijn LJ, Koster J, Zwijnenburg DA, et al.: TERT rearrangements are frequent in neuroblastoma and identify aggressive tumors. Nat Genet. 2015; 47(12): 1411–4. Gröschel S, Sanders MA, Hoogenboezem R, et al.: A single oncogenic enhancer rearrangement causes concomitant EVI1 and GATA2 deregulation in leukemia. Cell. 2014; 157(2): 369–81. Hnisz D, Weintraub AS, Day DS, et al.: Activation of proto-oncogenes by disruption of chromosome neighborhoods. Science. 2016; 351(6280): 1454–8. Northcott PA, Lee C, Zichner T, et al.: Enhancer hijacking activates GFI1 family oncogenes in medulloblastoma. Nature. 2014; 511(7510): 428–34. Flavahan WA, Drier Y, Liau BB, et al.: Insulator dysfunction and oncogene activation in IDH mutant gliomas. Nature. 2016; 529(7584): 110–4. Weischenfeldt J, Dubash T, Drainas AP, et al.: Pan-cancer analysis of somatic copy-number alterations implicates IRS4 and IGF2 in enhancer hijacking. Nat Genet. 2017; 49(1): 65–74. Yegodayev KM, Novoplansky O, Golden A, Prasad M, Levin L, Jagadeeshan S, Zorea J, Dimitstein O, Joshua BZ, Cohen L, Khrameeva E*, Elkabets M*. TGF-Beta-Activated Cancer-Associated Fibroblasts Limit Cetuximab Efficacy in Preclinical Models of Head and Neck Cancer. Cancers (Basel). 2020 Feb 3;12(2). pii: E339. doi:10.3390/cancers12020339. * - авторы с равным вкладом

 

Публикации

1. Егодаев К.М., Новоплански О., Гольден А., Прасад М., Левин Л., Ягадишан С., Зореа Д., Димитштейн О., Джошуа Б.-З., Кохен Л., Храмеева Е., Элкабец М. TGF-Beta-Activated Cancer-Associated Fibroblasts Limit Cetuximab Efficacy in Preclinical Models of Head and Neck Cancer Cancers, 12(2), 339 (год публикации - 2020) https://doi.org/10.3390/cancers12020339


Аннотация результатов, полученных в 2020 году
Несмотря на то, что давно разработаны методы для установления последовательности ДНК полного генома, многие принципы трехмерной укладки ДНК неясны. Конформация хроматина в ядре влияет на многие клеточные механизмы, такие как регуляция экспрессии генов, и за последние несколько лет в ведущих мировых журналах были опубликованы сотни работ, посвященных изучению различных аспектов пространственной организации хроматина. В настоящем проекте мы изучили Топологически Ассоциированные Домены (ТАДы), недавно открытые пространственные и функциональные единицы хроматина, которые участвуют в регуляции экспрессии генов. Поскольку в настоящем проекте мы ставим перед собой задачу изучить функции и механизм формирования ТАДов как можно более глубоко и всесторонне, мы исследовали ТАДы не только у человека, но и у популярных модельных организмов: дрозофилы и мыши. Совместно с коллабораторами из Университета Бен-Гурион в Негеве (Израиль), мы выполнили эксперименты Hi-C на кортикальных нейронах мышей возрастом 4, 10 и 20 месяцев, чтобы понять, какие изменения происходят в структуре хроматина нейронов на разных стадиях жизни организма. Мы аннотировали ТАДы на полученных картах Hi-C и сравнили их позиции между возрастными группами мышей. Профиль ТАДов глобально не изменился, в отличие от профиля компартментов. Однако глобальных изменений в профиле ТАДов между возрастами и не ожидалось: известно, что позиции ТАДов очень стабильны и сохраняются даже между разными тканями и эволюционно родственными видами. Важными могут являться более тонкие, локальные изменения. Чтобы их обнаружить, мы рассмотрели бины Hi-C карт, высоко вариабельные между возрастами, и обнаружили 86 бинов (содержащих 131 ген), значимо ассоциированных с возрастом по профилю ТАДов. Анализ функционального обогащения выявил категории, связанные с ионными каналами и трансмембранным транспортом. Эти функциональные категории являются очень интересными, т.к. наши эксперименты проводились в кортикальных нейронах, где функции ионных каналов и трансмембранного транспорта крайне важны для правильной передачи нервного импульса и, как следствие, для правильной работы мозга. Возможные изменения в регуляции работы генов ионных каналов с возрастом кажутся вполне логичными, и заслуживают более детального изучения и дополнительных экспериментов, в будущих проектах. Более того, нарушение функций ионных каналов с возрастом описано в литературе (Farajnia et al., 2015; Strickland et al., 2019). Далее, чтобы изучить ассоциацию ТАДов с функциональными характеристиками генома более детально, мы применили методы машинного обучения. Для этого анализа был выбран другой популярный модельный организм – плодовая мушка Drosophila. Цель анализа состояла в том, чтобы предсказать профиль ТАДов по эпигенетическим маркерам и определить, какие из них являются наиболее значимыми для предсказания профиля ТАДов. Поэтому мы построили модели линейной регрессии (LR), регрессионные модели с градиентным бустингом (GB) и рекуррентные нейронные сети (RNN). Архитектура RNN с двунаправленной долгосрочной краткосрочной памятью показала наилучшие результаты и выявила биологически значимые маркеры. Распределение белка Chriz (Chromator) и гистоновые модификации H3K4me3, H3K27ac оказались наиболее информативными признаками для предсказания ТАДов, что указывает на потенциальную важность этих факторов для формирования ТАДов. Разработанный нами подход может быть адаптирован к любому аналогичному набору биологических данных о характеристиках хроматина в любом организме и типе клеток. Подход реализован в виде программного обеспечения Hi-ChiP-ML, код которого доступен публично: https://github.com/MichalRozenwald/Hi-ChIP-ML. Результаты этого анализа опубликованы в журнале PeerJ Computer Science (Q1; IF=3; Rozenwald et al., 2020). Ранее мы показали, что ТАДы имеют иерархическую структуру: более мелкие активные ТАДы вложены в крупные неактивные (Luzhin et al., 2019). Однако это исследование, как и другие подобные исследования на других организмах, были выполнены на популяции клеток. И вопрос о существовании иерархической структуры ТАДов в клетках остается открытым: не является ли наблюдаемая нами иерархическая структура ТАДов результатом наложения профилей ТАДов, которые отличаются между клетками? Поэтому мы приняли участие в большой коллаборации с группами Нечаева С.K., Гельфанда M.С., Вассецкого Е.С., Чертовича A.В., Шевелева Ю.Я. и Разина С.В. по изучению упаковки хроматина в отдельных клетках и, как и предполагает тематика настоящего проекта, выполнили часть этого большого исследования, посвященную структуре и функциям ТАДов в отдельных клетках. Результаты нашего исследования показали, что в геноме отдельных клеток наблюдаются неиерархические ТАДы при разрешении Hi-C карт в 100 kb. Позиции этих ТАДов хорошо совпадают с позициями ТАДов в популяционных картах Hi-C. Более 40% границ ТАДов консервативны между разными клетками и характеризуются высоким уровнем активных эпигенетических маркеров, подобно ТАДам в популяционных картах Hi-C. Результаты этого анализа опубликованы в журнале Nature Communications (Q1; IF=12; Ulianov et al., 2021). 1. Farajnia S, Meijer JH, Michel S. Age-related changes in large-conductance calcium-activated potassium channels in mammalian circadian clock neurons. Neurobiol Aging. 2015 Jun;36(6):2176-83. doi: 10.1016/j.neurobiolaging.2014.12.040 2. Strickland, M., Yacoubi-Loueslati, B., Bouhaouala-Zahar, B., Pender, S., & Larbi, A. (2019). Relationships Between Ion Channels, Mitochondrial Functions and Inflammation in Human Aging. Frontiers in physiology, 10, 158. https://doi.org/10.3389/fphys.2019.00158 3. Rozenwald MB, Galitsyna AA, Sapunov GV, Khrameeva EE, Gelfand MS. 2020. A machine learning framework for the prediction of chromatin folding in Drosophila using epigenetic features. PeerJ Computer Science 6:e307 https://doi.org/10.7717/peerj-cs.307 4. Luzhin, AV, Flyamer, IM, Khrameeva, EE, Ulianov, SV, Razin, SV, Gavrilov, AA. Quantitative differences in TAD border strength underly the TAD hierarchy in Drosophila chromosomes. J Cell Biochem. 2019; 120: 4494-4503. https://doi.org/10.1002/jcb.27737 5. Ulianov, S. V., Zakharova, V. V., Galitsyna, A. A., Kos, P. I., Polovnikov, K. E., Flyamer, I. M., Mikhaleva, E. A., Khrameeva, E. E., Germini, D., Logacheva, M. D., Gavrilov, A. A., Gorsky, A. S., Nechaev, S. K., Gelfand, M. S., Vassetzky, Y. S., Chertovich, A. V., Shevelyov, Y. Y., & Razin, S. V. (2021). Order and stochasticity in the folding of individual Drosophila genomes. Nature communications, 12(1), 41. https://doi.org/10.1038/s41467-020-20292-z

 

Публикации

1. Розенвальд М.В., Галицына А.А., Сапунов Г.В., Храмеева Е.Е., Гельфанд М.С. A machine learning framework for the prediction of chromatin folding in Drosophila using epigenetic features PeerJ Computer Science, 6, e307 (год публикации - 2020) https://doi.org/10.7717/peerj-cs.307

2. Самборская М.Д., Галицына А., Плетенев И., Трофимова А., Миронов А.А., Гельфанд М.С., Храмеева Е.Е. Cumulative contact frequency of a chromatin region is an intrinsic property linked to its function PeerJ, e9566 (год публикации - 2020) https://doi.org/10.7717/peerj.9566

3. Ульянов С.В., Захарова В.В., Галицына А.А., Кос П.И., Половников К.Е., Флямер И.М., Михалева Е.А., Храмеева Е.Е., Гермини Д., Логачева М.Д., Гаврилов A.A., Горский A.С., Нечаев С.K., Гельфанд M.С., Вассецкий Е.С., Чертович A.В., Шевелев Ю.Я., Разин С.В. Order and stochasticity in the folding of individual Drosophila genomes Nature Communications, 12, 41 (год публикации - 2021) https://doi.org/10.1038/s41467-020-20292-z


Возможность практического использования результатов
Полученные в результате реализации проекта знания помогают лучше понять известные, а, возможно, и определить новые, молекулярные механизмы регуляции экспрессии генов. Это, в свою очередь, важно для идентификации механизмов развития целого спектра социально значимых заболеваний человека. Без понимания этих механизмов невозможна разработка новых лекарственных препаратов и подходов к лечению заболеваний человека. Таким образом, понимание принципов и механизмов пространственной организации генома является одной из ключевых проблем при переходе к высокотехнологичному здравоохранению. ТАДы важны в регуляции экспрессии генов, но их функции в целом изучены недостаточно. Известно, что разрушение некоторых ТАДов приводит к нарушениям в экспрессии генов, и, как следствие, к тяжелым заболеваниям – нарушениям развития (Lupiáñez et al., 2015; Franke et al., 2016) и онкологическим заболеваниям: нейробластоме (Peifer et al., 2015; Valentijn et al., 2015), лейкемии (Gröschel et al., 2014; Hnisz et al., 2016), медуллобластоме (Northcott et al., 2014), глиоме (Flavahan et al., 2016), раку прямой кишки (Weischenfeldt et al., 2017). Эти онкологические заболевания являются многофакторными, и у каждого пациента могут быть вызваны поломками в разных местах генома. Таким образом, изучение всего многообразия нарушений экспрессии генов, связанных с разрушением различных ТАДов, необходимо при переходе к персональной медицине, для разработки новых высокотехнологичных (как и все современные методы лечения онкологических заболеваний) методов лечения и диагностики. В настоящем проекте мы изучили функции и механизмы формирования ТАДов вычислительными (биоинформатическими) методами с последующей экспериментальной проверкой полученных результатов. Были изучены контакты генов и энхансеров в пространстве ядра, их связь с заболеваниями человека, а также расположение генов, ассоциированных с болезнями, относительно границ ТАДов. Были усовершенствованы существующие и разработаны новые подходы к анализу биологических данных по пространственной структуре хроматина, а также выполнена интеграция этих данных с разнородными данными по функциональным характеристикам генома. Разработка новых подходов к анализу биологических данных и интеграции разнородных данных, поиск в них новых биологических явлений также является одной из самых актуальных задач современной биологии. Разработанные нами подходы могут успешно применяться для анализа аналогичных данных в медицинских целях.