КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 18-14-00240

НазваниеРоль длинных некодирующих РНК в эпигенетической регуляции в масштабе полных геномов и транскриптомов

РуководительМедведева Юлия Анатольевна, Кандидат биологических наук

Организация финансирования, регион Федеральное государственное учреждение "Федеральный исследовательский центр "Фундаментальные основы биотехнологии" Российской академии наук", г Москва

Период выполнения при поддержке РНФ 2018 г. - 2020 г. 

Конкурс№28 - Конкурс 2018 года «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами».

Область знания, основной код классификатора 04 - Биология и науки о жизни, 04-207 - Системная биология; биоинформатика

Ключевые словаДлинные некодирующие РНК, метилирование ДНК, модификации гистонов, модификация хроматина, взаимодействие РНК-хроматин, РНК-ДНК триплексы, РНК-РНК дуплексы

Код ГРНТИ34.03.23


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
К настоящему времени стало понятно, что сложность высших организмов заметно сильнее коррелирует не с количеством белок-кодирующих генов, а со сложностью регуляторных программ. Эпигенетическая регуляция экспрессии генов - важнейший класс регуляторных механизмов - интенсивно изучалась в течение последних нескольких десятилетий, заложив методологические и концептуальные основы для комплексного понимания этих механизмов. Тем не менее, для большинства эпигенетических модификаций механизмы их установления известны далеко не полностью, особенно плохо изучено, каким образом белки-ферменты, осуществляющие эти модификации, нацеливаются на специфические геномные локусы. В литературе последних лет сообщалось о нескольких примерах днкРНК, нацеливающих эпигенетические комплексы к специфическим геномным локусам. Высокопроизводительные экспериментальные методики, основанные на геномном секвенировании (такие как ChiRP-Seq, CHART, MARGI, GRID-seq и др) указывают на то, что ряд днкРНК взаимодествует с множеством участков хроматина, возможно меняя его эпигенетическое состояние. Также показано, что количество различных днкРНК в геномах человека и других млекопитающих, вполне сравнимо с количеством белок-кодирующих генов, однако функции большинства этих РНК неизвестны. В данном проекте мы предлагаем объединить эпигенетическую регуляцию с регуляцией при помощи днкРНК и создать полную карту эпигенетической регуляции, управляемой с помощью днкРНК. Данный проект позволит определить функцию и возможный механизм действия для многих днкРНК. Программные инструменты и база данных, которые будут разработаны, будут представлять собой важный источник информации об регуляции экспрессии генов человека с помощью эпигенетических механизмов и днкРНК. Новизна и оригинальность предлагаемого проекта отражены как в его основных целях и задачах, так и в предлагаемом методологическом подходе. Длинные некодирующие РНК относятся к быстро растущему классу РНК с плохо аннотированной функциональностью. Коллаборация с международным консорциумом FANTOM6 предоставляет нашей команде доступ к уникальным экспериментальным данным, систематически оценивающим функции широкого спектра днкРНК, и взаимодействий РНК с хроматином. Наша группа, обладающая большим заделом в биоинформатического анализа взаимодействий РНК-РНК и РНК-ДНК, предлагает новый подход к моделированию этого взаимодействия - переход от моделирования таких взаимодейстий только в рамках оценок свободных энергий к комплексному моделированию, которое также включает вероятностную компоненту, что позволяет более достовено проводить сравнения различных взаимодействий. Кроме того, наша группа разрабатывает алгоритм мультиомиксной интеграции, который объединяет информацию нескольких типов полногеномных экспериментов (RNA-Seq, ChIP-Seq) и результатов моделирования РНК-РНК и РНК-ДНК взаимодействий. Данный метод позволит повысить качество и достоверность предсказаний мишеней днкРНК и позволит массово анализировать днкРНК с целью выявить те, которые участвуют в регулировании хроматина. Данный проект имеет не только фундаментальные, но и прикладное значение. Достоверно известно, что нарушение эпигенетических механизмов способствует возникновению и развитию многих заболеваний, включая рак, метаболические и нейродегенеративные расстройства. Несколько эпигенетических препаратов, влияющих на метилирование ДНК и ацетилирование гистонов, уже используются в клинической практике во всем мире, в том числе и в России. Однако, эти препараты не специфичны и не могут модифицировать эпигенетический статус конкретного гена или специфических геномных локусов, что снижает их эффективность и дает побочные эффекты. С другой стороны, экспериментальные методы, позволяющие редактировать геномы с помощью CRISPR | Cas или изменять уровень экспрессии РНК с помощью коротких РНК (siRNA, ASO), позволяют нацеливаться на очень специфические геномные регионы или транскрипты в клетках. Детальное понимание механизмов работы днкРНК, нацеливающих эпигенетические комплексы на специфические геномные локусы, а также выявление наиболее перспективных с этой точки зрения днкРНК, может в будущем способствовать созданию технологий высокоспецифичного эпигенетического редактирования. Безусловно, подобные технологии будут способствовать прогрессу биомедицинских исследований и, следовательно, будут иметь важное общественное значение.

Ожидаемые результаты
Основные результаты данного проекта: - Новые статистические методы, позволяющие проводить вероятностные взаимодействия РНК-ДНК и РНК-РНК в масштабах полного генома и транскриптома; - Алгоритм биоинформатического полногеномного и полнотранскриптомного поиска днкРНК, взаимодействующих с хроматином и участков их взаимодействия; - Вычислительные комплексы для идентификации статистически значимых и потенциально биологически функциональных дуплексов днкРНК-РНК и триплексов днкРНК-ДНК, которые могут быть вовлечены в нацеливание эпигенетических модификаторов на специфические геномные местоположения; вычислительные комплексы будут включать в себя как новые статистические методы для взаимодействия днкРНК-ДНК, так и анализ существующих данных о экспрессии РНК и наличии скоррелированной эпигенетической модификации; - Коллекция днкРНК, потенциально вовлеченных в нацеливание эпигенетических модификаторов на специфические геномные местоположения, подтвержденные публичными и проприоритарными данными (получеными в рамках коллаборации с консорциумом FANTOM6) о взаимодействии РНК- хроматина и РНК-РНК, полученных с помощью методов ChIRP-seq, CHART, PARIS и подобных; - Веб-сервер, обеспечивающий удобные для пользователя интерфейсы к разработанным инструментам; - База данных с веб-интерфейсом, в которой представлены результаты анализа генома и транскриптома днкРНК и их участие в нацеливании эпигенетических модификаций на конкретные геномные локации; база данных будет включать информацию о конкретных комбинациях днкРНК- геномный локус, в котором конкретная РНК может способствовать установлению или изменению эпигенетического профиля; - Набор экспериментально подтвержденных днкРНК, которые вносят вклад в локальное эпигенетическое состояние хроматина; - Сравнительно-геномный анализ пар днкРНК-геномный локус для изучения эволюции этих взаимодействий Результаты предлагаемого проекта лежат на переднем крае исследований в области эпигенетики и будут способствовать пониманию механизмов создания и поддержания эпигенетических профилей. До сих пор, роль днкРНК в эпигенетической регуляции была продемонстрирована лишь для немногих примеров. Предложенный крупномасштабный проект сможет обнаружить множество новых днкРНК, потенциально участвующих в эпигенетической регуляции и понять механизмы их воздействия. Наиболее перспективные днкРНК предсказания будут подтверждены либо в лаборатории, где планируется осуществить проект, либо в сотрудничестве с международным консорциумом FANTOM6. Инновационный характер предлагаемых целей в сочетании с междисциплинарным подходом и квалификацией команды делает проект высококонкурентным на международном уровне. Результаты проекта будут опубликованы в ведущих научных журналах. Разработанные программы и базы данных будут использоваться широким научным сообществом. В будущем инструменты, разработанные в ходе проекта, могут также способствовать медицинским исследованиям и создать основу для разработки хорошо нацеленных эпигенетических препаратов. Нарушение эпигенетических механизмов способствует патогенезу многих сложных и социально значимых заболеваний, включая рак, метаболические и нейродегенеративные расстройства и др. Хотя в настоящее время в клинике используются несколько эпигенетических препаратов, изменяющих метилирование ДНК и ацетилирование гистонов, они не нацелены на конкретные гены / регионы генома, а кроме того токсичны в высоких дозах. В то же время методы целенаправленного редактирования ДНК и РНК на основе CRISPR | Cas системы, а также методы нокдауна РНК с использованием миРНК (siRNA) доказали свою высокую эффективность in vivo. Понимание роли днкРНК в нацеливании эпигенетических модификаторов на конкретные области генома в сочетании с методами биоинженерии для локального редактирования дает основание разработки высоко специфичных эпигенетических лекарственных средств.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2018 году
В 2018 году в рамках проекта велась разработка статистических методов для анализа роли длинных некодирующих РНК в формировании профиля хроматина клетки, а также программных конвейеров, инкорпорирующих эти методы. В первую очередь нами разработана вероятностная модель взаимодействия РНК и ДНК с формированием триплексов по правилам Хугстина. Базовым алгоритмом для предсказания взаимодействия РНК и ДНК с образованием триплексов, который используется в этой работе, является алгоритм, реализованный в программе Triplexator. В нашей текущей работе этот алгоритм был существенно доработан. Разработана вероятностная модель распределения численной величины (скора), которую определяет исходный алгоритм и которая отражает количество спаренных оснований. Данная модель позволяет учитывать длины взаимодействуюзщих участков РНК и ДНК, их нуклеотидный состав и особенности определения триплексов исходной программной. Полученная модель позволяет проводить полногеномные и полнотранскриптомные сравнения, что в свою очередь позволяет выбирать кандидатные РНК, наиболее вероятно формирующие триплекс. Ранее нами было показано, что хотя предсказания триплексов с помощью программы Triplexator лучше других описывает экспериментальные данные, программа дает слишком много ложно-положительных предсказаний. Чтобы компенсировать этот недостаток, дополнительно к запланированным на этот год работам, были проведены тесты с учетом вторичной структуры РНК. То есть выделены участки РНК, которые скорее всего не спарены внутри РНК и потенциально могут связывать ДНК. Предсказания были валидированы на эксперимнетальных данных по полногеномному связыванию MEG3 с хроматином. Было показано, что использование только неспаренных участков РНК, полученным c помощью RNAplfold (Vienna) действительно повышают специфичность предсказания, не снижая чувствительности. Далее, нами был разработан прототип программного конвейера для поиска днкРНК, которые потенциально могут влиять на состояние хроматина путем образования триплексов с целевыми районами. Программный конвейер состоит из следующих основных блоков: (1) стандартизованный поиск участков модицикации гистонов в десятках образцов; (2) нормализация данных экспрессии днкРНК в этих же образцах; (3) корреляция численного значения пика модицикации гистонов и экспрессии днкРНК; (4) определение возможности образования триплекса между кандидатными парами ДНК-РНК и оценка его статистической значимости. Протопит протестироан на на примере гистоновой метки H3K27me3, поскольку известно, днкРНК MEG3, которая связывает ДНК, формируя триплекс, также участвует в установлении именно этой метки. Кроме этого, были проанализированы экспериментальных данные о взаимодействии РНК с хроматином, полученные в колаборации, а также публичные данные GRID-seq. Показано, что хотя абсолютное число межхромосомных контактов (РНК связывается с ДНК другой хромосомы) невелики, однако относительные частоты триплексов в них достаточно высоки. Также обнаружены РНК, которые формируют триплексы с большим количеством участков генома, что ранее про эти РНК не было известно. Также, с опережением графика был начат пилотный анализ данных, полученных в рамках консорциума FANTOM6, по изменению экспрессии при нокдауном различных РНК. Нами были проанализированы промоторы генов, значимо меняющих экспрессию при нокдауне ряда днкРНК и выявлены ряд РНК, которы значимо чаще вормируют триплексы среди промоторов, экспрессия которых значимо изменилась при нокдауне этой РНК. Эти данные указывают на возможный механизм регуляции экспрессии генов при помощи данной РНК, однако нуждаются в дальнейшей экспериметальной проверке.

 

Публикации


Аннотация результатов, полученных в 2019 году
В 2019 году в рамках завершена разработка статистических методов для анализа роли длинных некодирующих РНК в формировании профиля хроматина, а также программных конвейеров, инкорпорирующих эти методы. Конвейер был улучшен и доработан: уточнен отбор образцов, большая часть вычислений векторизована для увеличения скорости обработки заметно увеличившегося количества данных, разработаны методы статистической обработки данных нокдаунов, данных колокализации РНК и ДНК, данных метилирования. С помощью этого конвейера были проанализированы 10 эпигенетических модификаций и области переменного метилирования ДНК. Были более глубоко обработаны результаты анализа корреляций между экспрессией нкРНК и наличием гистоновой модификации в определенном локусе: скоррелированные пики ChIP-seq для модификаций были ассоциированы с регулируемми ими генами. В свою очередь, полученные списки генов, скоррелированных с конкретными нкРНК, были разделены по знаку корреляции. Мы предполагаем, что знак корреляции может указывать на функциональное значение корреляционной связи нкРНК-модификация-ген: положительная корреляция означает, что нкРНК может участвовать в проставлении модификации гистона, отрицательная корреляция означает, что нкРНК может участвовать в ее удалении. Далее, для функционального анализа, были инкорпорированы данные, полученные в рамках консорциума FANTOM6 по изменению экспрессии при нокдауне различных нкРНК. Для каждой нкРНК мы разделиои списки дифференциально экспрессирующихся генов при нокдауне по направлению изменения экспрессии. Для общих с нашими данными нкРНК из данных FANTOM6 была предсказана значимость пересечения списка генов, имеющих пики модификаций, имеющих корреляцию с нкРНК определенного знака, со списком диффэкспрессирующихся в определенную сторону генов из экспериментов FANTOM6. Таким образом было выделено 4 группы нкРНК по их функциональному значению: нкРНК ставящие репрессивные метки, нкРНК снимающие репрессивные метки, нкРНК ставящие активаторные метки, нкРНК снимающие активаторные метки. Также был проведен анализ колокализации нкРНК со скоррелированными участками ДНК с использованием данных iMARGi. Для оценки значимости колокализации разметок генома была использованная программа GenometricCorr. В результате для каждой модификации были получены коллекции нкРНК, потенциально вовлеченных в нацеливание гистоновых модификаторов на специфические геномные локусы и классифицированы в одну из 4х групп по возможному типу влияния на гистоновую метку. Также получен список нкРНК, которые потенциально влияют на метилирование в конкретных местах генома. Всего выявлено более 50 нкРНК, потенциально вовлеченных в изменение модификаций гистонов и метилирования ДНК. Полученные нкРНК были протестированы на возможность образования дуплексов нкРНК-РНК и триплексов нкРНК-ДНК с помощью программ ASSA, Triplexator и TDF. Среди найденных с помощью нашего конвейера нкРНК есть как описанные в литературе, так и нкРНК, роль которых не была показана ранее. Роль одной из них подтверждена экспериментально.

 

Публикации

1. Елена Матвейшина, Иван Антонов, Юлия А. Медведева Practical Guidance in Genome-Wide RNA:DNA Triple Helix Prediction International Journal of Molecular Sciences, 2020, 21(3), 830 (год публикации - 2020) https://doi.org/10.3390/ijms21030830

2. Мазуров Е., Антонов И., Матвейшина Е., Медведева Ю.А. Long non-coding RNA in chromatin formation Proceedings of the Workshop “Epigenetics of infectious and non-communicable diseases” 16 – 19 September 2019, Cape Town, South Africa, p.37 (год публикации - 2019)

3. Матвейшина Е., Медведева Ю.А. Predicting DNA:RNA triplexes based on RNA secondary structure Proceedings of 9th Moscow Conference on Computational Molecular Biology MCCMB'19; - М.: ИППИ РАН, 2019, 224 (год публикации - 2019)

4. Медведева Ю.А. ФОРМИРОВАНИЕ ТРИПЛЕКСОВ ДЛИННЫМИ НЕКОДИРУЮЩИМИ РНК В МАСШТАБЕ ПОЛНОГО ГЕНОМА VII СЪЕЗД ВАВИЛОВСКОГО ОБЩЕСТВА ГЕНЕТИКОВ И СЕЛЕКЦИОНЕРОВ, ПОСВЯЩЕННЫЙ 100-ЛЕТИЮ КАФЕДРЫ ГЕНЕТИКИ СПБГУ, И АССОЦИИРОВАННЫЕ СИМПОЗИУМЫ. Сборник тезисов Международного Конгресса. Издательство: ООО "Издательство ВВМ" (Санкт-Петербург), 124 (год публикации - 2019)


Аннотация результатов, полученных в 2020 году
В 2020 году в рамках работ по проекту завершена разработка программного конвейера для анализа роли длинных некодирующих РНК в формировании профиля хроматина. Основным улучшением, сделанным в этом году является независимый анализ различных ASO, который позволяет с большей достоверностью определять нкРНК, которые участвуют в эпигенетической регуляции. С помощью этого конвейера были проанализированы десять эпигенетических модификаций и области переменного метилирования ДНК. По результатам анализа создана база данных HiMoRNA (himorna.fbras.ru), которая содержит 5640250 значимо скоррелированных длинных некодирующих РНК и участков генома для 10 модификаций гистонов и 4145 нкРНК. Чтобы охарактеризовать каждую пару нкРНК-геномный локус, мы также собрали серию метаданных для каждого взаимодействия. Разработанный программный конвейер выявил 48 нкРНК, потенциально вовлеченных в регуляцию хотя бы одной эпигенетической модификации, сопряженной с функциональными изменениями в экспрессии генов. Более половины этих РНК показали согласованный результат в биологических репликах, а также валидированы с помощью данных о взаимодействии РНК и хроматинка (iMARGI). Мы обнаружили крайне неравномерное хромосомное распределение локусов, в которых эпигенетическая модификация коррелирована с нкРНК. В частности, программный конвейер показывает сильную связь между FTX и метилированием ДНК и между JPX и H3K9me3. Как метилирование ДНК, так и H3K9me3 являются репрессивными модификаторами и, как известно, вносят вклад в различные стадии инактивации X. Мы показали, что почти все пики H3K9me3, ассоциированные с JPX, расположены на Х-хромосоме, что указывает на то, что JPX может также вносить вклад не только в регуляцию XIST как такового, но также и непосредственно в репрессию Х-хромосомы. Изучая механизмы взаимодействия нкРНК с целевыми районами, мы также показали, что около 30% всех нкРНК, подвергшихся нокдауну, могут регулировать целевые гены с помощью образования дуплексов нкРНК:РНК. Большинство таких длинных нкРНК, вероятно, функционируют в ядре, где они могут взаимодействовать с таргетными транскриптами в процессе их синтеза (котранскрипционно). Это наблюдение было также подтверждено экспериментальными данными о взаимодействии нкРНК-хроматин. нкРНК CHASERR наиболее вероятно формирует дуплексы нкРНК:РНК с регулируемыми генами ко-транскрипционно. Нами предложена модель, в рамках которой хеликаза CHD2, в комплексе с CHASERR, взаимодействующей с целевыми промоторами, активирует гены, вдали от мести транскрипции самой нкРНК. Выявлены консервативные участки данной нкРНК, наиболее вероятно участвующие в выполнении CHASERR своих функций. Нами также выявлены 14 нкРНК (CTD-3131K8.2, CTD-2587H24.5, AC124789.1, TUG1, RAB30-AS1, RP13-463N16.6, LINC00886, LINC00886, ZNF37BP, FTX, EMX2OS, FGD5-AS1, RP11-417E7.1, AC016747.3), которые могут образовывать РНК:ДНК триплексы с промоторами регулируемых генов, некоторые из них также вовлечены в эпигенетическую регуляцию. По результатам работы нами было выявлено 17 нкРНК, потенциально вовлеченных в регуляцию, по крайней мере, одной эпигенетической модификации. Среди найденных с помощью нашего конвейера нкРНК есть как описанные в литературе, так и нкРНК, роль которых не была показана ранее, либо была показана для других эпигенетических модификаций. Каждая нкРНК подвергласть повторному нокдауну, по крайней мере, двумя антисенс олигонуклеотидами (ASO), для целевой валидации. В дополнение к ранее запланированным работам, нами показана роль нкРНК ecCEBPA в регуляции метилирования про остром миелоидном лейкозе. Нами предложена модель регуляции метилирования ДНК посредством образования тройных спиралей нкРНК ecCEBPA и промоторов регулируемых генов. Показано также, что NR2F1-AS1 может являться губкой для микроРНК, таргетирующих ДЕГ, реагирующие на нокаут этой РНК. Нами также показано, что химерные транскрипты, играющие важную роль в канцерогенезе, формируют длинную шпильку, возможно, играющую аналогичную роль в качестве малых интерферирующих РНК (siRNA), препятствуя экспрессии генов. Наше исследование подчеркивает функциональную важность нкРНК независимо от уровня их экспрессии, локализации и консервативности, включая их особую роль в эпигенетической регуляции экспрессии генов. Молекулярное фенотипирование совмещенное с интеграцией мульти-омиксных данных позволяет проводить качественную функциональную аннотацию нкРНК, в том числе определять их роль в возникновении и прогрессе социально-значимых заболеваний, в частности онкологических. Полученные нами результаты выявляют новые цели для лекарственной терапии этих заболеваний.

 

Публикации

1. Алессандро Бонетти, Федерико Агостини, Ана Мария Судзуки, Косуке Хашимото, Джованни Паскарелла, ... Юлия Медведева, ... RADICL-seq identifies general and cell type–specific principles of genome-wide RNA-chromatin interactions Nature Communications, 11, Article number: 1018 (год публикации - 2020)

2. Джордан А. Рамиловски, Чи Вай Ип, Саумья Агравал, Джен-Чиен Чанг, Яри Чиани, ... Иван Антонов, ... Юлия А. Медведева и др. Functional annotation of human long noncoding RNAs via molecular phenotyping Genome Research, 30: 1060-1072 (год публикации - 2020) https://doi.org/10.1101/gr.254219.119

3. Иван Антонов и Юлия Медведева Direct Interactions with Nascent Transcripts Is Potentially a Common Targeting Mechanism of Long Non-Coding RNAs MDPI GENES, Genes 2020, 11(12), 1483 (год публикации - 2020) https://doi.org/10.3390/genes00010005

4. Елена Матвейшина, Иван Антонов, Юлия Медведева Practical guidance in genome-wide RNA:DNA triple helix prediction F1000research, International Society for Computational Biology Community Journal (год публикации - 2020) https://doi.org/10.7490/f1000research.1118137.1)

5. - Новый метод покажет, как РНК влияет на активность генома Naked Science (naked-science.ru), 16.03.2020 (год публикации - )

6. - Новый метод покажет, как РНК влияет на активность генома Kolibri.press, 16.03.2020 (год публикации - )

7. - Новый метод покажет, как РНК влияент на активность генома Seldon.News, 16.03.2020 (год публикации - )

8. - Как РНК взаимодействует с ДНК За науку, 16.03.2020 (год публикации - )

9. - Медицина будущего: исследования РНК позволят руководить активностью конкретных генов Поиск, 16.03.2020 (год публикации - )

10. - Показано, как РНК влияет на активность генома Индикатор, 16.03.2020 (год публикации - )

11. - Новый метод покажет, как РНК влияент на активность генома Газета.ру, 17.03.2020 (год публикации - )

12. - ПОКАЗАНО, КАК РНК ВЛИЯЕТ НА АКТИВНОСТЬ ГЕНОМА Биотех 2020, 19.03.2020 (год публикации - )

13. - У регуляторных РНК ищут контакты с ДНК Наука и жизнь, 27.03.2020 (год публикации - )


Возможность практического использования результатов
Наше исследование подчеркивает функциональную важность нкРНК независимо от уровня их экспрессии, локализации и консервативности. Молекулярное фенотипирование совмещенное с интеграцией мультиомикных данных позволяет проводить качествуенную функциональную аннотацию нкРНК, в том числе определять их роль в возникновении и прогрессе социально-значимых заболеваний, в частноти онкологических. Полученные нами результаты выявляют новые цели для лекарственной терапии этих заболеваний.