КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер проекта 19-14-00295

НазваниеИнтеграция и анализ омиксных данных по регуляции транскрипции, оценка влияния SNV.

Руководитель Колпаков Федор Анатольевич, Кандидат биологических наук

Организация финансирования, регион Федеральное государственное бюджетное научное учреждение "Федеральный исследовательский центр информационных и вычислительных технологий" , Новосибирская обл

Конкурс №35 - Конкурс 2019 года «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами»

Область знания, основной код классификатора 04 - Биология и науки о жизни; 04-207 - Системная биология; биоинформатика

Ключевые слова Омиксные данные, ChIP, регуляция транскрипции, сайты связывания транскрипционных факторов, SNP, SNV, база данных, GTRD, FANTOM5, GTEx, BioUML, машинное обучение

Код ГРНТИ34.03.23


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Современные методы высокопроизводительных исследований генерируют огромный массив информации по ключевым факторам регуляции транскрипции, в частности: - сайты связывания транскрипционных факторов (ССТФ) - основные экспериментальные методы: ChIP-seq, ChIP-exo, ChIP-nexus; - доступность хроматина - DNase-seq, ATAC-seq, FAIRE-seq; - гистоновые модификации - ChIP-seq; - сайты метилирования - WGBS, RRBS, methyl array; - сайты инициации транскрипции - CAGE; - уровень экспрессии соответствующих генов - CAGE, RNA-seq; - данные по влиянию SNV на экспрессию генов - eQTL, GWAS. Все эти типы данных будут использованы в предлагаемом проекте. Перечисленные выше типы данных были получены как большими международными консорциумами: - ENCODE (https://www.encodeproject.org/) - создана энциклопедия регуляторных ДНК элементов; - FANTOM 5 (http://fantom.gsc.riken.jp/5/) - создана функциональная аннотация и охарактеризованы уровни экспрессии функциональных участков ДНК; - Roadmap Epigenomics Project (http://www.roadmapepigenomics.org/) - собраны данные по эпигеномике и метилированию ДНК, - GTEx - Genotype-Tissue Expression – создана коллекция вариаций генной экспрессии среди индивидуумов и в 44 различных тканях тела человека, а также паттернов тканеспецифичности для выявления генетических основ болезней человека; так и отдельными лабораториями. Исходные данные таких экспериментов представлены в специализированных хранилищах данных, основными из которых являются Sequence Read Archive (SRA; https://www.ncbi.nlm.nih.gov/sra) и Gene Expression Omnibus (GEO; https://www.ncbi.nlm.nih.gov/geo/). Однако все вышеупомянутые данные недостаточно интегрированы друг с другом, что существенно затрудняет их совместное использование как для понимания механизмов регуляции транскрипции, так и для решения практических задач - например, для предсказания возможных эффектов одиночных нуклеотидных замен (SNV) в регуляторных районах генов. Хотя регуляция транскрипции осуществляется на разных уровнях при помощи разных механизмов, транскрипционные факторы (ТФ) и их сайты связывания (ССТФ) являются основными компонентами регуляции транскрипции. Поэтому поиск функциональных ССТФ и выявление их вклада в регуляцию транскрипции соответствующих генов остается “горячей” точкой современной биологии. Несмотря на большие объемы накопленных экспериментальных данных и достаточно большой набор методов компьютерного анализа, мы можем выделить как минимум четыре проблемы, связанные с этой задачей, не решенные до сих пор: 1) идентификация ССТФ - и экспериментальные методы, и компьютерные методы до сих пор имеют ряд нерешенных проблем. В частности, для экспериментальных методов проблема возникает по нескольким причинам: - большое количество повторов в геноме, которые создают "черные дыры" для методов секвенирования (Next-Generation Sequencing; NGS); - несовершенство методов поиска ССТФ по данным ChIP-seq и DNase-seq, - неспособность отличить связывание через посредников от прямого связывания. В случае компьютерных методов проблема возникает при распознавании ССТФ со слабо выраженным или отсутствующим мотивом. 2) клеточная специфичность ССТФ - набор ССТФ для одного и того же ТФ может существенно отличаться в зависимости от типа клетки (клеточной линии) и условий, в которых она находится. Однако, провести ChIP-seq эксперименты для всех типов клеток (клеточных линий) и условий невозможно. 3) функциональные ССТФ - различные исследования (например, Toropainen et al., 2016; Cusanovich et.al., 2014) показывают, что только малая часть ССТФ (3-10%) непосредственно влияют на уровень транскрипции. Проблема выделения функциональных ССТФ среди всего множества -ССТФ остается открытой. 4) интерпретация SNP и SNV в контексте регуляции транскрипции - большая часть SNP и SNV находится в регуляторных районах генов. Данный проект направлен на существенное продвижение в решении этих проблем. В его основе лежат четыре основные идеи: 1) единообразная аннотация, контроль качества и обработка большого объема экспериментальных NGS данных по регуляции транскрипции (более 80% от имеющихся в открытом доступе экспериментальных данных перечисленных выше типов для человека и мыши); 2) одновременное использование нескольких методов анализа NGS данных и последующий мета-анализ с целью наиболее достоверного выявления регуляторных элементов. Например, для выявления ССТФ по данным ChIP-seq экспериментов будут использоваться методы MACS, GEM, SISSRs, PICS и последующий мета-анализ полученных ими результатов. Для поиска участков открытого хроматина будут применены: Hotspot2, MACS2 и F-Seq. В последующем предсказании ССТФ по данным DNAse-seq экспериментов будут использоваться методы: Wellington и HINT. Также будет проведен мета-анализ полученных результатов. 3) интеграция результатов из различных типов NGS экспериментов в контексте заданного клеточного типа и условий. В рамках проекта это будет использоваться для 3 целей: а) Уточнение результатов за счет совместного (мета-анализа) данных. б) Создание метода для предсказания ССТФ для заданного клеточного типа и условий в случае отсутствия соответствующих ChIP-seq экспериментов (в этих клеточных типах и условиях). Метод будет основываться на других типах экспериментов (доступность хроматина, гистоновые модификации и др.) проведенных в этих условиях и будет использовать методы машинного обучения. в) как входные данные для машинного обучения для предсказания эффекта SNV на регуляцию транскрипции. 4) Автоматический анализ интегрированных NGS данных по регуляции транскрипции, вышеописанными методами, и сохранение результатов в базе данных GTRD. Данный подход повторяет идеологию проекта ENSEMBL, которая объединяет как экспериментальные данные по аннотации генома, так и компьютерные предсказания. Таким образом, GTRD должна стать аналогом EnsEMBL, но в плане регуляции транскрипции. Предсказание влияния SNV на транскрипцию может быть как качественным так и количественным. В первом случае оценивается значимость (вероятность) влияния SNV на экспрессию соответствующего гена. Во втором - как изменится уровень транскрипции соответствующего гена. В этом случае необходимо построение модели регуляции на основе методов машинного обучения. Предсказание экспрессии - как метод валидации насколько мы понимаем механизмы регуляции транскрипции. Участники проекта уже имеют существенный задел. Ими разработана и поддерживается база данных GTRD - Gene Transcription Regulation Database (http://gtrd.biouml.org/) - крупнейшая в мире база данных ССТФ, построенная на основе унифицированно обработанных данных ChIP-seq экспериментов. Для построения сценариев анализа данных используется платформа BioUML (http://www.biouml.org/), которая разработана и развивается авторами данного проекта с 2001 года для поддержки научных исследований в области системной биологии и биоинформатики.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


 

Публикации

1. Федор Колпаков, Илья Акбердин, Тимур Кашапов, Илья Киселев, Семен Колмыков, Юрий Кондрахин, Елена Кутумова, Никита Мандрик, Сергей Пинтус, Анна Рябова, Руслан Шарипов, Иван Евшин, Александр Кель BioUML: An Integrated Environment for Systems Biology and Collaborative Analysis of Biomedical Data Nucleic Acids Research, Vol.47. - Iss. W1. - P.W225-W233 (год публикации - 2019)
10.1093/nar/gkz440

2. Колмыков С.К., Кондрахин Ю.В., Евшин И.С., Шарипов Р.Н., Рябова А.С., Колпаков Ф.А. Population size estimation for quality control of ChIP-Seq datasets PLOS ONE, 14(8): e0221760 (год публикации - 2019)
10.1371/journal.pone.0221760

3. Семен Колмыков, Юрий Кондрахин, Иван Евшин, Руслан Шарипов, Михаил Куляшов, Федор Колпаков Human cistrome - genome-wide map of human transcription factor binding sites derived from GTRD database. 9th Moscow Conference on Computational Molecular Biology МССМВ'19, Moscow, 27-30 July 2019. (год публикации - 2019)

4. Юрий Кондрахин, Семён Колмыков, Иван Евшин, Руслан Шарипов, Анна Рябова, Михаил Куляшов, Федор Колпаков Combining GTRD ChIP-Seq datasets with FANTOM5’s transcription start sites for prediction of gene expression levels 9th Moscow Conference on Computational Molecular Biology МССМВ'19, Moscow, 27-30 July 2019. (год публикации - 2019)

5. Колмыков С.К., Евшин И.С., Колпаков Ф.А. Анализ NGS данных по регуляции транскрипции. Сборник тезисов XVII Российской конференции «Распределенные информационно-вычислительные ресурсы», DICR-2019 (3-6 декабря 2019 г., Новосибирск), (год публикации - 2019)

6. Куляшов М.А., Колмыков С.К., Евшин И.С.,Колпаков Ф.А. ОПИСАНИЕ, ХАРАКТЕРИСТИКА И АЛГОРИТМ СОЗДАНИЯ СЛОВАРЯ КЛЕТОЧНЫХ ТИПОВ И ТКАНЕЙ В БАЗЕ ДАННЫХ GTRD Сборник тезисов XVII Российской конференции «Распределенные информационно-вычислительные ресурсы», DICR-2019 (3-6 декабря 2019 г., Новосибирск) (год публикации - 2019)

7. Колмыков С., Евшин И., Куляшов М., Шарипов Р., Кондрахин И., Макеев В.Ю., Кулаковский И.В., Кель А., Колпаков Ф. GTRD: an integrated view of transcription regulation. Nucleic Acids Research, gkaa1057 (год публикации - 2021)
10.1093/nar/gkaa1057

8. Колмыков С.К., Кондрахин Ю.В., Шарипов Р.Н., Евшин И.С., Рябова А.С., Колпаков Ф.А. Meta-analysis of ChIP-seq Datasets Through the Rank Aggregation Approach Proceedings - 2020 Cognitive Sciences, Genomics and Bioinformatics, CSGB 2020 (Institute of Electrical and Electronics Engineers Inc.), Proceedings - 2020 Cognitive Sciences, Genomics and Bioinformatics, CSGB 2020, 9214614, pp. 180-184 (год публикации - 2020)
10.1109/CSGB51356.2020.9214614

9. Куляшов М.А., Колмыков С.К., Евшин И.С., Колпаков Ф.А. Advanced data curation in GTRD database: hierarchical dictionaries of cell types and experimental factors. Proceedings - 2020 Cognitive Sciences, Genomics and Bioinformatics, CSGB 2020 (Institute of Electrical and Electronics Engineers Inc.), Proceedings - 2020 Cognitive Sciences, Genomics and Bioinformatics, CSGB 2020, 9214681, pp. 23-27 (год публикации - 2020)
10.1109/CSGB51356.2020.9214681

10. Колмыков С.К., Евшин И.С., Колпаков Ф.А. Analysis of NGS Data on the Transcriptional Regulation CEUR Workshop Proceedings, CEUR Workshop Proceedings. – 2020. – Т. 2569. – P. 19–22 (год публикации - 2020)

11. Колпаков Ф.А., Евшин И.С., Колмыков С.К., Кондрахин Ю.В., Куляшов М.А., Шарипов Р.Н. GTRD - an integrated view on transcription regulation BGRS/SB-2020: 12th International Multiconference “Bioinformatics of Genome Regulation and Structure/Systems Biology”, BGRS/SB-2020: 12th International Multiconference “Bioinformatics of Genome Regulation and Structure/Systems Biology” (Novosibirsk, Russia, 06-10 July 2020). – 2020. – P. 45-46 (год публикации - 2020)
10.18699/BGRS/SB-2020-025

12. Куляшов М.А., Колмыков С.К., Колпаков Ф.А., Евшин И.С. Advanced data curation in GTRD database: hierarchical dictionaries of cell types and experimental factors BGRS/SB-2020: 12th International Multiconference “Bioinformatics of Genome Regulation and Structure/Systems Biology”, BGRS/SB-2020: 12th International Multiconference “Bioinformatics of Genome Regulation and Structure/Systems Biology” (Novosibirsk, Russia, 06-10 July 2020). – 2020. – P. 52-53. (год публикации - 2020)
10.18699/BGRS/SB-2020-029

13. Куляшов М.А., Колмыков С.К., Евшин И.С., Колпаков Ф.А. Description, characteristic and algorithm for creation of a dictionary of cell types and tissues in the GTRD database CEUR Workshop Proceedings, CEUR Workshop Proceedings. – 2020. – Т. 2569. – P. 13-18. (год публикации - 2020)

14. Шарипов Р.Н., Кондрахин Ю.В., Рябова А.С., Евшин И.С., Колпаков Ф.А. Assessment of transcriptional importance of cell line-specific features based on GTRD and FANTOM5 data PLOS ONE (год публикации - 2020)

15. Шарипов Р.Н., Евшин И.С., Кондрахин Ю.В., Рябова А.С., Колмыков С.К., Колпаков Ф.А. Peak caller comparison through quality control of ChIP-Seq datasets BGRS/SB-2020: 12th International Multiconference “Bioinformatics of Genome Regulation and Structure/Systems Biology”, BGRS/SB-2020: 12th International Multiconference “Bioinformatics of Genome Regulation and Structure/Systems Biology” (Novosibirsk, Russia, 06-10 July 2020). – 2020. – P. 105-106. (год публикации - 2020)
10.18699/BGRS/SB-2020-065

16. Абрамов С., Бойцов А., Быкова Д., Пензар Д.Д., Евшин И.С., Колмыков С.К., Фридман М.В., Фаворов А.В., Воронцов И.Е., Баулин Е., Колпаков Ф.А., Макеев В.Ю., Кулаковский И.В. Landscape of allele-specific transcription factor binding in the human genome Nature Communications, Т. 12, Вып. 1, номер статьи 2751 (год публикации - 2021)
10.1038/s41467-021-23007-0

17. Пинтус С.С, Акбердин И.Р., Евшин И.С., Махновский П., Тяпкина О., Нигметзянов И., Нуруллин Л., Девятьяров Р., Шагимарданова Е., Попов Д., Колпаков Ф.А., Гусев О., Газизова Г.Р. Genome-wide atlas of promoter expression reveals contribution of transcribed regulatory elements to genetic control of disuse-mediated atrophy of skeletal muscle Biology (Basel), V. 10(6), 557 (год публикации - 2021)
10.3390/biology10060557


 

Публикации

1. Федор Колпаков, Илья Акбердин, Тимур Кашапов, Илья Киселев, Семен Колмыков, Юрий Кондрахин, Елена Кутумова, Никита Мандрик, Сергей Пинтус, Анна Рябова, Руслан Шарипов, Иван Евшин, Александр Кель BioUML: An Integrated Environment for Systems Biology and Collaborative Analysis of Biomedical Data Nucleic Acids Research, Vol.47. - Iss. W1. - P.W225-W233 (год публикации - 2019)
10.1093/nar/gkz440

2. Колмыков С.К., Кондрахин Ю.В., Евшин И.С., Шарипов Р.Н., Рябова А.С., Колпаков Ф.А. Population size estimation for quality control of ChIP-Seq datasets PLOS ONE, 14(8): e0221760 (год публикации - 2019)
10.1371/journal.pone.0221760

3. Семен Колмыков, Юрий Кондрахин, Иван Евшин, Руслан Шарипов, Михаил Куляшов, Федор Колпаков Human cistrome - genome-wide map of human transcription factor binding sites derived from GTRD database. 9th Moscow Conference on Computational Molecular Biology МССМВ'19, Moscow, 27-30 July 2019. (год публикации - 2019)

4. Юрий Кондрахин, Семён Колмыков, Иван Евшин, Руслан Шарипов, Анна Рябова, Михаил Куляшов, Федор Колпаков Combining GTRD ChIP-Seq datasets with FANTOM5’s transcription start sites for prediction of gene expression levels 9th Moscow Conference on Computational Molecular Biology МССМВ'19, Moscow, 27-30 July 2019. (год публикации - 2019)

5. Колмыков С.К., Евшин И.С., Колпаков Ф.А. Анализ NGS данных по регуляции транскрипции. Сборник тезисов XVII Российской конференции «Распределенные информационно-вычислительные ресурсы», DICR-2019 (3-6 декабря 2019 г., Новосибирск), (год публикации - 2019)

6. Куляшов М.А., Колмыков С.К., Евшин И.С.,Колпаков Ф.А. ОПИСАНИЕ, ХАРАКТЕРИСТИКА И АЛГОРИТМ СОЗДАНИЯ СЛОВАРЯ КЛЕТОЧНЫХ ТИПОВ И ТКАНЕЙ В БАЗЕ ДАННЫХ GTRD Сборник тезисов XVII Российской конференции «Распределенные информационно-вычислительные ресурсы», DICR-2019 (3-6 декабря 2019 г., Новосибирск) (год публикации - 2019)

7. Колмыков С., Евшин И., Куляшов М., Шарипов Р., Кондрахин И., Макеев В.Ю., Кулаковский И.В., Кель А., Колпаков Ф. GTRD: an integrated view of transcription regulation. Nucleic Acids Research, gkaa1057 (год публикации - 2021)
10.1093/nar/gkaa1057

8. Колмыков С.К., Кондрахин Ю.В., Шарипов Р.Н., Евшин И.С., Рябова А.С., Колпаков Ф.А. Meta-analysis of ChIP-seq Datasets Through the Rank Aggregation Approach Proceedings - 2020 Cognitive Sciences, Genomics and Bioinformatics, CSGB 2020 (Institute of Electrical and Electronics Engineers Inc.), Proceedings - 2020 Cognitive Sciences, Genomics and Bioinformatics, CSGB 2020, 9214614, pp. 180-184 (год публикации - 2020)
10.1109/CSGB51356.2020.9214614

9. Куляшов М.А., Колмыков С.К., Евшин И.С., Колпаков Ф.А. Advanced data curation in GTRD database: hierarchical dictionaries of cell types and experimental factors. Proceedings - 2020 Cognitive Sciences, Genomics and Bioinformatics, CSGB 2020 (Institute of Electrical and Electronics Engineers Inc.), Proceedings - 2020 Cognitive Sciences, Genomics and Bioinformatics, CSGB 2020, 9214681, pp. 23-27 (год публикации - 2020)
10.1109/CSGB51356.2020.9214681

10. Колмыков С.К., Евшин И.С., Колпаков Ф.А. Analysis of NGS Data on the Transcriptional Regulation CEUR Workshop Proceedings, CEUR Workshop Proceedings. – 2020. – Т. 2569. – P. 19–22 (год публикации - 2020)

11. Колпаков Ф.А., Евшин И.С., Колмыков С.К., Кондрахин Ю.В., Куляшов М.А., Шарипов Р.Н. GTRD - an integrated view on transcription regulation BGRS/SB-2020: 12th International Multiconference “Bioinformatics of Genome Regulation and Structure/Systems Biology”, BGRS/SB-2020: 12th International Multiconference “Bioinformatics of Genome Regulation and Structure/Systems Biology” (Novosibirsk, Russia, 06-10 July 2020). – 2020. – P. 45-46 (год публикации - 2020)
10.18699/BGRS/SB-2020-025

12. Куляшов М.А., Колмыков С.К., Колпаков Ф.А., Евшин И.С. Advanced data curation in GTRD database: hierarchical dictionaries of cell types and experimental factors BGRS/SB-2020: 12th International Multiconference “Bioinformatics of Genome Regulation and Structure/Systems Biology”, BGRS/SB-2020: 12th International Multiconference “Bioinformatics of Genome Regulation and Structure/Systems Biology” (Novosibirsk, Russia, 06-10 July 2020). – 2020. – P. 52-53. (год публикации - 2020)
10.18699/BGRS/SB-2020-029

13. Куляшов М.А., Колмыков С.К., Евшин И.С., Колпаков Ф.А. Description, characteristic and algorithm for creation of a dictionary of cell types and tissues in the GTRD database CEUR Workshop Proceedings, CEUR Workshop Proceedings. – 2020. – Т. 2569. – P. 13-18. (год публикации - 2020)

14. Шарипов Р.Н., Кондрахин Ю.В., Рябова А.С., Евшин И.С., Колпаков Ф.А. Assessment of transcriptional importance of cell line-specific features based on GTRD and FANTOM5 data PLOS ONE (год публикации - 2020)

15. Шарипов Р.Н., Евшин И.С., Кондрахин Ю.В., Рябова А.С., Колмыков С.К., Колпаков Ф.А. Peak caller comparison through quality control of ChIP-Seq datasets BGRS/SB-2020: 12th International Multiconference “Bioinformatics of Genome Regulation and Structure/Systems Biology”, BGRS/SB-2020: 12th International Multiconference “Bioinformatics of Genome Regulation and Structure/Systems Biology” (Novosibirsk, Russia, 06-10 July 2020). – 2020. – P. 105-106. (год публикации - 2020)
10.18699/BGRS/SB-2020-065

16. Абрамов С., Бойцов А., Быкова Д., Пензар Д.Д., Евшин И.С., Колмыков С.К., Фридман М.В., Фаворов А.В., Воронцов И.Е., Баулин Е., Колпаков Ф.А., Макеев В.Ю., Кулаковский И.В. Landscape of allele-specific transcription factor binding in the human genome Nature Communications, Т. 12, Вып. 1, номер статьи 2751 (год публикации - 2021)
10.1038/s41467-021-23007-0

17. Пинтус С.С, Акбердин И.Р., Евшин И.С., Махновский П., Тяпкина О., Нигметзянов И., Нуруллин Л., Девятьяров Р., Шагимарданова Е., Попов Д., Колпаков Ф.А., Гусев О., Газизова Г.Р. Genome-wide atlas of promoter expression reveals contribution of transcribed regulatory elements to genetic control of disuse-mediated atrophy of skeletal muscle Biology (Basel), V. 10(6), 557 (год публикации - 2021)
10.3390/biology10060557


 

Публикации

1. Федор Колпаков, Илья Акбердин, Тимур Кашапов, Илья Киселев, Семен Колмыков, Юрий Кондрахин, Елена Кутумова, Никита Мандрик, Сергей Пинтус, Анна Рябова, Руслан Шарипов, Иван Евшин, Александр Кель BioUML: An Integrated Environment for Systems Biology and Collaborative Analysis of Biomedical Data Nucleic Acids Research, Vol.47. - Iss. W1. - P.W225-W233 (год публикации - 2019)
10.1093/nar/gkz440

2. Колмыков С.К., Кондрахин Ю.В., Евшин И.С., Шарипов Р.Н., Рябова А.С., Колпаков Ф.А. Population size estimation for quality control of ChIP-Seq datasets PLOS ONE, 14(8): e0221760 (год публикации - 2019)
10.1371/journal.pone.0221760

3. Семен Колмыков, Юрий Кондрахин, Иван Евшин, Руслан Шарипов, Михаил Куляшов, Федор Колпаков Human cistrome - genome-wide map of human transcription factor binding sites derived from GTRD database. 9th Moscow Conference on Computational Molecular Biology МССМВ'19, Moscow, 27-30 July 2019. (год публикации - 2019)

4. Юрий Кондрахин, Семён Колмыков, Иван Евшин, Руслан Шарипов, Анна Рябова, Михаил Куляшов, Федор Колпаков Combining GTRD ChIP-Seq datasets with FANTOM5’s transcription start sites for prediction of gene expression levels 9th Moscow Conference on Computational Molecular Biology МССМВ'19, Moscow, 27-30 July 2019. (год публикации - 2019)

5. Колмыков С.К., Евшин И.С., Колпаков Ф.А. Анализ NGS данных по регуляции транскрипции. Сборник тезисов XVII Российской конференции «Распределенные информационно-вычислительные ресурсы», DICR-2019 (3-6 декабря 2019 г., Новосибирск), (год публикации - 2019)

6. Куляшов М.А., Колмыков С.К., Евшин И.С.,Колпаков Ф.А. ОПИСАНИЕ, ХАРАКТЕРИСТИКА И АЛГОРИТМ СОЗДАНИЯ СЛОВАРЯ КЛЕТОЧНЫХ ТИПОВ И ТКАНЕЙ В БАЗЕ ДАННЫХ GTRD Сборник тезисов XVII Российской конференции «Распределенные информационно-вычислительные ресурсы», DICR-2019 (3-6 декабря 2019 г., Новосибирск) (год публикации - 2019)

7. Колмыков С., Евшин И., Куляшов М., Шарипов Р., Кондрахин И., Макеев В.Ю., Кулаковский И.В., Кель А., Колпаков Ф. GTRD: an integrated view of transcription regulation. Nucleic Acids Research, gkaa1057 (год публикации - 2021)
10.1093/nar/gkaa1057

8. Колмыков С.К., Кондрахин Ю.В., Шарипов Р.Н., Евшин И.С., Рябова А.С., Колпаков Ф.А. Meta-analysis of ChIP-seq Datasets Through the Rank Aggregation Approach Proceedings - 2020 Cognitive Sciences, Genomics and Bioinformatics, CSGB 2020 (Institute of Electrical and Electronics Engineers Inc.), Proceedings - 2020 Cognitive Sciences, Genomics and Bioinformatics, CSGB 2020, 9214614, pp. 180-184 (год публикации - 2020)
10.1109/CSGB51356.2020.9214614

9. Куляшов М.А., Колмыков С.К., Евшин И.С., Колпаков Ф.А. Advanced data curation in GTRD database: hierarchical dictionaries of cell types and experimental factors. Proceedings - 2020 Cognitive Sciences, Genomics and Bioinformatics, CSGB 2020 (Institute of Electrical and Electronics Engineers Inc.), Proceedings - 2020 Cognitive Sciences, Genomics and Bioinformatics, CSGB 2020, 9214681, pp. 23-27 (год публикации - 2020)
10.1109/CSGB51356.2020.9214681

10. Колмыков С.К., Евшин И.С., Колпаков Ф.А. Analysis of NGS Data on the Transcriptional Regulation CEUR Workshop Proceedings, CEUR Workshop Proceedings. – 2020. – Т. 2569. – P. 19–22 (год публикации - 2020)

11. Колпаков Ф.А., Евшин И.С., Колмыков С.К., Кондрахин Ю.В., Куляшов М.А., Шарипов Р.Н. GTRD - an integrated view on transcription regulation BGRS/SB-2020: 12th International Multiconference “Bioinformatics of Genome Regulation and Structure/Systems Biology”, BGRS/SB-2020: 12th International Multiconference “Bioinformatics of Genome Regulation and Structure/Systems Biology” (Novosibirsk, Russia, 06-10 July 2020). – 2020. – P. 45-46 (год публикации - 2020)
10.18699/BGRS/SB-2020-025

12. Куляшов М.А., Колмыков С.К., Колпаков Ф.А., Евшин И.С. Advanced data curation in GTRD database: hierarchical dictionaries of cell types and experimental factors BGRS/SB-2020: 12th International Multiconference “Bioinformatics of Genome Regulation and Structure/Systems Biology”, BGRS/SB-2020: 12th International Multiconference “Bioinformatics of Genome Regulation and Structure/Systems Biology” (Novosibirsk, Russia, 06-10 July 2020). – 2020. – P. 52-53. (год публикации - 2020)
10.18699/BGRS/SB-2020-029

13. Куляшов М.А., Колмыков С.К., Евшин И.С., Колпаков Ф.А. Description, characteristic and algorithm for creation of a dictionary of cell types and tissues in the GTRD database CEUR Workshop Proceedings, CEUR Workshop Proceedings. – 2020. – Т. 2569. – P. 13-18. (год публикации - 2020)

14. Шарипов Р.Н., Кондрахин Ю.В., Рябова А.С., Евшин И.С., Колпаков Ф.А. Assessment of transcriptional importance of cell line-specific features based on GTRD and FANTOM5 data PLOS ONE (год публикации - 2020)

15. Шарипов Р.Н., Евшин И.С., Кондрахин Ю.В., Рябова А.С., Колмыков С.К., Колпаков Ф.А. Peak caller comparison through quality control of ChIP-Seq datasets BGRS/SB-2020: 12th International Multiconference “Bioinformatics of Genome Regulation and Structure/Systems Biology”, BGRS/SB-2020: 12th International Multiconference “Bioinformatics of Genome Regulation and Structure/Systems Biology” (Novosibirsk, Russia, 06-10 July 2020). – 2020. – P. 105-106. (год публикации - 2020)
10.18699/BGRS/SB-2020-065

16. Абрамов С., Бойцов А., Быкова Д., Пензар Д.Д., Евшин И.С., Колмыков С.К., Фридман М.В., Фаворов А.В., Воронцов И.Е., Баулин Е., Колпаков Ф.А., Макеев В.Ю., Кулаковский И.В. Landscape of allele-specific transcription factor binding in the human genome Nature Communications, Т. 12, Вып. 1, номер статьи 2751 (год публикации - 2021)
10.1038/s41467-021-23007-0

17. Пинтус С.С, Акбердин И.Р., Евшин И.С., Махновский П., Тяпкина О., Нигметзянов И., Нуруллин Л., Девятьяров Р., Шагимарданова Е., Попов Д., Колпаков Ф.А., Гусев О., Газизова Г.Р. Genome-wide atlas of promoter expression reveals contribution of transcribed regulatory elements to genetic control of disuse-mediated atrophy of skeletal muscle Biology (Basel), V. 10(6), 557 (год публикации - 2021)
10.3390/biology10060557