КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер проекта 22-74-00023

НазваниеКоличественное исследование качества молекулярных подписей на основе ранговых статистик

Руководитель Ступников Алексей Ильич, кандидат наук (признаваемый в РФ PhD)

Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Московский физико-технический институт (национальный исследовательский университет)" , г Москва

Конкурс №70 - Конкурс 2022 года «Проведение инициативных исследований молодыми учеными» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными

Область знания, основной код классификатора 04 - Биология и науки о жизни; 04-207 - Системная биология; биоинформатика

Ключевые слова транскриптомика, метилирование, молекулярные подписи, биомаркеры, ранговые статистика, качество классификации

Код ГРНТИ34.03.23


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Молекулярная подпись, или биомаркер - одна из основных концепций биоинформатики и генетической медицины. Обычно их получают при решении дифференциальной задачи: противопоставления с помощью вычислительных моделей двух или более групп образцов, отличающихся фенотипически. Таким образом, подпись - это набор молекулярных признаков, включающих в себя большую часть информации о различиях между сравниваемыми группами. Характер подписи может меняться в зависимости от природы экспериментальных данных, на которых подпись была получена. Большое количество мутационных, экспрессионных и метильных подписей были недавно найдены для различных заболеваний и теперь широко используются в исследовательских работах и медицине. Другим источником происхождения молекулярных подписей является анализ путей (pathway analysis), который предполагает составление набора признаков не на основе формальных статистических процедур и подходов машинного обучения, а с активным привлечением предварительных биологических гипотез и деталей, лежащих в основе молекулярных механизмов. Главной проблемой описанной области является валидация полученного биомаркера. Было показано, что изменение моделей в процессе биоинформатического анализа или параметров при анализе путей приводят к значительным изменениям состава и структуры полученных подписей. Таким образом, вместо одного потенциального биомаркера обычно приходится иметь дело с целым набором подписей-кандидатов. Отсутствие данных “золотого стандарта”, особенно в области транскриптомики, не позволяет адаптировать процедуры биоинформатического анализа и непосредственно измерять качество получаемой подписи. Выбор одной из подписей для дальнейшей работы обычно осуществляется на основании плохо обоснованных критериев. Часто не представлено никаких веских доказательств в пользу какой-либо из рассматриваемых подписей из набора кандидатов. Поэтому сравнение различных биомаркеров, полученных из одного и того же набора данных, остается нерешенной проблемой. Разработанные к настоящему времени методы оценки наборов генов и молекулярных биомаркеров, хотя и помогают получить дополнительную информацию о структуре и биологической интерпретации такого набора или могут помочь с интеграцией мультимодальных данных, тем не менее не дают ответа на ключевой вопрос о качестве подписей в количественном выражении. В нашем проекте мы переформулируем задачу на формальном языке математики и фундаментальных понятий машинного обучения, что ранее не было сделано. Мы предлагаем формально определенную меру, которая может быть вычислена для каждой потенциальной молекулярной подписи в контексте конкретного набора данных. Таким образом, мы можем получить числовое значение, отображающее эффективность данной подписи для стратификации групп по отношению к внутренней структуре и неоднородности набора данных. Кроме того, подход ранговых статистик также позволяет установить статистическую значимость каждой отдельной тестируемой подписи. Таким образом, наш метод дает возможность не только напрямую сравнивать биомаркеры, но и статистически оценивать качество конкретного биомаркера. Наш подход, который мы назвали Hobotnica, будет иметь следующие приложения: Во-первых, он будет применен для сравнения результатов различных биоинформатических моделей. Отсутствие надежно обоснованного способа такого сравнения - давно и хорошо известная проблема, особенно для задачи дифференциальной экспрессии генов. Во-вторых, маркеры дифференциального метилирования могут быть оценены аналогичным образом. Поиск маркеров метилирования - задача, которая играет значительную роль в исследованиях рака. Эта область, в которой до сих пор появляются новые биоинформатические инструменты также выиграет от количественного подхода к стандартизации. В-третьих, может быть исследована внутренняя структура биомаркера. Ранее обсуждалось, какие стратегии фильтрации, ранжирования и определения размера являются оптимальными для создания подписи с лучшими качествами. Введенная нами мера и подход позволяют ответить на эти вопросы.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


 

Публикации

1. Будкина А.Ю., Медведева Ю.А., Ступников А.И. Assessing the Differential Methylation Analysis Quality for Microarray and NGS Platforms International Journal of Molecular Sciences, Т. 24. – №. 10. – С. 8591. (год публикации - 2023)
10.3390/ijms24108591

2. Ступников А.И. Quality assessment of differentially expressed gene signatures “Translational transcriptomics: a handbook of transcriptomics and its applications to research, biotechnology and medicine”, Elsevier, Cambridge (год публикации - 2024)


 

Публикации

1. Будкина А.Ю., Медведева Ю.А., Ступников А.И. Assessing the Differential Methylation Analysis Quality for Microarray and NGS Platforms International Journal of Molecular Sciences, Т. 24. – №. 10. – С. 8591. (год публикации - 2023)
10.3390/ijms24108591

2. Ступников А.И. Quality assessment of differentially expressed gene signatures “Translational transcriptomics: a handbook of transcriptomics and its applications to research, biotechnology and medicine”, Elsevier, Cambridge (год публикации - 2024)