КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ
Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.
ОБЩИЕ СВЕДЕНИЯ
Номер проекта 22-74-10031
НазваниеИспользование данных протеомики и фосфопротеомики для создания алгоритмов точной оценки активации молекулярных путей
Руководитель Захарова Галина Сергеевна, Кандидат химических наук
Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования Первый Московский государственный медицинский университет имени И.М. Сеченова Министерства здравоохранения Российской Федерации (Сеченовский Университет) , г Москва
Конкурс №71 - Конкурс 2022 года «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными
Область знания, основной код классификатора 04 - Биология и науки о жизни; 04-207 - Системная биология; биоинформатика
Ключевые слова Биоинформатика, молекулярные пути, онкология, секвенирование нового поколения, протеомика, фосфопротеомика, транскриптомика, генная экспрессия
Код ГРНТИ34.03.23
ИНФОРМАЦИЯ ИЗ ЗАЯВКИ
Аннотация
Профилирование генной экспрессии широко используется в фундаментальной и прикладной биомедицине. Анализ генной экспрессии можно осуществлять как на уровне РНК (транскриптомном), так и белка (протеомном). При этом транскриптомный анализ на нынешнем уровне технологического развития обладает более высокой разрешающей способностью, точностью, воспроизводимостью и ценовой доступностью. В то же время протеомный анализ существенно ближе к молекулярному фенотипу, поскольку большинство функций в живой клетке исполняется именно белками. При этом выполнением функций заняты не единичные белки, а их функциональные ансамбли, образующие молекулярные пути. К их основным типам можно отнести сигнальные, метаболические, ДНК-репарационные и цитоскелетные пути. Недавно был предложен ряд алгоритмов для оценки активности молекулярных путей в биообразцах исходя из широкомасштабных данных генной экспрессии. В принципе таковыми могут являться как транскриптомные, так и протеомные данные, но на практике для вычисления активности молекулярных путей пока широко использовались только транскриптомные данные в силу их относительной простоты накопления и стандартизации.
Важнейшим приложением анализа активности молекулярных путей стало его использование для персонализированного предсказания эффективности терапии у онкобольных. При этом препараты, блокирующие патологически усиленные в опухоли пути, получают более высокий рейтинг, чем те, которые блокируют пути, интактные или ослабленные в опухоли. Данный подход оказался эффективен как для ряда индивидуальных случаев, когда было невозможно подобрать лечение исходя из имеющихся стандартов терапии, так и в ходе масштабного клинического испытания для рецидивирующих метастатических опухолей.
Вместе с тем предсказательная точность этого подхода могла бы быть существенно повышена. Так, в настоящее время при расчете активации молекулярного пути используются концентрации мРНК его участников, нормализованные на контрольные образцы. При этом участникам пути присваиваются коэффициенты в зависимости от их функции для активации пути: положительные для активаторов и отрицательные для блокаторов. Но никак не учитывается то, насколько хорошо уровень мРНК гена индивидуального участника пути коррелирует с его уровнем белка. При этом из литературы известно, что для разных генных продуктов корреляция между соответствующими мРНК и белком может драматически различаться, от высокой до статистически незначимой.
Первой целью нашего проекта является повышение точности анализа активации молекулярных путей с помощью введения весовых коэффициентов, отражающих значимость корреляции между уровнями мРНК и белка для каждого генного продукта – участника молекулярного пути.
Второй важнейшей целью станет определение конкретного вычислительного алгоритма, наиболее точно отражающего объективные показатели активации молекулярного пути, такие, как концентрация активированных (фосфорилированных) форм терминальных эффекторов молекулярного пути. Например, для сигнального пути EGFR такими эффекторами можно считать белки группы RAF, ERK и ELK. Сравнив для разных алгоритмов расчетную и экспериментально показанную активацию молекулярного пути, можно будет отобрать наиболее точный способ расчета как по уровню белка, так и по мРНК. Решение этой задачи также впервые создаст удобную тест-систему для проверки будущих алгоритмов расчета активации молекулярных путей.
Для решения двух вышеуказанных целей мы предлагаем следующие экспериментальные и вычислительные подходы.
1) Цель нахождения весовых коэффициентов, отражающих значимость корреляции между уровнями мРНК и белка для генных продуктов – участников молекулярных путей.
Для этого мы планируем на материале раковых опухолей толстой кишки, легкого, почки и тройного негативного рака молочной железы провести протеомное и транскриптомное профилирование для одних и тех же образцов, в общей сложности – для не менее 48 образцов.
Для максимально возможного числа генов-участников основных молекулярных путей, связанных с онкогенезом, будут разрешены полуколичественные протеомные и транскриптомные профили для всех образцов. Образцы будут представлять парафинизированные блоки опухолевой ткани, а способ создания библиотек для РНК-секвенирования будет аналогичен таковому, используемому на практике для задач молекулярной диагностики и предсказания успешности терапии. Для каждого гена будет вычислена корреляция между транскриптомным и протеомным профилем, на основании значимости которой будут вводиться весовые коэффициенты. Высокой значимости будут соответствовать высокие весовые коэффициенты, и наоборот.
2) Цель определения наиболее точных вычислительных алгоритмов активации молекулярных путей.
Для этого на модели раковых клеточных линий будут определены транскриптомные, протеомные и фосфопротеомные профили, всего для не менее 10 линий. При анализе фосфопротеомных профилей акцент будет сделан на активированных фосфорилированных формах терминальных эффекторов молекулярных путей. Таким образом мы планируем экспериментально найти уровни активации не менее восьми ключевых путей, связанных с канцерогенезом и содержащих мишени, таргетируемые противоопухолевыми препаратами. Мы предполагаем включить в этот список молекулярные пути EGFR, регуляторную ось AKT-MTOR-PI3K, путь TGF-бета, путь сигнализации WNT, путь сигнализации NOTCH, путь эндотелиального фактора роста, путь активации протеасомы, путь сигнализации Hedgehog. Путем сравнения результатов вычисления с помощью различных конкурирующих алгоритмов с результатами экспериментально определенной активации соответствующих молекулярных путей, мы намерены определить наилучшие вычислительные алгоритмы. Они будут определены как с использованием протеомных, так и транскриптомных данных. При этом для транскриптомных данных будут опробованы различные системы весовых коэффициентов, разработанные в ходе выполнения предыдущей задачи.
Достижение обеих заявленных целей станет результатом мирового уровня и будет иметь значение как для фундаментальных, так и для прикладных исследований. Для фундаментальных исследований будут отобраны и валидированы наиболее точные алгоритмы расчета активации молекулярных путей, которые можно будет применить на любом типе экспрессионных данных для любого объекта. Для прикладных задач будут определены оптимальные алгоритмы и весовые коэффициенты, позволяющие наиболее эффективно предсказывать успешность противоопухолевой терапии. Кроме того, будет создан задел на будущее в виде готовой тест-системы скрининга новых вычислительных алгоритмов активации молекулярных путей.
ОТЧЁТНЫЕ МАТЕРИАЛЫ
Аннотация результатов, полученных в 2025 году
В рамках третьего этапа проекта были получены и проанализированы экспериментальные данные по 10 опухолевым клеточным линиям человека, представляющим различные типы опухолей. Образцы использовались для транскриптомного, протеомного и фосфопротеомного анализа. Для РНК-секвенирования получено ~32 млн прочтений на образец, доля уникально картированных прочтений составила 62–74%, определена экспрессия 36,5 тыс. генов. Протеомный и фосфопротеомный анализ позволил идентифицировать около 3,3 тыс. белков (по 2 и более пептидам) и 4,3 тыс. фосфопептидов на образец. Были рассчитаны уровни активации восьми ключевых онкогенных сигнальных путей (ERK, mTOR, Hippo, TGF-beta, STAT3, NGF, HGF/c-Met, HIF1-Alpha), используя функционально аннотированную базу фосфосайтов и методику расчета весов фосфосайтов для эффекторов. Полученные данные использованы в качестве референтных для валидации 18 алгоритмов предсказания активации сигнальных путей по транскриптомным данным (Oncobox, TAPPA, TBScore, SPIA, EASE, Pathway express, Camera, fGSEA, GSEA, GSVA, PADOG, ROAST, CePa, ANUBIX, BinoX, NEAT, netPEA, SAFE). Тестирование включало сравнение по метрикам ROC AUC, F-метрика, полнота и точность. Наилучшие результаты получены для алгоритмов EASE, Oncobox и SAFE с небольшим преимуществом алгоритма Oncobox. Далее для него были протестированы 10 систем назначения весовых коэффициентов для вклада генов в активацию путей. По результатам теста была выбрана система, основанная на уровне связности гена в тотальном интерактоме человека. Разработанные экспериментальные подходы и алгоритмы позволили количественно оценить точность предсказания сигнальных событий по данным РНК-секвенирования и определить условия, при которых транскриптомные данные наиболее информативны для анализа внутриклеточной сигнализации. Полученные результаты формируют основу для создания надёжных биоинформатических моделей предсказания активации сигнальных путей в опухолевых клетках.
Публикации
1.
Буздин А.А., Золотовская М.А., Румянцев С.А. и др.
EndoGene database: reported genetic variants for 5,926 Russian patients diagnosed with endocrine disorders
Frontiers in Endocrinology, 16:1472754 (год публикации - 2025)
10.3389/fendo.2025.1472754
2.
Сорокин М.И., Лядов В., Сунцова М.В., Гарипов М., Семенова А., Попова Н., Гугучкин Е., Гейдаров Р., Золотовская М.А.
Detection of fusion events by RNA sequencing in FFPE versus freshly frozen colorectal cancer tissue samples
Frontiers in molecular biosciences, 11:1448792 (год публикации - 2025)
10.3389/fmolb.2024.1448792
3. Луппов Д.В., Сорокин М.И., Буздин А.А., Захарова Г.С. Активация контрольной точки веретена деления влияет на ответ на терапию таксанами при раке молочной железы Материалы Всероссийской конференции с международным участием "Биохимия человека" 17-19 октября 2024 года, с.252 (год публикации - 2024)