КАРТОЧКА ПРОЕКТА,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 18-74-00144

НазваниеАннотация белков с неизвестными функциями путем анализа интерактомных данных для выявления потенциальных биомаркеров заболеваний

РуководительПоверенная Екатерина Владимировна, Кандидат биологических наук

Организация финансирования, регионФедеральное государственное бюджетное научное учреждение "Научно-исследовательский институт биомедицинской химии имени В.Н. Ореховича", г Москва

Срок выполнения при поддержке РНФ 07.2018 - 06.2020 

КонкурсКонкурс 2018 года по мероприятию «Проведение инициативных исследований молодыми учеными» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными

Область знания, основной код классификатора 04 - Биология и науки о жизни, 04-202 - Протеомика; структура и функции белков

Ключевые словаПротеом человека, протеомика, клеточные процессы, функциональная аннотация, белок с неизвестной функцией, белок-белковые взаимодействия, интерактомика, биоинформатика, мета-анализ, транскриптомика, генная экспрессия, масс-спектрометрия, генное редактирование, биомаркер.

Код ГРНТИ34.03.23, 34.15.00


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Осенью 2017 года на международном конгрессе HUPO (Human Proteome Organization) при обсуждении результатов выполнения проекта «Протеом человека» был поднят вопрос об отсутствии сведений об участии в клеточных процессах значительного ряда белков, которые успешно детектируются протеомными методами (https://hupo.org/HPP-News/5595319). Знания о функции белков и их роли в реализации клеточных процессов необходимы для решения как фундаментальных (выяснение принципов функционирования живых систем), так и практических задач (разработка прогностических, диагностических и терапевтических биомаркеров) (https://www.nature.com/scitable/topicpage/protein-function-14123348). На сегодняшний день 90% белок-кодирующих генов человека были детектированы на протеомном уровне, при этом для 13% из них (2587 белков) отсутствуют данные об их функции и локализации (согласно ресурсам neXtProt и UniProt). Таким образом, получаемые протеомные данные невозможно полностью интерпретировать в биологическом контексте. Данный проект направлен на аннотацию белков с неизвестными функциями, которые были зарегистрированы на протеомном уровне, путем анализа интерактомных данных для выявления потенциальных биомаркеров социально-значимых заболеваний. Объектом исследования являются белки, кодируемые генами хромосомы 18 человека: изучение этой хромосомы закреплено за российскими учеными в рамках реализации международного проекта «Протеом человека» (Archakov et al., 2009). Белок-белковые взаимодействия (ББВ) лежат в основе биологических процессов живых систем (Braun & Gingras, 2012). Интерактомные исследования позволяют не только обогатить данные о функциях белков и определить механизмы биологических процессов, но и имеют большое практическое значение, поиске биомаркеров заболеваний, выявлении потенциальных мишеней для действия лекарств (Ramírez et al., 2007; Rodriguez-Soca et al., 2010; Иванов А.С. и др., 2011) и др. Одним из превалирующих методов получения данных о ББВ является подход аффинной очистки, сопряженной с масс-спектрометрией (англ. affinity purification–mass spectrometry, AP-MS) (Nesvizhskii, 2012). Принцип этого метода заключается в «вылавливании» партнеров, взаимодействующих с исследуемым белком, идентификация которых происходит с помощью масс-спектрометрии. Особенностью интерактомных данных является их зашумленность и противоречивость, обусловленная техническими (использование антител, ограничение по чувствительности и т.д.) и биологическими факторами (разные биоматериалы и их физиологические и патологические состояния). В проекте предлагается использовать метод вычислительной интерактомики, направленный на корректное совмещение множества данных AP-MS – виртуальную ко-преципитацию (Zhang et al., 2010). Принцип метода виртуальной ко-преципитации (ВКП) заключается в определении частоты совместной встречаемости белков в исходных масс-спектрах, что позволяет “вычленять” ББВ, характерные для большинства клеток, с минимальным техническим и биологическим шумами. В качестве исходных данных будут использованы масс-спектры, полученные при выполнении крупномасштабного исследования интерактома человека методом AP-MS для ~11 тыс. генов (Huttlin et al., 2017). Стоит отметить, что результаты большинства экспериментов, выполненных методом AP-MS, депонируются в протеомные репозитории и не всегда находят отражение в интерактомных базах данных. В случае отсутствия опубликованных интерактомных данных для исследуемых белков в проекте предлагается применить модифицированный метод AP-MS, заключающийся во встраивании тега в последовательность исследуемого белка методом CRISPR/Cas9 для получения данных о ББВ (Dalvai et al., 2015; Nitika and Truman, 2017; Li et al., 2017). Использование такой модификации позволит практически исключить неспецифические взаимодействия, связанные с «вылавливанием», а также повысить чувствительность метода, поскольку тег «вшивается» в каждую белковую молекулу. Аннотация белков с неизвестными функциями будет основана на подходе «guilt-by-association», где описание исследуемых белков будет получено согласно выявленным для них ББВ (интерактомный профиль), т.е. путем анализа прямых взаимодействий или определения функционального кластера в составе интерактомной сети, в которой участвует исследуемый белок. Функциональные кластеры будут определены с использованием системы Gene Ontology (GO) через сопоставление интерактомных профилей белков. Информация об участии белков с неизвестными функциями в клеточных процессах, их уровне экспрессии в тканях и органах и роли в выживании клетки (на основе проекта Achilles) позволит оценить потенциал таких белков в качестве биомаркеров социально-значимых заболеваний.

Ожидаемые результаты
Результатом проекта будет получение новых знаний о белках человека с неизвестными функциями. Безусловно, тип полученных данных будет носить больше предсказательную роль, что характерно для работ по аннотированию белков (GO). Тем не менее, такие данные пригодны для интерпретации результатов геномных и постгеномных анализов, более того они также необходимы при планировании и выполнении доказательных экспериментов. Решение задачи по аннотации таких белков является одним из приоритетов на текущий момент для международного проекта «Протеом человека» (https://hupo.org/HPP-News/5595319). За российскими учеными закреплено исследование белков, кодируемых хромосомой 18 человека: для 16 белков целевой хромосомы, которые не имеют функциональной аннотации, будут получены сведения об их участии в клеточных процессах, локализации, взаимодействиях. Также будет оценен потенциал использования этих белков в качестве биомаркеров социально-значимых заболеваний. Кроме того, выполнение этой работы позволит расширить имеющиеся сведения о белок-белковых взаимодействиях и выявить новые данные об организации и регуляции клеточных процессов, что, в свою очередь, имеет большое значение для понимания молекулярных механизмов функционирования живых систем. Работа предусматривает как биоинформатический блок, заключающийся в применении методов вычислительной интерактомики и мета-анализа постгеномных данных, так и экспериментальную часть, направленную на получение данных о ББВ методом AP-MS. Выполнение проекта позволит усовершенствовать подходы к выявлению и анализу интерактомных данных. В случае вычислительной интерактомики будет модифицирован метод виртуальной ко-преципитации для анализа масс-спектров при обработке результатов крупномасштабного проекта по исследованию интерактома человека, выполненного командой под руководством Huttlin в 2017 году (Huttlin et al., 2017). Экспериментальная часть будет включать постановку метода AP-MS c использованием инструмента генетического редактирования - CRISPR/Cas9. Такая модификация метода AP-MS – это новое направление, которое только начинает использоваться исследователями. В рамках выполнения экспериментальных работ будут получены рабочие модели генетического редактирования для белков, кодируемых хромосомой 18 человека. Таким образом, результатом проекта будет не только приобретение новых знаний, ценных при разработке прогностических, диагностических и терапевтических биомаркеров, но и усовершенствование методик получения, анализа и обработки интерактомных данных, что позволит уменьшить априори высокую долю ложных результатов


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2018 году
Интерактомные данные являются основой для предсказания/выявления функции белков, исходящей из предположения, что физически взаимодействующие белки функционально связаны между собой. В первом году реализации гранта были получены сведения о белок-белковых взаимодействиях (119 тыс.) для более чем 1300 белков человека, в том числе для 13 белков с неизвестной функцией. Три таких белка оказались в составе функционального кластера, аннотация которого показала, что с высокой вероятностью для данных белков может быть указана функция связывания молекул, в частности ассоциированных с действием АТФазы. Интерактомные данные были получены путем ре-анализа масс-спектрометрических данных методом виртуальной копреципитации, заключающимся в определение совстречаемости белков в экспериментальных результатах. В качестве исходных данных использовали сведения из ресурса BioPlex (Huttlin et al., 2017), который является наиболее масштабным проектом по выявлению ББВ методом AP-MS. Суммарно было проанализировано свыше 6 тыс. экспериментов общим объемом 1,9 Тб.

 

Публикации


Аннотация результатов, полученных в 2019 году
В подавляющем большинстве случаев описание функции белков начинается с выявления белковых взаимодействий для этих белков. Работы второго отчетного года заключались как в экспериментальном получении белок-белковых взаимодействий с помощью модифицированного метода AP-MS на основе системы CRISPR/Cas9, так и в биоинформатическом исследовании путем анализа опубликованных результатов масс-спектрометрических данных, полученных методом AP-MS В результате проведенных работ впервые были описаны четыре (POTEC, C18orf21, CCDC102B и KLHL14) из десяти генов, кодируемых генами хромосомы 18 человека, для которых нет сведений об их роли в клеточных процессах. Проведенный мета-анализ опубликованных данных показал, что белок, кодируемый геном KLHL14, может быть рассмотрен в качестве возможного биомаркера раковых процессов в печени и почках.

 

Публикации

1. Поверенная Е, Киселева О, Романова А, Пятницкий М Predicting Functions of Uncharacterized Human Proteins: From Canonical to Proteoforms Genes, Номер 11 Том 6 стр. E677 (год публикации - 2020).