КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 21-71-10136

НазваниеИнтерпретируемые модели машинного обучения для анализа больших массивов мультимодальных биомедицинских и нейровизуализационных данных методами искусственного интеллекта

РуководительШараев Максим Геннадьевич, Кандидат физико-математических наук

Организация финансирования, регион Автономная некоммерческая образовательная организация высшего образования «Сколковский институт науки и технологий», г Москва

Период выполнения при поддержке РНФ 07.2021 - 06.2024 

Конкурс№61 - Конкурс 2021 года «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными.

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах, 01-202 - Интеллектуальный анализ данных и распознавание образов

Ключевые словаИнтерпретируемые модели, машинное обучение, методы искусственного интеллекта, МРТ, фМРТ, морфометрия, коннектомы, иммунологические маркеры, шизофрения, дифференциальная диагностика

Код ГРНТИ28.23.15


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Применение технологий Искусственного интеллекта к конкретным биомедицинским данным позволяют строить диагностические и прогностические модели для решения конкретных актуальных клинических задач, на основании которых создаются компьютерные системы поддержки принятия медицинских решений. Такие модели основаны, как правило, на выявленных в данных диагностически и/или прогностически значимых признаках (биомаркерах), по значениям которых для данных конкретного испытуемого строятся требуемые диагностические и/или прогностические выводы. Однако существует серьезный барьер для использования таких моделей и систем в клиническую практику, называемый общим термином «неинтерпретируемости» созданных моделей и результатов. Даже если построенная модель прошла тестирование на большом количестве данных и продемонстрировала хорошую точность (высокие показатели чувствительности и специфичности в биомедицинских приложениях), врач не может принять рекомендации системы поддержки принятия решений если выявленные математическими методами биомаркеры носят абстрактный (с клинической точки зрения) характер, а сделанные по ним выводы не имеют ясной и наглядной интерпретации в понятных врачу биомедицинских и клинических терминах. Особенно остро указанный барьер проявляется при создании моделей по мультимодальным данным (что является типичным для современного уровня медицины) с использованием технологий машинного обучения. Одним из актуальных направлений развития Искусственного интеллекта, которое появилось буквально в последние несколько лет, является разработка методов построения интерпретируемых моделей по данным (построение «карт внимания» в задачах компьютерного зрения, выделение наиболее информативных признаков при снижении размерности и другие), и это направление сейчас бурно развивается. Однако само понятие «интерпретируемости» не может быть универсальным, и оно обязательно должно быть привязано к конкретной предметной области, поэтому использование даже имеющегося «универсального» инструментария требует его адаптации и развития с использованием формализованных знаний и моделей предметной области. Проект посвящен развитию методов искусственного интеллекта для создания интерпретируемых диагностических и прогностических моделей глубокого обучения по большим массивам мультимодальных данных для решения клинических задач психиатрии. Новые возможности нейровизуализационых исследований (в частности, МРТ и КТ сканирования, ЭЭГ, и др.), успехи в области биохимии и иммунологии привели к тому, что наряду с традиционными источниками данных (результаты клинических осмотров, психометрического тестирования) для диагностики и прогноза исхода заболевания в психиатрии накоплены знания об особенностях нейровоспаления и изменениях головного мозга при различных психических расстройствах. В качестве конкретной предметной области, для которой предполагается использование разработанных методов, выбраны клинические задачи диагностики шизофрении и прогноза исхода заболевания. При этом предполагается, что разрабатываемые методы создания интерпретируемых моделей глубокого обучения могут быть использованы для существенно более широкого класса нозологий в области психоневрологических расстройств. Выбор шизофрении в качестве предметной области обусловлен не только широкой распространенностью этого расстройства и его социальной значимостью, но и сложностями в определении мультифакториального характера этиопатогенетических путей развития, которые остаются до сих пор неуточненными. Мультимодальный метод с применением машинного обучения для обработки больших массивов данных (клинических, молекулярных, нейрофизиологических) позволит приблизить понимание основных звеньев патогенеза этого расстройства, закономерностей формирования многообразия психопатологических проявлений. Научная значимость проблемы диагностики шизофрении определяется тем, что в настоящее время не существует единой общепринятой теории патогенеза шизофрении. По клиническим проявлениям выделяют гетерогенные расстройства шизофренического спектра с первичными психозами, ведущая симптоматика которых не только весьма разнообразная, но и сложно классифицируемая (параноидная, парафренная, гебефреническая, кататоническая). Кроме того, в разряд расстройств шизофренического спектра входят такие нозологии как шизотипическое расстройство, шизоаффективные психозы, хроническое и транзиторное бредовое расстройство, симптоматика которых во многом идентична таковой при шизофрении), но требует иных терапевтических тактик и реабилитационных стратегий. Конкретные новые актуальные клинические задачи диагностики и лечения шизофрении были сформулированы в ведущем психиатрическом лечебном заведении страны – ГБУЗ “Психиатрической клинической больнице 1 им. Н.А. Алексеева ДЗМ”. Проводимые в мире научные исследования, в том числе исследования в ГБУЗ “Психиатрической клинической больнице 1 им. Н.А. Алексеева ДЗМ”, показали, что наряду с опросами психиатров и результатами психометрического тестирования, диагностическую значимость имеют результаты нейровизуализационных исследований (особенности головного мозга, выявляемые при структурной и функциональной МРТ, ЭЭГ), а изучение молекулярно-генетических основ шизофрении показало, что существенная роль в развитии и прогрессировании этого заболевания принадлежит нарушениям системного иммунного ответа и иммунных процессов в центральной нервной системе, хроническому нейровоспалению. Тем самым, актуальны разработки новых диагностических подходов с использованием комплексов мультимодальных биомаркеров с возможностью прогностической оценки динамики шизофрении и уточнения прогноза развития психопатологических особенностей заболевания по мультимодальным данным пациента, включая социодемографические данные, результаты клинического обследования и психометрического тестирования, нейровизуализационные МРТ/фМРТ данные, данные иммунологических исследований (уровень маркеров системного воспаления, ключевых цитокинов, маркеров активации адаптивного иммунитета, и др.). Однако, даже при наличии таких данных, врачу или клиническому психологу трудно использовать их “вручную” из-за сложной структуры, высокой размерности и наличия неочевидных (скрытых, нелинейных) связей в данных. Поэтому необходимо создание прогностических моделей, которые будут находить валидные паттерны и связи у каждого пациента, что позволит на их основе принимать прогностические решения и разрабатывать тактику реабилитации. Такая система может быть создана методами искусственного интеллекта с использованием больших массивов мультимодальных данных, а если построенная модель будет интерпретируемой, то на ее основе может быть создана система поддержки принятия медицинских решений. Учитывая большую научную и клиническую значимость проблемы диагностики шизофрении, уточнения динамики и характера, а также построения прогноза исхода заболевания, ГБУЗ “Психиатрической клинической больнице 1 им. Н.А. Алексеева ДЗМ” предоставит имеющийся научный задел в виде массива мультидисциплинарных анонимизированных данных о пациентах, страдающих шизофренией и испытуемых в группе контроля, а также предоставить возможность пополнять этот массив данными о новых людях, получаемых с использованием нейровизуализационных сканеров. Поэтому основной конкретной решаемой задачей Проекта является развитие методов искусственного интеллекта для создания интерпретируемых диагностических и прогностических моделей по предоставленному массиву мультимодальных данных для решения клинических задач диагностики шизофрении и построения прогноза заболевания. Так как создание интерпретируемых моделей невозможно без использования знаний и моделей предметной области, в состав команды, наряду со специалистами в области ИИ входят специалисты в области клинических исследований психических расстройств, специалисты в области обработки и анализа неровизуализационных МРТ/фМРТ изображений, а также специалисты в области иммунологии, имеющие опыт работы в области неврологии и психиатрии, в том числе и шизофрении. Проект будет включать в себя решение нескольких конкретных задач, связанных с детальной постановкой решаемых клинических задач, выбором критериев характеризующих клиническое качество создаваемых прогностических моделей и требований к интерпретируемости выявленных нейровизуализационных и иммунологических биомаркеров, а также формализация знаний и моделей предметной области для их использования в разрабатываемой модели. Ожидаемыми результатами Проекта будут, прежде всего, адаптированные и усовершенствованные методы ИИ, применение которых к массивам мультидисциплинарных данных приведет к требуемой интерпретируемой модели диагностики шизофрении и прогноза заболевания. На основании этой модели будет разработана система поддержки медицинских решений для ее последующего использования в клинической практике, которая позволит разработку новых персонализированных подходов к профилактике и терапии шизофрении, основанных на данных клинических, патопсихологических, нейровизуализационных и иммунологических обследованиях. Ввиду интерпретируемости разрабатываемых моделей (с различными критериями для различных модальностей данных), результатами Проекта будут также новые фундаментальные научные знания, касающиеся выявленных взаимосвязей между характеристиками клинических форм шизофрении, особенностями анатомических структур и функциональной коннективностью головного мозга и иммунологическими биомаркерами. Это потенциально позволит сделать новые выводы о механизмах патологии и выявления эндофенотипов шизофрении, глубже понять роль иммуновоспалительных нарушений и дисбаланса иммунитета в многофакторном патогенезе шизофрении, а также сделать шаг в создании комплексных панелей биомаркеров для диагностики, прогноза заболевания и разработки новых подходов к персонализированной терапии.

Ожидаемые результаты
В проекте предполагается получить следующие научные и прикладные результаты: Сформулированный набор актуальных клинически значимых задач в области диагностики и прогнозирования течения и исхода шизофрении, которые должны быть решены по представительным наборам мультимодальных данных, включая требования к создаваемым моделям и требования к наборам данных для построения моделей. Сформированная уникальная база анонимизированных лонгитюдных мультимодальных данных, включающая в себя релевантные социодемографические данные, результаты клинических осмотров и психометрического тестирования, а также результаты нейровизуализационных и иммунологических исследований,группы пациентов с шизофренией (с различными формами заболевания) и контрольной группы волонтеров. Будут разработаны новые методы машинного обучения и анализа мультимодальных данных для построения неинтерпретируемых предиктивных моделей машинного обучения для типовых диагностических и прогностических задач неврологии и психиатрии. По набору имеющихся мультимодальных биомедицинских данных и с применением разработанных методов, будет построена совокупность неинтерпретируемых предиктивных моделей машинного обучения для решения клинических задач диагностики и прогнозирования течения и исхода шизофрении, сформулированных клиническими специалистами. Будут разработаны новые методы машинного обучения и анализа мультимодальных данных, позволяющие выделять во входных данных разработанных моделей информативные признаки, значимо влияющие на выходные результаты (решения) этих моделей. Такие признаки могут включать в себя: для нейровизуализационных данных - “карты внимания” и морфометрические характеристики различных регионов головного мозга на МРТ-изображениях, матрицы коннективности (коннектомы) построенные по результатам функциональной МРТ, и др.; для иммунологических данных - панель выявленных диагностически и прогностически значимых маркеров; для клинических, социодемографических, психопатологических и патопсихологических данных - обобщенные веса признаков, отражающих их влияние на результаты модели. Перечень этих признаков в процессе исследований может быть расширен. Будут разработаны методы преобразования выявленных значимых признаков в новую совокупность признаков, имеющих наглядную семантическую интерпретацию в терминах предметных областей психиатрии, нейровизуализации и иммунологии, с сохранением их диагностической и прогностической значимости. По новым семантически значимым признаком будет построена совокупность новых интерпретируемых предиктивных моделей машинного обучения для решения клинических задач диагностики и прогнозирования течения и исхода шизофрении, сформулированных клиническими специалистами. Предполагается, что построенные модели будут иметь самостоятельную ценность и возможность использования в научных исследованиях и клинике для диагностики, выбора тактики терапии и реабилитационных мероприятий для пациентов с шизофренией. Будет создан прототип системы поддержки принятия врачебных решений на базе отобранных признаков и лучших архитектур построенных моделей с дружественным интерфейсом, учитывающим особенности предметной области и позволяющих его использования специалистами с минимальными компьютерными знаниями. С использованием выявленных семантически интерпретируемых и прогностически значимых признаков и построенных интерпретируемых предиктивных моделей машинного обучения, специалисты предметных областей предполагают получить новые фундаментальные научные и клинические знания и сделать теоретические и научные выводы, а именно: получить новые знания о нейрофизиологических и иммунологических составляющих патологического процесса, приводящего к психическому расстройству, получить новые фундаментальные научные знания, касающиеся выявленных взаимосвязей между формами шизофрении, особенностями анатомических структур, функциональной коннективностью головного мозга и иммунологическими биомаркерами, глубже понять роль иммуновоспалительных нарушений и дисбаланса иммунитета в многофакторном патогенезе шизофрении, а также сделать новые научные выводы о механизмах патогенеза шизофрении, о роли нейроиммунных нарушений при этом заболевании, о новых фенотипах шизофрении, получить новые знания об отклонениях, которые возникают по мере развития психического расстройства (в динамике его течения), дифференцировать (ранжировать) пациентов с точки зрения уточненного прогноза течения заболевания с предложением персонализированного подхода, учитывающего весь массив данных о каждом пациенте, выявить комбинации прогностически значимых признаков в мультимодальных данных пациентов с шизофренией, на основе чего будут построены прогностические модели для оценки эффективности реабилитации пациентов в зависимости от выбранной тактики терапии, что важно для практической медицины, отобрана совокупность иммунологических параметров в составе мультимодальных данных пациентов для выявления различных фенотипов шизофрении и создания панелей биомаркеров, и их использования для диагностики, прогноза заболевания и разработки новых подходов к персонализированной терапии, и другие. Научная проблема создания интерпретируемых моделей машинного обучения возникла буквально в последние годы, к настоящему времени лишь имеются разрозненные результаты решения этой проблемы для конкретных типов данных обучающей выборки, поэтому ожидаемые результаты проекта, касающихся развития новых методов анализа данных и машинного обучения для создания интерпретируемых моделей по мультимодальным данным различных типов, являются значимыми для развития области знаний искусственного интеллекта и машинного обучения. В проекте предполагается применить разработанные методы к данным конкретной предметной области, но они смогут быть использованы также для решения существенно более широкого класса задач, что определяет их прикладную значимость. Результатом проекта будут также созданные прикладные модели машинного обучения для для решения клинических задач диагностики и прогнозирования течения и исхода шизофрении. Эти результаты будут иметь практическую значимость так как будут способствовать объективизации принимаемых врачебных решениях, основываясь не только на субъективных результатах клинических осмотров, но и на результатах нейровизуализационных и иммунологических исследованиях. Результаты проекта, касающиеся получения новых фундаментальных научных и клинических знаний, касающихся нейрофизиологических и иммунологических составляющих патологического процесса, приводящего к психическому расстройству, а также выявленных взаимосвязей между формами шизофрении, особенностями анатомических структур, функциональной коннективностью головного мозга являются значимыми для предметных областей проекта (психиатрии, иммунологии) и станут научной основой для выработки новых клинических практик.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2021 году
В отчетном периоде выполнялись следующие запланированные работы и исследования, включая 1) выбор и обоснование конкретных актуальных клинически значимых прикладных задач в предметной области проекта, для решения которых предполагается создание интерпретируемых предиктивных моделей машинного обучения, 2) формирование Базы данных, состоящей из мультимодальных биомедицинских данных, релевантных сформулированным клинических задачам, с использованием которых будут создаваться предиктивные модели; 3) усовершенствование известных и разработка новых методов машинного обучения и анализа больших массивов мультимодальных данных, необходимых для создания интерпретируемых предиктивные моделей машинного обучения для решения сформулированных клинических задач. 1.5.1. В рамках первого направления значительная часть работ выполнена участниками Проекта – специалистами в области неврологии и психиатрии, а также специалистами в области проведения и анализа инструментальных (нейровизуализационных психофизиологических) и лабораторных иммунологических исследований. Эти работы включали следующие взаимосвязанные части: • разработку унифицированной русскоязычной онтологии глубокого фенотипирования эндогенных психических расстройств, мотивированную стремительным накоплением данных о нейробиологических механизмах развития психических расстройства и необходимостью использования такой онтологии в процессе создания интерпретируемых предиктивные моделей машинного обучения; • формулирование общих требований к Системам поддержки принятия врачебных решений в области клинической медицины и специфических требований, определяемых областью использования создаваемых в Проекте интерпретируемых предиктивных моделей для поддержки принятия врачебных решений в предметной клинической области Проекта - лечении психических заболеваний определенного типа в условиях стационара. В результате проведенных работ и исследований была сформулирована следующая клинически значимая научно-медицинская задача: создание совокупности интерпретируемых предиктивных моделей машинного обучения для поддержки принятия врачебных решений и их объективизации по уточнению типа шизофренического расстройства по совокупности биомедицинских мультимодальных данных. Предполагается, что решение сформулированной задаче будет реализовано в программно-реализуемом прототипе конкретной Системы поддержки принятия врачебных решений для ее валидации и тестирования в клинической практике и дальнейшем практическом использовании. 1.5.2. В рамках выполненных работ второго направления были определены архитектура и структура создаваемой Базы данных, сформулированы критерии включения и исключения пациентов и добровольцев в целевые группы и группы контроля, а также определены типы включаемых данных (клинические и социодемографические данные, данные психологического тестирования, иммунологические данные, нейровизуализационные МРТ/фМРТданные, нейрофизиологические ЭЭГ данные), релевантные решаемым задачам и ожидаемым результатам. В процессе создания Базы данных были получены следующие научные результаты, на основании которых в Базу данных были включены дополнительные объективно измеряемые показатели: проведенные иммунологические исследования пациентов с психическими расстройствами позволили выявить и включить в Базу данных ряд иммунологических показателей, связанных с нарушениями системного иммунного ответа и иммунных процессов и имеющих потенциальную взаимосвязь с наличием шизофрении и характером симптоматики; нейровизуализационные исследования позволили выявить и включить в Базу данных уникальные характеристики ультрабыстрых последовательностей фМРТ, ранее не используемых в клинической рентгенологической практике; проведенные нейрофизиологические исследования позволили выявить и включить в Базу данных ряд новых показателей электрофизиологической активности 1.5.3. Были выполнены следующие исследования в смежных клинических задачах, в рамках которых были получены новые научные результаты, которые предполагается использовать для решения основных задач Проекта: • методы интеллектуального анализа данных были использованы для выявления в МРТ-изображениях структурных изменений и морфологических характеристик головного мозга у лиц пожилого возраста, перенесших и не перенесших COVID-19. В процессе исследований была разработана новая методика ускоренной сегментации головного мозга на области (с одновременным подсчетом их морфометрических характеристик), использующая распараллеливание вычислений с использованием суперкомпьютеров • методами машинного обучения, с использованием результатов нейропсихологических тестов и данных окулографии, были построены интерпретируемые модели для предсказания результатов решения когнитивных задач различной сложности, впервые доказавшие прогностическую значимость данных окулографии для оценивания качества решения когнитивных задач на ментальное внимание • по данным функциональной МРТ в состоянии покоя и стимул-зависимой функциональной МРТ, собранными в НМИЦ Нейрохирургии им. Бурденко для пациентов с различными локализациями опухоли (глиомами головного мозга), были построены предиктивные модели для выявления функционально значимых областей мозга для предоперационного картирования (локализация моторной, речевой и зрительной зон мозга). Показана высокая степень соответствия предсказаний построенной предиктивной модели по данным фМРТ с задачами и результатами интраоперационного картирования • методами машинного обучения, примененных к данным структурной МРТ различной модальности (T1, T1c, T2 и FLAIR) из базы данных BraTS, построены предиктивные модели для сегментации опухолей на основе U-net архитектуры. Полученная точность моделей соответствует мировому уровню. Изучена прогностическая способность каждой модальности в задаче сегментации и проведено сравнение разработанной модели с самыми современными решениями по базе данных BraTS. Впервые показано, что для сегментации как ядра, так и периферии опухоли, наибольшей информативностью обладают пост-контрастные Т1-взвешенные изображения; • построены интерпретируемые предиктивные модели для обнаружения шизофрения и ее классификации по группе патологий (включая биполярное аффективное расстройство, синдром гиперактивности и дефицит внимания) с использованием открытой выборке мультимодальных данных UCLA Psychoneurological Consortium (LA5). Для построения моделей были использованы как классические методы машинного обучения (Логистическая регрессия, Метод Опорных Векторов, и Метод ближайших соседей), так и методы компьютерного зрения (включая трехмерные сверточные сети 3DCNN и четырехмерные рекуррентные сети 4DRNN, адаптированные для задачи классификации шизофрении по данным, соответственно, структурной и функциональной МРТ). Вычислительные эксперименты с построенными моделями позволили оценить точность классификации для различных методов и выявить совокупность диагностически значимых биомаркеров для распознавания шизофрении • построены предиктивные модели для диагностики заболевания Альцгеймера по базе данных ADNI, являющейся одной из наиболее известных больших выборок изображений МРТ для заболевания Альцгеймера. При построении моделей были усовершенствованы методы компьютерного зрения для задачи классификации МРТ-изображений (включая перенос обучения и автокодирующие архитектуры моделей машинного обучения) и методы интерпретации моделей машинного обучения, а также были разработаны новые алгоритмы алгоритм предобработки данных, обучения и интерпретации моделей машинного обучения для задач классификации, включая новый алгоритм оценки качества интерпретации моделей. Проведенные вычислительные эксперименты с построенными моделями позволили оценить влияние различных процедур обработки данных на точность моделей, выбрать оптимальные параметры алгоритмов и оптимальную структуру процедур переноса обучения.

 

Публикации

1. Бачурина В.А., Сущинская С.О., Шараев М.Г., Бурнаев Е.В., Арсалиду М. A machine learning investigation of factors that contribute to predicting cognitive performance: Difficulty level, reaction time and eye-movements Decision Support Systems, Volume 155, April 2022, 113713 (год публикации - 2021) https://doi.org/10.1016/j.dss.2021.113713

2. Дружинина П.В., Кондратьева Е.А., Боженко А.А., Яркин В.Э., Шараев М.Г., Курмуков А.И. BRATS2021: exploring each sequence in multi-modal input for baseline U-net performance Springer LNCS proceedings, - (год публикации - 2022)

3. Пронин И.Н., Смирнов А.C., Мельникова-Пицхелаури Т.В., Шараев М.Г., Бернштейн А.В., Яркин В.Э., Жуков В.Ю., Буклина С.Б, Погосбекян Э.Л., Афандиев Р. М., Пицхелаури Д.И. Применение машинного обучения для предоперационного картирования по данным фМРТ покоя: сравнение со стимул-зависимой фМРТ и прямой электрической стимуляцией коры Журнал «Вопросы нейрохирургии» имени Н.Н. Бурденко, - (год публикации - 2022)

4. Смирнов А.C., Мельникова-Пицхелаури Т.В., Шараев М.Г., Яркин В.Э., Туркин А.М., Афандиев Р.М., Хасиева Л.М., Пицхелаури Д.И., Пронин И.Н. Сравнение функциональной МРТ в состоянии покоя и стимул-зависимой функциональной МРТ в предоперационном неинвазивном картировании пациентов с глиомами головного мозга Журнал «Вопросы нейрохирургии» имени Н.Н. Бурденко, - (год публикации - 2022)

5. Сюняков Т.С., Шараев М.Г., Савилов В.Б., Карпенко О.А., Курмышев М.В., Яркин В.Э., Ушаков В.Л., Бибяев А.Н., Соловьёва К.П., Андрющенко А.В. A Comparison of Regional Brain Volumes in Older Adults With and Without History of COVID-19 Consortium Psychiatricum, Volume 3 | Issue 1 (год публикации - 2022) https://doi.org/10.17816/CP145

6. Шараев М.Г., Малашенкова И.К., Масленникова А.В., Захарова Н.В., Бернштейн А.В., Мамедова Г.Ш., Крынский С.А., Огурцов Д.П., Кондратьева Е.А., Дружинина П.В., Архипов А. Ю., Стрелец В. Б., Ушаков В.Л. Диагностика шизофрении по данным различных модальностей: биомаркеры и методы машинного обучения (обзор) Современные технологии в медицине, - (год публикации - 2022)

7. - Researchers Teach Algorithm to Predict Success in Effortful Tasks Пресс-служба ВШЭ, - (год публикации - )

8. - Researchers teach algorithm to predict success in effortful tasks EurekAlert, - (год публикации - )

9. - Researchers teach algorithm to predict success in effortful tasks scienmag, - (год публикации - )


Аннотация результатов, полученных в 2022 году
На втором году Проекта были выполнены следующие работы: 1) развиты и усовершенствованы методы построения предиктивных моделей по мультимодальным данным, включая • методы глубокого обучения с использованием новых архитектур нейросетевых моделей с включением блока консолидации мультимодальных входных данных и компонентов тонкой настройки для получения клинически значимой интерпретации построенных мультимодальных предиктивных моделей; • методы канонического анализа независимых компонент, позволившие извлекать из фМРТ-данных биомаркеры, устойчивые к индивидуальной вариабильности испытуемых, которые были использованы для построения предиктивной модели для диагностики шизофрении по фМРТ-данным; • выбрана совокупность методов машинного обучения (МО), учитывающие модальность данных (ансамблевые модели для иммунологических данных и фМРТ- снимков, методы адаптации части слоев классификатора под задачи регрессии, и др.), которые были использованы для построения трех предиктивных моделей для оценки степени выраженности различных доменов заболевания Шизофренического спектра и предсказания выраженности симптомов заболевания; • обосновано использование показателя региональной однородности ReHo мозговой активности для построения статических 3D карт по данным фМРТ и построения ним предиктивных моделей; которые были использованы при построении семейства прогностически значимых биомаркеров и 15 прикладных интерпретируемых предиктивных моделей, востребованных в клинической практике. Был также проведен аналитический обзор существующих методов интерпретации предиктивных моделей МО, созданных по мультимодальным данным, по результатам которого были выработаны рекомендации по использованию методов в зависимости от типа нейросетевых моделей, а также определены направления совершенствования таких методов. 2) Были построены 15 унимодальных и мультимодальных предиктивных моделей по биомедицинским данным различной модальности (МРТ, фМРТ и ДТ-МРТ, ЭЭГ и иммунологическим), мотивированных актуальными клиническими задачами диагностики заболеваний (шизофрении, Мягкого Когнитивного Снижения, болезни Альцгеймера, большого депрессивного расстройства), для оценки степени выраженности доменов заболевания Шизофренического спектра и другими. При построении моделей использовались биомедицинские данные о пациентах и группах здорового контроля, содержащимися в открытых международных медицинских базах данных (МРТ COBRE SchizConnect, Human Connectome Project, ADNI, База ЭЭГ-данных КазНУ имени аль-Фараби), а также созданная в рамках Проекта База данных МРТ и иммунологических данных). 3) Впервые была разработана полная русскоязычная онтология глубокого фенотипирования больных с расстройствами шизофренического спектра PsyGenCheck, содержащая новые модели, которые достоверно отражают структуру психопатологии в различных дименсиях для пациентов с шизофренией и позволяют максимально подробно и формализовано описывать клинические особенности шизофрении. Разработанная онтология была использована при разметке данных в разработанной в рамках Проекта базе данных для описания клинического статуса больных с шизофренией. 4) Был выполнен цикл исследований для иммунологических данных пациентов с целью отбора кандидатов в диагностически значимые биомаркеры. Полученные результаты были использованы при построении мультимодальных предиктивных моделей по иммунологическим и нейровизуализационным данным для диагностики шизофрении. 5) Были развиты методы машинного обучения и анализа ЭЭГ данных для построения предиктивных моделей по данным ЭЭГ, включая методы предобработки данных (удаление артефактов, фильтрация и др.) и выделение новых биомаркеров (основанных на попарной спектральной когерентности электродов, корреляциях между огибающими; спектральные плотности мощности для выбранных частотных диапазонов, и др.), Эти результаты были использованы для построения предиктивной интерпретируемой модели для диагностики большого депрессивного расстройства по данным ЭЭГ. 6) Была расширена разработанная на первом этапе База биомедицинских и нейровизуализационных данных путем включения в нее результатов очистки от шумов и предобработки сырых необработанных фМРТ-данных и данных ЭЭГ, вычисленных морфометрических признаков для МРТ-данных, диагностически и прогностически значимых иммунологических признаков для иммунологических данных. Получены новые научные результаты, в том числе: 1) научные результаты в области разработки и совершенствования методов анализа мультимодальных данных и машинного обучения, включая: • предложенная новая архитектуры глубоких нейронных сетей, в которую добавлены блок консолидации мультимодальных входных данных и компоненты тонкой настройки для получения клинически значимой интерпретации построенных мультимодальных предиктивных моделей, • усовершенствованы методы канонического анализа независимых компонент, позволившие извлекать из фМРТ-данных биомаркеры, устойчивые к индивидуальной вариабильности испытуемых, • выбрана совокупность методов машинного обучения, учитывающих модальность входных данных, для построения предиктивных моделей для оценки степени выраженности различных доменов заболевания Шизофренического спектра и предсказания выраженности симптомов заболевания, • обосновано использование показателя региональной однородности ReHo мозговой активности для построения статических 3D карт по данным фМРТ и построения ним предиктивных моделей, • по результатам аналитического обзора, выработаны конкретные рекомендации по использованию конкретных методов интерпретации предиктивных моделей машинного обучения в зависимости от типа нейросетевых моделей, а также определены направления совершенствования таких методов. 2) научные результаты в области создания прототипов интерпретируемых предиктивных моделей для выявления патологий головного мозга на основе мультимодальных биомедицинских данных, включая: • построенные предиктивные модели для диагностики шизофрении, мягкого когнитивное снижения, болезни Альцгеймера, большого депрессивного расстройства по биомедицинским данным различной модальности (данным структурной, функциональной и диффузионно-тензорной магнитно-резонансной томографии, электроэнцефалографическим и иммунологическим данным), • предиктивные модели для оценки степени выраженности различных доменов заболевания Шизофренического спектра и предсказывать степени выраженности симптомов заболевания по данным структурной и функциональной МРТ и иммунологическим данным, и другие. 3) Впервые разработанная полная русскоязычная онтология глубокого фенотипирования больных с расстройствами шизофренического спектра PsyGenCheck, содержащая новые модели, достоверно отражающие структуру психопатологии в различных дименсиях для пациентов с шизофренией и позволяющие максимально подробно и формализовано описывать клинические особенности шизофрении. 4) Отобранные и ранжированные иммунологические параметры по их потенциальной диагностической и прогностической значимости для диагностики шизофрении. 5) Выявленные новые биомаркеры в данных ЭЭГ (основанных на попарной спектральной когерентности электродов, отфильтрованной в разных спектральных диапазонах, корреляциях между огибающими для каждого диапазона; спектральные плотности мощности для выбранных частотных диапазонов, и др.), прогностически значимые для диагностики большого депрессивного расстройства по данным ЭЭГ. 6) Расширение разработанной на первом этапе Базы биомедицинских данных путем включением в нее результатов предобработки сырых необработанных фМРТ-данных и данных ЭЭГ, а также морфометрических признаков МРТ-данных и выделенных признаков в иммунологических данных. Новизна и клиническая значимость разработанных методов и полученных результатов подтверждается их сравнением с имеющимися результатами, обзор и детальный анализ которых был проведен в рамках проведенных исследований.

 

Публикации

1. Зубрихина М.О., Абрамова О.В., Яркин В.Э., Ушаков В.Л., Очнева А.Г., Бернштейн А.В., Бурнаев Е.В., Андреюк Д.С., Савилов В.Б., Курмышев М.В., Сюняков Т.С., Карпенко А.В., Андрющенко А.В., Костюк Г.П., Шараев М.Г. Machine learning approaches to mild cognitive impairment detection based on structural MRI data and morphometric features Cognitive Systems Research, том 78, стр. 87-95 (год публикации - 2023) https://doi.org/10.1016/j.cogsys.2022.12.005

2. Зубрихина М.О., Масный Д.И., Хамуди Р., Альхаж Х., Исса Б., Кустубаева А.М., Камзанова А., Жолдассова М., Бернштейн А.В., Бурнаев Е.В., Артемов А.В., Шараев М.Г. Autoencoders with Deformable Convolutions for latent representation of EEG Spectrograms in classification tasks SPIE Conference Proceedings, - (год публикации - 2023)

3. Малашенкова И.К., Крынский С.А., Огурцов Д.П., Хайлов Н.А., Дружинина П.В., Бернштейн А.В., Артемов А.В., Шараев М.Г., Мамедова Г.Ш., Захарова Н.В., Костюк Г.П., Ушаков В.Л. Идентификация диагностических биомаркеров шизофрении на основе исследования параметров иммунитета и системного воспаления с помощью моделей машинного обучения Современные технологии в медицине, - (год публикации - 2023)

4. Бурнаев Е.В., Бернштейн А.В., Шараев М.Г. ИИ в нейрорентгенологии: стандартные подходы и перспективы Альманах искусственный интеллект №11 ИИ в здравоохранении, 11 выпуск (год публикации - 2022)

5. Бурнаев Е.В., Бернштейн А.В., Шараев М.Г. Предоперационное планирование в неврологии Альманах искусственный интеллект №11 ИИ в здравоохранении, 11 выпуск (год публикации - 2022)

6. - От избытка данных. Как диагностику опасных заболеваний ставят на поток РИА новости, - (год публикации - )

7. - Выпуск #31 "Искусственный интеллект". Наука # 101 Innopraktika, - (год публикации - )

8. - Искусственный интеллект поставил вам диагноз: можно ли доверить лечение ИИ? РИА подкасты, - (год публикации - )

9. - Московская неделя Эфир от 27.11.2022 ТВЦ, - (год публикации - )