КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 22-25-00683

НазваниеРазработка технологии распознавания летучих органический соединений - биомаркеров онкологических заболеваний на основе пространственно-временной динамики представления одорантов в гломерулярном слое обонятельной луковицы крыс

РуководительЛысенко Лариса Валерьевна, Кандидат биологических наук

Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Южный федеральный университет", Ростовская обл

Период выполнения при поддержке РНФ 2022 г. - 2023 г. 

Конкурс№64 - Конкурс 2021 года «Проведение фундаментальных научных исследований и поисковых научных исследований малыми отдельными научными группами».

Область знания, основной код классификатора 05 - Фундаментальные исследования для медицины, 05-106 - Нейробиология

Ключевые словалетучие органические соединения, кальциевая визуализация, обонятельная луковица, карта гломерул, распознавание запаха, лазерная сканирующая микроскопия, машинное обучение, нейросетевой классификатор, перенос обучения, биогибридный скрининг, рак желудка, рак легких

Код ГРНТИ34.39.19


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Целью данного проекта является разработка технологии распознавания летучих органический соединений - биомаркеров онкологических заболеваний в образцах выдыхаемого воздуха путем анализа пространственно-временной динамики представления одорантов в гломерулярном слое обонятельной луковицы крыс. Долгосрочная цель настоящего проекта состоит в том, чтобы найти подходы к ранней диагностике онкозаболеваний с использованием биогибридных систем, которые учитывают пространственные и временные характеристики ответов гломерул на предъявление отдельных биомаркеров онкозаболеваний. Известно, что анализ компонентов выдыхаемого воздуха представляет собой перспективный инструмент для неинвазивной диагностики онкозаболеваний, среди которых рак легких и рак желудка являются лидирующими причинами смертности от онкологических заболеваний. В настоящее время в выдыхаемом человеком воздухе выделены более сотни ЛОС, изменение концентрации которых характерно для онкопатологий. Однако традиционные методы анализа выдыхаемого воздуха: газовая хроматография, масс-спектроскопия, фотоакустическая спектроскопия, нанотехнологии, позволяющие детектировать концентрации ЛОС, отличаются громоздкостью и дороговизной, и часто дают противоречивые данные, а популярные системы исскуственного обоняния (e-noses) на основе газовых сенсоров и биосенсоров характеризуются низкой стабильностью, неселективностью и длительным временем срабатывания, в то время как для восприятия одорантов животным достаточно одного вдоха. Для устранения ограничений имеющихся методов мы предлагаем оригинальный подход, основанный на разработке технологии автоматического детектирования биомаркер-специфических откликов с помощью нейросетевого классификатора по in vivo визуализации кальциевой активности гломерул обонятельной луковицы крыс. Особенностью предлагаемого нами подхода будет являться использование синтезированных моделей данных позволяющих генерировать наборы данных, достаточные для того, чтобы компенсировать критическое для подходов глубокого обучения отсутствие достаточного объема выборки экспериментальных данных. Центральная гипотеза нашего исследования состоит в том, что внутрииндивидуальная вариабельность ответов гломерул является основным фактором, обеспечивающим устойчивость и точность распознавания биомаркеров. Гипотеза будет проверена с помощью решения семи конкретных задач: 1) In vivo визуализация динамики кальциевой активности гломерул обонятельной луковицы крыс при предъявлении биомаркеров рака желудка и рака легких: 2-бутанон, бензол, толуол, 2-пропанол, 6-метил-5-гептен-2-он, циклогексил изотиацинат; 2) Оценка межиндивидуальной и внутрииндивидуальной вариабельности вызванных реакций с определением идентичности и расположения наиболее чувствительных гломерул и специфичных для соответствующих биомаркеров пространственно-временных паттернов активации гломерул; 3) Исследование влияния концентрации биомаркеров на вызванные пространственно-временные паттерны гломерул; 4) Изучение временной взаимосвязи отдельных активированных гломерул при стимуляции различными концентрациями биомаркеров; 5) Автоматическое детектирование стимуло-специфических откликов гломерул с помощью нейросетевого классификатора; 6) Анализ информативных признаков таких откликов, например путём введения слоя пространственно-временного внимания (Attention layer); 7) Разработка модели нейрооптического отклика для генерации выборки синтезированных нейрооптических откликов с целью обучения классификатора на синтезированных данных в парадигме последовательного дообучения. Представленные задачи мы будем решать с использованием лазерной сканирующей микроскопии и методов машинного обучения (перенос обучения). Предлагаемое исследование имеет важное значение, поскольку определит, как пространственно-временные характеристики активности гломерул отражают наличие/отсутствие биомаркеров и изменение концентрации биомаркеров, и позволит разработать подходы, которые могут быть применены для изучения других биомаркеров и комплексов биомаркекров, чтобы открыть новые возможности для скрининговой диагностики. Эта работа позволит разработать основополагающие ресурсы для автоматического детектирования и анализа информативных признаков стимуло-специфических откликов, которые могут быть использованными другими исследователями. Ближайшим ожидаемым результатом этой работы является понимание того, какие пространственные и временные характеристики паттернов активности соответствуют изменению концентрации биомаркера по-сравнению со стандартом для здорового человека, а в долгосрочной перспективе, разработанные нами подходы заложат основу для разработки набора методов для лучшего скрининга онкозаболеваний на ранних стадиях с использованием образцов выдыхаемого воздуха.

Ожидаемые результаты
1) Будет впервые проведена in vivo визуализация динамики кальциевой активности гломерул обонятельной луковицы крыс при предъявлении биомаркеров рака желудка и рака легких: 2-бутанон, бензол, толуол, 2-пропанол, 6-метил-5-гептен-2-он, циклогексил изотиацинат; 2) Будет охарактеризована межиндивидуальная и внутрииндивидуальная вариабельности вызванных реакций и проведен отбор наиболее чувствительных гломерул и специфичных для соответствующих биомаркеров пространственно-временных паттернов активации гломерул; 3) Будут впервые получены данные о влиянии концентрации биомаркеров на вызванные пространственно-временные паттерны гломерул; 4) Будет исследована временная взаимосвязь отдельных активированных гломерул при стимуляции различными концентрациями биомаркеров; 5) Будет разработана модель нейрооптического отклика для генерации выборки синтезированных нейрооптических откликов с целью обучения классификатора на синтезированных данных в парадигме последовательного дообучения; 6) Будет реализовано автоматическое детектирование стимул-специфических откликов гломерул с помощью нейросетевого классификатора; 7) Будет выполнен анализ информативных признаков стимул-специфических откликов гломерул на предъявление биомаркеров рака желудка и рака легких. Решение поставленной в этом проекте проблемы впервые даст возможность разработать технологию для автоматического детектирования и анализа информативных признаков стимуло-специфических изменений пространственных и временные характеристик паттернов активности гломерул дорсальной поверхности луковицы крыс, вызванных предъявлением биомаркеров социально-значимых заболеваний: рака легких и рака желудка. А в долгосрочной перспективе, разработанные нами подходы заложат основу для разработки набора методов для скрининга онкозаболеваний на ранних стадиях с использованием образцов выдыхаемого воздуха. Разработанная технология автоматического распознавания летучих органический соединений - биомаркеров онкологических заболеваний в образцах выдыхаемого воздуха будет пригодна для широкого применения в нейробиологических лабораториях мира.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2022 году
Проведенные нами в 2022 г. эксперименты с использованием мониторинга постсинаптической кальциевой активности у анестезированных крыс в мультифотонном режиме сканирования, сосредоточены на понимании того, как гломерулярные ответы на ортоназальную стимуляцию кодируют идентичность и концентрацию биомаркеров рака желудка и рака легких. На выборке из 10 крыс нами систематически изучено взаимодействие между тремя градациями концентрации четырех биомаркеров (бензол, толуол, 6-метил-5-гептен-2-он, циклогексил изотиоцианат) с пятью - десятью повторными предъявлениями на крысу для высокой статистической мощности. Обнаружено, что все протестированные биомаркеры представлены на дорсальной поверхности обонятельной луковицы. Мы установили, что величина ответа гломерул, нелинейно зависит от удельного давления паров биомаркеров (от концентрации). Мы также выполнили внутрииндивидуальное и межиндивидуальное сравнение гломерулярных паттернов представления биомаркеров. Для оценки межиндивидуальной активности мозга был реализован и апробирован новый метод сравнения функциональных карт и расчёта вероятностной карты гломерулярной активности с корректировкой индивидуальных карт, заключающейся во вращении, масштабировании и сдвиге функциональной карты относительно ее ожидаемого положения на вероятностной карте, вычисленной в соответствии с анатомическими координатами. В силу высокой степени межиндивидуальной и внутрииндивидуальной вариабельности пространственно-временных характеристик паттернов гломерулярной активности в ходе экспериментальных исследований, размытости и нестационарности активируемых гломерулярных кластеров, традиционные процедуры локализации и сегментации на основе применения пороговых функций или методов объединения (наращивания) областей оказались не эффективными. Поэтому для решения задачи поиска в составе каждого кадра видеоряда областей ROI, активируемых при предъявлении животному биомаркера, нами использована нейронная сеть простейшей архитектуры при неявном представлении с помощью радиальных базисных функций (РБФ) поверхности кадра видеоряда – поля функций яркости пикселов. В результате выполненных вычислительных экспериментов было получено, что применение сети с РБФ позволило сжать размерность набора данных в 27 раз при сохранении точности бинарной классификации событий «маркер присутствует» или «маркера нет» при отборе лишь 20% нод от общего их количества, т.е. при условии K’=0.2K. Таким образом, нами показана принципиальная возможность синтеза адекватной математической модели временно́й динамики детектированных областей изображений и, соответственно, возможность построения модели нейрооптического отклика для генерации выборки синтезированных нейрооптических откликов с целью обучения классификатора на синтезированных данных в парадигме последовательного дообучения. Для декодирования паттернов гломерулярных карт для детекции наличия биомаркеров, добавленных в образцы воздуха, выдыхаемого здоровыми добровольцами, нами разработана модель нейрооптического отклика для генерации выборки синтезированных нейрооптических откликов с целью обучения классификатора на синтезированных данных в парадигме последовательного дообучения. Представленная модель синтезированных данных позволяет генерировать наборы данных, достаточные для компенсации критического для подходов глубокого обучения отсутствия труднодоступных экспериментальных данных. Кроме того, нами было показано, что метод классификации CNN на основе триплетных потерь способен обеспечить достаточную точность, несмотря на высокую дисперсию данных. По нашим данным, благодаря использованию предварительного обучения на синтетических данных, точность увеличилась с 0,68 до 0,74. Это показывает возможность улучшения подходов трансферного обучения к задачам декодирования гломерулярных карт. Таким образом, в 2022 нами проведена успешная проверка работоспособности биогибридного подхода и апробация при обнаружении биомаркеров рака, добавленных в образцы выдыхаемого человеком воздуха. Этот подход сочетает в себе сильные стороны обонятельной чувствительности крыс и возможности компьютерного зрения и методов машинного обучения для обнаружения и распознавания паттернов гломерулярной активности, специфичных для биомаркеров.

 

Публикации


Аннотация результатов, полученных в 2023 году
Проведенные нами в 2023 г. эксперименты с использованием мониторинга постсинаптической кальциевой активности дорсальной поверхности обонятельной луковицы (дОЛ) у анестезированных крыс в мультифотонном режиме сканирования, сосредоточены на изучении возможности оценки изменения концентрации компонентов в смесях летучих органических соединений - биомаркеров рака желудка (6-метил-5-гептен-2-он) и рака легких (бензол, толуол). Для моделирования повышения концентрации биомаркера у онкологических больных, концентрация одного из компонентов смеси - 6-метил-5-гептен-2-он варьировалась. Оценка, выполненная с помощью библиотеки CaImAn, продемонстрировала динамический диапазон чувствительности гломерул к одорантам в составе смесей в интервале от 2 до 3, что согласуется с данными литературы о динамическом диапазоне гломерул у мышей. Повышение концентрации одного из компонентов смеси - 6-метил-5-гептен-2-она в 10 раз, моделирующее повышение концентрации биомаркера у онкологических больных, сопровождается увеличением амплитуды относительных значений (df/f) компонент высокого качества (комплекса гломерул), активных при предъявлении двух- и трех-компонентных смесей. В то же время дифференциация двух- и трехкомпонентных смесей с разными комбинациями концентраций биомаркеров по гломерулярным ответам с помощью библиотеки CaImAn затруднена низким качеством большинства извлеченных временных компонент кальциевой активности. В качестве альтернативного метода для выявления пространственных компонент и связанной с ними активности биомаркеров при отдельном предъявлении и в составе смесей мы использовали сеть гауссовских радиальных базисных функций (РБФ) для интерполяции интенсивности флуоресценции изображений дОЛ. Выбрав количество нод скрытого слоя РБФ-сети примерно равным возможному числу гломерул на изображении дОЛ, мы перешли к модели флуоресценции гломерулярного поля. Вся информация о флуоресценции изображения дОЛ содержится в векторе весов гауссовских нод обученной РБФ-сети. Мы предположили, что дискретные временные ряды весов тех гауссовых нод, которые принадлежат запаховым паттернам, имеют упорядоченную временную структуру, а временные ряды весов нод, которые относятся к паттернам жизнедеятельности, будут ближе к стационарному стохастическому процессу. Чтобы идентифицировать узлы, связанные с паттернами, вызванными запахами, мы использовали сингулярный спектральный анализ. Проведенный численный эксперимент подтвердил эффективность разработанной процедуры идентификации. Рассмотренный подход позволяет визуализировать запаховые закономерности на дОБ-изображении и реконструировать карты их пространственной топографии в единой стереотаксической системе координат мозга грызунов. Визуализация и реконструкция карт пространственной топографии паттернов отдельных биомаркеров и их двух- и трехкомпонентных смесей в пиксельной системе координат на основе использования нейронной сети со слоем РБФ демонстрирует вытормаживание паттерна активации гломерул при повышении концентрации 6 метил 5 гептен-2-она как при одиночном предъявлении, так и в составе смеси, что, по-видимому, позволяет контролировать чувствительность к входным данным, поддерживая пространственные карты гломерулярной активности. Обнаружено, что паттерн активации трехкомпонентной смеси, содержащей 6-метил-5-гептен-2-он, может быть эффективно восстановлен (по крайней мере, в пределах сканируемой области) с помощью анализа реакции на один и из компонентов смеси. Большая часть (80 %) расхождений между картами обусловлена вытормаживанием гломерул, активированных отдельным предъявлением стимула. Таким образом, задача предсказания паттерна гломерулярной активности в ответ на трехкомпонентную смесь запахов бензол + толуол+ 6 метил 5 гептен-2-он на основании реакций на 6-метил-5 гептен-2-он, является разрешимой. Исходя из эффективности на реальных данных и на более реалистичном моделировании кальциевого отклика предложена гипотеза, что сохранив калибровочные данные нейросетевого классификатора, полученные на 1 этапе проекта, можно различить реакцию крысы на запах в контрольном эксперименте с отдельным предъявлением биомаркера рака желудка 6-метил-5-гептен-2-она и на запах в эксперименте с предъявлением двухкомпонентных и трехкомпонентных смесей биомаркеров, включающих бензол, толуол, 6-метил-5-гептен-2-он. Для автоматического детектирования стимул-специфических откликов гломерул на биомаркеры: бензол, толуол, 6-метил-5-гептен-2-он с помощью нейросетевого классификатора, основанного на глубоком обучении, с использованием триплетной функции потерь, рассмотрена выборка данных (последовательностей изображений нейрооптических откликов на одоранты) двух крыс. Исходя из эффективности на реальных данных и на моделировании кальциевого отклика из 10 кодировщиков, предобученных на искусственных данных, выбран кодировщик №3 с наибольшей метрикой точности на валидационной выборке в сценарии с нормальным предобучением: сначала выполнялось предобучение на искусственных данных, затем – обучение на реальных данных. Точность на конец обучения составила 0.928. Вычислены евклидовы расстояния между энкодингами, соответствующими высокой концентрации эталонного вещества (6-метил 5 гептен-2-он), и энкодингами, соответствующими проверочным одорантам. Расстояния между энкодингами эталонных веществ и одорантов типа «помеха», как правило, не больше, чем между энкодингами эталонных запахов и энкодингами эталона в смеси. Для одной из протестированных крыс расстояния между энкодингами эталонного вещества и энкодингами одорантов типа «помеха» (бензол, толуол) больше, чем расстояния до энкодинга эталонного вещества в смеси с другими веществами, что говорит об успешном обучении кодировщика. Однако, аналогичные расстояния для другого животного отличаются слабо, что указывает на недостаточную обобщающую способность. Предполагается, что в перспективе расширение обучающей выборки добавлением данных в том же формате по другим крысам позволит повысить обобщающую способность основанного на глубоком обучении нейросетевого классификатора.

 

Публикации

1. Копелиович М.В., Петрушан М.В., Матухно А.Е., Лысенко Л.В. Towards detection of cancer biomarkers in human exhaled air by transfer-learning-powered analysis of odor-evoked calcium activity in rat olfactory bulb HELIYON, HLY 20173 (год публикации - 2023) https://doi.org/10.1016/j.heliyon.2023.e20173

2. Матухно А.Е., Петрушан М.В., Кирой В.Н., Арсеньев Ф.В., Лысенко Л.В. The method for assessment of local permutations in the glomerular patterns of the rat olfactory bulb by aligning interindividual odor maps Journal of Computational Neuroscience, Volume 51, Issue 4, Page 433-444 (год публикации - 2023) https://doi.org/10.1007/s10827-023-00858-8

3. Матухно А.Е., Петрушан М.В., Лысенко Л.В., Кирой В.Н. Биосенсорные системы: определение оптимальных временных параметров ольфакторной стимуляции Биофизика, № 6, т.68 (год публикации - 2023)

4. Щербань И.В., Федотова В.С., Кириленко Н.Е., Матухно А.Е., Щербань О.Г., Лысенко Л.В. Метод локализации пространственно-временных паттернов на последовательности биомедицинских изображений Информационные технологии, № 1, том 30, с. 42-49 (год публикации - 2024)


Возможность практического использования результатов
Мы рассматриваем представленную работу как технико-экономическое обоснование нового подхода, в котором стремимся доказать осуществимость детекции биомаркеров рака путем анализа кальциевых сигналов в обонятельной луковице крыс. Нестационарный характер активированных паттернов ограничивает использование традиционных подходов к обработке изображений. Текущее исследование является первым шагом на пути к разработке биогибридного подхода к скринингу рака, сочетающего сенсорные способности животных с математическим моделированием, компьютерным зрением и методами машинного обучения. Насколько нам известно, ранее не было сделано никаких сообщений о применении кальциевой активности гломерул обонятельной луковицы в биогибридной системе. Учитывая небольшой набор экспериментальных данных, собранных в рамках данного технико-экономического обоснования, можно ожидать низкую точность классификации. В связи с этим в рамках проекта впервые разработаны и апробированы два альтернативных метода анализа пространственно-временной динамики гломерулярной активности обонятельной луковицы крыс. 1) Машинное обучение с этапом предварительного обучения, на котором мы обучаем нашу модель глубокую сверточную нейронную сеть на синтетических данных. При этом подходе мы не стремились создать математически точную модель вызванной запахом кальциевой динамики и ее представление на изображениях. Вместо этого мы создали математическую модель, которая воспроизводит пространственно-временные закономерности, основанные на эмпирически наблюдаемых качествах, присущих реальным данным кальциевой визуализации; 2) Компактная математическая модель пространственно-временной динамики интенсивности флуоресценции кальциевых сигналов на последовательности изображений, разработанная посредством интерполяции радиальными базисными функциями каждого отдельного изображения. Последующая локализация структур искомых динамических паттернов средствами математического аппарата сингулярного спектрального анализа. Разработанные методы обеспечивают надежный автоматический поиск закономерностей, вызываемых биомаркерами онкологических заболеваний человека, позволяют классифицировать пространственно-временные паттерны вызванной биомаркерами кальциевой активности гломерул обонятельной луковицы с точностью равной и превышающей 0,7, и потенциально могут быть применены для распознавания широкого спектра одорантов.