КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

ОБЩИЕ СВЕДЕНИЯ

Номер 22-19-00364

НазваниеРазработка прикладных систем технического зрения видимого, инфракрасного и гиперспектрального режима съемки на основе одно- и мультиапертурных дифракционно-оптических систем и методов глубокого обучения

РуководительНиконоров Артем Владимирович, Доктор технических наук

Организация финансирования, регион Федеральное государственное бюджетное учреждение "Национальный исследовательский центр "Курчатовский институт", г Москва

Период выполнения при поддержке РНФ

2022 г. - 2024 г.

Конкурс№68 - Конкурс 2022 года «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами».

Область знания, основной код классификатора 09 - Инженерные науки, 09-608 - Инженерно-технические и информационные автоматизированные системы мониторинга биоресурсов, биосферы и технических систем

Ключевые словаВычислительная фотография, обработка изображений, дифракционная оптика, реконструкция изображений, гиперспектральные данные, глубокое обучение, сверточные нейронные сети, трансформеры

Код ГРНТИ28.23.33

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ

Аннотация
Настоящий проект является развитием ряда прорывных результатов, полученных исполнителями при разработке уникальных компонентов фотоники на основе дифракционно-оптических элементов, изображающих дифракционно-оптических и компактных гиперспектрометров. По версии издания РИА Новости, полученные результаты входят в десятку российских изобретений, которые способны изменить мир [https://ria.ru/abitura_research/20180410/1518308349.html]. Разработанные элементы имеют ряд значительных преимуществ перед существующими аналогами, в весе, габаритах и простоте изготовления. Мультиапертурные решения на основе дифракционной оптики делают возможным создание высокоразрешающих систем технического зрения с широким углом обзора, малый вес которых делает возможным их установку на малые БПЛА и наноспутники. Основной научной проблемой проекта является создание прикладных систем технического зрения видимого, инфракрасного и гиперспектрального режима съемки на основе одно- и мультиапертурных дифракционно-оптических систем и методов глубокого обучения. Разрабатываемые системы технического зрения на основе дифракционной оптики позволят получить принципиально новые технические решения для распределенного сбора данных в видимом и гиперспектральном диапазонах при помощи мобильных сенсоров, с возможностью установки на малые БПЛА и наноспутники. Такие решения актуальны для различных сфер цифровой экономики, анализа окружающей обстановки и анализа данных ДЗЗ. Одной из главных исследуемых в настоящем проекте научных проблем является комплексирование данных различных сенсоров (sensor fusion) с целью расширения функционала и повышения качества анализа окружающей обстановки. Такое объединение информации с нескольких оптических систем позволяет исправить недостатки отдельных сенсоров и делает возможным использование мультимодальных нейросетевых моделей, таких как визуальные трансформеры, для анализа полученных данных. Проект соответствует Стратегии научно-технологического развития Российской Федерации, направлению Н1, включающему такие сквозные цифровые технологии, как искусственный интеллект, сенсорика, обработка и анализ данных большого объема. Выполняемый проект согласно государственной программе «Цифровая экономика Российской Федерации» формирует исследовательские компетенции и технические заделы для направления цифровое сельское хозяйство, строительство, промышленность и энергетика.

Ожидаемые результаты
1. Разработка методов и технологий создания мультиапертурных систем и компактных гиперспектрометров на основе дифракционной оптики, совместимых с мобильными устройствами. 2. Развитие методов и нейросетевых алгоритмов реконструкции, обеспечивающих повышение качества изображений в системах технического зрения на основе дифракционной оптики. 3. Создание методов и алгоритмов комплексирования изображений различных модальностей для решения прикладных задач анализа окружающей обстановки. 4. Разработка мультимодальных нейростевых алгоритмов одновременной реконструкции и анализа изображений дифракционно-оптических систем для решения прикладных задач перспективных отраслей цифровой экономики, таких как умный город, цифровое сельское хозяйство и индустрия 4.0. 5. Разработка методов, алгоритмов и информационных технологий интеграции систем технического зрения на основе дифракционной оптики с программно-аппаратной платформой мобильных устройств с учетом возможности использования нейропроцессоров.

ОТЧЁТНЫЕ МАТЕРИАЛЫ

Аннотация результатов, полученных в 2022 году
Проведенные в рамках первого этапа проекта исследования показали, что задача нейросетевой реконструкции изображений в дифракционно-оптических системах, родственна задаче сверхразрешения по одному изображению (SISR, single image super-resolution). В последних работах по SISR используется в качестве модели деградации используется размытие локальным, пространственно-инвариантным ядром. Такая модель существенно упрощает обработку, и, в частности, позволяет использовать для решения задачи SISR нейронные сети с достаточно небольшим полем зрения (narrow receptive field), порядка 40-50 пикселов. Ключевые отличия задачи реконструкции изображений в дифракционно-оптических системах состоят в более сложной модели деградаций изображения. Показано, что такие искажения не являются пространственно-инвариантными и зависят от всего контекста изображения, т.е. можно говорить о контекстно-зависимых искажениях, и как следствие требуют использования нейросетевых моделей с широким полем зрения (wide receptive field), от 200-400 пикселов. Дальнейшие исследования в проекте будут сосредоточены на сетях такого класса и/или последовательной обработке изображения сетями с широким и узким полем зрения. Ключевым этапом калибровки алгоритмов реконструкции изображений на основе сквозной нейросетевой технологии безусловно является процедура обучения сети, основанная на сформированной обучающей выборке. Фактически, процедура формирования обучающей выборки и является ключевым этапом калибровки системы под конкретный сенсор или дифракционно-оптическую систему. Эта процедура становится тем более критичной, с учетом того, что изменение условий съемки и/или устройства съемки могут приводить к существенному уровню артефактов реконструкции, особенно в случае обучения по малым и нулевым выборкам (zero-shot/few-shot learning, FSL/ZSL). В рамках проекта разработаны следующие методы, позволяющие существенно снизить уровень артефактов нейросетевой реконструкции. Предложен критерий ложных контуров (false edges level, FEL), позволяющий проводить контроль уровня артефактов реконструкции по изображениям реальной сцены без необходимости сопоставления с эталонным изображением, в том числе для сценариев ZSL/FSL. Также предложены алгоритмы аугментации обучающей выборки на основе добавления ISO-шума камеры с использованием комбинации распределений Пуассона и Гаусса, и сдвига экспозиции изображения. Разработанные алгоритмы обучения с использованием критерия FEL и предложенной аугментации позволили существенно снизить уровень артефактов реконструкции. Разработаны новые методы и технологии создания изображающих мультиапертурных дифракционно-оптических систем, совместимых с мобильными устройствами. А именно, разработана трехлинзовая дифракционно-оптическая система [3*] и гибридный рефракционно-дифракционный объектив. Гибридный объектив в результате примененной нейросетевой реконструкции с применением методов компенсации артефактов реконструкции позволил поднять качество выше 28 дБ по критерию пикового отношения сигнал-шум (PSNR). Разработаны методы реконструкции, основанные на модифицированной архитектуре U-net с широким полем зрения позволяющие успешно выполнять реконструкцию как для однолинзовых, так и для гибридных и многолинзовых дифракционно-оптических систем. Разработаны малопараметрические процедурные методы цветовой коррекции для камер с неизвестной моделью регистрации изображения на основе аппроксимации тонокомпенсирующего сплайна и цветокорректирующей матрицы, позволяющие проводить цветовую коррекцию как в классических, так и в дифракционно-оптических системах. Для дифракционно-оптических систем разработанные методы позволяют решать задачи адаптивной цветовой коррекции по единичному образцу, реализуя single-shot learning подход. Для гибридной системы удалось получить цветовую коррекцию с отклонением менее 0,6 dE от образца, что является крайне высоким показателем даже для классических систем.

Публикации

1. Бибиков С.А., Петров М.В., Алексеев А.П., Алиев М.В., Парингер Р.А., Гошин Е.В., Серафимович П.Г., Никоноров А.В. Метод цветовой консистентности для камер с неизвестной моделью Компьютерная оптика, Т. 47, №1, С.92-103 (год публикации - 2023) https://doi.org/10.18287/2412-6179-CO-1205

2. Евдокимова В.В., Бибиков С.А., Никоноров А.В. Meta-Learning Approach in Diffractive Lens Computational Imaging Pattern Recognition and Image Analysis, Pattern Recognit. Image Anal. 32, 466–468 (2022). (год публикации - 2022) https://doi.org/10.1134/S1054661822030117

3. Степаненко С.О., Евдокимова В.В., Петров М.В., Бланк В.А., Скиданов Р.В., Никоноров А.В. Получение цветных изображений системой на основе трех дифракционных линз Компьютерная оптика, - (год публикации - 2023)

Аннотация результатов, полученных в 2023 году
Компактные и легкие дифракционные оптические элементы являются перспективной заменой длиннофокусной рефракционной оптики в системах компьютерного зрения, однако, существенные оптические искажения сужают область применения дифракционной оптики. Настоящий этап проекта направлен на совершенствование оптических схем изображающих систем на основе дифракционных оптических элементов и нейростевых методов реконструкции изображений. В раках второго этапа проекта изготовлены следующие макетные образцы изображающих систем на основе дифракционной оптики. Два макетных образца систем технического зрения на основе дифракционной оптки: трехапертурная система и гибридная дифракционно-рефракционная система. Два макетных образца сверхкомпактных сканирующих гиперспектрометров с дифракционными диспергирующеми элементами. Штативный гиперспектрометр с массой 0.67 кг, и гиперспектральный микроскоп массой 0.16 кг, оба гиперспектрометра имеют 250 спектральных каналов в диапазоне 400-1000 нм. Созданные образцы гиперспектральных камер и разработанные пространственно-спектральные нейросетевые классификаторы были использованы для решения задач анализа медицинских микропрепаратов и классификации минерального состава почв с точностью более 96%. Была разработана двухэтапная процедура сквозной нейросетевой реконструкции которая обеспечивает качество от 25.8 дБ до 28.32 дБ по критерию PSNR для разных дифракционно-оптических систем. Максимальное качество в 28.32 дБ полученое для гибридной системы превосходит мировые аналоги. Полученное качество превосходит показатели ряда существующих технологий обработки видео, в частности, современные показатели для повышения качества видео в реальном времени на основе обучаемых таблиц поиска (learnable LUT) находятся в диапазоне 25-26 дБ. Таким образом можно утверждать, что качество получаемых после нейросетевой реконструкции изображений сопоставимо с и даже превосходит качество необходимое для решения ряда задач технического зрения. Столь высокие результаты были получены с использованием двух этапов нейросетевой рекоснтрукции включающих в себя сеть с большим рецептивным полем типа энкодер-декодер с кроссвязями (типа UNet) для полнокадровой реконструкции и трансформерную сеть типа RCAN с поканальным внутренним вниманием для локальной реконструкции. Разработанные алгоритмы аугментации и критерий ложных контуров, позволили провести эффективную адаптацию к реальным условиям съемки и существенно уменьшить артефакты реконструкции, возникающие вследствие различий в доменах изображений, использованных при обучении и в реальной съемке. На настоящем этапе проекта разработан малопараметрический алгортм коррекции цветовых искажений в дифракционно-оптических системах, развивающий подход, впервые предложенный на первом этапе настоящего проекта. Показано, что предложенный малопараметрический алгоритм цветовой коррекции на основе цветокорректирующей матрицы и тонокорректирующего сплайна позволяет существенно, на 0,61 DE, увеличить точность цветопередачи в изображающих дифракционно-оптических системах. Для решения задачи доменной адаптации нейростевых моделей по малым выборкам в рамках настоящего проекта предложен и теоретически обоснован метод крупношагового метаобучения. В рамках второго этапа были разработаны алгоритмы доменной адаптации нейросетевых моделей обнаружения аномалий и нейросетевой реконструкции изображений. В результате был показан прирост точности от 5 до 12 процентов по сравнению с трансферным обучением и существенное улучшение визуального качества реконструкции, которое также подтверждается существенным улучшением согласно предложенному критерию ложных контуров с 32,1% до 7,3%, так же по сравнению с результатами на основе трансферного обучения.

Публикации

1. Евдокимова В.В., Подлипнов В.В., Ивлиев Н.А., Петров М.В., Ганчевская С.В., Fursov V.A., Yuzifovich Y., Stepanenko S.O., Kazanskiy N.L., Nikonorov A.V., Skidanov R.V. Hybrid Refractive-Diffractive Lens with Reduced Chromatic and Geometric Aberrations and Learned Image Reconstruction Sensors, Т. 23, № 1, С. 415 (год публикации - 2023) https://doi.org/10.3390/s23010415

2. Евдокимова В.В., Рябов В.Д., Алексеев А.П., Никоноров А.В. Исследование метаобучения для нейросетевой реконструкции изображений в дифракционно-оптических системах Информационные процессы, Т. 23, № 3, C. 335–342 (год публикации - 2023) https://doi.org/10.53921/18195822_2023_23_3_335

3. Жердева Л.А., Минаев Е.Ю., Фирсов Н.А. Building surface damage recognition based on synthetic data 2023 IX International Conference on Information Technology and Nanotechnology (ITNT), С. 1-6. (год публикации - 2023) https://doi.org/10.1109/ITNT57377.2023.10139288

4. Н.С. Давыдов, В.В. Евдокимова, П.Г. Серафимович, В.И. Проценко, А.Г. Храмов, А.В. Никоноров Нейросетевая технология обнаружения ступенчатых аномалий в параметрах движения головы для функциональной МРТ с адаптацией на основе метаобучения Компьютерная оптика, Т. 47, № 6. – С. 991-1001. (год публикации - 2023) https://doi.org/10.18287/2412-6179-CO-1337

5. Петров М.В., Бибиков С.А., Серафимович П.Г., Никоноров А.В. Малопараметрический алгоритм цветовой коррекции изображений в дифракционно-оптических системах Информационные процессы, Т. 23, № 3 (год публикации - 2023) https://doi.org/10.53921/18195822_2023_23_3_343

6. Пирогов А.В., Никоноров А.В., Музыка А.А., Макаров А.Р., Рыськова Д.Д., Ивлиев Н.А., Подлипнов В.В., Фирсов Н.А., Борискин П.В. Hyperspectral images neural network analysis of unstained micropreparations 2023 IX International Conference on Information Technology and Nanotechnology (ITNT), С. 1-5 (год публикации - 2023) https://doi.org/10.1109/ITNT57377.2023.10139173

7. Рыськова Д.Д., Никоноров А.В., Пирогов А.В., Макаров А.Р., Скиданов Р.В., Музыка А.А., Подлипнов В.В., Фирсов Н.А., Ивлиев Н.А., Лобанов В.Е. Neural network classification of soils with different carbon and calcium content based 2023 IX International Conference on Information Technology and Nanotechnology (ITNT), С. 1-4 (год публикации - 2023) https://doi.org/10.1109/ITNT57377.2023.10139139