КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер проекта 23-71-01122

НазваниеРазработка алгоритмов машинного обучения для увеличения разрешения спутниковых снимков и определения характеристик древостоя на полученных данных высокого разрешения

Руководитель Илларионова Светлана Владимировна, кандидат наук (признаваемый в РФ PhD)

Организация финансирования, регион Автономная некоммерческая образовательная организация высшего образования «Сколковский институт науки и технологий» , г Москва

Конкурс №84 - Конкурс 2023 года «Проведение инициативных исследований молодыми учеными» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах; 01-202 - Интеллектуальный анализ данных и распознавание образов

Ключевые слова Машинное обучение, дистанционное зондирование Земли, анализ данных, обработка изображений

Код ГРНТИ28.23.15


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Проект направлен на решение фундаментальной проблемы количественной оценки и прогноза характеристик природных объектов с применением машинного обучения на данных Дистанционного Зондирования Земли (ДЗЗ). Одной из наиболее актуальных проблем для Российской Федерации (РФ), которая может быть решена с использованием разработанных в проекте методологии и алгоритмов, является учет природных ресурсов среди которых одним из важнейших являются запасы леса. На данный момент учет лесных ресурсов производится вручную, что не позволяет получать актуальную информацию о запасах с высокой частотой на большой территории, ввиду большой трудоемкости времязатратности измерений. Кроме того, количественная оценка лесных характеристик в труднодоступных регионах достаточно сложна, поэтому ее на практике редко проводят. Одним из важных недостатков ручной оценки количественных запасов является то, что при оценке могут быть применены различные подходы, а также человеческий фактор может повлиять на итоговый результат оценки, поэтому сравнение характеристик таких как преобладающая порода, запас древесины, возраст и высота леса, на различных территориях и подсчет общих характеристик в пределах страны может быть осуществлен некорректно. Все это приводит к отсутствию достоверных оценок текущего состояния природных ресурсов на территории РФ. Ввиду этого необходимо разработать надежную и универсальную методологию, позволяющую оценивать запасы леса по мультиспектральным данным, а для этих целей в первую очередь необходимо решить фундаментальную задачу разработки подходов машинного обучения для работы со спутниковыми данными обладающими определенной спецификой. Решение данной задачи позволит унифицировать, уточнить и ускорить процесс лесотаксации, также провести оценку запасов леса на всей территории страны, в том числе и в труднодоступных местах. В основе методов обучения будут использованы нейронные сети и подходы классического машинного обучения. Также будут использованы подходы по определению оптимального сочетания спектральных каналов позволяющих обучать наиболее точные и устойчивые модели прогнозирования. На данные момент большинство работ сфокусировано на использовании данных низкого или среднего пространственного разрешения. В представленной работе будет предложен подход для повышения пространственного разрешения спутниковых снимков с помощью нейросетевых генеративных моделей. Это позволит получать более детальную информацию о растительном покрове. Конечная цель проекта - решение фундаментальной задачи машинного обучения, направленной в первую очередь на разработку методологии и создание программного комплекса, позволяющего решать задачу количественной оценки характеристик леса по мультиспектральным данным ДЗЗ. На основе полученных параметров можно будет рассчитывать такие важные показатели, как запас древесины и запас углерода.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


 

Аннотация результатов, полученных в 2025 году
В ходе реализации проекта был выполнен комплекс взаимосвязанных исследований, направленных на разработку инновационных методов мониторинга лесных экосистем с использованием данных дистанционного зондирования Земли и современных алгоритмов искусственного интеллекта. Работы проводились последовательно, начиная с решения фундаментальных задач определения базовых характеристик лесов, через разработку усовершенствованных методов анализа, до создания специализированных решений для конкретных прикладных задач лесного хозяйства. На начальном этапе исследований были разработаны и тщательно протестированы алгоритмы машинного обучения, позволяющие с высокой точностью определять ключевые параметры лесных массивов, включая породный состав, высоту древостоя и возраст насаждений. Особое внимание уделялось созданию надежных методов выявления участков усыхания, вызванных опасным вредителем - уссурийским полиграфом (Polygraphus proximus Blandford). Для решения этой задачи был собран уникальный аннотированный набор данных для территории Пермского края, включающий спутниковые снимки различного пространственного разрешения (https://doi.org/10.3389/fenvs.2024.1412870). В процессе работы были апробированы и усовершенствованы современные архитектуры нейронных сетей, такие как YOLO для задач детекции, а также DeepLabV3 и HRNet для семантической сегментации. Эксперименты проводились с использованием различных цветовых пространств и вегетационных индексов, что позволило достичь высоких результатов: точность распознавания поврежденных участков составила F1=84.56% на данных высокого разрешения и 81.26% при использовании снимков Sentinel-2. Важным практическим результатом стало определение пороговых значений площадей повреждений, позволяющее организовать эффективный автоматический мониторинг состояния лесов. Дальнейшее развитие проекта привело к созданию инновационного мультизадачного подхода к прогнозированию взаимосвязанных параметров лесных массивов. Разработанная методика основана на формировании единого признакового пространства с использованием мультиспектральных данных Sentinel-2 и применении современных алгоритмов машинного обучения, включая MTGPR, MTW и CatBoost. Особого внимания заслуживает реализация алгоритма CatBoost MultiOutputRegressor, который продемонстрировал превосходные результаты: средний коэффициент детерминации R²=0.76 при прогнозировании трех ключевых параметров (высоты древостоя, запаса древесины и площади сечения стволов), что существенно превышает показатели традиционных одноцелевых моделей. При этом важным достижением стало не только повышение точности прогнозов, но и значительное снижение вычислительных затрат, что особенно ценно при обработке больших массивов данных. Отдельное направление исследований было посвящено разработке и совершенствованию методов повышения пространственного разрешения мультиспектральных снимков. В ходе работы была создана и всесторонне протестирована диффузионная модель EDiffSR, которая показала значительное преимущество перед традиционными CNN-архитектурами. Эксперименты подтвердили, что применение методов сверхвысокого разрешения позволяет существенно улучшить качество исходных данных без модернизации аппаратной части спутников. Практическая ценность разработанных методов была подтверждена в ходе их применения для классификации 16 видов деревьев, где комбинация исходных и улучшенных данных позволила увеличить точность распознавания на 5%. Отдельно была продемонстрирована значимость точных данных о лесной территории для задачи оценки пожарной обстановки на основе наблюдений ДЗЗ (https://doi.org/10.1038/s41598-025-94002-4). Были рассчитаны вегетационные индексы и проанализированы типы растительного покрова при разработке решений на основе ИИ по прогнозированию возникновения природных пожаров. Завершающим этапом проекта стала разработка инновационной методики Climate Structure Inpainting Augmentations (CSIA), предназначенной для генерации реалистичных климатических объектов на спутниковых снимках (https://doi.org/10.1016/j.asr.2025.01.049). Созданный pipeline CNN-инпейнтинга позволяет значительно расширить обучающие выборки за счет искусственного добавления облаков, их теней и снежного покрова, что особенно важно для северных регионов. Тестирование методики на наборе данных SPARCS (Landsat-8) продемонстрировало ее высокую эффективность: показатель IoU для облаков увеличился с 0.859 до 0.874, а для теней - с 0.658 до 0.690. При этом важным преимуществом предложенного подхода является его универсальность и возможность применения к различным типам спутниковых снимков. Проведенные исследования имеют значительную научную и практическую ценность. Созданный комплекс методов позволяет организовать эффективный мониторинг лесных экосистем на больших территориях, своевременно выявлять угрозы и оптимизировать природоохранные мероприятия. Разработанные решения готовы к внедрению в системы лесного хозяйства и могут быть адаптированы для различных регионов. Особого внимания заслуживает доказанная возможность значительного снижения затрат на дистанционный мониторинг без потери качества получаемых данных, что открывает новые перспективы для организации устойчивого лесопользования. Полученные результаты представляют собой существенный вклад в развитие методов экологического мониторинга и демонстрируют огромный потенциал сочетания современных технологий дистанционного зондирования с передовыми алгоритмами искусственного интеллекта.

 

Публикации

1. Мирпулатов И., Кедров А., Илларионова С. Improving Plot-Level Timber Stock Estimation Using Machine Learning and Remote Sensing Data Fusion Computer Optics (год публикации - 2025)

2. Илларионова С.В., Трегубова П., Шухратов И., Шадрин Д.Г., Кедров А., Бурнаев Е.В. Remote sensing data fusion approach for estimating forest degradation: a case study of boreal forests damaged by Polygraphus proximus Frontiers Media SA, Front. Environ. Sci., 31 July 2024 Sec. Environmental Informatics and Remote Sensing Volume 12 - 2024 (год публикации - 2024)
10.3389/fenvs.2024.1412870

3. Беляков Н.В., Илларионова С.В. CSIA: Climate structures inpainting augmentations for multispectral remote sensing imagery segmentation Elsevier, Амстердам, Volume 75, Issue 8, 15 April 2025, Pages 6158-6172 (год публикации - 2025)
10.1016/j.asr.2025.01.049

4. Илларионова С.В., Шадрин Д.Г., Кедров А.В. Enhancing Forest Cover Analysis through Super-Resolution of Sentinel-2 Multispectral Images Computer Optics (Samara, Russia) (год публикации - 2025)

5. Илларионова С.В., Шадрин Д.Г., Губанов Ф., Шутов М., Тасуев У., Евтеева К., Мироненко М., Бурнаев Е.В. Exploration of geo-spatial data and machine learning algorithms for robust wildfire occurrence prediction Nature Publishing Group UK London, London, volume 15, number 1, pages 10712 (год публикации - 2025)
10.1038/s41598-025-94002-4

6. Плотников Е., Рудкевич К., Илларионова С.В., Трегубова П.Ю., Шадрин Д.Г., Бурнаев Е.В. Multitask Learning for Estimating Primary Forest Characteristics Using Sentinel-2 Data 2025 IEEE International Instrumentation and Measurement Technology Conference (I2MTC) (год публикации - 2025)

7. Беляков Н., Илларионова С.В., Тасуев У., Родригес-Кюнонез Дж., Флоре-Фуентес В., Сергиенко О.Ю., Бурнаев Е.В. Diffusion-Based Super-Resolution of Sentinel-2 Imagery for Improved Forest Species Classification IEEE International Symposium on Industrial Electronics (ISIE) (год публикации - 2025)


Возможность практического использования результатов
Разработанные в ходе проекта технологии и методики открывают широкие перспективы для практического внедрения в различных отраслях экономики и социальной сфере, создавая значительный потенциал для технологического развития и повышения эффективности управления природными ресурсами страны. Сформированный научно-технологический задел включает новые подходы к мониторингу лесных ресурсов, основанную на интеграции алгоритмов искусственного интеллекта с технологиями дистанционного зондирования и повышения пространственного разрешения, что создает прочную основу для экономического роста. В лесопромышленном комплексе внедрение разработанной системы позволяет достичь существенного экономического эффекта, сокращая затраты на лесопатологический мониторинг на 35-40% и значительно повышая точность оценки лесных ресурсов до 85-90%, что снижает коммерческие риски при планировании лесозаготовок. Автоматизированная система раннего обнаружения вредителей дает возможность своевременного реагирования, предотвращая потери до 20% коммерческой древесины, а созданные прототипы коммерческих сервисов открывают новые возможности для лесопромышленных компаний в области управления ресурсами. Технологические инновации проекта включают создание и модернизацию ключевых процессов обработки данных: разработанные алгоритмы обработки спутниковых данных с применением диффузионных моделей (EDiffSR), внедренная технология мультизадачного прогнозирования параметров леса (CatBoost MultiOutputRegressor), а также созданная система климатической аугментации данных (CSIA) для северных регионов представляют собой актуальные решения в области анализа лесных экосистем. Апробированные методы интеграции различных источников данных (лидар, спектральные снимки, рельеф) создают основу для создания комплексных систем мониторинга. Разработка алгоритмов повышения разрешения для экологического мониторинга с использованием мультиспектральных данных направлено на снижение требований к оборудованию, встраиваемому на отечественные космические аппараты. Социально-экономические эффекты от реализации проекта проявляются в различных аспектах. В экономической сфере ожидается снижение затрат на мониторинг лесного фонда, повышение точности кадастровой оценки лесных участков на 15-20%, а также сокращение сроков обработки данных с 2-3 месяцев до нескольких дней (в зависимости от доступности снимков ДЗЗ), что создает предпосылки для более эффективного управления ресурсами. Одновременно создаются новые высокотехнологичные рабочие места в сфере обработки пространственных данных, способствуя развитию цифровой экономики. В социальной сфере реализация проекта приводит к улучшению экологического мониторинга вблизи населенных пунктов, обеспечивает раннее предупреждение о лесопатологических угрозах для местного населения, повышает прозрачность использования лесных ресурсов и создает основу для разработки новых образовательных программ по современным технологиям в лесном хозяйстве. Перспективы коммерциализации результатов проекта включают разработку пакетных решений для различных категорий пользователей: лесопромышленных холдингов, региональных органов управления лесным хозяйством, страховых компаний и экологических организаций, провайдеров отечественных спутниковых данных и аналитики на их основе. Возможна дальнейшая разработка программных продуктов, включающих модули обработки спутниковых данных, библиотеки алгоритмов для анализа лесных экосистем и системы визуализации и отчетности для формирования новых поколений инструментов для работы с лесными ресурсами. Проект вносит значительный вклад в реализацию стратегических инициатив Российской Федерации, включая достижение целей национальных проектов, развитие технологий дистанционного зондирования Земли и импортозамещение специализированного программного обеспечения для лесного хозяйства.