КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ
Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.
ОБЩИЕ СВЕДЕНИЯ
Номер проекта 20-72-00106
НазваниеСоздание базы данных активных областей на Солнце на основе параметризации, построенной методами машинного обучения
Руководитель Илларионов Егор Александрович, Кандидат физико-математических наук
Организация финансирования, регион Федеральное государственное бюджетное образовательное учреждение высшего образования «Московский государственный университет имени M.В.Ломоносова» , г Москва
Конкурс №49 - Конкурс 2020 года «Проведение инициативных исследований молодыми учеными» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными
Область знания, основной код классификатора 02 - Физика и науки о космосе; 02-703 - Солнце и Солнечная система
Ключевые слова Солнечная активноть, активная область, нейронный сети, автоэнкодер, машинное обучение, база данных, солненая цикличность, космическая погода
Код ГРНТИ41.21.19
ИНФОРМАЦИЯ ИЗ ЗАЯВКИ
Аннотация
Наблюдения солнечной активности играют ключевую роль как для понимания общих процессов на Солнце, так и для решения оперативных задач прогноза космической погоды. Своевременное детектирование таких событий как корональные дыры, солнечные вспышки, корональные выбросы масс и оценка их геоэффективности позволяет оценивать риски для систем связи и навигации, спутниковых аппаратов и авиации. Исходными данными для анализа выступают, в первую очередь, изображения диска Солнца в различных длинах волн. На изображениях выделяют активные области, например, магнитные активные области или корональные дыры. Далее на основе конфигурации области и ее положения принимается решение о ее активности или вероятности произвести активное событие. Однако как показывает практика и исторический анализ, реальная эффективность прогнозов оказывается достаточно далека от желаемой. Более того, скорость накопления массива ежедневных наблюдений Солнца не приводит соответствующему росту точности, а сколь-либо детальному анализу подвергается лишь незначительная часть всех данных. Ситуация, очевидно, требует системного улучшения, который не кажется невозможным на фоне значительных успехов в области обработки и извлечения полезных связей в больших объемах данных в других областях. Целью предлагаемого проекта является привлечение современных методов машинного обучения для выделения признакового описания активных областей и создания на его основе базы данных активных областей. Разработанные модели и база данных будут ориентированы как на организации, вовлеченные в Службу Солнца для нужд прогноза, так и на исследования по солнечной активности. Для новых объектов система позволить проводить поиск структурно похожих объектов из базы, что актуально для оценки вероятности различных сценариев развития области. Для объектов из базы система позволит выделять группы схожих объектов, что интересно с точки зрения уточнения системы классификации. Таким образом, результаты работы будут актуальны далеко за рамками только текущего проекта.
При работе с современными наблюдательными данными одной из первых задач обычно встает необходимость значительного снижения размерности, прежде чем данные станут сколь-либо обозримы для последующих моделей. Однако традиционные пути введения количественных характеристик достаточно ограничены по своей выразительности. Так, говоря об активной области на Солнце, достаточно трудно как-то существенно разнообразить ее описание, помимо, например, подсчета площади, координат центра и, возможно, еще нескольких геометрических характеристик. Во-многом из-за ограниченности подобного описания и значительной потери информации на этом этапе последующие модели и расчеты часто оказываются достаточно далеки от реальных значений. В рамках проекта мы предлагаем новый взгляд на процесс построения характеристик областей, основанный на привлечении моделей машинного обучения. В качестве основного инструмента предлагается использовать нейронные сети типа автоэнкодеров.
На практике за пределами задач физики Солнца обучение и эксперименты с нейронными сетями типа автоэнкодеров известны достаточно хорошо. Цель подобных моделей состоит в том, чтобы найти прямое и обратное отображение входных данных, например, изображения, в вектор фиксированной размерности (обычно значительно меньшей, чем размерность исходных данных), чтобы исходное и восстановленное изображение минимально различались. Для обучения модели нужен датасет с примерами входных данных. Например, хорошо известны эксперименты, в которых изображения лиц кодировались в вектор небольшой длины и с минимальной ошибкой восстанавливались обратно. Более того, анализ показывал, что часть признаков имеет вполне понятную интерпретацию. Например, модели удавалось сформировать признаки, характеризующие форму носа, разрез глаз и другие черты лица. Еще более интересен тот факт, что пространству признаков можно придавать некоторые заранее предопределенные свойства, что облегчает его последующий анализ. Для этих целей применяются вариационные и условные автоэнкодеры. В приложении к задачам солнечной физики подобные модели будут впервые исследоваться систематически.
В рамках проекта мы будем использовать архив наблюдений Солнца со спутниковых и наземных телескопов и архив контуров активных областей Кисловодской горной астрономической станции ГАО РАН. Этот выбор обусловлен постоянством метода обработки наблюдений и ручным контролем качества данных, применяемым на данной обсерватории. На основе этого архиве мы проведем эксперименты с выбором архитектуры автоэнкодера, приводящей в наиболее показательным признакам. По итогам обучения модели мы получим признаковые описания для каждой активной области, которые станут основой для новой базы данных. Для интерпретации признаков будет выполнен анализ их широтно-временных распределений, циклической зависимости, корреляции с другими физическими параметрами. Этот этап, в частности, расширит наше представление о вариабельности форм и проявлений активных областей и, возможно, найдет свое объяснение или поставит новые вопросы перед теорией солнечной активности.
На следующем этапе будет сформирована база данных активных областей и реализованы инструменты работы с базой на основе вспомогательных моделей машинного обучения. Идея здесь состоит в том, чтобы ввести метрику в пространстве признаков, которая будет характеризовать степень похожести объектов. Отметим, что в отличие от наивного попиксельного сравнения, который, например, неустойчив с сдвигам, в данном подходе мы соотносим объекты по их структурным характеристикам. Далее, с помощью методов кластерного анализа мы сможем выделить группы схожих между собой областей, а для новых объектов осуществлять поиск похожих объектов в базе. Именно эта база данных, выведенная в открытый доступ, станет, по нашему мнению, одним из основных результатов проекта и будет актуальна для широкого спектра дальнейших исследований. Так, например, поиск похожих событий и анализ их развития в позволит лучше предсказывать сценарии развития текущего объекта, а анализ временных вариаций признаков позволит уточнить границы солнечных циклов и характеризовать уровень активности в целом.
ОТЧЁТНЫЕ МАТЕРИАЛЫ
Публикации
1.
Илларионов Е., Косовичев А., Тлатов А.
Machine-learning Approach to Identification of Coronal Holes in Solar Disk Images and Synoptic Maps
Astrophysical Journal, том 903, № 2 (год публикации - 2020)
10.3847/1538-4357/abb94d
2.
Тлатов А.Г., Илларионов Е.А., Березин И.А., Шрамко А.Д.
Прогнозирование солнечных вспышек и фоновых потоков рентгеновского излучения по данным синоптических наземных наблюдений с помощью методов машинного обучения
Космические исследования, том 58, номер 6 (год публикации - 2020)
10.31857/S0023420620060102
3.
Соколов Д.Д., Чикина А.А., Илларионов Е.А.
Mean Square Geodesic Deviation in the Zeldovich Problem on Light Propagation in a Universe with Inhomogeneities
Astronomy Reports, Vol. 65, No. 5, pp. 362–369. (год публикации - 2021)
10.1134/S1063772921050073
4. Райс М., Муглах К., Мёстль К., Ардж Ч., Бэли Р., Делуиль В., Гартон Т., Хамада А., Хофмайстер С.,Илларионов Е., Яролим Р., Кирк М., Косовичев А., Криста Л., Ли С., Лоудер К., Макнайк П., Верониг А. The Observational Uncertainty of Coronal Hole Boundaries in Automated Detection Schemes The Astrophysical Journal (год публикации - 2021)
5.
В. Садыков, И. Китиашвили, А.С. Дальда, В. Ориа, А. Косовичев, Е. Илларионов
Compression of Solar Spectroscopic Observations: a Case Study of Mg II k Spectral Line Profiles Observed by NASA's IRIS Satellite
2021 International Conference on Content-Based Multimedia Indexing (CBMI), c.1-6 (год публикации - 2021)
10.1109/CBMI50038.2021.9461879
6.
В. Садыков, Е. Илларионов
Как машинное обучение помогает изучать Солнце
Земля и Вселенная, №4, 2021 (год публикации - 2021)
10.7868/S0044394821040034
7.
Е.А. Илларионов, Д.Д. Соколов
Finite memory time and anisotropy effects for initial magnetic energy growth in random flow of conducting media
Physical Review E, том 104, № 1 (год публикации - 2021)
10.1103/PhysRevE.104.015214
8.
Илларионов Е.А., Тлатов А.Г.
Parametrization of sunspot groups based on machine learning approach
Solar Physics, Sol Phys 297, 19 (2022) (год публикации - 2022)
10.1007/s11207-022-01955-0
Публикации
1.
Илларионов Е., Косовичев А., Тлатов А.
Machine-learning Approach to Identification of Coronal Holes in Solar Disk Images and Synoptic Maps
Astrophysical Journal, том 903, № 2 (год публикации - 2020)
10.3847/1538-4357/abb94d
2.
Тлатов А.Г., Илларионов Е.А., Березин И.А., Шрамко А.Д.
Прогнозирование солнечных вспышек и фоновых потоков рентгеновского излучения по данным синоптических наземных наблюдений с помощью методов машинного обучения
Космические исследования, том 58, номер 6 (год публикации - 2020)
10.31857/S0023420620060102
3.
Соколов Д.Д., Чикина А.А., Илларионов Е.А.
Mean Square Geodesic Deviation in the Zeldovich Problem on Light Propagation in a Universe with Inhomogeneities
Astronomy Reports, Vol. 65, No. 5, pp. 362–369. (год публикации - 2021)
10.1134/S1063772921050073
4. Райс М., Муглах К., Мёстль К., Ардж Ч., Бэли Р., Делуиль В., Гартон Т., Хамада А., Хофмайстер С.,Илларионов Е., Яролим Р., Кирк М., Косовичев А., Криста Л., Ли С., Лоудер К., Макнайк П., Верониг А. The Observational Uncertainty of Coronal Hole Boundaries in Automated Detection Schemes The Astrophysical Journal (год публикации - 2021)
5.
В. Садыков, И. Китиашвили, А.С. Дальда, В. Ориа, А. Косовичев, Е. Илларионов
Compression of Solar Spectroscopic Observations: a Case Study of Mg II k Spectral Line Profiles Observed by NASA's IRIS Satellite
2021 International Conference on Content-Based Multimedia Indexing (CBMI), c.1-6 (год публикации - 2021)
10.1109/CBMI50038.2021.9461879
6.
В. Садыков, Е. Илларионов
Как машинное обучение помогает изучать Солнце
Земля и Вселенная, №4, 2021 (год публикации - 2021)
10.7868/S0044394821040034
7.
Е.А. Илларионов, Д.Д. Соколов
Finite memory time and anisotropy effects for initial magnetic energy growth in random flow of conducting media
Physical Review E, том 104, № 1 (год публикации - 2021)
10.1103/PhysRevE.104.015214
8.
Илларионов Е.А., Тлатов А.Г.
Parametrization of sunspot groups based on machine learning approach
Solar Physics, Sol Phys 297, 19 (2022) (год публикации - 2022)
10.1007/s11207-022-01955-0