КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ
Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.
ОБЩИЕ СВЕДЕНИЯ
Номер проекта 18-71-00156
НазваниеРазработка методов стохастического интеллектуального анализа данных с реализацией в виде гетерогенных вычислительных сервисов цифровой платформы
Руководитель Горшенин Андрей Константинович, Доктор физико-математических наук
Организация финансирования, регион федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской академии наук" , г Москва
Конкурс №29 - Конкурс 2018 года по мероприятию «Проведение инициативных исследований молодыми учеными» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными
Область знания, основной код классификатора 01 - Математика, информатика и науки о системах; 01-202 - Интеллектуальный анализ данных и распознавание образов
Ключевые слова сервис, цифровая платформа, гетерогенные вычисления, смешанные вероятностные модели, интеллектуальный анализ данных
Код ГРНТИ27.43.51
ИНФОРМАЦИЯ ИЗ ЗАЯВКИ
Аннотация
Проект направлен на исследование и развитие вероятностно-статистических подходов, основанных на методологии зашумления выборок, использовании сеточных EM-алгоритмов, в том числе и для обучения нейронных сетей, модификации классических подходов теории экстремальных значений и т.п., для обработки реальных данных из различных предметных областей с реализацией в виде гетерогенного вычислительного научного сервиса в рамках цифровой платформы и апробацией на высокопроизводительной аппаратной базе Центра обработки данных ФИЦ ИУ РАН как объекте современной исследовательской инфраструктуры. Математическую основу развиваемых в рамках данного проекта методов составляют смешанные вероятностные модели, хорошо зарекомендовавшие себя при решении различных задач, связанных с анализом потоков данных различной природы.
Наиболее современный подход к обработке больших массивов сложноструктурированных данных основан на использовании технологий вычислений на графических процессорах (GPU), прежде всего на основе решений NVIDIA CUDA. Привлекательность применения графических процессоров для научных исследований связана с их относительно низкой стоимостью, сочетающейся со значительной производительностью и возможностью реализации достаточно точных численных методов в широком спектре задач математического моделирования реальных процессов. Наибольшую популярность приобретают гибридные решения, использующие возможности видеокарт для быстрой параллельной обработки данных совместно с традиционными вычислениями на базе центрального процессора, представляющие собой основу так называемых гетерогенных вычислений.
В рамках современной исследовательской парадигмы доступ к таким ресурсам и алгоритмам можно эффективно осуществлять за счет использования цифровых платформ, представляющих собой совокупность как технических, так и научно-инновационных решений. Использование цифровых платформ соответствует задачам программы «Цифровая экономика Российской Федерации» и ведет к формированию нового подхода к проведению научных исследований, отвечающего самым современным требованиям, в частности, актуальной парадигме Data-Intensive Science, в рамках которой постулируется факт возможности получения значимых научных результатов только на основе анализа огромных массивов данных, накопленных в конкретных предметных областях.
Актуальность данных исследований также обусловлена необходимостью автоматизации исследовательских процессов и создания соответствующих аналитических инструментов и методов, которые обеспечат пользователей набором алгоритмов с единой реализацией. Такой подход гарантирует воспроизводимость результатов для максимально широкой группы исследователей – и возможные различия в результатах анализа будут свидетельствовать только об особенностях в структуре данных и отличиях в настройках методов.
ОТЧЁТНЫЕ МАТЕРИАЛЫ
Публикации
1.
Горшенин А.К.
Зашумление данных конечными смесями нормальных и гамма-распределений с применением к задаче округления наблюдений
Информатика и ее применения, Т. 12. Вып. 3. C. 28–34. (год публикации - 2018)
10.14357/19922264180304
2.
Горшенин А.К.
Развитие сервисов цифровых платформ для преодоления нефинансовых барьеров
Информатика и ее применения, Т. 12. Вып. 4. C. 106–112. (год публикации - 2018)
10.14357/19922264180415
3. Батанов Г.М., Борзосеков В.Д., Горшенин А.К., Харчев Н.К., Королев В.Ю., Сарксян К.А. Evolution of statistical properties of microturbulence during transient process under electron cyclotron resonance heating of the L-2M stellarator plasma Plasma Physics and Controlled Fusion (год публикации - 2019)
4. Горшенин А.К., Лебедева М.А., Лукина С.С., Яковлева А.А. On handling the missing values in precipitation records using machine learning algorithms Материалы XXII Международной научной конференции DCCN-2019, М.: РУДН, 2019. – С. 258–265. (год публикации - 2019)
5.
Горшенин А.К., Мартынов О.П.
Гибридные модели экстремального градиентного бустинга для восстановления пропущенных значений в данных об осадках
Информатика и ее применения, Т. 13. Вып. 3. C. 34–40. (год публикации - 2019)
10.14357/19922264190306
6.
Горшенин А.К., Лебедева М.А., Лукина С.С., Яковлева А.А.
Application of machine learning algorithms to handle missing values in precipitation data
Lecture Notes in Computer Science, Vol. 11965. P. 563-577. (год публикации - 2019)
10.1007/978-3-030-36614-8_43
7.
Королев В.Ю., Горшенин А.К.
Probability models and statistical tests for extreme precipitation based on generalized negative binomial distributions
Mathematics, Vol. 8. Iss. 4. Art. No. 604 (год публикации - 2020)
10.3390/math8040604
Публикации
1.
Горшенин А.К.
Зашумление данных конечными смесями нормальных и гамма-распределений с применением к задаче округления наблюдений
Информатика и ее применения, Т. 12. Вып. 3. C. 28–34. (год публикации - 2018)
10.14357/19922264180304
2.
Горшенин А.К.
Развитие сервисов цифровых платформ для преодоления нефинансовых барьеров
Информатика и ее применения, Т. 12. Вып. 4. C. 106–112. (год публикации - 2018)
10.14357/19922264180415
3. Батанов Г.М., Борзосеков В.Д., Горшенин А.К., Харчев Н.К., Королев В.Ю., Сарксян К.А. Evolution of statistical properties of microturbulence during transient process under electron cyclotron resonance heating of the L-2M stellarator plasma Plasma Physics and Controlled Fusion (год публикации - 2019)
4. Горшенин А.К., Лебедева М.А., Лукина С.С., Яковлева А.А. On handling the missing values in precipitation records using machine learning algorithms Материалы XXII Международной научной конференции DCCN-2019, М.: РУДН, 2019. – С. 258–265. (год публикации - 2019)
5.
Горшенин А.К., Мартынов О.П.
Гибридные модели экстремального градиентного бустинга для восстановления пропущенных значений в данных об осадках
Информатика и ее применения, Т. 13. Вып. 3. C. 34–40. (год публикации - 2019)
10.14357/19922264190306
6.
Горшенин А.К., Лебедева М.А., Лукина С.С., Яковлева А.А.
Application of machine learning algorithms to handle missing values in precipitation data
Lecture Notes in Computer Science, Vol. 11965. P. 563-577. (год публикации - 2019)
10.1007/978-3-030-36614-8_43
7.
Королев В.Ю., Горшенин А.К.
Probability models and statistical tests for extreme precipitation based on generalized negative binomial distributions
Mathematics, Vol. 8. Iss. 4. Art. No. 604 (год публикации - 2020)
10.3390/math8040604