КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 14-11-00823

НазваниеВысокопроизводительные вычислительные технологии усвоения данных в гибридных динамических моделях для прогнозирования поведения сложных систем

РуководительБухановский Александр Валерьевич, Доктор технических наук

Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет ИТМО", г Санкт-Петербург

Период выполнения при поддержке РНФ 2017 г. - 2018 г. 

Конкурс Конкурс на продление сроков выполнения проектов, поддержанных грантами Российского научного фонда по приоритетному направлению деятельности Российского научного фонда «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами».

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах, 01-412 - Суперкомпьютерное моделирование: инструментальные средства, прикладное программное обеспечение и сервисы

Ключевые словаРаспределенные вычисления, инструментальная среда, прогнозирование, сложная система, усвоение данных, ансамбль, параллельный эволюционный алгоритм, облачная среда, композитное приложение

Код ГРНТИ28.17.19


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Проект в целом направлен на повышение эффективности методов прогнозирования поведения сложных систем (СС) за счет усвоения данных текущих наблюдений за их характеристиками. В рамках исследований 2014-2016 г. разработано семейство методов оперативного и ретроспективного усвоения данных в дискретных и непрерывных моделях CC различных предметных областей на основе мультипопуляционного генетического алгоритма (МПГА), использующего ансамбль популяций, соответствующих различным сценариям эволюции СС. Продемонстрирована применимость данного подхода для решения задач прогнозирования нагонных наводнений, динамики городской транспортной системы, пешеходной мобильности и распространения информации в социальных сетях Интернет. В 2017-2018 г. планируется обобщением разработанного подхода на DDA-модели СС со слабоформализованной структурой, в которых усвоение данных учитывает как изменчивость параметров и свойств отдельных элементов, так и саму структуру связей моделей, что реализуется путем симбиоза ранее разработанных методов усвоения на основе МПГА с технологиями извлечения знаний о процессах из больших баз данных (т.н. Process Mining, PM). В ходе выполнения проекта будет разработан математический формализм для описания семейства информационных и математических моделей СС со слабоформализованной структурой, пригодных для реализации PM в логике усвоения (ассимиляции) данных, обобщены методы усвоения данных и построения прогностических ансамблей для моделей СС со слабоформализованной структурой, разработаны метод и параллельный алгоритм усвоения данных на основе коэволюционного (иерархического) МПГА, осуществляющего одновременно настройку параметров и структуры связей по ходу наблюдения эволюции самой СС, разработан высокопроизводительный программный комплекс усвоения данных в модели СС со слабоформализованной структурой и проведены экспериментальные исследования на его основе. Новизна постановки задач обусловлена возможностью интерпретации подхода PM как варианта усвоения данных, в котором результатом усвоения является подстройка одновременно и количественных, и структурных характеристик модели. В отличие от существующих подходов, такая постановка обеспечивает робастность к пропускам и засорениям исходных данных, а также позволяет реализовать аппарат оценивания неопределенности как меры качества восстановления модели СС по исходным базам данных (журналам событий информационных систем). Практическая апробация результатов исследований будет проведена на примере задачи повышения качества оказания медицинской помощи кардиологическим пациентам с острым коронарным синдромом; она реализуется на основе уникальной базы данных (~6 тыс. пациентов), предоставленной Северо-Западным федеральным медицинским исследовательским центром (СЗФ МИЦ) им. В.А. Алмазова.

Ожидаемые результаты
1) Общий метод усвоения данных и построения прогностических ансамблей для моделей СС со слабоформализованной структурой, обеспечивающий динамическую идентификацию как количественных характеристик, так и структуры связей средствами PM. 2) Параллельный алгоритм усвоения данных на основе коэволюционного (иерархического) МПГА, осуществляющего одновременно настройку параметров и структуры связей по ходу наблюдения эволюции самой СС. 3) Процедура ансамблевого прогнозирования динамики СС со слабоформализованной структурой на основе механизмов усвоения данных, реализуемых совокупно с PM. 4) Процедура оценки качества прогнозов и качества восстановления связей (структуры) СС посредством сочетания технологий PM и усвоения данных, основанная на композиции вероятностных критериев по точности, заблаговременности и реактивности прогнозов. 5) Экспериментальный образец программной системы усвоения данных в модели СС со слабоформализованной структурой, включающий модули сбора и агрегации данных, собственно PM, моделирования, усвоения данных, ансамблевого прогнозирования и визуализации (включая комплект программной и эксплуатационной документации). 6) Методика практического применения разработанных методов и технологий в современных задачах управления здравоохранением. Уровень запланированных результатов соответствует мировому, что косвенно обеспечивается общей актуальностью тематики, уровнем международной апробации существующего научного задела, а также участием коллектива в международной коллаборации – европроекте HORIZON'2020 СOMPAT (Computing Patterns for High Performance Multiscale Computing). Результаты проекта могут быть использованы для создания информационно-аналитических систем и систем поддержки принятия решения по управлению бизнес-процессами в областях, для которых характерна высокая вариативность ресурсов и неопределенность условий их использования (например, для эффективной организации современного здравоохранения).


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2017 году
В ходе выполнения проекта в 2017 г. было проведено исследование возможностей по реализации процедур усвоения и предсказательного моделирования для моделей сложных систем (СС) со слабоформализованной структурой (С4) с использованием возможностей моделей, методов и алгоритмов интеллектуального анализа процессов (process mining, PM). В ходе исследований были проанализированы и систематизированы возможности PM по построению моделей СС. Разработан общий метод усвоения данных и построения прогностических ансамблей для моделей С4, обеспечивающий динамическую идентификацию количественных характеристик, структуры связей средствами PM. В частности, была разработана общая схема построения моделей С4, в которой учтена возможность автоматизации работы с количественными, структурными и функциональными параметрами системы в части идентификации моделей и усвоения данных. Также была разработана общая формальная структура сложных моделей (СМ). Разработан общий метод усвоения данных, расширяющий реализованные ранее в рамках данного проекта решения за счет введения обобщенного метода представления и анализа пространства структурных параметров СС в форме графовой структуры, формируемой на основании анализа прецедентов. Разработан параллельный алгоритм усвоения данных на основе коэволюционного (иерархического) МПГА, осуществляющего одновременно настройку параметров и структуры связей по ходу наблюдения эволюции самой СС. В составе данного алгоритма разработан метод на основе совместной (ко)эволюции графового представления пространства возможных структур модели С4 и популяции экземпляров моделей. В качестве рабочего примера были реализованы экспериментальные решения, демонстрирующие на примере моделей PM для анализа процессов оказания медицинской помощи пациентам с острым коронарным синдромом (ОКС) в специализированном медицинском центре. Реализована процедура ансамблевого прогнозирования динамики С4 на основе механизмов усвоения данных, реализуемых на основе интеграции методов PM и интеллектуального анализа данных (data mining, DM). В качестве рабочего примера был реализован механизм предсказательного моделирования для оперативного предсказания кластера в рамках эпизода ОКС. Разработана архитектура программной системы усвоения данных в С4, включающая модули сбора и агрегации данных, PM, моделирования, усвоения данных, ансамблевого прогнозирования и визуализации. В рамках расширения архитектуры, разработанной на предыдущих этапах проекта, на этом этапе была детализована и структурирована архитектура модулей обработки знаний в контексте методов PM и DM. Для проведения дальнейших экспериментальных исследований были разработаны прототипы нескольких модулей и баз для использования в рамках задач моделирования процессов оказания медицинской помощи (используемых в качестве основных рабочих примеров для данного проекта). Проведены экспериментальные исследования, демонстрирующие эффективность использования разработанного подхода (на примере медицинских данных по оказанию помощи пациентам с острым коронарным синдромом). Для проведения экспериментальных исследований была использована база медицинской информационной системы (МИС) НМИЦ им. В.А. Алмазова. Используемая копия базы содержит электронные медицинские карты с данными о лечении пациентов с 2009 по 2016 год (490 тыс. пациентов). База содержит ретроспективные данные о лечении пациентов более чем 4873 нозологий. В частности, с использованием сформированного набора данных был разработан прототип экспериментального средства интерактивной визуализации графовых структур с возможной интерпретацией процессов и характеристик отдельных пациентов и их групп. Кроме того, с использованием разработанных подходов, методов и средств были выявлены, проанализированы и интерпретированы 10 кластеров пациентов с ОКС, полученные в результате анализа клинических путей с идентификацией типовых клинических путей (моделей процессов) для каждого кластера и медицинским обоснованием специфики каждого из них. По результатам идентификации кластеров была построена имитационная дискретно-событийная модель для анализа процесса обслуживания потока пациентов с ОКС группой ключевых отделений (отделения кардиологии (стационар), реанимации и хирургии). В рамках исследования идентификации структуры моделей С4 был реализован ряд экспериментальных исследований, направленных на идентификацию имитационных моделей клинических процессов.

 

Публикации

1. Болгова Е.В., Звартау Н.Е., Ковальчук С.В., Балахонцева М.А., Мецкер О.Г. Improving Electronic Medical Records with Support of Human Computer Interaction in Medical Information Systems Procedia Computer Science, - (год публикации - 2017)

2. Буханов Н., Балахонцева М., Крикунов А., Сабиров А., Семакова А., Звартау Н., Конради А. Clustering of comorbidities based on conditional probabilities of diseases in hypertensive patients Procedia Computer Science, — 2017. — Vol. 108. — pp. 2478-2487 (год публикации - 2017) https://doi.org/10.1016/j.procs.2017.05.073

3. Вишератин А.А., Трофименко Т.Б., Мухина К.Д., Насонов Д., Бухановский А.В. A multi-layer model for diffusion of urgent information in mobile networks Journal of Computational Science, — 2017. — Vol. 20. — pp. 129-142 (год публикации - 2017) https://doi.org/10.1016/j.jocs.2017.02.002

4. Деревицкий И.,Кротов Е., Волошин Д., Яковлев А., Ковальчук С., Карбовский В. Simulation of emergency care for patients with ACS in Saint Petersburg for ambulance decision making Procedia Computer Science, — 2017. — Vol. 108. — pp. 2210-2219 (год публикации - 2017) https://doi.org/10.1016/j.procs.2017.05.178

5. Ноймани Д., Никитин Н.О., Калюжная А.В. Urban Pluvial Flood Forecasting using Open Data with Machine Learning Techniques in Pattani Basin Procedia Computer Science, — 2017. — Vol. 119. — pp. 288-297 (год публикации - 2017) https://doi.org/10.1016/j.procs.2017.11.187

6. Пресбитеро Л., Квакс Р., Кржижановская В., Слоот П. Anomaly Detection in Clinical Data of Patients Undergoing Heart Surgery Procedia Computer Science, – 2017. – Т. 108. – С. 99-108. (год публикации - 2017) https://doi.org/10.1016/j.procs.2017.05.002

7. Семакова А., Звартау Н., Боченина К., Конради А. Towards Identifying of Effective Personalized Antihypertensive Treatment Rules from Electronic Health Records Data Using Classification Methods: Initial Model rocedia Computer Science, - (год публикации - 2017)

8. Функнер А.А., Яковлев А.Н., Ковальчук С.В. Data-driven modeling of clinical pathways using electronic health records Procedia Computer Science, - (год публикации - 2017)

9. Функнер А.А., Яковлев А.Н., Ковальчук С.В. Имитационное моделирование нагрузки на группу ключевых отделений специализированного медицинского центра в ходе обслуживания разнородного потока пациентов на примере острого коронарного синдрома Восьмая всероссийская научно-практическая конференция «Имитационное моделирование. Теория и практика» ИММОД-2017., Восьмая всероссийская научно-практическая конференция «Имитационное моделирование. Теория и практика» ИММОД-2017. Труды конференции, 2017, сс. 550-553. (год публикации - 2017)

10. - Облачные вычисления второго поколения: Система CLAVIRE https://habrahabr.ru, 17.01.2017 г. (год публикации - )


Аннотация результатов, полученных в 2018 году
В ходе выполнения проекта в 2018 г. была разработана процедура оценки качества прогнозов и качества восстановления связей (структуры) СС посредством сочетания технологий PM и усвоения данных, основанная на композиции вероятностных критериев по точности, заблаговременности и реактивности прогнозов. В рамках процедуры задействованы методы интеллектуального анализа данных (data mining, DM) и процессов (process mining, PM), машинного обучения и эволюционных вычислений для построения и применения моделей СС со слабоформализованной структурой (С4). В рамках предложенной процедуры, совмещенной с разработанными ранее принципами иерархического контроля сложных моделей (на уровне моделирования, настройки моделей, решения прикладных задач), была предложена общая схема, обеспечивающая контроль моделирования на уровнях модели, данных и системы. Был разработан экспериментальный образец программной системы усвоения данных в модели СС со слабоформализованной структурой, включающий модули сбора и агрегации данных, собственно PM, моделирования, усвоения данных, ансамблевого прогнозирования и визуализации (включая комплект программной и эксплуатационной документации). Архитектура системы усвоения данных представляет собой схему взаимодействия элементов информационного процесса с целью выявления классов и подклассов моделей и кластеров с внедрением результатов анализа в информационный цикл. В рамках разработки дополнительных компонентов программной системы были реализованы системные и прикладные компоненты. Системные компоненты призваны расширить функциональность программной системы или повысить качество решения стоящих перед ней задач. Прикладные компоненты ориентированы на реализацию отдельных решений в рамках моделирования процессов оказания медицинской помощи как основного рабочего примера в рамках продолжения проекта в 2017-2018 гг. Были проведены экспериментальные исследования, демонстрирующие функциональные возможности и производительность программной системы на выбранных тестовых примерах. Использовано несколько прикладных тестовых задач, принципиально выбранных из различных областей и имеющих различную степень проработки в рамках проекта, а именно: А) Задача ансамблевого моделирования в гидрометеорологии в качестве плановой использовалась на протяжении базовой части проекта и его продолжения. Б) Задача предсказательного моделирования комплексных процессов оказания медицинской помощи и течения заболеваний на данных НМИЦ им. В.А. Алмазова на примере острых и хронических заболеваний кардиологического профиля. Данная задача была выбрана в качестве базового примера для продолжения проекта как характерный пример процесса в С4. В) Задача моделирования судопроизводства выбрана в качестве экспериментальной в рамках оценки перспектив трансляции полученных решений в другие области. Для исследуемых процессов, несмотря на жесткую регламентированность, характерна высокая вариабельность в деталях и времени протекания отдельных этапов процесса. В рамках предварительного анализа была выявлена потенциальная возможность персонификации и влияния региональной специфики, и пр. Была разработана методика практического применения разработанных методов и технологий в современных задачах управления здравоохранением. Методика основана на взаимодействии программной системы, формализации эмпирических знаний, процессов анализа, управления моделями (в т.ч. усвоения данных). На основе важности предикторов, полноты данных МИС и результатов анализа данных разработаны индикаторы качества оказания помощи (на примере острым пациентам с сердечно-сосудистыми заболеваниями). Для корректной оценки, предсказания и прогнозирования индикаторов используется разработанный в рамках данного проекта двухфазный эволюционный алгоритм. В итоге, в рамках предложенной методики возможно мониторирование данных количественных показателей индикаторов качества оказания медицинской помощи в задачах управления здравоохранением.

 

Публикации

1. Абухай Т.М., Ковальчук С.В., Балахонцева М.А., Бухановский А.В. Моделирование, анализ и прогнозирование процессов оказания кардиологической помощи в стационаре Известия высших учебных заведений. Приборостроение, Т. 61, № 8. С. 730—733. (год публикации - 2018) https://doi.org/10.17586/0021-3454-2018-61-8-730-733

2. Арайа-Лопес Х.Л., Никитин Н.О., Калюжная А.В. Case-adaptive ensemble technique for met-ocean data restoration Procedia Computer Science, Vol. 136, pp. 311–320 (год публикации - 2018) https://doi.org/10.1016/j.procs.2018.08.283

3. Вычужанин П.В., Хватов А.А., Калюжная А.В. Anomalies Detection in Metocean Simulation Results Using Convolutional Neural Networks Procedia Computer Science, Vol. 136, pp. 321–330 (год публикации - 2018) https://doi.org/10.1016/j.procs.2018.08.282

4. Ковальчук С.В., Мецкер О.Г., Функнер А.А., Кисляковский И.О., Никитин Н.О., Калюжная А.В., Ваганов Д.А., Боченина К.О. A Conceptual Approach to Complex Model Management with Generalized Modelling Patterns and Evolutionary Identification Complexity, Vol. 2018, Article ID 5870987 (год публикации - 2018) https://doi.org/10.1155/2018/5870987

5. Ковальчук С.В., Москаленко М.А., Яковлев А.Н. Towards Model-Based Policy Elaboration on City Scale Using Game Theory: Application to Ambulance Dispatching Lecture Notes in Computer Science, Vol. 10860, pp. 404–417 (год публикации - 2018) https://doi.org/10.1007/978-3-319-93698-7_31

6. Ковальчук С.В., Функнер А.А., Мецкер О.Г., Яковлев А.Н. Simulation of patient flow in multiple healthcare units using process and data mining techniques for model identification Journal of Biomedical Informatics, Vol. 82, pp. 128-142 (год публикации - 2018) https://doi.org/10.1016/j.jbi.2018.05.004

7. Мецкер О.Г., Трофимов Е, Сикорский С.А., Ковальчук С.В. Text and Data Mining Techniques in Judgment Open Data Analysis for Administrative Practice Control Communications in Computer and Information Science, Vol. 947 (год публикации - 2018)

8. Мецкер О.Г., Яковлев А.Н., Болгова Е.В., Васин А., Ковальчук С.В. Identification of Pathophysiological Subclinical Variances During Complex Treatment Process of Cardiovascular Patients Procedia Computer Science, Vol. 138, pp. 161-168 (год публикации - 2018) https://doi.org/10.1016/j.procs.2018.10.023

9. Насонов Д., Бутаков Н.А., Мельник М.М., Вишератин А.А., Линев А., Швец П.А., Соболев С.И., Мухина К.Д. The multi-level adaptive approach for ecient execution of multi-scale distributed applications with dynamic workload Суперкомпьютерные дни в России: Труды международной конференции (24-25 сентября 2018 г., г. Москва), 2018, С. 600- 611. (год публикации - 2018)

10. Семакова А.А., Звартау Н.Э., Ковальчук С.В., Бухановский А.В. Многомасштабное популяционное моделирование процессов развития и лечения артериальной гипертензии Известия высших учебных заведений. Приборостроение, Т. 61, № 10. С. 922—929. (год публикации - 2018) https://doi.org/10.17586/0021-3454-2018-61-10-922-929

11. Фу С., Пресбитеро А.В., Ковальчук С.В., Кржижановская В.В. Coupling Game Theory and Discrete-Event Simulation for Model-Based Ambulance Dispatching Procedia Computer Science, Vol. 136, pp. 398-407 (год публикации - 2018) https://doi.org/10.1016/j.procs.2018.08.274

12. Функнер А.А., Кисляковский И.О., Мецкер О.Г., Яковлев А.Н. Evolutionary approach to modeling of clinical pathways with static and dynamic model identification 2018 XXI IEEE International Conference on Soft Computing and Measurements / Сборник трудов XXI Международной конференции по мягким вычислениям и измерениям СПбГЭТУ "ЛЭТИ", - (год публикации - 2018)

13. Арайа Лопес Хосе Луис, Никитин Николай Олегович, Калюжная Анна Владимировна, Косухин Сергей Сергеевич, Бухановский Александр Валерьевич Программный комплекс для адаптивного ансамблевого восстановления пропусков в гидрометеорологических данных -, 2018664149 от 12.11.2018 (год публикации - )


Возможность практического использования результатов
В рамках рекомендаций по использованию результатов НИР в реальном секторе экономики можно выделить несколько категорий решений, приобретающих преимущество при использовании результатов НИР: аналитические решения, получающие преимущества за счет идентификации структуры и функциональных характеристик С4; системы на основе предсказательного моделирования (в т.ч. СППР, рекомендательные систем, системы оценки рисков), обеспечивающие более качественное решение поставленной проблемы за счет более точного моделирования С4; системы оптимизации работы С4 и процессов в них, получающие возможность заблаговременной оценки эффекта от изменения структуры или характеристик СС.