КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 22-71-10061

НазваниеМетоды оценки и контроля предсказательной способности моделей социо-экономических процессов в условиях многомасштабного дрейфа предсказуемости данных

РуководительЧунаев Петр Владимирович, Кандидат физико-математических наук

Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет ИТМО", г Санкт-Петербург

Период выполнения при поддержке РНФ 07.2022 - 06.2025 

Конкурс№71 - Конкурс 2022 года «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными.

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах, 01-211 - Математическое моделирование социальных и экономических процессов

Ключевые словамоделирование социо-экономических процессов, качество предсказательного моделирования, предсказуемость данных, машинное обучение, комплексные сети, временные ряды, цепочки событий

Код ГРНТИ28.17.19


СтатусЗакрыт досрочно


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Проект направлен на разработку методов оценки и контроля предсказательной способности моделей социо-экономических процессов в условиях многомасштабного дрейфа предсказуемости данных. Решение указанной проблемы представляется крайне актуальным в условиях постоянного повышения доступности данных о процессах в социо-экономических системах и количества подходов к их предсказательному моделированию, потому что позволяет не только оценить границы доступного качества моделирования на классах данных и моделей социо-экономической сферы, но и за счет выявления разрыва между внутренней (присущей данным) и реализованной (наблюдаемой в контексте выбранной модели) предсказуемостью данных разных типов выяснить, ограничивается эффективность прогнозирования качеством и количеством данных или способностью выбранной предиктивной модели объяснить эти данные. Естественными инструментами в этом контексте являются генеративные модели построения классов данных с заданным уровнем предсказуемости, с использованием которых возможно построение экстремальных примеров данных для «стрессовых» оценок предсказательной способности моделей социо-экономических процессов. Динамические варианты указанных генеративных моделей в свою очередь позволяют осуществлять контроль качества моделирования при различных сценариях дрейфа предсказуемости данных на разных масштабах. Научная значимость решения проблемы определяется: - созданием методов анализа предсказуемости данных разных типов (временных рядов, цепочек событий, темпоральных сетей и пр.) и их использования для априорной оценки наилучшего доступного качества предиктивных моделей на этих данных; - созданием методов учета взаимосвязи внутренней и реализованной (в контексте модели) предсказуемости данных социо-экономической сферы для получения априорных оценок качества моделей; - разработкой унифицированных подходов к контролю предсказательной способности моделей социо-экономических процессов в условиях многомасштабного дрейфа предсказуемости данных. В рамках поставленной научной проблемы планируется решение задач по следующим направлениям: (I) разработка и исследование методов априорной оценки предсказуемости для различных типов данных (рядов, транзакционных данных, сложных сетей и др.) и моделей социо-экономических процессов; (II) разработка и исследование методов генерации параметрических классов данных с заданной предсказуемостью для различных задач машинного обучения (анализ временных рядов, цепочек событий (транзакций), разработка рекомендательных систем, выделение сообществ и восстановление связей в сложных сетях); (III) разработка и исследование методов оценки границ наилучшего доступного качества моделирования на основе метрик предсказуемости для различных классов данных и моделей социо-экономической сферы; (IV) разработка и исследование методов прогнозирования социо-экономических процессов в условиях многомасштабного дрейфа предсказуемости данных. Научная новизна поставленных задач определяется применением методического аппарата оценки и анализа компонент предсказуемости различных классов данных (синтетических и реального мира) для оценки, контроля и улучшения предсказательной способности моделей социо-экономических процессов. Данный методический аппарат имеет следующие отличительные особенности: - предполагает систематическую оценку качества моделей (в том числе машинного обучения) на данных с дрейфом предсказуемости, при котором объекты меняют свои качества в ходе эволюции системы; - делается акцент на предсказуемости как на характеристике данных (как некоем присущем им свойстве) и на исследовании ее границ в динамике; - используются методы генерации синтетических данных для оценки и контроля качества моделей сложных систем; - осуществляется выделение подклассов данных по качеству их прогнозирования (реализованной предсказуемости) путем стратификации. В совокупности создание и развитие методов в этом направлении приведет к созданию нового подхода к эмпирическому моделированию динамики социо-экономических систем и к повышению эффективности методов оценки и контроля предсказательной способности моделей социально-экономических систем в условиях многомасштабного дрейфа предсказуемости данных.

Ожидаемые результаты
Общие ожидаемые результаты проекта: 1. Набор методов динамической оценки предсказуемости потоковых данных (и их представлений), их стратификации по уровню предсказуемости, а также методов контроля предсказательной способности предиктивных моделей в терминах предсказуемости потоковых данных на различных масштабах. 2. Набор методов генерации наборов данных с заданным классом предсказуемости, а также методов построения экстремальных примеров данных для «стрессовых» оценок качества моделирования в рамках конкретных задач машинного обучения (анализ временных рядов и цепочек событий, построение рекомендательных систем, выделение сообществ и восстановление связей в сложных сетях). 3. Набор методов оценки границ наилучшего доступного качества предиктивных моделей социо-экономических процессов для данных с заданным классом предсказуемости. 4. Метод мета-обучения для получения априорных оценок предсказуемости и границ наилучшего доступного качества моделирования социо-экономических процессов. 5. Экспериментальный образец программного комплекса предсказательного моделирования социо-экономических процессов, включающий компоненты оценки границ наилучшего доступного качества прогнозов и их учета при прогнозировании социо-экономических процессов в условиях многомасштабного дрейфа предсказуемости данных. 6. Результаты экспериментальных исследований, демонстрирующие функциональные возможности, масштабируемость и производительность программного комплекса, а также применимость полученных научных и технологических решений для предметных примеров социо-экономической сферы. В совокупности в ходе реализации проекта будут созданы методические и технологические решения для оценки, контроля и улучшения предсказательной способности моделей социо-экономических процессов в условиях многомасштабного дрейфа предсказуемости данных. Практическим результатом проекта является технологическая реализация разработанных методов и алгоритмов в виде программного комплекса предсказательного моделирования социо-экономических процессов с поддержкой, среди прочего, динамической оценки и контроля предсказательной способности моделей в терминах предсказуемости поступающих потоковых данных; моделирования и прогнозирования социо-экономических процессов с оценкой качества воспроизведения ретроспективных данных на разных масштабах с учетом предсказуемости этих ретроспективных данных; автоматическим выбором структуры и параметров генеративных моделей для генерации классов данных с различной предсказуемостью и тестирования предиктивных моделей на таких данных; визуализации пространственно-временной динамики социо-экономических процессов с отображением агрегированных статистик для данных с разными свойствами предсказуемости. Работа программного комплекса будет продемонстрирована на следующих предметных примерах: - деятельность контрагентов в финансово-экономических сетях и пользователей в социальных сетях; - транзакционное поведение клиентов банков и других коммерческих организаций; - отслеживание состояния финансово-экономических систем в терминах порождаемых ими временных рядов и цепочек событий. Результаты проекта позволят создать опережающий научно-технологический задел в области моделирования динамических социо-экономических систем с учетом предсказуемости моделируемых данных. Соответствие ожидаемых результатов мировому уровню исследований подтверждается, во-первых, тенденцией к комплексированию предсказательных моделей на базе машинного обучения, наличием неразрешенных проблем неполноты и неопределенности исходных данных, во-вторых, отсутствием комплексных решений для моделирования социо-экономических систем в условиях многомасштабного дрейфа предсказуемости данных. Практическая значимость проекта определяется применимостью разработанных методов, моделей и алгоритмов в системах анализа и оптимизации информационных воздействий, включая рекомендательные системы, системы планирования маркетинговых и рекламных кампаний, а также в системах поддержки принятия управленческих решений для сетей продаж и сервисного обслуживания клиентов (в сферах ритейла, персональных услуг, государственных и муниципальных предприятиях).


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ