КАРТОЧКА
ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ
Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.
ОБЩИЕ СВЕДЕНИЯ
Номер 22-71-10061
НазваниеМетоды оценки и контроля предсказательной способности моделей социо-экономических процессов в условиях многомасштабного дрейфа предсказуемости данных
РуководительЧунаев Петр Владимирович, Кандидат физико-математических наук
Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет ИТМО", г Санкт-Петербург
Период выполнения при поддержке РНФ | 07.2022 - 06.2025 |
Конкурс№71 - Конкурс 2022 года «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными.
Область знания, основной код классификатора 01 - Математика, информатика и науки о системах, 01-211 - Математическое моделирование социальных и экономических процессов
Ключевые словамоделирование социо-экономических процессов, качество предсказательного моделирования, предсказуемость данных, машинное обучение, комплексные сети, временные ряды, цепочки событий
Код ГРНТИ28.17.19
СтатусЗакрыт досрочно
ИНФОРМАЦИЯ ИЗ ЗАЯВКИ
Аннотация
Проект направлен на разработку методов оценки и контроля предсказательной способности моделей социо-экономических процессов в условиях многомасштабного дрейфа предсказуемости данных.
Решение указанной проблемы представляется крайне актуальным в условиях постоянного повышения доступности данных о процессах в социо-экономических системах и количества подходов к их предсказательному моделированию, потому что позволяет не только оценить границы доступного качества моделирования на классах данных и моделей социо-экономической сферы, но и за счет выявления разрыва между внутренней (присущей данным) и реализованной (наблюдаемой в контексте выбранной модели) предсказуемостью данных разных типов выяснить, ограничивается эффективность прогнозирования качеством и количеством данных или способностью выбранной предиктивной модели объяснить эти данные. Естественными инструментами в этом контексте являются генеративные модели построения классов данных с заданным уровнем предсказуемости, с использованием которых возможно построение экстремальных примеров данных для «стрессовых» оценок предсказательной способности моделей социо-экономических процессов. Динамические варианты указанных генеративных моделей в свою очередь позволяют осуществлять контроль качества моделирования при различных сценариях дрейфа предсказуемости данных на разных масштабах.
Научная значимость решения проблемы определяется:
- созданием методов анализа предсказуемости данных разных типов (временных рядов, цепочек событий, темпоральных сетей и пр.) и их использования для априорной оценки наилучшего доступного качества предиктивных моделей на этих данных;
- созданием методов учета взаимосвязи внутренней и реализованной (в контексте модели) предсказуемости данных социо-экономической сферы для получения априорных оценок качества моделей;
- разработкой унифицированных подходов к контролю предсказательной способности моделей социо-экономических процессов в условиях многомасштабного дрейфа предсказуемости данных.
В рамках поставленной научной проблемы планируется решение задач по следующим направлениям: (I) разработка и исследование методов априорной оценки предсказуемости для различных типов данных (рядов, транзакционных данных, сложных сетей и др.) и моделей социо-экономических процессов; (II) разработка и исследование методов генерации параметрических классов данных с заданной предсказуемостью для различных задач машинного обучения (анализ временных рядов, цепочек событий (транзакций), разработка рекомендательных систем, выделение сообществ и восстановление связей в сложных сетях); (III) разработка и исследование методов оценки границ наилучшего доступного качества моделирования на основе метрик предсказуемости для различных классов данных и моделей социо-экономической сферы; (IV) разработка и исследование методов прогнозирования социо-экономических процессов в условиях многомасштабного дрейфа предсказуемости данных.
Научная новизна поставленных задач определяется применением методического аппарата оценки и анализа компонент предсказуемости различных классов данных (синтетических и реального мира) для оценки, контроля и улучшения предсказательной способности моделей социо-экономических процессов. Данный методический аппарат имеет следующие отличительные особенности:
- предполагает систематическую оценку качества моделей (в том числе машинного обучения) на данных с дрейфом предсказуемости, при котором объекты меняют свои качества в ходе эволюции системы;
- делается акцент на предсказуемости как на характеристике данных (как некоем присущем им свойстве) и на исследовании ее границ в динамике;
- используются методы генерации синтетических данных для оценки и контроля качества моделей сложных систем;
- осуществляется выделение подклассов данных по качеству их прогнозирования (реализованной предсказуемости) путем стратификации.
В совокупности создание и развитие методов в этом направлении приведет к созданию нового подхода к эмпирическому моделированию динамики социо-экономических систем и к повышению эффективности методов оценки и контроля предсказательной способности моделей социально-экономических систем в условиях многомасштабного дрейфа предсказуемости данных.
Ожидаемые результаты
Общие ожидаемые результаты проекта:
1. Набор методов динамической оценки предсказуемости потоковых данных (и их представлений), их стратификации по уровню предсказуемости, а также методов контроля предсказательной способности предиктивных моделей в терминах предсказуемости потоковых данных на различных масштабах.
2. Набор методов генерации наборов данных с заданным классом предсказуемости, а также методов построения экстремальных примеров данных для «стрессовых» оценок качества моделирования в рамках конкретных задач машинного обучения (анализ временных рядов и цепочек событий, построение рекомендательных систем, выделение сообществ и восстановление связей в сложных сетях).
3. Набор методов оценки границ наилучшего доступного качества предиктивных моделей социо-экономических процессов для данных с заданным классом предсказуемости.
4. Метод мета-обучения для получения априорных оценок предсказуемости и границ наилучшего доступного качества моделирования социо-экономических процессов.
5. Экспериментальный образец программного комплекса предсказательного моделирования социо-экономических процессов, включающий компоненты оценки границ наилучшего доступного качества прогнозов и их учета при прогнозировании социо-экономических процессов в условиях многомасштабного дрейфа предсказуемости данных.
6. Результаты экспериментальных исследований, демонстрирующие функциональные возможности, масштабируемость и производительность программного комплекса, а также применимость полученных научных и технологических решений для предметных примеров социо-экономической сферы.
В совокупности в ходе реализации проекта будут созданы методические и технологические решения для оценки, контроля и улучшения предсказательной способности моделей социо-экономических процессов в условиях многомасштабного дрейфа предсказуемости данных.
Практическим результатом проекта является технологическая реализация разработанных методов и алгоритмов в виде программного комплекса предсказательного моделирования социо-экономических процессов с поддержкой, среди прочего, динамической оценки и контроля предсказательной способности моделей в терминах предсказуемости поступающих потоковых данных; моделирования и прогнозирования социо-экономических процессов с оценкой качества воспроизведения ретроспективных данных на разных масштабах с учетом предсказуемости этих ретроспективных данных; автоматическим выбором структуры и параметров генеративных моделей для генерации классов данных с различной предсказуемостью и тестирования предиктивных моделей на таких данных; визуализации пространственно-временной динамики социо-экономических процессов с отображением агрегированных статистик для данных с разными свойствами предсказуемости. Работа программного комплекса будет продемонстрирована на следующих предметных примерах:
- деятельность контрагентов в финансово-экономических сетях и пользователей в социальных сетях;
- транзакционное поведение клиентов банков и других коммерческих организаций;
- отслеживание состояния финансово-экономических систем в терминах порождаемых ими временных рядов и цепочек событий.
Результаты проекта позволят создать опережающий научно-технологический задел в области моделирования динамических социо-экономических систем с учетом предсказуемости моделируемых данных.
Соответствие ожидаемых результатов мировому уровню исследований подтверждается, во-первых, тенденцией к комплексированию предсказательных моделей на базе машинного обучения, наличием неразрешенных проблем неполноты и неопределенности исходных данных, во-вторых, отсутствием комплексных решений для моделирования социо-экономических систем в условиях многомасштабного дрейфа предсказуемости данных.
Практическая значимость проекта определяется применимостью разработанных методов, моделей и алгоритмов в системах анализа и оптимизации информационных воздействий, включая рекомендательные системы, системы планирования маркетинговых и рекламных кампаний, а также в системах поддержки принятия управленческих решений для сетей продаж и сервисного обслуживания клиентов (в сферах ритейла, персональных услуг, государственных и муниципальных предприятиях).
ОТЧЁТНЫЕ МАТЕРИАЛЫ