КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 17-19-01038

НазваниеРазработка комплексной теории управления устойчивым развитием активных систем

РуководительУгольницкий Геннадий Анатольевич, Доктор физико-математических наук

Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Южный федеральный университет", Ростовская обл

Период выполнения при поддержке РНФ 2017 г. - 2019 г.  , продлен на 2020 - 2021. Карточка проекта продления (ссылка)

Конкурс№18 - Конкурс 2017 года «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами».

Область знания, основной код классификатора 09 - Инженерные науки, 09-801 - Фундаментальные основы конвергентных наук

Ключевые словаактивные системы, генетические алгоритмы, дифференциальные игры, механизмы управления, неопределенность модели, согласование интересов, устойчивое развитие

Код ГРНТИ43.00.00


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Проблема исследования заключается в разработке комплексной теории управления устойчивым развитием активных систем произвольной природы (организационных, социальных, эколого-экономических) на основе конвергентного синтеза: - экологической концепции устойчивого развития; - социологии организаций и менеджмента качества; - теории управления (кибернетики); - математических моделей управления устойчивым развитием активных систем посредством учета интересов образующих эти системы активных элементов; - информационных технологий исследования этих моделей. Для теоретического анализа и практической реализации управления устойчивым развитием активных систем необходима четкая формализация, которую можно осуществить с помощью математического аппарата динамических игр. Формализация охватывает две группы требований: гомеостаза и согласованности. Условия гомеостаза описывают требования к состоянию управляемой подсистемы моделируемой активной системы; в первом приближении требуется, чтобы на длительном или даже бесконечном периоде времени показатели состояния управляемой подсистемы принимали значения из желаемого заданного диапазона. Математически эти условия формулируются как фазовые ограничения в динамической игре с возможными дополнительными требованиями асимптотической устойчивости идеального состояния системы. Еще более важными и новыми в данном контексте представляются условия согласованности. Условия гомеостаза не будут выполнены сами по себе, без заинтересованного субъекта их реализации. Поэтому нужно формулировать требования не только к состоянию управляемой подсистемы, но и к воздействию на нее, осуществляемому управляющей подсистемой. А поскольку со сложной активной системой всегда ассоциированы несколько субъектов, то следует стремиться к компромиссу как некоему приемлемому исходу конфликтного взаимодействия, создающему условия для кооперации. Здесь также важно, чтобы найденное компромиссное решение сохраняло устойчивость на протяжении длительного или бесконечного периода времени. Математически условия согласованности формулируются в виде некоторого системно согласованного и динамически устойчивого решения дифференциальной игры, при этом стратегии игроков и информационный регламент игры в целом отражают методы управления. По отдельности условия гомеостаза и согласованности необходимы, а в совокупности и достаточны для успешного управления устойчивым развитием. Исторически понятие устойчивого развития возникло применительно к отношениям общества (в первую очередь хозяйственной деятельности человека) и окружающей его природной среды, что нашло отражение в понятии эколого-экономической системы. Исходя из конвергентного подхода, предлагается распространить это понятие и описанную выше его формализацию (пользуясь ее математической универсальностью) на произвольные активные системы, включающие целеустремленных субъектов и их отношения любой природы (не только эколого-экономические, но и социальные, политические, организационные и т.д.). Впервые предлагаются и исследуются иерархические дифференциально-игровые модели с различными информационными регламентами, в которых: - тип стратегии ведущего игрока (программные или позиционные, с обратной связью по управлению ведомых или без нее, воздействующие на множества допустимых стратегий или функции выигрыша ведомых) моделирует различные методы управления; - дополнительные фазовые ограничения отражают требования типа гомеостаза к состоянию управляемой динамической системы; - индекс системной согласованности должен принимать значение не меньше заданного, что отражает требования к согласованию интересов активных агентов. В ряде прикладных постановок допустимо использование моделей со специфической упрощенной структурой (линейные по состоянию, линейно-квадратичные и т.п.), для которых решение можно получить в явном виде. В общем случае для решения будут использованы приближенные методы, генетические алгоритмы и имитационное моделирование. Будут исследованы также задачи, содержащие случайные и неопределенные факторы. Влияние таких факторов может существенным образом сказываться на качественном поведении систем. В частности, представляет интерес проблема обеспечения устойчивого развития в случае, когда точное описание динамики системы отсутствует. Для исследования таких задач могут быть использованы методы статистического и онлайн-обучения, а также обучения с подкреплением, используемого в теории управляемых марковских процессов. Для описания моделей с неопределенностью в последнее десятилетие была развита теория сублинейных математических ожиданий.

Ожидаемые результаты
Разработка комплексной теории управления устойчивым развитием активных систем произвольной природы (организационных, социальных, эколого-экономических) на основе конвергентного синтеза экологической концепции устойчивого развития, социологии организаций и менеджмента качества, теории управления (кибернетики), математических моделей управления устойчивым развитием активных систем посредством учета интересов образующих эти системы активных элементов; информационных технологий исследования этих моделей. В качестве конкретных результатов ожидаются: - единое математическое описание управления устойчивым развитием активных систем произвольной природы; - обобщение на динамический случай моделей стимулирования в активных системах; - апробация методики оценки сравнительной эффективности методов иерархического управления, формализуемых как различные информационные регламенты дифференциальных игр, на основе индексов системной согласованности, обобщающих цену анархии; - обоснование применения генетических алгоритмов для решения иерархических дифференциальных игр; - использование методов on-line обучения; - разработка методов структурной и числовой идентификации математических моделей на базе имитационного моделирования; - разработка 1-2 информационно-аналитических систем поддержки управления в конкретных предметных областях; - исследование связей между дискретными и непрерывными моделями, включающими случайные и неопределенные факторы; - издание не менее 25 публикаций, из них 15 в изданиях, индексируемых в базах данных «Сеть науки» (Web of Science) или «Скопус» (Scopus); 9 в русскоязычных изданиях, учитываемых РИНЦ; 1 монографии; - презентация результатов исследования на 9 международных конференциях; - защита одной докторской, двух кандидатских и 48 магистерских диссертаций по теме проекта. При изучении моделей, включающих случайные и неопределенные факторы, наряду с численными будут использованы асимптотические методы. В частности, будут исследованы предельный переход от моделей с дискретным временем и большим числом шагов к моделям с непрерывным временем, а также асимптотическое поведение функционалов, характеризующих агрегированное состояние системы при неограниченном увеличении числа агентов. С практической точки зрения, речь идет о разработке дифференциально-игровых моделей и информационных технологий их исследования как основе методики управления организациями и территориями с учетом согласования интересов активных агентов и требований устойчивого развития. Целостные методики такого рода в мировой практике отсутствуют. Востребованность запланированных результатов проекта в экономике и социальной сфере чрезвычайно высока. Большинство программ устойчивого развития на любом уровне (предприятия, региона, страны в целом) остаются декларациями в силу отсутствия заинтересованных субъектов их реализации. Предлагаемый подход позволяет решать задачи управления устойчивым развитием произвольных сложных систем посредством согласования интересов их активных агентов.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2017 году
Исследованы динамические теоретико-игровые модели двухуровневых систем управления с учетом условий устойчивого развития. Проведен сравнительный анализ эффективности различных механизмов управления для модели экосистемы мелководного водоема (на примере Азовского моря), где ведущий игрок - контрольный орган службы рыбного хозяйства, ведомый игрок - рыболовецкое предприятие. Проведены численные расчеты по модели с помощью имитационного моделирования по сценариям, отражающим правдоподобные гипотезы относительно возможных стратегий управления. Рассматривались информационные регламенты с обратной связью и без нее для принуждения и побуждения. Даны уточненные по сравнению с предыдущими работами определения решений игры и проведено исследование равновесий принуждения и побуждения с учетом требований устойчивого развития. Основные результаты относятся к сравнительному анализу указанных решений игр, полученных на примере численного исследования модели экосистемы мелководного водоема. Полученные результаты могут найти практическое применение при решении задач управления устойчивым развитием реальных динамических активных систем (эколого-экономических, организационных, социальных). Рассмотрено применение системного подхода к управлению устойчивым развитием региона на базе теоретико-игровых моделей и информационных технологий. Специфицированы понятие региональной активной системы и задача управления устойчивым развитием на уровне региона. Предложены иерархическая структура системы моделей в этой области и ее реализация в виде региональной информационно-аналитической системы. Исследована двухуровневая модель оптимального рыболовства в условиях параметрической неопределенности. Изучен случай двух иерархически упорядоченных субъектов управления: федеральное правительство (регулятор) и рыболовецкое предприятие (рыбак). Регулятор считается дальновидным, а рыбаки близорукими. Динамика рыбной популяции описана нелинейным разностным уравнением. Доказано, что функция значения этой задачи удовлетворяет уравнению Айзекса-Беллмана и описывает оптимальную налоговую стратегию регулятора. Решены два численных примера, соответствующих различным предположениям относительно параметров. Предложен подход к теоретико-игровому моделированию распределения ресурсов в иерархической системе "Центр - агенты", который обладает следующими особенностями: 1) явно описывается динамика ресурса в зависимости от управления Центра; 2) Центр распределяет ресурс между агентами пропорционально их действиям, что побуждает агентов к выбору более напряженного плана; 3) управление Центра не может меняться резко, что формализуется как липшицево свойство функции управления; 4) на основе предыдущей гипотезы разработан генетический алгоритм нахождения оптимальной стратегии Центра в иерархической дифференциальной игре. Концепция управления устойчивым развитием активных систем на базе иерархических теоретико-игровых моделей применена для описания информационно-аналитических систем управления в различных областях. Так, предложены проекты информационно-аналитических систем взаимодействия центрального и коммерческого банка и работы кредитного отдела банка. Создана демонстрационная версия системы на языке С# с использованием системы управления базой данных PostgreSQL и визуальным интерфейсом, реализованном с помощью HTML, CSS, JQuery. Построена иерархическая теоретико-игровая модель контроля качества поверхностных вод, учитывающая интересы субъектов управления двух уровней. Предложен алгоритм построения равновесия Штакельберга при побуждении, проведена его реализация для входных функций частного вида. Рассмотрена схема оперативного мониторинга загрязнения атмосферы, а также предложена модель системы наблюдений. Выявлена основная роль автотранспорта в загрязнении атмосферы, сделаны предположения о взаимосвязи областей разовых превышений ПДК по некоторым загрязняющим веществам с дорожной инфраструктурой и интенсивностью движения. Предложен метод качественно репрезентативных сценариев в имитационном моделировании, позволяющий одновременно организовать проведение вычислительных экспериментов и идентификацию модели. Идея метода состоит в том, что при управлении сложными (активными) системами реального мира (социальными, экономическими, организационными) можно указать очень небольшое количество значений управляющих переменных и параметров модели управления, которые ведут к качественно различным траекториям развития управляемой системы и соответственно дают достаточно полную картину. Остальные же значения управлений и параметров существенно не отличаются от одной из качественно репрезентативных траекторий. Эта идея формализована применительно к иерархической дифференциальной игре и дифференциальной игре с равноправными участниками. Метод апробирован для моделей рыболовства в мелководном водоеме и социального партнерства в системе дополнительного профессионального образования с достаточно хорошими результатами численных экспериментов. Исследованы динамические теоретико-игровые модели инновационного развития корпорации, основанные на согласовании частных и общественных интересов агентов. Основной вклад работы - сравнительный анализ эффективности методов иерархического управления для информационных регламентов Штакельберга/Гермейера при принуждении/побуждении с помощью индексов системной согласованности. Рассмотрена модель стимулирования с марковской динамикой и дисконтированным критерием в случае дискретного времени и бесконечного горизонта планирования. Динамика системы, доходы регулятора и затраты исполнителя зависят от состояния системы и действий исполнителя, но не зависят явно от времени в силу бесконечности периода рассмотрения. Показано, что ε-оптимальная стратегия основана на решении задачи оптимального управления с целевым функционалом, равным разности функций дохода ведущего и затрат ведомого, т.е. получено непосредственное обобщение соответствующего результата для статической модели стимулирования. При этом в доказательстве явно не используется построение механизма поощрения-наказания. Теорема первоначально доказана для полунепрерывных сверху стратегий регулятора и затем распространена на универсально измеримые стратегии. Рассмотрена задача предсказания индивидуальных последовательностей в режиме онлайн. Цель предсказания состоит в том, чтобы суммарная ошибка L_n после n шагов была как можно ближе к суммарной ошибке E_n лучшего эксперта из заданного конечного класса. Из теории динамического обучения (online learning) хорошо известно, что в типичной ситуации суммарное сожаление R_n=L_n-E_n удовлетворяет оценке R_n≤C√n . Предлагаемый поход основан на представлении задачи в форме последовательности игр предсказания и формальном предельном переходе при n→∞. Данный предельный переход приводит к нелинейному параболическому уравнению типа Айзекса–Беллмана. Его гладкие суперрешения специального вида соответствуют известным в теории динамического обучения потенциальным функциям в смысле Cesa-Bianci, Lugosi (2003) и порождают алгоритмы взвешивания экспертных решений. Традиционная верхняя оценка наибольшего сожаления выводится с помощью стандартного в теории оптимального управления метода верификации. Опубликованы четыре статьи в журналах из списка WoS/Scopus и дополнительно пять статей в изданиях, индексируемых в РИНЦ, защищены 23 магистерские диссертации по направлению подготовки "Прикладная математика и информатика". Результаты представлены на четырех конференциях.

 

Публикации

1. Давтян С.А., Усов А.Б. ИНФОРМАЦИОННЫЕ РЕГЛАМЕНТЫ В СИСТЕМЕ КОНТРОЛЯ КАЧЕСТВА РЕЧНЫХ ВОД ЭКОЛОГИЯ. ЭКОНОМИКА. ИНФОРМАТИКА. СЕРИЯ: СИСТЕМНЫЙ АНАЛИЗ И МОДЕЛИРОВАНИЕ ЭКОНОМИЧЕСКИХ И ЭКОЛОГИЧЕСКИХ СИСТЕМ, - (год публикации - 2017)

2. Магдесян В.А., Усов А.Б. Информационно-аналитическая система управления взаимодействием центрального и коммерческого банков Инженерный вестник Дона, №3 (год публикации - 2017)

3. Магдесян В.А., Усов А.Б. МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ КОНТРОЛЯ КАЧЕСТВА ПОВЕРХНОСТНЫХ ВОД Экология. Экономика. Информатика. Серия: Системный анализ и моделирование экономических и экологических систем, т.1 №2 (год публикации - 2017)

4. Пучкин М.В., Усов А.Б. ИСПОЛЬЗОВАНИЕ СЕРВИСОВ МОНИТОРИНГА ДОРОЖНОГО ДВИЖЕНИЯ В ЗАДАЧАХ НАБЛЮДЕНИЯ ЗА ЗАГРЯЗНЕНИЯМИ АТМОСФЕРЫ ЭКОЛОГИЯ. ЭКОНОМИКА. ИНФОРМАТИКА. СЕРИЯ: СИСТЕМНЫЙ АНАЛИЗ И МОДЕЛИРОВАНИЕ ЭКОНОМИЧЕСКИХ И ЭКОЛОГИЧЕСКИХ СИСТЕМ, - (год публикации - 2017)

5. Рохлин Д.Б. PDE APPROACH TO THE PROBLEM OF ONLINE PREDICTION WITH EXPERT ADVICE: A CONSTRUCTION OF POTENTIAL-BASED STRATEGIES International Journal of Pure and Applied Mathematics, 114(4), 907-915 (год публикации - 2017) https://doi.org/10.12732/ijpam.v114i4.20

6. Смирнова А.А., Усов А.Б. ИНФОРМАЦИОННО-АНАЛИТИЧЕСКАЯ СИСТЕМА УПРАВЛЕНИЯ РАБОТОЙ ОТДЕЛА КРЕДИТОВАНИЯ БАНКА ЭКОЛОГИЯ. ЭКОНОМИКА. ИНФОРМАТИКА. СЕРИЯ: СИСТЕМНЫЙ АНАЛИЗ И МОДЕЛИРОВАНИЕ ЭКОНОМИЧЕСКИХ И ЭКОЛОГИЧЕСКИХ СИСТЕМ, - (год публикации - 2017)

7. Сухинов А.И., Чистяков А.Е., Угольницкий Г.А.. Усов А.Б., Никитина А.В., Пучкин М.В., Семенов И.С. Game-Theoretic Regulations for Control Mechanisms of Sustainable Development for Shallow Water Ecosystems Automation and Remote Control, 78(6), 1059-1071 (год публикации - 2017) https://doi.org/10.1134/S0005117917060078

8. Угольницкий Г.А. A System Approach to the Regional Sustainable Management Advances in Systems Science and Applications, 17(2), 52-62 (год публикации - 2017)

9. Угольницкий Г.А., Рохлин Д.Б., Усов А.Б. A TWO-LEVEL MODEL OF OPTIMAL HARVESTING UNDER PARAMETER UNCERTAINTY Far East Journal of Mathematical Sciences, 102(7), 1365-1380 (год публикации - 2017) https://doi.org/10.17654/MS102071365


Аннотация результатов, полученных в 2018 году
Изучена оригинальная модель продвижения инноваций в организациях, в которой предусмотрена возможность использования двух информационных регламентов, соответствующих дифференциальным играм Гермейера с обратной связью по управлению и без нее. Численно реализованы алгоритмы построения равновесий, что позволяет выбрать информационный регламент и метод иерархического управления, которые обеспечивают максимальный экономический эффект от внедрения инноваций для всех субъектов и лучшую системную согласованность Рассмотрена динамическая задача стимулирования для нескольких ведомых, вовлеченных в марковскую игру с конечным пространством состояний и конечными множествами действий. Показано, что ε-оптимальная стратегия лидера определяется задачей стохастического оптимального управления, в которой требуется максимизировать разность между доходами лидера и суммарными затратами ведомых. Решив эту задачу, лидер должен сообщить каждому ведомому оптимальный план и покрыть его расходы со стимулирующей надбавкой порядка ε (при условии, что ведомый следует указанному плану). Данный результат обобщает близкий результат авторов для случая одного ведомого и известные результаты статической теории организационных систем. В рамках простой модели управления запасами рассмотрен пример, в котором менеджер компании (лидер) размещает заказы на производство компонент сложного товара у нескольких поставщиков (ведомых). Рассмотрена игра между лидером и ведомым, в которой действия игроков влияют на стохастическую динамику процесса состояний x_t,t∈Z_+. Игроки наблюдают свои выигрыши и состояние x_t системы. Переходное ядро процесса x_t и функции доходов оппонента им неизвестны. На каждом шаге игры лидер выбирает действие〖 a〗_t первым. При выборе действия b_t ведомому известно a_t. Действия ведомого лидеру неизвестны (неинформированный лидер). Каждый из игроков стремится максимизировать дисконтированный критерий, применяя алгоритм Q-обучения. Рандомизированные стратегии игроков определяются распределениями Больцмана, зависящими от Q-функций лидера и ведомого, обновляемых в процессе обучения. Особенность рассматриваемого алгоритма состоит в том, что при обновлении своей Q-функции ведомый считает, что действие лидера в следующем состоянии будет таким же, как в текущем (наивный ведомый). Показано, что для сходимости алгоритма достаточно существования детерминированных стационарных стратегий, порождающих неразложимую марковскую цепь. Предельное поведение Q-функций игроков при больших значениях времени описано в терминах управляемых марковских процессов. Распределения действий игроков сходятся к распределениям Больцмана, зависящим от предельных Q-функций. Рассмотрена модель, в которой менеджер распределяет фиксированный капитал между N рациональными агентами с целью максимизации суммарного объема производства. Прибыль i-го агента равна разности между вознаграждением, полученным от менеджера и производственными затратами. Проведено сравнение (i) нормативной схемы компенсации, в которой менеджер экономически принуждает агентов следовать оптимальной кооперативной стратегии; (ii) линейной сдельной схемы компенсации, в которой менеджер определяет оптимальное вознаграждение за единицу произведенного товара; (iii) пропорциональной схемы компенсации, в которой вознаграждение агента пропорционально его вкладу в общее производство. Пусть соответствующие уровни производства равны s^*,s ̂ и s ̅ соответственно, где последний соответствует единственному равновесию Нэша. Исследованы пределы цен анархии A_N=s^*/¯s,A_N^'=¯s/¯s при N→∞. Эти пределы вычислены для случаев одинаковых выпуклых функций затрат со степенной асимптотикой в нуле и для степенных функций затрат, соответствующих производственным функциям Кобба-Дугласа и обобщенным CES-функциям. Полученные результаты показывают, что асимптотически потери эффективности отсутствуют в терминах A_N^' и не превышают 31% в терминах A_N. Исследован алгоритм обучения в обратной игре Штакельберга при отсутствии информации об издержках агентов в задаче стимулирования. Разработан алгоритм вычисления вероятности выхода за барьер субординированного геометрического броуновского движения. Для динамической обратной задачи Штакельберга предложен алгоритм вычисления равновесия, использующий эволюционное моделирование, для динамической обратной задачи Штакельберга предложен алгоритм вычисления кусочно-постоянной аппроксимации равновесной стратегии лидера с дихотомическим разбиением интервалов. Предложен линейный прогноз в бинарной модели Кокса-Росса-Рубинштейна с шумом и определен фильтр Калмана для прогноза в модели стохастической волатильности. Рассмотрена задача динамического распределения ресурса. Рассмотрены три варианта постановки задачи. Сопоставляется динамическое программирование с генетическим алгоритмом. Предложена междисциплинарная методология исследования социального партнерства на примере дополнительного профессионального образования. Использование математического аппарата дифференциальных игр позволяет провести количественный сравнительный анализ эффективности различных способов организации социального партнерства (изоляция, иерархия, кооперация), учесть необходимость согласования частных и общественных интересов. Описаны методика идентификации математических моделей с использованием реальных данных социологических опросов и сценарный подход к решению дифференциальных игр на базе компьютерной имитации. Найдено аналитическое решение задачи стимулирования сбора и переработки пластиковых отходов для случаев трехуровневой системы управления государство - предприятия - население и нескольких агентов в двухуровневой системе государство - предприятия. Модель представляет собой иерархическую игру, для решения которой использована двухэтапная процедура оптимизации. Особое внимание уделено идентификации модели на реальных данных, доступных в Интернете. При решении задачи поиска оптимального уровня вторичной переработки пластиковой тары выявлено, что распределение финансовой нагрузки позволяет значительно увеличить объем переработки, а налоговые льготы являются действенным механизмом управления. При увеличении объемов субсидирования значительно возрастает объем перерабатываемого пластика, что позволяет участникам системы достигать больших выигрышей. Дана интерпретация известных моделей влияния и управления на сетях применительно к маркетингу. Анализируемая социальная сеть трактуется как целевая аудитория некоторой фирмы, действующей как субъект управления. Мнение агента (представителя целевой аудитории) отражает сумму денег, которую агент готов потратить на покупку товаров или услуг данной фирмы. Фирма заинтересована в максимизации этой величины на рассматриваемом отрезке времени посредством маркетинговых воздействий на целевую аудиторию при ограничениях на маркетинговый бюджет, что порождает задачу оптимального управления. На этапе анализа в составе целевой аудитории выделяются сильные подгруппы и спутники. Поскольку финальные мнения всех агентов зависят только от начальных мнений членов сильных подгрупп, то маркетинговые воздействия следует оказывать на них и только на них, что существенно снижает расходы на управление. Для решения задачи прогноза разработан оригинальный алгоритм, реализованный на языке программирования R. Другие поставленные задачи могут быть решены стандартными средствами этого языка, что проиллюстрировано на тестовом примере вместе с результатами авторского алгоритма.

 

Публикации

1. Агиева М.Т., Угольницкий Г.А. Regional Sustainable Management Problems on Networks Competitive, Sustainable and Secure Development of the Regional Economy: Response to Global Challenges (CSSDRE 2018). Atlantis Press, 2018., volume 39, p.6-9. (год публикации - 2018)

2. Баркалов В.В., Угольницкий Г.А. Модель стимулирования сбора и переработки пластиковых отходов Современная экономика: проблемы и решения, v.3, p.8-16 (год публикации - 2018)

3. Белявский Г.И., Гирченко М.А. Вычисление вероятности выхода случайного процесса из области в связи с устойчивым развитием активных систем и вычисление цен барьерных опционов в субординированных моделях Известия ВУЗов. Северо-Кавказский регион. Естественные науки., №1. С.10-14. (год публикации - 2018)

4. Белявский Г.И., Данилова Н.В., Угольницкий Г.А. Эволюционные методы решения динамических задач распределения ресурсов Математическая теория игр и ее приложения, 10(1), 5-22 (год публикации - 2018)

5. Белявский Г.И.. Данилова Н.В., Угольницкий Г.А. Markovian Mechanism of Proportional Resource Allocation in the Incentive Model as a Dynamic Stochastic Inverse Stackelberg Game Mathematics, 2018, 6(8), 131 (год публикации - 2018)

6. Нор-Аревян О.А., Тарасенко Л.В., Угольницкий Г.А. Математическое моделирование социального партнерства: методология междисциплинарного исследования Социологические исследования, 2018, 4, 15-24 (год публикации - 2018)

7. Рохлин Д.Б., Угольницкий Г.А. Stackelberg Equilibrium in a Dynamic Stimulation Model with Complete Information Automation and Remote Control, 2018, 79(4), 691-702 (год публикации - 2018)

8. Рохлин Д.Б., Усов А.Б. Asymptotic efficiency of the proportional compensation scheme for a large number of producers Yugoslav Journal of Operations Research, 2018. N4 (год публикации - 2018)

9. Смирнова А.А. Модели оценки, отбора и продвижения инноваций Экология. Экономика. Информатика. Т.1: Системный анализ и моделирование экономических и экологических систем, Выпуск 3. С.309-312. (год публикации - 2018)

10. Угольницкий Г.А., Усов А.Б. Computer Simulations as a Solution Method for Differential Games Computer Simulations: Advances in Research and Applications, Eds. M.D. Pfeffer and E. Bachmaier. - N.Y.: Nova Science Publishers, 2018. P.63-106 (год публикации - 2018)

11. Угольницкий Г.А.. Усов А.Б. Sustainable Management in Regional Fisheries: Mechanisms of Motivation of Myopic Agents Competitive, Sustainable and Secure Development of the Regional Economy: Response to Global Challenges (CSSDRE 2018). Atlantis Press, 2018., volume 39, p.69-73 (год публикации - 2018)

12. Белявский Г.И., Данилова Н.В., Угольницкий Г.А. Методы случайного поиска для решения игры Гермейера распределения ресурсов IX Московская международная конференция по исследованию операций (ORM2018), Т.2. С.10-13. (год публикации - 2018)

13. Угольницкий Г.А., Усов А.Б. Теоретико-игровая модель продвижения инноваций в организациях IX Московская международная конференция по исследованию операций (ORM2018), Т.2. С.35-39. (год публикации - 2018)


Аннотация результатов, полученных в 2019 году
Описана методика исследования задачи управления устойчивым развитием активных систем, включающая следующие этапы. 1. Построить дифференциальную игру активных агентов в нормальной форме. Найти множество равновесий Нэша в этой игре как условие согласования интересов агентов. Найти множество управлений агентов, обеспечивающих выполнение условия гомеостаза, исследовать зависимость найденных множеств от параметров модели. Проверить выполнение условия разрешимости задачи управления устойчивым развитием активной системы, т.е. наличие непустого пересечения найденных множеств. 2. Ввести суммарный функционал выигрыша и найти множество кооперативных решений, исследовать его зависимость от параметров модели. Вычислить индекс системной согласованности, провести сравнительный анализ независимого и кооперативного поведения агентов. 3. Добавить Центр и получить иерархическую дифференциальную игру в нормальной форме с учётом требования гомеостаза. Выяснить условия разрешимости задачи управления устойчивым развитием в данной постановке. 4. Построить и проанализировать дифференциальные игры в форме характеристической функции на основе дифференциальных игр в нормальной форме и иерархические дифференциальные игры в форме характеристической функции на основе иерархической дифференциальной игры. Здесь согласование интересов формализуется как принцип распределения выигрыша максимальной коалиции между всеми агентами. Выяснить условия динамической устойчивости решения и при необходимости провести процедуру распределения дележа по Л.А. Петросяну. Предложена теоретико-игровая модель внедрения инноваций в организациях. В ней использованы два информационных регламента, соответствующие прямым и обратным играм Штакельберга. Реализация предложенных алгоритмов построения равновесий проведена численно путём имитационных экспериментов методом качественно репрезентативных сценариев. Сделан вывод о том, что для внедрения инноваций целесообразна иерархическая организация системы управления. Рассмотрена система управления устойчивым развитием для мелководного водоёма с учётом пространственной неоднородности вдоль одного направления, представленная двухуровневой теоретико-игровой моделью. Указаны алгоритмы построения равновесий в прямой и обратной играх Штакельберга. При численной реализации предложенных алгоритмов использован метод качественно репрезентативных сценариев имитационного моделирования. Исследована игра между лидером и ведомым, в которой действия игроков влияют на стохастическую динамику процесса состояний. Игроки наблюдают свои выигрыши и состояние системы. Переходное ядро процесса и функции доходов оппонента им неизвестны. На каждом шаге игры лидер выбирает действие первым. При выборе действия ведомому известно действие лидера. Действия ведомого лидеру неизвестны. Каждый из игроков стремится максимизировать дисконтированный критерий, применяя алгоритм Q-обучения. Рандомизированные стратегии игроков определяются распределениями Больцмана, зависящими от Q-функций, обновляемых в процессе обучения. Особенность рассматриваемого алгоритма состоит в том, что при обновлении своей Q-функции ведомый считает, что действие лидера в следующем состоянии будет таким же, как в текущем (наивный ведомый). Показано, что для сходимости алгоритма достаточно существования детерминированных стационарных стратегий, порождающих неразложимую марковскую цепь. Распределения действий игроков сходятся к распределениям Больцмана, зависящим от предельных Q-функций. Сформулированы простые условия, гарантирующие выполнение условий Роббинса-Монро для алгоритма Q-обучения с локальной скоростью обучения, зависящей от числа посещений конкретного состояния (локальное время) и номера итерации (глобальное время). Предполагается, что управляемый марковский процесс является неразложимым и используемая стратегия обеспечивает стойкое изучение (persistent exploration). Ограничения накладываются на функциональную зависимость скорости обучения от локального и глобального времени. Изучена задача максимизации прибыли большой корпорации путём распределения имеющихся фондов между производителями (ведомыми). Поставленная задача формализована как стохастическая обратная игра Штакельберга с дискретным временем и бесконечным горизонтом, в которой прибыли менеджера и каждого производителя определяются дисконтированным критерием качества. Установлено, что для реализации ε-оптимального стимулирующего механизма лидер должен решить задачу стохастического оптимального управления, в которой требуется максимизировать разность между доходом корпорации и суммарными затратами производителей, сообщить оптимальную стратегию каждому производителю и покрыть его расходы со стимулирующей надбавкой ε. Рассмотрена задача о распределении ресурсов в сетях связи с большим числом пользователей, которая состоит в определении механизма назначения цен на скорости передачи данных с целью стимулирования оптимального использования имеющихся ресурсов. Критерием оптимальности является сумма полезностей всех пользователей. В отличие от обычного подхода, предложенный алгоритм не использует информацию о суммарном трафике на каждом соединении. Его входными данными являются общее число пользователей N, пропускные способности соединений и оптимальные близорукие реакции случайно выбранных пользователей на текущие цены. Динамическая схема назначения цен основана на двойственном стохастическом методе проекции градиента. Для специального класса функций полезности получены верхние оценки для невязок в ограничениях и отклонения целевой функции от оптимального значения. Эти оценки равномерны по N и имеют порядок O(T^(-1\/4) ) по числу T реакций пользователей. Изучен широкий класс задач оптимального управления стохастическими динамическими системами с разладкой. Качество управления определяется функционалом, задаваемом на конце интервала управления. Разладка динамической системы наступает в случайный момент остановки относительно фиксированной фильтрации. Получен результат, базирующийся на представлении мартингала, позволяющий вычислять оптимальное управление. Научная новизна заключается в рассмотрении в задачах оптимального управления процессов с разладкой, которые образуют подкласс процессов с непрерывными траекториями. Результаты применимы в задачах управления с неопределённым описанием динамики объекта управления. Решена задача вычисления вероятности невыхода случайного процесса из полосы на заданном временном интервале. Получен эффективный метод вычисления вероятности, в котором ключевыми моментами выступают случайное разбиение интервала, использование факторизации Винера-Хопфа и применение метода Монте-Карло. Кроме этого, исследовалась возможность использования преобразования Гирсанова для упрощения имитации траектории. Получена более высокая точность вычислений по сравнению со стандартным методом Монте-Карло. Результаты применимы в задачах, связанных с проблемой гомеостаза, условия которого формулируются в стохастических терминах. Решена задача вычисления равновесия в игре Штакельберга, моделирующей распределение ресурсов в иерархической системе управления. Эта игра сведена к задаче бесконечномерной оптимизации, для которой подбиралась её конечномерная аппроксимация. Получены условия трансформации игры Штакельберга в задачу конечномерной оптимизации на примере задачи распределения ресурса. Исследованы генетический алгоритм, алгоритм имитации отжига и метод половинного разбиения временного интервала со случайным выбором. Предложен алгоритм, сочетающий имитацию отжига с обучением с подкреплением, и алгоритм половинного деления, сочетающий аппроксимацию решения в вейвлет-базисе со случайным выбором очередного интервала дробления. Решена задача квантильного хеджирования. Её основная сложность заключается в неполноте данного рынка, что потребовало дополнительных усилий для вычисления экстремальной мартингальной меры. Основная новизна – метод вычисления оптимального управления рисковым активом. Критерием оптимальности в задаче управления служит риск в смысле Марковица. Развит авторский подход к решению задач управления мнениями в социальных сетях применительно к маркетингу. Анализируемая социальная сеть трактуется как целевая аудитория некоторой фирмы (или нескольких конкурирующих фирм), действующей как субъект управления. Мнение агента (представителя целевой аудитории) отражает сумму денег, которую агент готов потратить на покупку товаров или услуг данной фирмы. Фирма заинтересована в максимизации этой величины на рассматриваемом отрезке времени посредством маркетинговых воздействий на целевую аудиторию при ограничениях на маркетинговый бюджет, что в совокупности и порождает задачу оптимального управления (или теоретико-игровую задачу). На этапе анализа в составе целевой аудитории выделяются сильные подгруппы и спутники. Целесообразна также дополнительная количественная характеристика членов сильных подгрупп с помощью различных мер влияния вершин графа. Поскольку финальные мнения всех агентов зависят только от начальных мнений членов сильных подгрупп, то маркетинговые воздействия следует оказывать на них и только на них, что существенно снизит расходы на управление.

 

Публикации

1. Агиева М.Т., Бабичева Ю.В., Окулист Н.М., Угольницкий Г.А. Задачи анализа и прогноза при управлении целевой аудиторией в маркетинге Управление большими системами, - (год публикации - 2019)

2. Агиева М.Т., Бабичева Ю.В., Окулист Н.М.. Угольницкий Г.А. ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ УПРАВЛЕНИЯ МНЕНИЯМИ В МАРКЕТИНГЕ Системы управления и информационные технологии, - (год публикации - 2019)

3. Агиева М.Т., Королёв А.В., Угольницкий Г.А. Modeling and Simulation of Impact and Control in Social Networks Communications in Computer and Information Science 1079. Springer, 2019., - (год публикации - 2019)

4. Белявский Г.И., Данилова Н.В. Random search methods for the solution of a Stackelberg game of resource allocation Game Theory and Management, - (год публикации - 2019)

5. Белявский Г.И., Данилова Н.В., Землякова И.А. Optimal Control Problems with Disorder Automation and Remote Control, - (год публикации - 2019)

6. Белявский Г.И., Данилова Н.В., Угольницкий Г.А. Calculation of Probability of the Exit of a Stochastic Process from a Band by Monte-Carlo Method: A Wiener-Hopf Factorization Mathematics, - (год публикации - 2019)

7. Данилова Н.В., Землякова И.А. Квантильное хеджирование на неполном рынке Известия ВУЗов. Северо-Кавказский регион. Естественные науки, - (год публикации - 2019)

8. Рохлин Д.Б. Q-обучение в стохастической игре Штакельберга между неинформированным лидером и наивным ведомым Теория вероятностей и её применения, - (год публикации - 2019)

9. Рохлин Д.Б. Robbins-Monro conditions for persistent exploration learning strategies Springer Proceedings in Mathematics and Statistics, - (год публикации - 2019)

10. Рохлин Д.Б., Угольницкий Г.А. Optimal Incentive Strategy in a Markov Game with Multiple Followers Frontiers of Dynamic Games. Static & Dynamic Game Theory: Foundations & Applications., - (год публикации - 2019)

11. Рохлин Д.Б., Угольницкий Г.А. Optimal incentive strategy in a discounted stochastic Stackelberg game Game Theory and Management, - (год публикации - 2019)

12. Угольницкий Г.А. Методология и прикладные задачи управления устойчивым развитием активных систем Проблемы управления, - (год публикации - 2019) https://doi.org/10.25728/pu.2019.2.3

13. Угольницкий Г.А., Усов А.Б. Spatially Distributed Differential Game Theoretic Model of Fisheries Mathematics, - (год публикации - 2019)

14. Угольницкий Г.А., Усов А.Б. Динамические модели согласования частных и общественных интересов при продвижении инноваций Математическая теория игр и её приложения, - (год публикации - 2019)

15. Рыжова В.С., Усов А.Б. Моделирование взаимодействия банков с клиентами при выполнении финансовых операций Экология. Экономика. Информатика. Серия: Системный анализ и моделирование экономических и экологических систем, - (год публикации - 2019) https://doi.org/1023885-2500-395X-2019-1-4-52-56

16. Угольницкий Г.А., Белявский Г.И., Данилова Н.В., Рохлин Д.Б., Усов А.Б., Агиева М.Т.. Мальсагов М.Х. Модели управления устойчивым развитием активных систем и их приложения Издательство ЮФУ, Ростов-на-Дону-Таганрог, - (год публикации - 2019)

17. Кораблина Э.В., Усов А.Б. Равновесие Штакельберга при согласовании интересов субъектов Экология. Экономика. Информатика. Серия: Системный анализ и моделирование экономических и экологических систем, - (год публикации - 2019) https://doi.org/1023885|2500-395X-2019-1-4-230-2

18. Нинидзе Д.Л., Усов А.Б. Система управления внедрением инноваций Экология. Экономика. Информатика. Серия: Системный анализ и моделирование экономических и экологических систем, - (год публикации - 2019) https://doi.org/1023885|2500-395X-2019-1-4-19-22

19. Поповян Н.О., Усов А.Б. Равновесие Штакельберга с обратной связью по управлению в системах контроля качества речных вод Экология. Экономика. Информатика. Серия: Системный анализ и моделирование экономических и экологических систем, - (год публикации - 2019) https://doi.org/1023885-2500-395X-2019-1-4-257-260


Возможность практического использования результатов
не указано