КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер 18-19-00203

НазваниеАгрегирование предпочтений для решения задач обработки многомерных гетероскедастичных измерительных данных

РуководительМуравьев Сергей Васильевич, Доктор технических наук

Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский Томский политехнический университет", Томская обл

Период выполнения при поддержке РНФ 2018 г. - 2020 г. 

Конкурс№28 - Конкурс 2018 года «Проведение фундаментальных научных исследований и поисковых научных исследований отдельными научными группами».

Область знания, основной код классификатора 09 - Инженерные науки, 09-605 - Комплексирование и обработка информации в технических системах

Ключевые словакомплексирование данных, обработка интервальных данных, задача о ранжировании Кемени, моделирование Монте-Карло, предпочтения, агрегирование предпочтений, робастность, слабые порядки

Код ГРНТИ28.23.25


СтатусУспешно завершен


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Комплексирование данных (data fusion) представляет собой процесс совместной обработки данных о некотором объекте, предоставленных несколькими источниками, с целью получения более полного, объективного и точного знания исследуемой характеристики по сравнению со знанием, полученным из единственного источника. В теории и практике измерений широко используется описание результатов измерений в форме интервалов c найденными экспериментально или заданными границами. Процедура комплексирования интервальных данных заключается в формировании такого результирующего интервала, который согласован с максимальным количеством исходных интервалов и с максимальной степенью правдоподобия содержит значение, которое может служить представителем всех этих интервалов с соответствующей неопределенностью. Существующие методы комплексирования интервальных данных не обеспечивают одновременно единственность результата комплексирования и его устойчивость к несогласованности или виду закона распределения входных данных. Поэтому существует необходимость в разработке метода комплексирования интервальных данных, позволяющего на основании неточных, неполных или противоречивых данных определить результат с повышенной точностью, робастностью и достоверностью. Эти полезные свойства результата комплексирования может обеспечить метод агрегирования предпочтений. В ходе проекта предполагается осуществить разработку, теоретические и экспериментальные исследования метода комплексирования интервальных неравноточных измерительных данных на основе агрегирования предпочтений, устойчивого к виду закона распределения входных данных и обеспечивающего получение результатов комплексирования с повышенными точностью и достоверностью по сравнению с традиционными методами. В рамках решения поставленной задачи предполагается провести следующие исследования: разработка и программная реализация метода комплексирования интервальных данных на основе агрегирования предпочтений принадлежащих этим интервалам дискретных значений и экспериментальные исследования его работоспособности и свойств; разработка способа разбиения диапазона актуальных значений, полученного в результате объединения исходных интервалов, для формирования ранжируемых дискретных значений; разработка и верификация типовых методик применения предложенного метода комплексирования интервальных данных для решения практических задач. Основная идея, определяющая научную новизну поставленной задачи, заключается в том, что впервые в мировой практике в области методов комплексирования данных заданные на вещественной оси исходные интервалы, предназначенные для комплексирования, представляются отношениями слабого порядка (ранжированиями) на множестве принадлежащих этим интервалам дискретных значений. Результатом комплексирования x* служит наилучшее значение в ранжировании консенсуса, найденном для набора ранжирований дискретных значений, соответствующих исходным интервалам.

Ожидаемые результаты
В результате выполнения проекта будет разработан и программно реализован метод комплексирования интервальных данных на основе агрегирования предпочтений принадлежащих этим интервалам дискретных значений; будут проведены экспериментальные исследования его работоспособности и свойств; будет разработан способ оптимального разбиения диапазона актуальных значений, полученного в результате объединения исходных интервалов, для формирования ранжируемых дискретных значений; будут разработан и экспериментально исследован комплекс типовых методик применения предложенного метода комплексирования интервальных данных для решения следующих практических задач: построение калибровочной зависимости для многокомпонентного цифрового цветометрического анализа состава веществ на основе обработки многомерных данных; оценивание неопределенностей значений фундаментальных физических констант; оценивание опорных значений ключевых и межлабораторных сличений; повышение точности результатов измерений узлов беспроводной сенсорной сети, предоставляющих в центральный узел неточные и/или неполные показания; автоматизированное визуальное распознавание дефектов сварных соединений. Анализ состояния проблемы позволяет утверждать, что запланированные результаты соответствуют мировому уровню. Необходимость в методах комплексирования интервалов существует в системах обеспечения единства и требуемой точности измерений; робототехнических и мехатронных системах; системах и сетях сбора данных и т.п. В частности, в беспроводных сенсорных сетях, предназначенных для различных видов мониторинга, комплексирование интервальных измерительных данных может обеспечить повышение точности результатов измерений мультисенсоров и продление их времени жизни.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2018 году
1. Разработано специализированное алгоритмическое и программное обеспечение IntFusion для проведения численных экспериментальных исследований методом Монте-Карло разработанного метода комплексирования интервалов в сравнении с традиционными методами (одобрительным голосованием на основе правил относительного и абсолютного большинства) в среде программирования NI LabVIEW. ПО осуществляет генерацию случайных интервальных данных по нормальному и равномерному законам распределения посредством улучшенного генератора Вихманна-Хилла и определение результата комплексирования x* и его неопределенности ε*. 2. Предложен и программно реализован метод комплексирования интервалов IF&PA, основанный на агрегировании предпочтений принадлежащих этим интервалам дискретных значений, где результатом комплексирования является наилучшее дискретное значение в ранжировании консенсуса, найденном по правилу Кемени для набора наведенных интервалами ранжирований дискретных значений. Исследования метода IF&PA с помощью разработанного ПО показали, что он обеспечивает получение результата комплексирования с более высокими робастностью (≈ в 2 раза), точностью (≈ в 1,1-1,5 раз) и достоверностью (≈ на 14-58 %) по сравнению с традиционными методами. 3. Для формирования ранжируемых дискретных значений предложена аналитическая формула расчета мощности n разбиения диапазона актуальных значений (ДАЗ), полученного в результате объединения исходных интервалов, обеспечивающая оптимальную разрешающую способность метода комплексирования IF&PA. Формула базируется на использовании поправки Шеппарда для дисперсии дискретизированных данных и имеет вид: n = ceil [(an - a1)/(σ*√(24w+12w^2)]+1, где a1,an – нижняя и верхняя граница ДАЗ, w – допускаемая погрешность, σ – оценка СКО данных, а значение ceil[] означает округление в большую сторону до ближайшего целого числа. 4. Проведена экспериментальная верификации оптимальности предложенной аналитической формулы для расчета мощности n разбиения ДАЗ с помощью ПО IntFusion. Доказано, что при заданной допускаемой погрешности формула позволяет определить значение n, которое с вероятностью 0,95 обеспечивает получение результата комплексирования, наиболее близкого к номинальному значению среди всех возможных значений n от 4 до 15. По итогам выполнения этапа 1 опубликованы три статьи в изданиях, индексируемых WoS/Scopus, пять статей в изданиях, индексируемых РИНЦ. Две статьи находятся на рассмотрении в журналах IEEE Sensors Journal (Q1) и Food Chemistry (Q1).

 

Публикации

1. Борисова М.А., Муравьев С.В. Data analysis of energy surveys by preference aggregation method Journal of Physics: Conference Series, vol, 1065, 202005 (год публикации - 2018) https://doi.org/10.1088/1742-6596/1065/20/202005

2. Минь Дай Хо, Муравьев С.В. Уменьшение погрешности при индивидуальной градуировке терморезисторов ТРУДЫ XIV МЕЖДУНАРОДНОЙ НАУЧНО-ТЕХНИЧЕСКОЙ КОНФЕРЕНЦИИ АКТУАЛЬНЫЕ ПРОБЛЕМЫ ЭЛЕКТРОННОГО ПРИБОРОСТРОЕНИЯ АПЭП – 2018 В 8 томах, Новосибирск, Том 3, с. 161-165 (год публикации - 2018)

3. Муравьев С.В., Борисова М.А. Анализ и визуализация данных энергоаудита методом агрегирования предпочтений Труды 28-й Международной конференции по компьютерной графике и машинному зрению (GraphiCon 2018, 24–27 сент. 2018 г.), Томск, с. 155-157 (год публикации - 2018)

4. Муравьев С.В., Борисова М.А. Агрегирование предпочтений в интерпретации данных энергетических обследований Известия Томского политехнического университета. Инжиниринг георесурсов, том 329, № 12, с. 166–175 (год публикации - 2018)

5. Худоногова Л.И., Муравьев С.В. Interval data fusion with preference aggregation in wireless sensor network: energy-accuracy trade-off in presence of outliers Journal of Physics: Conference Series, vol. 1065, 072016 (год публикации - 2018) https://doi.org/10.1088/1742-6596/1065/7/072016


Аннотация результатов, полученных в 2019 году
1. Получены аналитические выражения, описывающие свойства пространства инранжирований. Показано, что пространство инранжирований, формируемых процедурой IF&PA, является подмножеством всех слабых порядков с единственным символом строгого порядка. Представлены выражения для расчета мощности пространства слабых порядков, пространства инранжирований и пространства запрещенных ранжирований. Выявлена связь мощности пространств с числами Стирлинга второго рода S(n,q), которые определяют количество неупорядоченных разбиений n-элементного множества на q непустых подмножеств. Показано, что мощность пространства инранжирований определяется треугольными числами в зависимости от заданного числа n дискретных элементов диапазона актуальных значений. Исследован состав пространства инранжирований для различных значений n. 2. Разработано формальное описание механизма учета специфики информации об инранжированиях, содержащейся в матрице профиля размера (n×n), строки и столбцы которой обозначены номерами альтернатив. Введено понятие порождающего множества для инранжирования. Получено выражение для определения числа порождающих множеств в зависимости от числа n альтернатив в инранжированиях. Пространства инранжирований и соответствующие порождающие множества представлены в виде перестановочных многогранников. 3. Модернизирован алгоритм нахождения ранжирования консенсуса по правилу Кемени с учетом специфики инранжирований и множественности решений задачи о ранжировании Кемени. Показано, что множественные оптимальные перестановки, т.е. выходной профиль Β, как решения задачи о ранжировании Кемени для m ранжирований n альтернатив, могут быть эффективно преобразованы в точное и единственное оптимальное ранжирование консенсуса βfin, которое может содержать толерантности. Предложено следующее правило свертки: в итоговом ранжировании консенсуса βfin альтернативы располагаются в порядке возрастания сумм их рангов, рассчитанных для выходного профиля Β; в βfin две альтернативы являются толерантными, если они имеют одинаковые суммы рангов в выходном профиле Β. Разработанное правило свертки гарантирует определение точного и единственного оптимального ранжирования консенсуса βfin для любого выходного профиля Β. Показано, что полученное правило свертки согласуется с правилом агрегирования предпочтений, известным как счет Борда. Доказана справедливость правила свертки на основе аксиоматизации Х.П. Янгом правила Борда. 4. Проведены численные экспериментальные исследования для верификации алгоритма нахождения ранжирования консенсуса по правилу Кемени, модифицированного с учетом специфики инранжирований и правила свертки, с помощью ПО IntFusion. На вход алгоритма подавались различные случайно сгенерированные наборы исходных интервалов. При формировании соответствующих инранжирований получались входные профили, имеющие большое число толерантностей, что, в свою очередь, приводило к значительному увеличению числа N оптимальных решений. Эксперименты проводились для 500 индивидуальных задач при различных значениях m = 5, ..., 20 и n = 5, ..., 20. Полученные после обработки множественные решения (выходной профиль) посредством разработанного правила свертки трансформировались в единственное итоговое ранжирование консенсуса βfin. Результаты экспериментов показали, что во всех случаях модифицированный алгоритм нахождения ранжирования консенсуса по правилу Кемени приводит к получению единственного оптимального итогового ранжирования консенсуса βfin. Время поиска решения алгоритмом свертки не превышало 8 мин даже при N > 10^7. По итогам выполнения этапа 2 опубликованы 6 статей в изданиях, индексируемых WoS/Scopus и РИНЦ, в том числе 3 статьи в журнале с импакт-фактором > 1 (квартиль Q1/Q2), из них 2 статьи - в Q1.

 

Публикации

1. Гавриленко Н.А., Саранчина Н.В., Камбарова Е.А., Уразов Е.В., Гавриленко М.А. Colorimetric and fluorescent sensing of rhodamine using polymethacrylate matrix Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, vol. 220, 117106 (год публикации - 2019) https://doi.org/10.1016/j.saa.2019.05.011

2. Гавриленко Н.А., Федан Д.А., Саранчина Н.В., Гавриленко М.А. Solid phase colorimetric determination of iodine in food grade salt using polymethacrylate matrix Food Chemistry, vol. 280, 15-19 (год публикации - 2019) https://doi.org/10.1016/j.foodchem.2018.12.037

3. Муравьев С.В., Баранов П.Ф., Емельянова Е.Ю. How to transform all multiple solutions of the Kemeny Ranking Problem into a single solution Journal of Physics: Conference Series, Vol. 1379, 012053 (год публикации - 2019) https://doi.org/10.1088/1742-6596/1379/1/012053

4. Муравьев С.В., Гавриленко Н.А., Саранчина Н.В., Баранов П.Ф. Polymethacrylate sensors for rapid digital colorimetric analysis of toxicants in natural and anthropogenic objects IEEE Sensors Journal, vol. 19, no. 13, 4765-4772 (год публикации - 2019) https://doi.org/10.1109/JSEN.2019.2903314

5. Муравьев С.В., Емельянова Е.Ю. Combinatorial characterization of inrankings as weak orders induced by intervals Journal of Physics: Conference Series, vol. 1379, 012052 (год публикации - 2019) https://doi.org/10.1088/1742-6596/1379/1/012052

6. Муравьев С.В., Худоногова Л.И. A consensus ranking based proposal for combining data in adjustment of the fundamental physical constant values 16th IMEKO TC10 Conference 2019 on Testing, Diagnostics and Inspection as a Comprehensive Value Chain for Quality and Safety; Berlin; Germany; 3 - 4 September 2019, - (год публикации - 2019)


Аннотация результатов, полученных в 2020 году
1. Разработана методика оценивания неопределенностей значений при согласовании фундаментальных физических констант (ФФК) на основе комплексирования методом IF&PA интервалов неопределенностей констант, предоставленных национальными метрологическими институтами. В отличие от традиционных методов, методика не требует проведения предварительной проверки исходных данных на согласованность и исключения несогласованных интервалов. Проведена верификация разработанной методики посредством численных экспериментальных исследований и посредством обработки реальных значений, использованных CODATA при согласовании констант в 2006 и 2017 гг. Результаты показали, что методика по степени робастности и точности превосходит традиционный метод наименьших квадратов с коэффициентом Берджа, а также позволяет уменьшить относительную неопределенность результирующей оценки значения ФФК не менее чем в 5 раз. 2. Разработана методика оценивания опорных значений ключевых и межлабораторных сличений на основе метода комплексирования интервалов IF&PA. Методика позволяет определить опорное значение измеряемой величины, наилучшим образом характеризующее наибольшее подмножество надежных результатов измерений (т.н. наибольшее согласованное подмножество НСП). Проведена верификация разработанной методики посредством численных экспериментальных исследований и посредством обработки значений реальных сличений эталона высокочастотной мощности КК CIPM CCEM.RF-K25.W. Результаты показали, что методика характеризуется большей (не менее чем в 2 раза) точностью и робастностью по сравнению с Процедурой А и алгоритмом Нильсена, а также позволяет сформировать НСП наибольшей мощности. 3. Предложена методика, позволяющая с помощью агрегирования предпочтений выбрать цветовую модель для организации как однокомпонентного, так и многокомпонентного цифрового цветометрического анализа (ЦЦА). Цветовая модель для заданного набора аналитов должна обеспечивать наилучшие значения характеристик построенных для них градуировочных зависимостей аналитических сигналов, что, в свою очередь, способствует повышению достоверности ЦЦА. Методика экспериментально апробирована на наборе стандартных цветовых моделей RGB, HSL, XYZ и L*a*b*. В качестве определяемых веществ были использованы семь аналитов: серебро, медь, железо, кобальт, хром, никель и сумма тяжелых металлов. Результаты показали, что для ЦЦА наиболее приемлемой системой представления цвета является цветовая модель RGB. 4. Разработана методика повышения точности результатов измерений узлов беспроводной сенсорной сети (БСС) на основе метода IF&PA. Методика решает задачу нахождения значения измеряемой величины в кластере сети в условиях, когда данные, поступающие от сенсорных узлов, с большой вероятностью могут быть неточными и/или неполными вследствие выхода узлов из строя или потери данных из-за возникающих в сети коллизий. Проведена верификация разработанной методики посредством численных экспериментальных исследований и посредством обработки значений температуры и влажности, полученных реальной БСС для контроля параметров окружающей среды. Результаты показали, что методика позволяет не менее чем в 20-40 раз снизить неопределенность результата измерений сенсоров в кластере БСС, при этом наличие выбросов и отсутствие данных с некоторых сенсоров не влияет на точность результата. 5. Предложена методика автоматизированного визуального распознавания дефектов сварных швов на основе традиционного метода наращивания областей, начальные параметры f и b которого характеризуют множества пикселов переднего и заднего планов соответственно. Изображение сварного шва разбивается на полосы равной ширины, для каждой из которых определяются интервалы уровней серого переднего и заднего планов на основе анализа построенных для них гистограмм яркости. Параметры f и b изображения в целом определяются посредством обработки полученных интервалов методом IF&PA. Успешная распознающая способность метода IF&PA продемонстрирована при сегментации дефектов типа "прожог", "трещина" и "множественный дефект". По итогам выполнения этапа 3 опубликованы 9 статей в изданиях, индексируемых WoS/Scopus и РИНЦ, в том числе 8 статей в изданиях, индексируемых WoS/Scopus, 3 статьи в журналах квартилей Q1/Q2, 2 статьи в журналах с импакт-фактором > 1.

 

Публикации

1. Муравьев С.В, Спиридонова А.С., Емельянова Е.Ю. Preference aggregation when choosing a color space for digital colorimetric analysis of substances composition Bulletin of the Tomsk Polytechnic University, Geo Assets Engineering, 331(8), 166-176 (год публикации - 2020) https://doi.org/10.18799/24131830/2020/8/2778

2. Муравьев С.В., Баранов П.Ф., Худоногова Л.И., Хо М.Д. Inertial MEMS Sensors Accuracy Improvement by Interval Fusion with Preference Aggregation 2020 IEEE Sensors Proceedings, October 25-28, Rotterdam, The Netherlands, - (год публикации - 2020)

3. Муравьев С.В., Борисова М.А. Dimension reduction of preference profile for aggregation of energy audit data Journal of Physics: Conference Series, - (год публикации - 2020)

4. Муравьев С.В., Погадаева Е.Ю. Computer-Aided Recognition of Defects in Welded Joints during Visual Inspections Based on Geometric Attributes Russian Journal of Nondestructive Testing, Volume 56, Issue 3, Pages 259-267 (год публикации - 2020) https://doi.org/10.1134/S1061830920030055

5. Муравьев С.В., Погадаева Е.Ю. Recognition Ability of Interval Fusion with Preference Aggregation in Weld Defects Images Analysis Proceedings of the 17th IMEKO TC10 Conference "Global Trends in Testing, Diagnostics & Inspection for 2030", Dubrovnik, Croatia, October 19-22, 2020, pp. 271-276 (год публикации - 2020)

6. Муравьев С.В., Худоногова Л.И., Хо М.Д. Precise Measurand Value Estimating By Interval Fusion With Preference Aggregation: Heteroscedasticity Case Proceedings of the 17th IMEKO TC10 Conference "Global Trends in Testing, Diagnostics & Inspection for 2030", Dubrovnik, Croatia, October 19-22, 2020, pp. 208-213 (год публикации - 2020)

7. Муравьев С.В., Худоногова Л.И., Хо М.Д. Adjustment of fundamental physical constant values using the interval fusion with preference aggregation Measurement, 2020, vol. 163, 108037 (год публикации - 2020) https://doi.org/10.1016/j.measurement.2020.108037

8. Хо М.Д., Муравьев С.В. Accuracy enhancement of measurand estimate on the base of additive combined measurements Sensor Review, vol. 40, issue 3, pp. 377-383 (год публикации - 2020) https://doi.org/10.1108/SR-01-2020-0009

9. Хо М.Д., Муравьев С.В. Повышение точности оценки измеряемой величины на основе мультипликативных совокупных измерений Труды XVI Международной научно-практической конференции «Электронные средства и системы управления», 18-20 ноября 2020 г., ТУСУР, Томск, 2020, - (год публикации - 2020)

10. Муравьев С.В., Хо М.Д. Программное обеспечение для обработки аддитивных совокупных измерений Свидетельство о государственной регистрации программы для ЭВМ, № 2020664471 (год публикации - 2020)

11. Муравьев С.В., Хо М.Д., Худоногова Л.И. Программный комплекс для комплексирования интервалов агрегированием предпочтений Свидетельство о государственной регистрации программы для ЭВМ, № 2020664470 (год публикации - 2020)


Возможность практического использования результатов
По современной классификации методов искусственного интеллекта агрегирование предпочтений относится к машинному обучению без учителя. Развиваемая в рамках проекта технология обработки и комплексирования многомерных гетероскедастичных данных различного происхождения, основанная на агрегировании предпочтений, наглядно демонстрирует положительный эффект от применения методов искусственного интеллекта. Она может быть рекомендована для использования во всех прикладных областях, где есть необходимость на основании неточных, неполных или противоречивых данных определить результат с повышенной точностью и достоверностью. Такими прикладными областями могут быть, в частности, системы обеспечения единства и требуемой точности измерений; робототехнические и мехатронные системы; системы и сети сбора данных произвольной природы и т.п.