КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

 

ОБЩИЕ СВЕДЕНИЯ


Номер проекта 24-21-00386

НазваниеИсследование процессов посменного применения машины экстремального обучения (как режима функционирования) и глубокого обучения (как режима сна) для создания инкрементных методов обучения искусственных нейронных сетей

Руководитель Орлов Алексей Александрович, Доктор технических наук

Организация финансирования, регион федеральное государственное бюджетное образовательное учреждение высшего образования "Владимирский государственный университет имени Александра Григорьевича и Николая Григорьевича Столетовых" , Владимирская обл

Конкурс №89 - Конкурс 2023 года «Проведение фундаментальных научных исследований и поисковых научных исследований малыми отдельными научными группами»

Область знания, основной код классификатора 01 - Математика, информатика и науки о системах; 01-726 - Системы и технологии интеллектуального анализа данных и распознавания образов

Ключевые слова инкрементное машинное обучение, онлайновое машинное обучение, искусственные нейронные сети, машина экстремального обучения

Код ГРНТИ28.23.37


 

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ


Аннотация
Проект направлен на исследование процессов посменного (поочередного с повторением) применения машины экстремального обучения для корректировки весов только выходного слоя сети (режима функционирования) и обратного распространения ошибки (глубокого обучения) для корректировки всех весов сети (режима сна) с целью решения фундаментальной научной проблемы создания высокоэффективных инкрементных (в том числе онлайновых) методов обучения (с учителем) искусственных нейронных сетей. Актуальность обозначенной проблемы связана с необходимостью проведения исследований в области интеллектуального анализа для решения большего множества прикладных задач повышенной сложности, в которых требуются высокоточные и быстродействующие инкрементные методы обучения искусственных нейронных сетей, работающие в условиях малого объема обучающей выборки, а также адаптирующиеся в реальном масштабе времени под изменения внешних условий на этапе функционирования. Иначе говоря, на практике возникает задача "мгновенного" и одновременно точного реагирования на каждый обучающий пример, т.е. после обучения на одном примере сеть сразу должна с заданной точностью его повторить (выдавать ответ, соответствующий обучающему примеру). Итерационные методы обучения нейросетей (включая популярные методы обучения как обучение с подкреплением, состязательные модели) имеют плавную сходимость, поэтому не позволяют достичь такого эффекта. Исключение составляет машина экстремального обучения, в которой возможно также последовательное обучение. Но машина экстремального обучения обладает недостатками, связанными с отсутствием глубокого обучения, что ограничивает ее использование на практике. Существуют довольно новые методы быстрого обучения, в которых в качестве обучающей выборки применяются мета-примеры. Но эти методы требуют генерации специальных синтетических данных, отличаются малой изученностью и слабой пригодностью на практике, в связи с чем данные методы пока подвергаются критике. В основе проекта лежит идея создания высокоэффективных инкрементных нейросетей, использующая совокупность следующих взаимосвязанных принципов: - нейросеть (в качестве нейросети рассматривается многослойный персептрон) может находиться в двух режимах (в режиме функционирования и режиме сна); - в режиме функционирования сеть выдает выходные данные (ответы) на входные данные (запросы) для решения поставленной задачи интеллектуального анализа или дообучается в случае наличия обучающих примеров; - обучение выполняется последовательно по одному примеру или последовательно пакетами примеров; - обучение в режиме функционирования построено на основе машины экстремального обучения, в котором происходит корректировка весов только выходного слоя нейронов сети; - для реализации инкрементного обучения в машине экстремального обучения применяется мемоизация и рекуррентное вычисление матриц системы нормальных уравнений линейной регрессии; - в случае переобучения (возникновения больших по модулю значений весовых коэффициентов на выходном слое) сеть переходит в режим сна; - в режиме сна выполняется передача части значений весов выходного слоя на нижние слои нейронов сети (веса с выходного слоя "растекаются" на нижние слои с помощью метода обратного распространения ошибки); - для обучения сети в режиме сна используются ответы, которые выдает та же сеть на сгенерированные случайным образом запросы (иначе говоря, сеть заново обучает сама себя, но уже другим методом); - дополнительно применяется фаза сна (часть режима сна), в которой выполняется уменьшение (по модулю) значений весов нейронов путем деления одного нейрона на два (система которых эквивалентна разделенному нейрону); - режимы функционирования и сна поочередно сменяют друг друга, длительность и момент смены которых зависят от значений весовых коэффициентов в нейронах сети.


 

ОТЧЁТНЫЕ МАТЕРИАЛЫ


Аннотация результатов, полученных в 2024 году
За первый год реализации проекта получены следующие результаты: 1. Методы и алгоритмы последовательного и пакетного обучения нейросети, основанные на машине экстремального обучения и мемоизации матриц системы нормальных уравнений линейной регрессии. Разработаны методы и алгоритмы инкрементного последовательного и пакетного обучения нейронных сетей на основе машины экстремального обучения, которые включают механизм мемоизации матриц системы нормальных уравнений линейной регрессии, позволяющий сократить время обучения по сравнению с классическими методами до 300 раз. Получены результаты исследования влияния ключевых параметров на работу алгоритма посменного инкрементного обучения в контексте нейронных сетей. Проведенные эксперименты позволили определить влияние числа нейронов в скрытом слое, типов функций активации и значений весовых коэффициентов на производительность алгоритма. Результаты подчеркивают значимость этих параметров в формировании обучающих возможностей и общей эффективности алгоритма посменного инкрементного обучения в контексте нейронных сетей. 2. Методы и алгоритмы обучения нейросети в режиме сна, основанные на передаче части значений весов на нижние слои нейронов. Разработан алгоритм посменного инкрементного обучения, адаптированный для нейронной сети к новым данным и задачам без полного переобучения. Алгоритм включает два основных состояния: состояние функционирования и состояние сна. В состоянии функционирования нейронная сеть либо генерирует выходные данные на основе входных, либо проходит инкрементное обучение на новых примерах. Обучение в этом состоянии основано на использовании машины экстремального обучения. Машина экстремального обучения настраивает только веса выходного слоя, что позволяет модели быстро адаптироваться к новым данным, сохраняя неизменной общую структуру сети. Когда модель нейросети начинает демонстрировать признаки переобучения или когда веса выходного слоя становятся слишком большими, она переходит в состояние сна. В этом состоянии применяется метод обратного распространения ошибки для глобальной оптимизации всех весов сети. Это помогает предотвратить переобучение и улучшить общую производительность модели. Кроме обратного распространения ошибки, машина экстремального обучения используется для инкрементного обучения на псевдопримерах, что эффективно проводит консолидацию знаний о предыдущих задачах и улучшает адаптацию к новым данным. Псевдопримеры позволяют нейронной сети сохранять и адаптировать свои знания, избегая катастрофического забывания. Они способствуют улучшению способности модели к обобщению и повышению качества обучения. Проведено исследование методов генерации псевдопримеров для обучения нейронных сетей в рамках разработанного алгоритма посменного инкрементного обучения, которое показало эффективность методов, основанных на вариационных автокодировщиках, и методов GANs, обеспечивших наивысшую точность по метрике F1 Micro и значительно улучшающих сбалансированность предсказаний. 3. Результаты экспериментального исследования разработанных методов и алгоритмов. Выполнено исследование разработанных методов и алгоритмов на примере решения задачи распознавания активности человека и задачи классификации изображений маркировки на металлических поверхностях промышленных изделий. Показано, что разработанный метод посменного инкрементного обучения нейронной сети, основанный на использовании инкрементной машины экстремального обучения и метода обратного распространения ошибки, обеспечивает точность инкрементного обучения до 96% по метрике F1-micro на данных о физической активности человека. Результаты исследования разработанного метода на примере решения задачи классификации символов маркировки показали возможность дообучения модели нейросети в процессе функционирования. При этом наибольшую оценку точности (до 95%) при дообучении нейросети показала модель VGG16.

 

Публикации

1. Абрамова Е.С., Орлов А.А., Абрамов О.А. Exploring the Impact of Parameters on the Effectiveness of the Neural Network Alternate Incremental Learning Algorithm 2024 International Russian Smart Industry Conference (SmartIndustryCon), IEEE, Abramova E. S. , Orlov A. A., Abramov O. A. Exploring the Impact of Parameters on the Effectiveness of the Neural Network Alternate Incremental Learning Algorithm // 2024 International Russian Smart Industry Conference (SmartIndustryCon), Sochi, Russian Federation, 2024, pp. 611-615, doi: 10.1109/SmartIndustryCon61328.2024.10515861. (год публикации - 2024)
10.1109/SmartIndustryCon61328.2024.10515861

2. Мареев А.В., Орлов А.А. Incremental Training of Convolutional Neural Networks for Recognition of Marking Symbols ICIEAM 2024, IEEE, Mareev A., Orlov A. Incremental Training of Convolutional Neural Networks for Recognition of Marking Symbols // International Conference on Industrial Engineering, Applications and Manufacturing, ICIEAM 2024, 2024, pp. 934–938 (год публикации - 2024)
10.1109/ICIEAM60818.2024.10553947


Аннотация результатов, полученных в 2025 году
За второй год реализации проекта получены следующие результаты: 1. Метод деления нейронов с сохранением суммы весов для адаптивной архитектуры нейронной сети. Разработан и исследован принципиально новый алгоритм динамической структурной адаптации нейронных сетей, направленный на преодоление проблемы переобучения при обучении на малых выборках. Алгоритм автоматически идентифицирует «проблемные» нейроны, склонные к излишней специализации, на основе двух формализованных метрик: степени обученности (отражает величину последних изменений весов) и упругости (характеризует стабильность выхода). При превышении пороговых значений выбранный нейрон делится на два новых, при этом их веса инициализируются с соблюдением принципа консервации знания: суммарный взвешенный вход для следующего слоя остаётся неизменным. Это обеспечивает минимальный сбой в работе сети на уже изученных данных при увеличении её вычислительной мощности. Эксперименты на синтетических последовательных задачах подтвердили, что предложенный метод позволяет повысить общую точность модели и улучшить баланс между способностью усваивать новое и сохранять старое знание по сравнению с сетями фиксированной архитектуры. 2. Усовершенствованный метод управления режимами «функционирования» и «сна» в инкрементном обучении. Проведена глубокая доработка и формализация алгоритма посменного инкрементного обучения, предложенного в первом году проекта. Разработан и апробирован комплексный критерий «усталости» сети, который определяет оптимальный момент для перехода из фазы активного обучения в фазу консолидации знаний («сон»). Критерий основан на анализе не только нормы весов, но и динамики ошибки на валидационных данных и стабильности предсказаний сети. Это позволяет более точно предсказывать приближение состояния переобучения. Кроме того, экспериментально определены оптимальные параметры фазы «сна»: длительность и методы генерации псевдопримеров, используемых для дообучения. Установлено, что короткая, но интенсивная фаза сна с использованием псевдопримеров, сгенерированных на основе предыдущих состояний сети, наиболее эффективна для закрепления знаний без потери пластичности. 3. Комплексная система для прикладной задачи идентификации объектов с инкрементальным обучением и её экспериментальная верификация. Теоретические разработки проекта были успешно применены для создания интеллектуальной системы автоматической идентификации железнодорожных колёс по маркировке в видеопотоке. Разработанный программный комплекс реализует полный конвейер обработки: обнаружение колеса, локализацию маркировки, сегментацию и классификацию символов. Ключевой особенностью системы является интеграция механизма инкрементного посменного обучения в этап классификации, что позволяет системе адаптироваться к появлению новых типов маркировки прямо в процессе эксплуатации, без остановки производства и полного переобучения. В ходе масштабных экспериментальных исследований определены оптимальные стратегии трансферного и инкрементного обучения для современных нейросетевых архитектур (YOLOv11). Установлено, что заморозка определённых слоёв (4-23) в сочетании с оптимизатором SGD и малым темпом обучения обеспечивает дообучение на новых типах символов с минимальной деградацией точности на старых (потеря всего ~1%). Проведённый сравнительный анализ показал, что разработанный гибридный подход превосходит классические методы полного переобучения по эффективности использования ресурсов и конкурирует с современными методами непрерывного обучения (такими как iCaRL и EWC) по итоговой точности, особенно в условиях ограниченной памяти.

 

Публикации

1. Орлов А.А., Абрамова Е.С. Алгоритм посменного инкрементного обучения нейронной сети в условиях непрерывного поступления данных ММРО-2025, ООО "МАКС Пресс", Орлов, А. А. Алгоритм посменного инкрементного обучения нейронной сети в условиях непрерывного поступления данных / А. А. Орлов, Е. С. Абрамова // Математические методы распознавания образов : Тезисы докладов 22-й всероссийской конференции с международным участием, Муром, 22–26 сентября 2025 года. – Москва: ООО "МАКС Пресс", 2025. – С. 69-70. – EDN CZXBFZ. (год публикации - 2025)
10.29003/m4729.978-5-317-07438-8

2. Мареев А.В., Орлов А.А., Верещагин И.Д. Adaptive Recognition of Markings on Railway Wheels Using Incremental Learning with YOLOv11 ICIEAM 2025, IEEE, Mareev A., Orlov A., Vereshchagin I. Adaptive Recognition of Markings on Railway Wheels Using Incremental Learning with YOLOv11 // International Conference on Industrial Engineering, Applications and Manufacturing, ICIEAM 2025, 2025, pp. 789-793 (год публикации - 2025)
10.1109/ICIEAM65163.2025.11028540

3. Мареев А.В., Орлов А.А., Верещагин И.Д. Исследование нейросетевой архитектуры YOLO для идентификации железнодорожных колес в видеопотоке с инкрементным обучением DSPA - 2025, Российское научно-техническое общество радиотехники, электроники и связи им. А.С. Попова, Москва, Мареев, А. В. Исследование нейросетевой архитектуры YOLO для идентификации железнодорожных колес в видеопотоке с инкрементным обучением / А. В. Мареев, А. А. Орлов, И. Д. Верещагин // Цифровая обработка сигналов и её применение DSPA - 2025 : Доклады XXVII Международной конференции, Москва, 26–28 марта 2025 года. – Москва: Российское научно-техническое общество радиотехники, электроники и связи им. А.С. Попова, 2025. – С. 161-166 (год публикации - 2025)

4. Абрамова Е.С., Орлов А.А. A Neuron Splitting Algorithm with Weight Conservation for Adaptive Neural Networks International Russian Automation Conference (RusAutoCon), IEEE, E. S. Abramova and A. A. Orlov, "A Neuron Splitting Algorithm with Weight Conservation for Adaptive Neural Networks," 2025 International Russian Automation Conference (RusAutoCon), Sochi, Russian Federation, 2025, pp. 148-152, doi: 10.1109/RusAutoCon65989.2025.11177446. (год публикации - 2025)
10.1109/RusAutoCon65989.2025.11177446

5. Мареев А.В., Орлов А.А., Верещагин И.Д. Архитектура и реализация программного комплекса для идентификации колес по маркировке с использованием инкрементного обучения Журнал "Программная инженерия", "ООО "Издательство "Новые технологии" (год публикации - 2025)


Возможность практического использования результатов
Результаты, полученные в ходе реализации проекта, обладают потенциалом для практического применения в экономике и социальной сфере Российской Федерации, формируя научно-технологический задел в области создания адаптивных систем искусственного интеллекта для динамических сред. Разработанные методы инкрементного посменного обучения, алгоритм адаптации архитектуры через расщепление нейронов и готовые программные решения позволяют создавать или существенно модернизировать интеллектуальные системы промышленного мониторинга и контроля качества. В частности, внедрение разработанного комплекса для идентификации железнодорожных колёс по маркировке в видеопотоке напрямую способствует технологическому перевооружению транспортного машиностроения и логистики, повышая точность прослеживаемости продукции, эффективность производства и снижая эксплуатационные риски за счёт автоматизации. В социальной сфере данные технологии могут быть адаптированы для создания доступных систем удалённого мониторинга здоровья, адаптивных образовательных платформ и интеллектуальных помощников, способных непрерывно обучаться и персонализировать взаимодействие под изменяющиеся потребности пользователей, тем самым внося вклад в развитие цифровой экономики, импортозамещение критических программных решений и повышение качества жизни граждан.