КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ

Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.

ОБЩИЕ СВЕДЕНИЯ

Номер 17-72-20127

НазваниеПоиск новой физики в данных LHCb с применением методов глубокого обучения

РуководительДеркач Денис Александрович, кандидат наук (признаваемый в РФ PhD)

Организация финансирования, регион федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики", г Москва

Период выполнения при поддержке РНФ

07.2017 - 06.2020

, продлен на 07.2020 - 06.2022. Карточка проекта продления (ссылка)

Конкурс№24 - Конкурс 2017 года по мероприятию «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными.

Область знания, основной код классификатора 02 - Физика и науки о космосе, 02-101 - Физика элементарных частиц

Ключевые словамеждисциплинарное исследование, физика частиц, идентификация частиц, глубокое обучение, большой адронный коллайдер, машинное обучение, обнаружение аномалий

Код ГРНТИ29.05.37

СтатусУспешно завершен

ИНФОРМАЦИЯ ИЗ ЗАЯВКИ

Аннотация
Стандартная модель (СМ) физики элементарных частиц -- одно из главных достижений современной фундаментальной науки. Уже подтверждённая многими экспериментами, она обладает большой предсказательной силой и, в частности, может служить хорошей базовой теорией для описания большинства известных процессов, происходящих на ускорителях частиц. Тем не менее, некоторые актуальные вопросы пока остаются за пределами Стандартной модели: объяснение иерархии масс, поиск кандидатов в тёмную материю, источник асимметрии между материей и антиматерией и некоторые другие. Набор теорий, которые помогают решить тот или иной фундаментальный вопрос называют Новой физикой (НФ). В этом проекте предлагается использовать новейшие методы науки о данных для поиска эффектов Новой физики в данных эксперимента LHCb. Фундаментальным способом открытия таких эффектов является тщательное изучения известных процессов и поиск промежуточных частиц, которые не принадлежат известному спектру Стандартной модели. Необходимые для этого данные могут быть получены в специализированных экспериментах (SHiP, NA62) или в более универсальных экспериментах на Большом адронном коллайдере. Хорошим кандидатом для подобного поиска является эксперимент LHCb. Его основной особенностью является пространственное положение, выгодное для обнаружения частиц, состоящих из тяжёлых кварков. Преимуществом детектора LHCb также является точная система идентификации заряженных частиц, которая позволяет проводить прецизионные анализы широкого спектра. Целью данного исследования является поиск НФ обоими способами: сравнение характеристики распадов c предсказаниями СМ и обнаружение частицы X0, которая распадается на два мюона. Указание на рождение такой частицы были впервые получены на эксперименте HyperCP в 2005 году (PRL.94:021801,2005). Существование такой частицы поддерживается несколькими теоретическими моделями (например, two higgs doublet или next to minimal supersymmetry). Предполагаемая частица должна рождаться в распадах тяжёлых мезонов и барионов, которые в изобилии рождаются на Большом адронном коллайдере. В данном проекте предлагается исследовать два распада: распад B-мезона в 4 мюона и распад Сигма бариона в протон и два мюона. Оба распада представляются перспективными с точки зрения поиска новой физики и могут быть впервые зарегистрированы в данных LHCb run 2. Критическую роль в успехе проекта играют качественный алгоритм определения типа частиц (в частности, уровень выделения мюонов из остальных кандидатов), который, кроме прочего, должен обладать специальными свойствам, например, его эффективность не должна зависеть от импульса частицы. Этого можно достичь путём применения новейших методов науки о данных. Построенный алгоритм будет иметь значение не только для анализов, указанных в проекте, но и принесёт большую пользу другим анализам LHCb, придя на смену алгоритму, используемому сейчас. Особенностью предлагаемого алгоритма является агрегация низкоуровневых данных из различных частей детектора (поддетекторов). Эта характеристика является уникальной особенностью алгоритма и представляет самостоятельную научную ценность. Благодаря агрегации разнородных данных представится возможным варьировать и точность и скорость работы алгоритма. В то же время промежуточные результаты работы алгоритма агрегированные по времени могут служить индикаторами качества работы различных поддетекторов. Таким образом, дополнительным важным ожидаемым результатом от разработки предлагаемого алгоритма будет являться возможность использования его для поиска аномально работающих частей детектора, что облегчит задачи сертификации данных для эксперимента LHCb.

Ожидаемые результаты
Ожидаемые результаты можно разделить на несколько частей. Физический результат заключается в обнаружении указанных распадов. В случае, если искомая частица X0 будет обнаружена, это станет первым серьёзным продвижением на пути понимания устройства микромира за рамками Стандартной модели. Использование методов глубокого обучения в физике частиц -- актуальная тематика исследований по всему миру. Подобные методы тестируются в новых экспериментах: Belle 2, Nova. В случае поддержки проекта, глубокая нейросеть может впервые стать одним из базовых алгоритмов на одном из главных детекторов Большого адронного коллайдера. Кроме того, инструментально построенный алгоритм глубокого обучения может сократить ресурсы, необходимые для наблюдения за работой детектора LHCb. Это будет являться серьёзной инновацией и в дальнейшем может быть также использовано в индустриальных приложениях.

ОТЧЁТНЫЕ МАТЕРИАЛЫ

Аннотация результатов, полученных в 2017 году
В первый год выполнения проекта было проведены исследования, направленные на внедрение современных методов машинного обучения в процесс сбора и обработки данных на экспериментах Большого адронного коллайдера. В частности, были предложены новые подходы к комбинации информации, получаемых с разных частей эксперимента. Эти подходы, использующие методы глубокого обучения и решающие деревья, натренированные с изменённой функцией потерь позволяют не только повысить качество классификации, но и снизить зависимость качества модели от кинематических параметров треков. Это свойство позволит в дальнейшем снизить систематическую погрешность измерений. Полученные алгоритмы позволили начать два физических анализа, заключающихся в поиске сверхредких распадов B -> mu mu mu mu и Sigma -> p mu mu. В частности, было показано, что более высокая эффективность моделей идентификации частиц увеличивает вероятность обнаружения новых распадов. Теоретические исследования для уточнения предсказаний были также начаты в рамках работ первого года. Кроме того, был разработан и предложен алгоритм, который на основании предыдущих решений дежурных позволяет не только классифицировать данные как плохие или хорошие, но и формулировать адресные запросы экспертам подсистем. Интересной особенностью этого алгоритма, основанного на нейронной сети специального вида, является то, что для его тренировки не применяется информация, выходящая за рамки обычного дежурства: в качестве разметки используются флаги выставляемые дежурными на регулярной основе. Таким образом, для тренировки не расходуется дополнительное время экспертов, а сама система мониторинга становится более эффективной.

Публикации

1. Аззолини В., Борисяк М., Серминара Г., Деркач Д., Францони Г., Де Гуйо Ф., Коваль О., Пьерини М., Пол А., Ратников Ф., Сироки Ф., Устюжанин А., Влиман Ж-Р. Deep Learning Method for Inferring Cause of Data Anomalies Journal of Physics: Conference Series, - (год публикации - 2018)

2. Деркач Д., Гущин М., Лихоманенко Т., Рогожников А., Казеев Н., Чекалина В., Нейчев Р., Кириллов С., Ратников Ф. Machine Learning based global particle identification algorithms at LHCb experiment Journal of Physics: Conference Series, - (год публикации - 2018)

Аннотация результатов, полученных в 2018 году
Работы, проведённые во второй год, проекта были направлены на расширение результатов, полученных ранее. В частности, были протестированы и улучшены модели идентификации частиц с учётом требований, предъявляемых к скорости работы алгоритмов и их покрытию физического пространства параметров. Было произведено построение метода ускорения предсказаний нейронных сетей, использованных для задачи PID, с помощью байесовского разреживания. Данный метод показал наилучшее ускорение без потери качества. Результат работы опубликован в виде отдельной библиотеки. В процессе работы с данными было отмечено, что качество анализа зависит от размера и качества использованной выборки симулированных событий. Потому, для улучшения анализа было предложено построить генеративно-состязательную сеть, которая по параметрам трека и его ближайших соседей предсказывает распределение реконструированных высокоуровневых величин (например, отношения правдоподобий гипотез о типе частицы). Данный подход позволяет не только получить функцию генерации, но и существенно сокращает время, требуемое для получения дополнительных наборов симулированных данных, что очень важно с учётом количества данных, которые необходимо будет анализировать в будущих запусках экспериментов Большого адронного коллайдера и других экспериментов. Большое внимание также уделялось методам тренировки на зашумлённых данных, в которых форма сигнала и шума известны. Был предложен метод, улучшающий качество классификации, используя результаты оценки максимального правдоподобия, а также изменённая функция потерь для тренировки генеративно-состязательных сетей на данных, собранных в эксперименте. Кроме того, работы велись над улучшенными алгоритмами поиска аномалий в данных. Особенностью этого поиска является наличие высокого дисбаланса классов. Был предложен алгоритм, являющийся промежуточным этапом между одноклассовой и двухклассовой классификациями, который позволяет учесть известные аномальные примеры, при этом меньше страдающий от их недостаточного количества. Физические анализы, запланированные в проекте, близки к завершению, начата подготовка к теоретической интерпретации результатов.

Публикации

2. Гущин М., Чекалина В. Particle-identification techniques and performance at LHCb in Run 2 Nuclear Instruments and Methods in Physics Research Section A: Accelerators, Spectrometers, Detectors and Associated Equipment, 10 144 (год публикации - 2018) https://doi.org/10.1016/j.nima.2018.10.144

3. Деркач Д., Гущин М., Лихоманенко Т., Рогожников А., Казеев Н., Чекалина В., Нейчев Р., Кириллов С., Ратников Ф. Machine-Learning-based global particle-identification algorithms at the LHCb experiment Journal of Physics: Conference Series, Vol. 1085. No. 4. P. 1-5. (год публикации - 2018) https://doi.org/10.1088/1742-6596/1085/4/042038

4. Казеев Н.А., Деркач Д. А, Ратников Ф.Д., Устюжанин А.Е., Волохова А.С. Cherenkov detectors fast simulation using neural networks Nuclear Instruments and Methods in Physics Research Section A: Accelerators, Spectrometers, Detectors and Associated Equipment, - (год публикации - 2019) https://doi.org/10.1016/j.nima.2019.01.031

5. Гущин М.И., Деркач Д.А., Казеев Н.А. Machine Learning based Global Particle Identification Algorithms at the LHCb Experiment EPJ Web of Conferences, - (год публикации - 2019)

6. - Нейросеть научили предсказывать сигналы детекторов частиц Индикатор, - (год публикации - )

Аннотация результатов, полученных в 2019 году
В третий год работы над проектом, были проведены работы по имплементации полученных решений в программный стек LHCb. В частности, были протестированы новые модели идентификации частиц, которые позволили улучшить чувствительность в анализах с редкими распадами, идентифицированы недостатки решений. В рамках проекта также была проведена подготовка к новому запуску Большого адронного коллайдера, запланированному на 2022 год. Генеративные нейросетевые модели для симуляции отклика системы идентификации частиц, которые были получены в рамках проекта, были протестированы на реальных данных. Полученное качество описания системы позволило использовать эти модели в системе быстрой симуляции Lamarr, разработанной коллаборацией LHCb. Использование данной системы позволит значительно сэкономить время, необходимое для получения симулированных данных для выполнения анализа. Также в 2020 году было завершено исследование о построении классификаторов в условиях несбалансированных выборок данных. Это исследование было направлено на решение проблемы, которая часто возникает при построении алгоритмов машинного обучения для сертификации данных -- отсутствие большого количества примеров некачественных данных. Построенный алгоритм использует модифицированную функцию потерь, которая позволяет превзойти все известные подходы по качеству результатов.

Публикации

1. Борисяк М. С., Рыжиков А. С., Устюжанин А. Е., Деркач Д. А, Ратников Ф. Д., Минеева О. А. (1 + epsilon)-class Classification: an Anomaly Detection Method for Highly Imbalanced or Incomplete Data Sets Journal of Machine Learning Research, 21(72):1−22, 2020. (год публикации - 2020)

2. Казеев Н. А. Machine Learning for Muon Identification at LHCb Journal of Physics: conference series, - (год публикации - 2020)

3. Казеев Н. А., Борисяк М. А. Machine Learning on sWeighted data Journal of Physics: Conference Series, - (год публикации - 2020)

4. М. Борисяк, Н. Казеев Machine Learning on data with sPlot background subtraction Journal of Instrumentation, 14, no.08, P08020 (год публикации - 2019) https://doi.org/10.1088/1748-0221/14/08/P08020

5. Маевский А. С., Деркач Д.А., Казеев Н. А., Устюжанин А.Е, Артемьев М. Р., Андерлини Л. Fast Data-Driven Simulation of Cherenkov Detectors Using Generative Adversarial Networks Journal of Physics: Conference Series, - (год публикации - 2020)

6. Рыжиков А.С, Гущин М.И., Деркач Д.А. Variational Dropout Sparsification for Particle Identification speed-up Journal of Physics: Conference Series, - (год публикации - 2020)

Возможность практического использования результатов
Использование машинного обучения -- перспективное направление развитие для многих индустрий. В этом проекте мы разработали две потенциально применимых технологии: построение цифровых двойников с помощью генеративно-состязательных сетей и автоматизированный поиск аномалий в данных. Обе технологии могут позволить сэкономить издержки производства при правильном применении в индустрии.