КАРТОЧКА ПРОЕКТА ФУНДАМЕНТАЛЬНЫХ И ПОИСКОВЫХ НАУЧНЫХ ИССЛЕДОВАНИЙ,
ПОДДЕРЖАННОГО РОССИЙСКИМ НАУЧНЫМ ФОНДОМ
Информация подготовлена на основании данных из Информационно-аналитической системы РНФ, содержательная часть представлена в авторской редакции. Все права принадлежат авторам, использование или перепечатка материалов допустима только с предварительного согласия авторов.
ОБЩИЕ СВЕДЕНИЯ
Номер проекта 20-71-10127
НазваниеАнализ и оптимизация энергоэффективности и производительности суперкомпьютеров на перспективной элементной базе отечественного производства
Руководитель Тимофеев Алексей Владимирович, Кандидат физико-математических наук
Организация финансирования, регион Федеральное государственное бюджетное учреждение науки Объединенный институт высоких температур Российской академии наук , г Москва
Конкурс №50 - Конкурс 2020 года «Проведение исследований научными группами под руководством молодых ученых» Президентской программы исследовательских проектов, реализуемых ведущими учеными, в том числе молодыми учеными
Область знания, основной код классификатора 01 - Математика, информатика и науки о системах; 01-505 - Системы компьютерной поддержки научных исследований
Ключевые слова Высокопроизводительные вычисления, суперкомпьютер, суперкомпьютер субэкзафлопского класса, процессор Эльбрус, Intel, AMD, вычислительная сеть Ангара, иммерсионное охлаждение, энергоэффективность
Код ГРНТИ50.33.03, 50.33.04, 50.09.33
ИНФОРМАЦИЯ ИЗ ЗАЯВКИ
Аннотация
Данный проект направлен на решение задачи построения архитектуры суперкомпьютера субэкзафлосного класса, эффективного по производительности энергопотреблению с максимизацией содержания элементов отечественного производства. Проект основан на развитии задела, накопленного в процессе работы руководителя проекта и остальных членов научной группы с новейшими суперкомпьютерными компонентами отечественного и зарубежного производства в течение последних пяти лет, а в отдельных случаях в течение последнего десятка лет. Важной чертой проекта является ориентированность на оптимизацию архитектуры суперкомпьютера под решение часто встречающихся конкретных научных и инженерных задач.
В течение многих лет в России почти не было производства элементной базы суперкомпьютеров, способного конкурировать с зарубежным по качеству, производительности и стоимости. Сейчас наблюдается кардинальное изменение ситуации, которое проявляется как в указах Президента РФ о необходимости развивать технологии, требующие высокопроизводительные вычислительные системы, так и в появлении конкурентоспособных суперкомпьютерных компонент, произведённых в России, что подчёркивает научную новизну проекта. Глобальная политическая ситуация и усиливающиеся сложности сотрудничества с зарубежными производителями передовых компонент вычислительной техники только усиливают необходимость развития отечественной элементной базы суперкомпьютеров и актуальность данного проекта.
Проект разбит на несколько задач, позволяющих рассмотреть основные компоненты суперкомпьютера:
1) Исследование энергоэффективности вычислительных кластеров с учётом жидкостной погружной и воздушной систем охлаждения;
2) Исследование энергоэффективности и производительности процессоров (например, Elbrus, Байкал-ARM, AMD, Intel);
3) Исследование энергоэффективности и производительности видеокарт (например, Nvidia, AMD);
4) Исследование эффективности интерконнектов (например, Angara, OmniPath, InfiniBand).
5) Формулирование предложений по созданию эффективного по производительности, энергопотреблению и стоимости суперкомпьютера с максимизацией содержание элементов отечественного производства.
Для тестирования всех компонент в данном проекте планируется опираться на следующие классы задач:
а) матричные операции;
б) быстрое преобразование Фурье;
в) искусственный интеллект;
г) молекулярная динамика.
Выполнимость проекта подкрепляется заделом научной группы в виде обширных контактов с отечественными и зарубежными производителями суперкомпьютерных компонент, в виде исследований современных образцов суперкомпьютерных компоненты отечественного и зарубежного производства и в виде наличия целого ряда разных архитектур либо собранных непосредственно в научной группе, либо доступных для работы и исследования.
Для выполнения проекта собран уникальный коллектив, включающий
а) учёных, занимающихся кроме исследования проблем суперкомпьютеров ещё и задачами материаловедения, физики и др., что позволяет оптимизировать архитектуру под реальные и самые распространённые задачи, и
б) специалистов, разрабатывающих компоненты и суперкомпьютеры, что позволяет подключить глубокое понимание особенностей элементной базы суперкомпьютеров. Практически по всем перечисленным задачам наш коллектив находится в контакте с отечественными и зарубежными фирмами-производителями. Встречаясь с их сотрудниками и ведущими учёными суперкомпьютерной области на научных конференциях, мы убеждаемся, что наши результаты соответствуют лучшему мировому уровню.
Здесь и далее нумерация разделов сохраняется той же, что в аннотации проекта.
ОТЧЁТНЫЕ МАТЕРИАЛЫ
Публикации
1.
Халилов М.Р., Тимофеев А.В.
Performance analysis of CUDA, OpenACC and OpenMP programming models on TESLA V100 GPU
Journal of Physics: Conference Series, 1740 012056 (год публикации - 2021)
10.1088/1742-6596/1740/1/012056
2. Шамсутдинов А., Халилов М., Исмгилов Т., Пирюгин А., Бирюков С., Стегайлов В., Тимофеев А. Performance of supercomputers based on Angara interconnect and novel AMD CPUs/GPUs Communications in Computer and Information Science, V.1413 (год публикации - 2021)
3.
А.Мукосей, А.Семёнов
Simulation of Utilization and Energy Saving of the Angara Interconnect
Lobachevskii Journal of Mathematics, 2022, Vol. 43, No. 4, pp. 879–887. (год публикации - 2022)
10.1134/S1995080222070186
4.
Бычков А., Никольский В.
Rust Language for Supercomputing Applications
Communications in Computer and Information Science, V.1510, pp. 391-403 (год публикации - 2022)
10.1007/978-3-030-92864-3_30
5.
Халилов М.Р.,Тимофеев А.В.
Towards OpenUCX and GPUDirect Technology Support for the Angara Interconnect
Lecture Notes in Computer Science, vol 13708 (год публикации - 2022)
10.1007/978-3-031-22941-1_43
6.
Ю.Гончарук, Ю.Гришичкин, А.Семенов, В.Стегайлов, В.Умрихин
Evaluation of the Angara Interconnect Prototype TCP/IP Software Stack: Implementation, Basic Tests and BeeGFS Benchmarks
Lecture Notes in Computer Science, LNCS, volume 13708 (год публикации - 2022)
10.1007/978-3-031-22941-1_31
7.
Колотинский Д.А., Тимофеев. А.В.
Performance Analysis of GPU-Based Code for Complex Plasma Simulation
Lecture Notes in Computer Science, volume 13708, pp 276–289 (год публикации - 2022)
10.1007/978-3-031-22941-1_20
8.
Пугачев Л., Умаров И., Попов В., Андреев В., Стегайлов В.В., Тимофеев А.В.
PIConGPU on Desmos Supercomputer: GPU Acceleration, Scalability and Storage Bottleneck
Lecture Notes in Computer Science, volume 13708, pp 290–302 (год публикации - 2022)
10.1007/978-3-031-22941-1_21
9.
Никольский В., Павлов Д., Стегайлов В.В.
State-of-the-Art Molecular Dynamics Packages for GPU Computations: Performance, Scalability and Limitations
Lecture Notes in Computer Science, volume 13708, pp 290–302 (год публикации - 2022)
10.1007/978-3-031-22941-1_25
10.
Колотинский Д.А., Тимофеев А.В.
OpenDust: A fast GPU-accelerated code for the calculation of forces acting on microparticles in a plasma flow
Computer Physics Communications, Volume 288, 108746 (год публикации - 2023)
10.1016/j.cpc.2023.108746
11.
Халилов М.Р.,Тимофеев А.В.
Implementation of OpenUCX framework and GPUDirect technology support for the Angara interconnect
Параллельные вычислительные технологии – XVI международная конференция, ПаВТ'2022, г. Дубна, 29–31 марта 2022 г. Короткие статьи и описания плакатов. Челябинск: Издательский центр ЮУрГУ, c.130 (год публикации - 2022)
10.14529/pct2022
12.
Павлов Д.Г., Колотинский Д.А., Стегайлов В.В.
GPU-Based Molecular Dynamics of Turbulent Liquid Flows with OpenMM
Parallel Processing and Applied Mathematics. PPAM 2022. Lecture Notes in Computer Science, vol 13826. Springer, Cham., С. 346-358. (год публикации - 2023)
10.1007/978-3-031-30442-2_26
13. Исмагилов Т.Ф., Пирюгин А.П., Семёнов А.С. Early Performance Evaluation of Distributed Learning via GPU-aware MPI over the Angara Interconnect Lobachevskii Journa l of Mathematics (год публикации - 2023)
14.
А.Мукосей, А.Семенов, А.Третьяков
Graph based routing algorithm for torus topology and its evaluation for the Angara interconnect
Journal of Parallel and Distributed Computing, 183, 104765 (год публикации - 2023)
10.1016/j.jpdc.2023.104765
Публикации
1.
Халилов М.Р., Тимофеев А.В.
Performance analysis of CUDA, OpenACC and OpenMP programming models on TESLA V100 GPU
Journal of Physics: Conference Series, 1740 012056 (год публикации - 2021)
10.1088/1742-6596/1740/1/012056
2. Шамсутдинов А., Халилов М., Исмгилов Т., Пирюгин А., Бирюков С., Стегайлов В., Тимофеев А. Performance of supercomputers based on Angara interconnect and novel AMD CPUs/GPUs Communications in Computer and Information Science, V.1413 (год публикации - 2021)
3.
А.Мукосей, А.Семёнов
Simulation of Utilization and Energy Saving of the Angara Interconnect
Lobachevskii Journal of Mathematics, 2022, Vol. 43, No. 4, pp. 879–887. (год публикации - 2022)
10.1134/S1995080222070186
4.
Бычков А., Никольский В.
Rust Language for Supercomputing Applications
Communications in Computer and Information Science, V.1510, pp. 391-403 (год публикации - 2022)
10.1007/978-3-030-92864-3_30
5.
Халилов М.Р.,Тимофеев А.В.
Towards OpenUCX and GPUDirect Technology Support for the Angara Interconnect
Lecture Notes in Computer Science, vol 13708 (год публикации - 2022)
10.1007/978-3-031-22941-1_43
6.
Ю.Гончарук, Ю.Гришичкин, А.Семенов, В.Стегайлов, В.Умрихин
Evaluation of the Angara Interconnect Prototype TCP/IP Software Stack: Implementation, Basic Tests and BeeGFS Benchmarks
Lecture Notes in Computer Science, LNCS, volume 13708 (год публикации - 2022)
10.1007/978-3-031-22941-1_31
7.
Колотинский Д.А., Тимофеев. А.В.
Performance Analysis of GPU-Based Code for Complex Plasma Simulation
Lecture Notes in Computer Science, volume 13708, pp 276–289 (год публикации - 2022)
10.1007/978-3-031-22941-1_20
8.
Пугачев Л., Умаров И., Попов В., Андреев В., Стегайлов В.В., Тимофеев А.В.
PIConGPU on Desmos Supercomputer: GPU Acceleration, Scalability and Storage Bottleneck
Lecture Notes in Computer Science, volume 13708, pp 290–302 (год публикации - 2022)
10.1007/978-3-031-22941-1_21
9.
Никольский В., Павлов Д., Стегайлов В.В.
State-of-the-Art Molecular Dynamics Packages for GPU Computations: Performance, Scalability and Limitations
Lecture Notes in Computer Science, volume 13708, pp 290–302 (год публикации - 2022)
10.1007/978-3-031-22941-1_25
10.
Колотинский Д.А., Тимофеев А.В.
OpenDust: A fast GPU-accelerated code for the calculation of forces acting on microparticles in a plasma flow
Computer Physics Communications, Volume 288, 108746 (год публикации - 2023)
10.1016/j.cpc.2023.108746
11.
Халилов М.Р.,Тимофеев А.В.
Implementation of OpenUCX framework and GPUDirect technology support for the Angara interconnect
Параллельные вычислительные технологии – XVI международная конференция, ПаВТ'2022, г. Дубна, 29–31 марта 2022 г. Короткие статьи и описания плакатов. Челябинск: Издательский центр ЮУрГУ, c.130 (год публикации - 2022)
10.14529/pct2022
12.
Павлов Д.Г., Колотинский Д.А., Стегайлов В.В.
GPU-Based Molecular Dynamics of Turbulent Liquid Flows with OpenMM
Parallel Processing and Applied Mathematics. PPAM 2022. Lecture Notes in Computer Science, vol 13826. Springer, Cham., С. 346-358. (год публикации - 2023)
10.1007/978-3-031-30442-2_26
13. Исмагилов Т.Ф., Пирюгин А.П., Семёнов А.С. Early Performance Evaluation of Distributed Learning via GPU-aware MPI over the Angara Interconnect Lobachevskii Journa l of Mathematics (год публикации - 2023)
14.
А.Мукосей, А.Семенов, А.Третьяков
Graph based routing algorithm for torus topology and its evaluation for the Angara interconnect
Journal of Parallel and Distributed Computing, 183, 104765 (год публикации - 2023)
10.1016/j.jpdc.2023.104765
Публикации
1.
Халилов М.Р., Тимофеев А.В.
Performance analysis of CUDA, OpenACC and OpenMP programming models on TESLA V100 GPU
Journal of Physics: Conference Series, 1740 012056 (год публикации - 2021)
10.1088/1742-6596/1740/1/012056
2. Шамсутдинов А., Халилов М., Исмгилов Т., Пирюгин А., Бирюков С., Стегайлов В., Тимофеев А. Performance of supercomputers based on Angara interconnect and novel AMD CPUs/GPUs Communications in Computer and Information Science, V.1413 (год публикации - 2021)
3.
А.Мукосей, А.Семёнов
Simulation of Utilization and Energy Saving of the Angara Interconnect
Lobachevskii Journal of Mathematics, 2022, Vol. 43, No. 4, pp. 879–887. (год публикации - 2022)
10.1134/S1995080222070186
4.
Бычков А., Никольский В.
Rust Language for Supercomputing Applications
Communications in Computer and Information Science, V.1510, pp. 391-403 (год публикации - 2022)
10.1007/978-3-030-92864-3_30
5.
Халилов М.Р.,Тимофеев А.В.
Towards OpenUCX and GPUDirect Technology Support for the Angara Interconnect
Lecture Notes in Computer Science, vol 13708 (год публикации - 2022)
10.1007/978-3-031-22941-1_43
6.
Ю.Гончарук, Ю.Гришичкин, А.Семенов, В.Стегайлов, В.Умрихин
Evaluation of the Angara Interconnect Prototype TCP/IP Software Stack: Implementation, Basic Tests and BeeGFS Benchmarks
Lecture Notes in Computer Science, LNCS, volume 13708 (год публикации - 2022)
10.1007/978-3-031-22941-1_31
7.
Колотинский Д.А., Тимофеев. А.В.
Performance Analysis of GPU-Based Code for Complex Plasma Simulation
Lecture Notes in Computer Science, volume 13708, pp 276–289 (год публикации - 2022)
10.1007/978-3-031-22941-1_20
8.
Пугачев Л., Умаров И., Попов В., Андреев В., Стегайлов В.В., Тимофеев А.В.
PIConGPU on Desmos Supercomputer: GPU Acceleration, Scalability and Storage Bottleneck
Lecture Notes in Computer Science, volume 13708, pp 290–302 (год публикации - 2022)
10.1007/978-3-031-22941-1_21
9.
Никольский В., Павлов Д., Стегайлов В.В.
State-of-the-Art Molecular Dynamics Packages for GPU Computations: Performance, Scalability and Limitations
Lecture Notes in Computer Science, volume 13708, pp 290–302 (год публикации - 2022)
10.1007/978-3-031-22941-1_25
10.
Колотинский Д.А., Тимофеев А.В.
OpenDust: A fast GPU-accelerated code for the calculation of forces acting on microparticles in a plasma flow
Computer Physics Communications, Volume 288, 108746 (год публикации - 2023)
10.1016/j.cpc.2023.108746
11.
Халилов М.Р.,Тимофеев А.В.
Implementation of OpenUCX framework and GPUDirect technology support for the Angara interconnect
Параллельные вычислительные технологии – XVI международная конференция, ПаВТ'2022, г. Дубна, 29–31 марта 2022 г. Короткие статьи и описания плакатов. Челябинск: Издательский центр ЮУрГУ, c.130 (год публикации - 2022)
10.14529/pct2022
12.
Павлов Д.Г., Колотинский Д.А., Стегайлов В.В.
GPU-Based Molecular Dynamics of Turbulent Liquid Flows with OpenMM
Parallel Processing and Applied Mathematics. PPAM 2022. Lecture Notes in Computer Science, vol 13826. Springer, Cham., С. 346-358. (год публикации - 2023)
10.1007/978-3-031-30442-2_26
13. Исмагилов Т.Ф., Пирюгин А.П., Семёнов А.С. Early Performance Evaluation of Distributed Learning via GPU-aware MPI over the Angara Interconnect Lobachevskii Journa l of Mathematics (год публикации - 2023)
14.
А.Мукосей, А.Семенов, А.Третьяков
Graph based routing algorithm for torus topology and its evaluation for the Angara interconnect
Journal of Parallel and Distributed Computing, 183, 104765 (год публикации - 2023)
10.1016/j.jpdc.2023.104765