10-12 March 2020
Academpark
Asia/Novosibirsk timezone

Распределённые и параллельные вычисления, технологии больших данных для проектов класса мегасайенс

Not scheduled
20m
Academpark

Academpark

Nikolaev str. 12, Novosibirsk, Russia
Invited oral Пленарная секция

Speaker

Prof. Владимир Васильевич Кореньков (ОИЯИ)

Description

Российские исследовательские институты и университеты активно участвуют в международных мегапроектах: LHC, CERN (эксперименты: ATLAS, ALICE, LHCb, CMS), XFEL, DESY (европейский лазер на свободных электронах), ESRF, France (европейский синхротронный центр), FAIR, GSI, Germany (эксперименты CBM, PANDA),ITER, France и др. В России идет подготовка проектов класса мегасаейнс: НИКА, ОИЯИ, Дубна (Коллайдер протонов и тяжелых ионов), ПИК, НИЦ ПИЯФ, Гатчина (Высокопоточный реакторный комплекс),ИССИ-4, НИЦ ИФВЭ, Протвино, Супер С-тау фабрика, ИЯФ СО РАН Новосибирск (Электрон-позитронный коллайдер), СКИФ, ИЯФ СО РАН Новосибирск (Сибирский кольцевой источник фотонов). Реализуется нейтринная программа: проекты в России (Байкал), Китае (JUNO), США (NOVA, DUNE) и другие масштабные проекты. Важнейшей частью проектов класса мегасайенс является создание и развитие компьютерных систем для обработки, хранения и анализа экспериментальных данных, алгоритмов поиска и доступа к данным.Информационно-вычислительные инфраструктуры, необходимые для выполнения исследовательских задач проектов класса мегасайнс, являются сложными распределенными, гетерогенными системами, включая системы экстрамассивного параллелизма, и системами распределенного хранения огромных массивов данных. Эксперименты на Большом Адронном Коллайдере (БАК) в ЦЕРН (Женева, Швейцария) играют ведущую роль в научных исследованиях не только в физике элементарных частиц и ядерной физике, но и в области аналитики Больших Данных. Глобальная распределенная система для обработки, хранения и анализа данных WLCG (Worldwide LHC Computing GRID) объединяет ресурсы около 180 компьютерных центров в 50 странах мира, общий объем хранения данных составляет более 1000 Петабайт. Обработка и анализ данных ведется с использованием высокопроизводительных комплексов (Грид), академических, национальных и коммерческих ресурсов облачных вычислений, суперкомпьютеров и других ресурсов. Российские центры, в первую очередь НИЦ КИ и ОИЯИ, активно участвуют в интеграции распределенных неоднородных ресурсов и развитии технологий Больших данных для обеспечения современных мегапроектов в таких высокоинтенсивных областях науки, как физика высоких энергий, астрофизика, биоинформатика и другие. В ОИЯИ активно ведутся работы по сооружению уникального ускорительного комплекса НИКА, который требует новых подходов к реализации распределенной инфраструктуры для обработки и анализа экспериментальных данных. В докладе представлен обзор крупных интегрированных инфраструктур для поддержки мегапроектов и тенденции их эволюции. Особое внимание уделяется новым перспективным направлениям в создании распределенных хранилищ данных (DataLake), интеграции Больших данных и суперкомпьютерных технологий, методов «машинного обучения».

Primary author

Presentation Materials

There are no materials yet.