Speaker
Prof.
Владимир Васильевич Кореньков
(ОИЯИ)
Description
Российские исследовательские институты и университеты активно участвуют в международных мегапроектах: LHC, CERN (эксперименты: ATLAS, ALICE, LHCb, CMS), XFEL, DESY (европейский лазер на свободных электронах), ESRF, France (европейский синхротронный центр), FAIR, GSI, Germany (эксперименты CBM, PANDA),ITER, France и др. В России идет подготовка проектов класса мегасаейнс: НИКА, ОИЯИ, Дубна (Коллайдер протонов и тяжелых ионов), ПИК, НИЦ ПИЯФ, Гатчина (Высокопоточный реакторный комплекс),ИССИ-4, НИЦ ИФВЭ, Протвино, Супер С-тау фабрика, ИЯФ СО РАН Новосибирск (Электрон-позитронный коллайдер),
СКИФ, ИЯФ СО РАН Новосибирск (Сибирский кольцевой источник фотонов). Реализуется нейтринная программа: проекты в России (Байкал), Китае (JUNO), США (NOVA, DUNE) и другие масштабные проекты. Важнейшей частью проектов класса мегасайенс является создание и развитие компьютерных систем для обработки, хранения и анализа экспериментальных данных, алгоритмов поиска и доступа к данным.Информационно-вычислительные инфраструктуры, необходимые для выполнения исследовательских задач проектов класса мегасайнс, являются сложными распределенными, гетерогенными системами, включая системы экстрамассивного параллелизма, и системами распределенного хранения огромных массивов данных.
Эксперименты на Большом Адронном Коллайдере (БАК) в ЦЕРН (Женева, Швейцария) играют ведущую роль в научных исследованиях не только в физике элементарных частиц и ядерной физике, но и в области аналитики Больших Данных. Глобальная распределенная система для обработки, хранения и анализа данных WLCG (Worldwide LHC Computing GRID) объединяет ресурсы около 180 компьютерных центров в 50 странах мира, общий объем хранения данных составляет более 1000 Петабайт. Обработка и анализ данных ведется с использованием высокопроизводительных комплексов (Грид), академических, национальных и коммерческих ресурсов облачных вычислений, суперкомпьютеров и других ресурсов.
Российские центры, в первую очередь НИЦ КИ и ОИЯИ, активно участвуют в интеграции распределенных неоднородных ресурсов и развитии технологий Больших данных для обеспечения современных мегапроектов в таких высокоинтенсивных областях науки, как физика высоких энергий, астрофизика, биоинформатика и другие.
В ОИЯИ активно ведутся работы по сооружению уникального ускорительного комплекса НИКА, который требует новых подходов к реализации распределенной инфраструктуры для обработки и анализа экспериментальных данных.
В докладе представлен обзор крупных интегрированных инфраструктур для поддержки мегапроектов и тенденции их эволюции. Особое внимание уделяется новым перспективным направлениям в создании распределенных хранилищ данных (DataLake), интеграции Больших данных и суперкомпьютерных технологий, методов «машинного обучения».
Primary author
Prof.
Владимир Васильевич Кореньков
(ОИЯИ)