Семинар

пятница, 18 января 2019
11:30
Конференц-зал ЛВФЭ
В.В. Кореньков
(ЛИТ, ОИЯИ)

Тенденции и перспективы развития распределенных вычислений и аналитики Больших данных для поддержки проектов класса мегасайенс

Эксперименты на Большом Адронном Коллайдере (БАК) в ЦЕРН играют ведущую роль в научных исследованиях в физике элементарных частиц, ядерной физике и в области аналитики Больших Данных (БД). Глобальная распределенная система для обработки, хранения и анализа данных WLCG - Worldwide LHC Computing GRID - объединяет ресурсы около 180 компьютерных центров в 50 странах мира. Общий объем хранения данных составляет более 1000 Петабайт. Анализ данных ведется с использованием высокопроизводительных комплексов (Грид), академических, национальных и коммерческих ресурсов облачных вычислений, суперкомпьютеров и других ресурсов. Российские центры НИЦ КИ и ОИЯИ участвуют в интеграции распределенных неоднородных ресурсов и развитии технологий БД для обеспечения проектов в физике высоких энергий, астрофизике, биоинформатике и др. В ОИЯИ ведутся работы по сооружению комплекса НИКА, который требует новых подходов к анализу данных. Установки класса мегасайенс создаются в крупных организациях России и других странах (PIC, FAIR, ELI, SKA и др.). Представлен обзор интегрированных инфраструктур мегапроектов и тенденции их эволюции. Внимание уделяется новым направлениям в создании хранилищ данных (DataLake), интеграции БД, суперкомпьютерных технологий, методов машинного обучения.