Блестящая защита как один из итогов года в Лаборатории информационных технологий 20 декабря в Лаборатории информационных технологий им. М. Г. Мещерякова с успехом прошла защита диссертации Сергея Белова на соискание ученой степени кандидата технических наук. Темой диссертационной работы стали методы и технологии Больших данных для решения задач физики высоких энергий в распределенной вычислительной среде. Научным руководителем работы выступил научный руководитель ЛИТ ОИЯИ доктор технических наук Владимир Кореньков. Д.ф.-м.н. Лев Дудко, заведующий Лабораторией электрослабых и новых взаимодействий отдела экспериментальной физики высоких энергий НИИЯФ МГУ, стал научным консультантом диссертационной работы. Оппоненты заведующий Центром распределённых вычислений ИППИ РАН д.ф.-м.н. Александр Афанасьев и инженер-исследователь высшей квалификации Марсельский центр физики частиц Института ядерной физики и физики частиц Национального центра научных исследований (Марсель, Франция) к.ф.-м.н. Андрей Царегородцев. «Диссертационная работа Сергея Белова имеет большое научное, технологичное и практическое значение, так как он участвовал во многих пионерских работах по развитию мониторинга крупных компьютерных систем, управления распределенными данными масштабных научных проектов, созданием платформ аналитики Больших данных, цифровой экосистемы ОИЯИ», - подчеркнул в своем комментарии по итогам защиты Владимир Кореньков. В крупных научных экспериментах в области физики высоких энергий одной есть ряд ключевых задач, среди которых физическое моделирование, хранение данных и организация доступа к ним, а также организации распределенных вычислений. Сергей Белов предложил подход к автоматизации некоторых этапов моделирования физических событий в физике высоких энергий, основанный на описании метаинформации о событиях для передачи между этапами обработки и на использовании базы знаний в распределённой вычислительной среде. Им были разработаны новые методы, модели, алгоритмы и программные средства для создания системы хранения и доступа к моделированным физическим данным для экспериментов на Большом адронном коллайдере (БАК) в ЦЕРН, с целью повышения интеллектуального уровня анализа данных. В рамках диссертационной работы им создана специализированная база знаний смоделированных событий MCDB для использования в распределенной вычислительной среде. Разработанные база событий Монте-Карло моделирования и средства описания метаинформации о моделировании были успешно использованы для повышения степени автоматизации официальной цепочки моделирования в эксперименте CMS в 2010–2013 годах, а разработанный язык разметки HepML используется программами-генераторами CompHEP и CalcHEP. Как отметил Владимир Кореньков, Сергей Белов активно участвовал в пионерских работах на БАК по созданию системы мониторинга Worlwide LHC Computing Grid на новой технологической платформе, разработке системы поддержки физического моделирования и анализа ProdSys2, а также разработке информационной системы для распределенного компьютинга ATLAS Grid Information System и поддержке мониторинга передачи данных в рамках проекта Dashboard. Сергеем Беловым был сформулирован подход к созданию масштабируемого мониторинга передачи данных эксперимента ATLAS в распределенной вычислительной среде. Разработанные на основе этого подхода комплексы программ используются в ATLAS в новой системе мониторинга передачи данных ЦЕРН MONIT. Кроме этого, Сергеем Беловым разработаны средства анализа статистики доступа к данным эксперимента ATLAS. В этих работах были впервые внедрены методы и технологии аналитики Больших данных. Также в рамках диссертации виде программного комплекса был реализован метод анализа востребованности наборов данных в глобально распределенных хранилищах физического эксперимента ATLAS, который в настоящее время применяется для определения эффективности стратегий управления данными и их оптимизации. Владимир Кореньков подчеркнул огромный объем работ, проделанный Сергеем Беловым на пути к защите диссертации, и его способность реализовывать крупные задачи, за решение которых прежде никто не брался. Сергей Белов начал свою работу в ЛИТ в 2003 году, будучи студентом Московского физико-технического института (МФТИ). В это же время на Большом адронном коллайдере началась активная реализация проектов по компьютингу (проекты LCG - LHC Computing GRID и EGEE - Enabling Grids for E-sciencE), а также создание Российского грид-сегмента (Консорциум RDIG - Russian Data-Intensive Grid). «Сергей Белов активно включился в эту деятельность и за короткое время вместе с другим магистром МФТИ Игорем Ткачевым они выполнили пионерскую работу: создали систему мониторинга и учета использования ресурсов RDIG. В дальнейшем Сергей Белов участвовал во многих проектах и показал незаурядные способности и талант в реализации самых смелых и перспективных идей, лишь часть из которых вошли в его диссертацию», - подчеркнул Владимир Кореньков. Так, Сергей Белов был основным исполнителем работ по созданию и модернизации системы грид-мониторинга для Научно-технической программы Союзного государства России и Белоруссии СКИФ-ГРИД, системы мониторинга и учета использования ресурсов для проекта ГридННС (создание грид-инфраструктуры для национальной нанотехнологической сети), координировал работы по созданию системы управления данными Российской грид-сети. Обобщив методы, созданные для решения задач физики высоких энергий, и предназначенные для эффективного проведения исследований в различных областях науки с использованием технологий Больших данных, Сергей Белов разработал архитектуру и создал прототип цифровой платформы для анализа сложных социально-экономических систем. На базе этого прототипа были выполнены прикладные исследования российского рынка труда и тематики публикаций в научных журналах. «С 2016 года Сергей включился в проект по развитию платформы Больших данных для широкого класса масштабных задач, занимался развитием методов интеллектуального анализа текстов на естественных языках. Был одним из руководителей проекта «Разработка информационно-аналитической системы мониторинга и анализа потребностей рынка труда в выпускниках ВУЗов на основе аналитики Больших данных», результаты которого имеют большое практическое значение и используются социальном навигаторе по профессиям и зарплатам в регионах России - совместный проект МИА «Россия сегодня» и РЭУ им. Г. В. Плеханова, в исследованиях ФГБУ «ВНИИ труда» Минтруда России. В качестве одного из основных исполнителей активно участвовал в проекте по развитию технологий и платформ для решения задач цифровой экономики и научных проектов класса мегасайенс на основе синтеза технологий Больших данных, суперкомпьютерных технологий, озер данных и машинного обучения», - рассказал Владимир Кореньков. В настоящее время в ЛИТ Сергей Белов возглавляет Сектор развития и сопровождения ЦЭС в Научно-техническом отделе внешних коммуникаций и распределенных информационных систем, где ведет крупный проект по создания Цифровой экосистемы ОИЯИ и участвует в создании платформы аналитики Больших данных, а также продолжает работу в области компьютинга физических экспериментов, в том числе эксперимента SPD в мегасайенс-проекте NICA. «Я хотел бы выразить благодарность моему бессменному научному руководителю Владимиру Васильевичу Коренькову. Я видел, как Лаборатория непрерывно развивалась под его руководством, это было и высокой мотивацией, и примером для меня. Я очень благодарен диссертационному совету лаборатории и, конечно, его секретарю Елене Валериевне Земляной за огромную помощь в подготовке к защите моей диссертационной работы, а также за всестороннюю поддержку. Моя научная жизнь со студенческой скамьи связана с Лабораторией информационных технологий. Это уникальное место не только за счет традиционно высокого, мирового уровня научных исследований, мощной вычислительной инфраструктуры, но и прежде всего атмосферы доброжелательности и научного поиска в коллективе Лаборатории», - отметил Сергей Белов. Общим мнением, прозвучавшим на защите Сергея Белова со стороны как оппонентов, так и выступивших экспертов, стало то, что работа значительно превышает по своей актуальности, масштабу проделанной работы и пионерскому характеру исследований уровень, необходимый для присуждения ученой степени кандидата наук.