В ЛИТ состоялась защита кандидатской диссертации по тематике распределенных вычислений 12 сентября в Лаборатории информационных технологий состоялась успешная защита диссертационной работы научного сотрудника ЛИТ Игоря Пелеванюка на соискание ученой степени кандидата технических наук. Темой работы стали методы и программные средства создания распределённых гетерогенных вычислительных сред на базе платформы DIRAC. Описанные в диссертации методы были разработаны, реализованы и успешно применены на примере обработки данных экспериментов на ускорительном комплексе NICA и ряда других экспериментов. Научным руководителем работы выступил научный руководитель ЛИТ ОИЯИ доктор технических наук Владимир Кореньков. Официальные оппоненты: доктор технических наук, заведующий кафедрой вычислительных технологий Национального исследовательского университета «МЭИ» Виктор Топорков и кандидат физико-математических наук, заведующий лабораторией аналитических вычислений в физике высоких энергий НИИЯФ МГУ Александр Крюков. «Диссертационная работа Игоря Пелеванюка имеет большое научное, технологичное и практическое значение. Он активно участвует в развитии уникального Многофункционального информационно-вычислительного комплекса ОИЯИ, выполнил интеграцию оборудования различной архитектуры (грид, облака, кластеры, суперкомпьютер, системы хранения информации), которая эффективно используется для ряда крупных научных проектов», — отметил научный руководитель работы Владимир Кореньков. На сегодняшний день организация географически распределённых гетерогенных вычислительных сред является необходимым инструментом для решения задач крупных физических проектов. При непрерывном росте объёмов данных, генерируемых современными научными экспериментами и проектами, их требования зачастую превышают возможности любого из доступных для них вычислительных ресурсов. Здесь решением зачастую служит совместное использование сразу нескольких вычислительных кластеров, систем хранения, суперкомпьютеров и облачных инфраструктур. В таком случае возникает необходимость организации единой вычислительной среды, способной интегрировать доступные ресурсы и использовать их для хранения и обработки данных. Такое объединение ресурсов всё ещё остаётся сложной задачей, требующей комплексного подхода. В диссертационной работе Игорь Пелеванюк поставил целью развитие методов и программных средств для организации распределённых гетерогенных вычислительных сред обработки данных на базе платформы DIRAC, которая в свое время была создана для решения задач эксперимента LHCb на Большом адронном коллайдере в СERN. С 2017 года по настоящее время Игорь Пелеванюк успешно развивает такую вычислительную среду на базе DIRAC в ОИЯИ. Она включает суперкомпьютер «Говорун», кластеры Tier1 и Tier2, кластеры «NICA» и «BM@N DAQ Computing Center», облачные инфраструктуры ОИЯИ и стран-участниц ОИЯИ, вычислительные ресурсы некоторых членов коллабораций экспериментов на ускорительном комплексе NICA. В качестве систем хранения были интегрированы дисковое хранилище EOS, ленточное хранилище Enstore и ленточное хранилище CTA. Изначально, в инструментарий платформы DIRAC не входили инструменты мониторинга задач и передачи данных, инструменты анализа выполнения больших пакетов задач, а также отсутствовала возможность прямой интеграции облачных ресурсов, работающих на платформе OpenNebula. Игорь Пелеванюк разработал новый программный инструментарий для интеграции облачных ресурсов, поддерживающих протокол OCCI, а также для прямой интеграции облаков, использующих OpenNebula. Оба модуля были включены в исходный код платформы DIRAC. Им были разработаны и реализованы системы мониторинга пользовательских задач и передачи данных, позволяющие анализировать процесс выполнения отдельных пользовательских задач. Был предложен оригинальный метод анализа выполнения больших пакетов задач в гетерогенных вычислительных средах, который позволяет анализировать, как пакеты задач, так и вычислительные ресурсы, на которых эти задачи исполнялись. Также были разработаны и внедрены инструменты для упрощения массового запуска задач и передач данных. Все разработанные системы работают независимо друг от друга, что позволяет применять предложенные подходы в рамках других вычислительных инфраструктур, организованных с использованием платформы DIRAC. Разработанный метод анализа выполнения больших пакетов задач позволил обнаружить ошибку в расчёте производительности при работе с процессорами AMD Epic, которая впоследствии была исправлена разработчиками DIRAC. Помимо использования разработанных систем по отдельности, их совместное применение позволяет выявлять аномалии в процессе выполнения задач, анализировать причины их возникновения и прогнозировать поведение распределённой инфраструктуры при выполнении большого количества задач. Часть решений, разработанных Игорем Пелеванюком, были применены для экспериментов BES-III и международного нейтринного эксперимента JUNO в Институте физики высоких энергий АН КНР (г. Пекин). Разработанная Игорем Пелеванюком вычислительная среда на базе DIRAC в ОИЯИ нашла широкое применение для флагманского проекта NICA. Так, являясь ответственным за массовую распределенную обработку данных в эксперименте ВМ@М, Игорь Пелеванюк в 2023 году разработал методику массовой обработки экспериментальных данных с использованием имеющихся географически-распределённых, гетерогенных ресурсов, и в последствии успешно применил её для обработки данных 8-го сеанса эксперимента ВМ@М. Кроме того, им был разработан и внедрён метод передачи данных между ресурсами поддерживающими стандартные грид-протоколы передачи данных и теми ресурсами, где такие протоколы не поддерживаются. Благодаря разработанным и внедрённым программным инструментам организована распределённая, гетерогенная вычислительная среда, позволяющая коллаборации BM@N обрабатывать экспериментальные данные 8-го сеанса размером порядка 400 ТБ за одну неделю, эффективно подбирая вычислительные ресурсы для разных типов задач обработки. С 2019 года эксперимент MPD на коллайдере NICA начал активно использовать организованную Игорем Пелеванюком распределенную гетерогенную среду на базе DIRAC. Благодаря разработанному им программному обеспечению был значительно ускорен процесс обработки данных, необходимых для проектирования детекторов установки MPD, тестирования алгоритмов реконструкции и физического анализа. Также платформа DIRAC в ОИЯИ с успехом использовалась на начальных стадиях подготовки эксперимента SPD на NICA. С использованием разработанных Игорем Пелеванюком методов участниками коллаборации SPD выполнялось моделирование и анализ данных с использованием Tier1 и Tier2 кластера. Помимо этого, организованная в ходе работы Игорем Пелеванюком вычислительная среда нашла применение для решения задач обработки данных эксперимента Baikal-GVD и проекта Folding@Home. «Он всегда в поиске, у него всегда много идей, которые он успешно реализует. Его отличительная особенность — доводить дело до реального результата», — прокомментировал работу своего подопечного Владимир Кореньков. Свой путь в науке Игорь Пелеванюк начал в ЛИТ ОИЯИ в 2013 году после окончания магистратуры университета «Дубна», при этом он активно работал с лабораторией еще в студенческие годы. В первые годы своей работы в ЛИТ Игорь Пелеванюк занимался мониторингом грид-сервисов для вычислительного комплекса ЛИТ и системы DIRAC эксперимента BES-III в Китае. Через четыре года началась работа по организации вычислительной среды на базе платформы DIRAC в ОИЯИ. В настоящее время Игорь Пелеванюк, научный сотрудник Сектора распределенных систем продолжает успешно развивать распределенную среду ОИЯИ и стран-участниц. Игорь Пелеванюк с успехом совмещает активную научную деятельность с преподаванием в Государственном университете Дубна, где читает лекции, проводит практические занятия для студентов. Он также активно вовлечен в деятельность по популяризации науки, которую ведет ОИЯИ.