ЛИТ на школе, посвященной применению новых перспективных методов обработки и анализа данных 4 декабря на базе Московского физико-технического института (МФТИ) завершила работу вторая Научная школа-семинар «Новые методы обработки данных физического эксперимента». Целью мероприятия стало объединение усилий разных научных групп в разработке новых концепций для обработки больших объемов данных с использованием методов искусственного интеллекта (ИИ), включая методы машинного обучения, искусственные нейронные сети, мягкие вычисления и др. Организаторами школы выступили МФТИ и Объединенный институт ядерных исследований (ОИЯИ). Ряд сотрудников Лаборатории информационных технологий им. М.Г.Мещерякова (ЛИТ) ОИЯИ приняли участие в мероприятии и выступили докладчиками. На открытии школы от имени Объединенного института с приветствием к участникам обратился директор ЛИТ Сергей Шматов. Он рассказал, зачем физикам нужно разбираться в вычислительных методах и способах обработки данных на примере экспериментов на Большом адронном коллайдере (БАК) в ЦЕРН. В докладе были представлены планы ЛИТ по организации систем сбора, обработки и хранения данных мегасайенс-проекта NICA (Nuclotron based Ion Collider Acility). В программу школы также вошел доклад старшего научного сотрудника ЛИТ ОИЯИ Мартина Буреша о применении квантовых алгоритмов в реконструкции событий в коллайдерных экспериментах. Школа ориентирована на специалистов, аспирантов и студентов ведущих российских институтов, заинтересованных в применении новых методов получения, процессинга и обработки данных физических экспериментов класса «мегасайенс». Одна из ее задач — дать обзор новых методов работы с данными современного физического эксперимента, выявление основных проблем, требующих решения и выработку подходов по их решению. «Методы искусственного интеллекта составляют все большую и большую часть в самых разнообразных сферах нашей жизни. Однако, для ряда областей физики они по-прежнему во многом представляют новшество. В рамках этой школы мы хотим рассказать молодежи о том, какие методы ИИ применяются в физике в настоящий момент, заинтересовать их и дать обзор, показать, где есть место новым методам. Вместе с этим, наша задача сориентировать молодых ученых, и, не давая им завышенных ожиданий от ИИ, показать точки входа в конкретные задачи в этой сфере и практические возможности применения», — отметил Сергей Шматов. «Экспоненциальный рост объема данных в фундаментальных физических экспериментах требует новых подходов к анализу. Машинное обучение и другие передовые технологии необходимы для преодоления этих вызовов и достижения прорывных результатов», — прокомментировал задачи мероприятия один из организаторов школы-семинара, старший научный сотрудник ЛФВЭ ОИЯИ Алексей Апарин. На площадке школы был рассмотрен опыт различных научных групп по внедрению методов ИИ на различных этапах обработки экспериментальных данных, а также мониторинга параметров детекторов и ускорительного комплекса во время работы. Все это может быть использовано в дальнейшем в работе экспериментальных установок класса мегасайенс, таких как комплекс NICA в ОИЯИ. Это уже вторая подобная школа, и ее организаторы нацелены на то, чтобы сделать мероприятие традиционным с дальнейшим вовлечением в нее более широкого круга российских и международных исследовательских и научно-образовательных организаций и научных групп. «Мы видим развитие школы не только в расширении географии лекторов, но и в более глубоком погружении участников в практику и методику применения ИИ. Дополнив программу обзорных лекций практическими занятиями, мы сможем продемонстрировать участникам, как именно применяются представленные в докладах методы и какие это дает результаты. И самое важное, что участники получат возможность попробовать это все руками на практике. В идеале в этой части, по опыту проведения IT-школы ЛИТ, мы хотим расширить программу хакатонами и туториалами», — отметил участник мероприятия заместитель директора ЛИТ Николай Войтишин. В программе школы-семинара были представлены доклады, освещающие ключевые аспекты развития вычислительных технологий в физике высоких энергий, а также общие подходы к использованию генеративных нейронных сетей для решения задач обработки данных в физике высоких энергий и алгоритмы поиска распадов B-мезонов, основанные на сверхточных нейронных сетях. Рассматривались методы анализа больших данных в физике частиц и астрофизике, в частности для нейтринного эксперимента Baikal-GVD, актуальные вопросы, связанные с организацией работы с данными, практические решения для ускорения анализа и сокращения времени, затрачиваемого на отладку рабочих программ. Ряд докладов был посвящен применению методов машинного обучения к некоторым задачам отбора и классификации данных в экспериментах BM@N и SPD на NICA, а также расчету магнитных полей на ускорителях и удержания нужных параметров пучка ускоренных частиц. «Важной частью школы стали ежедневные заключительные сессии, посвященные общим дискуссиям и обсуждению докладов, представленных в течение дня, — рассказал Алексей Апарин. — Во это время участники смогли в менее формальной обстановке продолжить общение по интересующим их вопросам, которые были рассмотрены на лекциях. Стоит отметить, что многие докладчики сами являются молодыми учеными, что создает максимально дружескую атмосферу дискуссии. Таким образом мы надеемся увеличить интерес студентов к работе в мегасайенс-экспериментах и привлечь еще больше молодых людей в физику». В работе трехдневной школы «Новые методы обработки данных физического эксперимента» приняли участие более 80 специалистов, аспирантов и студентов ведущих российских научно-образовательных организаций, в числе которых ОИЯИ, МФТИ, НИЦ КИ, НИУ ВШЭ, ИЯИ РАН и СПбГУ. Методы искусственного интеллекта в ЛИТ Говоря о спектре работ ЛИТ, ведущихся с использованием методов ИИ, Сергей Шматов отметил, что идеологом этого направления в лаборатории выступает Геннадий Ососков, главный научный сотрудник Научного отдела вычислительной физики ЛИТ. Под его руководством группа ученых работает в области применения методов машинного обучения и нейронных сетей для трекинга — восстановления траекторий заряженных частиц, а также в направлении квантовых вычислений на основе квантового отжига. На базе ЛИТ методы ИИ активно применяются в области физики частиц, где ключевым выступает проект NICA и его эксперименты MPD, SPD, BM@N. Также ЛИТ активно использует методы ИИ для эксперимента CMS на БАК (ЦЕРН), используя нейронные сети для моделирования и анализа экспериментальных данных. Работы по идентификации элементарных частиц, а также по использованию нейронных сетей в численном интегрировании ведутся в Секторе методов моделирования нелинейных систем под руководством Александра Айрияна. Сектор гетерогенных вычислений и квантовой информатики ЛИТ во главе с Оксаной Стрельцовой применяет методы ИИ в области радиобиологии в межлабораторных исследованиях совместно с Лабораторией радиационной биологии (ЛРБ) ОИЯИ и сербскими научными организациями. Эти работы в том числе ведутся по направлениям разработки алгоритмов на базе машинного и глубокого обучения, а также создания веб-сервисов для автоматизации обработки данных, получаемых в экспериментах, проводимых в ЛРБ по изучению влияния ионизирующего излучения на биологические объекты, а именно, разработаны сервисы для анализа данных поведенческих тестов на мелких лабораторных животных, создан веб-сервис для автоматизированного анализа радиационно-индуцированных фокусов в ядрах клеток. Яркие результаты получены Александром Ужинским, старшим научным сотрудником Научно-технического отдела внешних коммуникаций и распределенных информационных систем. Используя сверточные нейронные сети в распознавании образов, команда этого проекта создала онлайн-платформу и мобильное приложение, способное с очень высокой точностью распознавать различные болезни и вредителей растений. Активное внедрение методов ИИ (нейросетевой подход, методы и алгоритмы машинного и глубокого обучения, и т.д.) для решения широкого спектра задач обусловлено многими факторами. К основным из них можно отнести развитие вычислительных архитектур, особенно при использовании методов глубокого обучения для сверточных нейронных сетей, а также развитие библиотек, в которых реализовано широкое многообразие алгоритмов и фреймворков, позволяющих быстро строить различные модели нейросетей. Для обеспечения всех этих возможностей как по разработке математических моделей и алгоритмов, так и для проведения ресурсоемких расчетов, в том числе на графических ускорителях, позволяющих существенно сокращать время вычислений, для пользователей платформы HybriLIT создана и активно развивается экосистема для задач машинного и глубокого обучения и анализа данных. Также на ресурсах экосистемы развернут квантовый полигон, позволяющий проводить разработку алгоритмов с использованием квантовых симуляторов. Гетерогенная вычислительная платформа HybriLIT является частью Многофункционального информационно-вычислительного комплекса (МИВК) ЛИТ ОИЯИ. Платформа представляет собой многокомпонентную систему, при этом, основным вычислительным ресурсом является суперкомпьютер «Говорун» с пиковой производительностью 1,7 ПФЛОПС для вычислений с двойной точностью и 26 ПФЛОПС с половинной точностью для задач искусственного интеллекта. В МФТИ обсудили специфику работы с данными в физических экспериментах