О вариантах распределенных информационно-вычислительных систем

В.П.Шириков, Л.А.Калмыкова

Объединенный Институт Ядерных Исследований, Дубна

Этот доклад посвящен обзору состояния и использования работ, выполненных или предвидимых в области совместного применения средств Web и Grid. Частично элементы такого обзора содержатся в докладе [1], вдобавок характеристика многих российских работ дана их авторами в Трудах конференции "Научный сервис в сети Интернет" и "Распределенные вычисления и ГРИД-технологии" (Дубна, 2004 г.), но за прошедший год появились и новые, достаточно интересные приложения в области применения ранее существовавших средств middleware, и готовые к использованию перспективные и унифицированные программные инструментальные средства общего назначения, основанные на реализации архитектуры OGSA " on top of " WSRF в рамках пакета Globus Toolkit 4 (GT4), а также некоторые возможности по "миграции" систем, реализованных на базе GT2/GT3 (migration GT2/GT3 to GT4).

В принципе созданная даже на базе GT4.0 система (как и все известные нам Grids) еще не будет в полной мере удовлетворять критериям, изложенным в работе [2], поскольку работы по стандартизации применяемых протоколов и интерфейсов еще продолжаются в рамках деятельности рабочих групп Grid Globus Forum (GGF), но созданием первой эксплуатационной версии GT4 сделан важный шаг к возможному созданию Grid, который по масштабу может сравниться с Web [3].

Если говорить о реализованных или реализуемых системах, то можно отметить достижения в следующих направлениях:

1) Использование технологии построения "распределенного метакомпьютера" с производительностью до нескольких зетафлопс на основе мобилизации свободных ресурсов РС.

   Примерами являются как известные проекты SETI@home и rosetta@home (World Community Grid), так и реализованные в 2004 году Einstein@home (обработка данных по излучению гравитационных волн сверхплотными звездами) и LHC@home (моделирование движения частиц в тракте ускорителя LHC), когда используются специальные screen savers в качестве фоновых задач персональных компьютеров. На идее свободного использования полезного screen saver основано и применение монитора динамического слежения за прохождением потока задач в рамках LHC Computing Grid (LCG)[4]. Мобилизация свободных (неиспользуемых) ресурсов РС предусмотрена, например, и в реализуемом проекте "Дубна-ГРИД": она основана на применении свободно-распространяемого продукта VMWare (IBM) для создания набора виртуальных сегментов под разные варианты Grid-систем в общем пуле РС наукограда [5].

   2) Интерактивное использование Web и Grid для съема и обработки в реальном масштабе времени данных от разных источников информации.

   Примером является система, созданная для поддержки работы персонала и территориально распределенного коллектива экспертов в процессе динамического контроля работы установок по управляемому термоядерному синтезу (УТС), регистрации, обработки и визуализации информации для совместного принятия решений о возможных вмешательствах в ход эксперимента [6]. Примененная авторами указанной работы технология для клиент-серверного обмена данными через Web, использования средств типа Access Grid и VRVS для обмена аудио/видео информацией и динамического доступа к Grid-middleware для запуска прикладных сервисов может быть полезна и для других проектов общего рассматриваемого направления (например, при обработке данных от телескопов).

   3) Применение Grid в режиме распределенной пакетной обработки задач с использованием middleware уровня GT и gLite.

   По существу есть два основных "конкурента" средств middleware, претендующих на применение в ближайшем будущем по крайней мере в области физики высоких энергий для проведения экспериментов на LHC-ускорителе (ЦЕРН, Женева) в 2007 году: gLite от проекта EGEE ( Enabling Grids for E-sciencE ) и GT4.

   Временное преимущество gLite [7] в том, что он был взят на вооружение в рамках проекта ARDA [8] коллаборациями экспериментальных установок (ALICE, CMS, ATLAS, LHCb), когда не оправдались надежды на GT3 как стандартное удобное средство создания и использования Grid-сервисов и не было рабочей версии GT4, появившейся только в конце апреля 2005 года. Сейчас - период формирования документации, опробования и сравнительная оценка обоих вариантов.

   Некоторые подробности и ссылки, относящиеся к данному обзору, содержатся в презентации доклада, доступной по адресу

http://lit.jinr.ru/people/Shirikov/VP.html

   ЛИТЕРАТУРА:

1. В.П.Шириков. Программное обеспечение Grid: переоценка ценностей.//Труды Всероссийской научной конференции "Научный сервис в сети Интернет", Новороссийск, 2004, стр.142-144.

2. Ian Foster. What is the Grid? A Three Point Checklist. ( http://www.gridtoday.com/02/0722/100136.html)

3. http://gdp.globus.org/gt4-tutorial/

http://www-unix.globus.org/toolkit/docs/4.0/

4. http://boinc.berkeley.edu

5. П.В.Зрелов, В.В.Иванов и др. Проект "Дубна-ГРИД".//Труды международной конференции "Распределенные вычисления и ГРИД-технологии в науке и образовании", Дубна, 2004, стр.48-54.

http://dubna-grid.jinr.ru

http://dgrsrv.jinr.ru/ganglia/

6. http://www.globus.org/alliance/publications/papers/clade_submitted_corrected.pdf

7. http://glite.web.cern.ch/glite/

8. http://lcg.web.cern.ch/LCG/activities/arda/documents.html

http://lcg.web.cern.ch/lcg/PEB/arda/public_docs/ARDA_report_final.pdf