ИНФОРМАЦИОННЫЕ СИСТЕМЫ, БАЗЫ ДАННЫХ И НАУЧНЫЕ ТЕЛЕКОММУНИКАЦИИ

(Проблематика и разработки по проектам РФФИ)

Доктор физ.-мат. наук, профессор Л.А. Калиниченко, доктор техн. наук, профессор О. В. Сюнтюренко, доктор физ.-мат. наук, профессор А.Н. Томилин, доктор физ.-мат. наук, профессор В.П. Шириков, кандидат физ.-мат. наук Л.Н. Щур

Под общей редакцией академика Ю.И. Журавлева



Авторы выражают искреннюю благодарность д.ф.-м.н. Ю.Е. Малашенко, д.т.н. Ю.Ф. Рябову, д.т.н. Л.Н. Столярову, д.ф.-м.н. Ю.С. Тюпкину за ценные замечания и предложения, использованные при подготовке этого обзора.

Содержание


Введение
1. Информационные системы и базы данных
1.1. Информационно-поисковые системы
1.2. Системы, поддерживающие гипертекст и гипермедиа
1.3. Интероперабельные информационные системы
1.4. Системы управления базами данных
1.5. Системы, накапливающие и использующие знания
1.6. Средства защиты информации
1.7. Выводы
Приложение 1. Список выполненных проектов РФФИ по те­матике информационных систем и баз данных
2. Научные телекоммуникации
2.1. Общий анализ проблематики
2.2. Исследования и разработки, поддержанные РФФИ
2.2.1. Сетевые информационные системы
2.2.2. Локальные вычислительные сети
2.2.3. Обеспечение подключения к сети INTERNET
2.2.4. Создание региональных вычислительных сетей
2.2.5. Методические рекомендации по организации структуры регионального информационного сетевого центра
2.3. Выводы
Приложение 2. Список выполненных проектов РФФИ по тематике научных телекоммуникаций
Заключение

Введение

   В обзоре рассматриваются:
— современное состояние исследований и раз­работок в области информационных систем, баз данных и научных телекоммуникаций;
— результаты и значение выполнения наиболее успешных проектов по рассматриваемой проблематике, поддержанных РФФИ.

Информационные системы и базы данных

   Содержательно разработки целевых информационных систем и баз данных, представленные в отчетах о выполнении проектов ИС и БД, поддер­жанных РФФИ, имеют большое значение для раз­вития соответствующих направлений науки. Большинство из этих разработок аналогов не имеет и предоставляет для исследователей и разработчиков существенно новую информацию и способы ее обработки. Следует также положительно отметить стремление авторов многих разработок к максимально ясным схемам ввода, хранения и поиска данных.


1.1. Информационно-поисковые системы

    В последние годы в связи с изменением общей структуры мирового информационного потока наметился ряд тенденций в развитии классических информационно-поисковых систем (ИПС). К этим тенденциям можно отнести следующие:
- быстрое развитие связей как между отдельными информационными элементами, так и внутри самих информационных элементов (гипертекстовые связи, межсетевые связи и т.п.);
- усложнение структуры информационных элементов (внедренная графика, мультимедиа, Java - приложения или "апплеты", OLE объекты);
- резкое нарастание объемов обрабатываемой документальной информации и ее динамическое изменение - имеются примеры реализации Oracle Text Server с количеством документов общего типа до нескольких миллиардов с объемом несколько терабайт с непрерывным изменением до 10% документов;
- слияние различных информационных систем в гетерогенные сети с унифицированным пользовательским интерфейсом при базировании на технологии "клиент-сервер"; как правило, такая гетерогенная система реализуется в рамках интранет сетей (т.е. корпоративных сетей, объединенных че рез Internet).
   Все эти тенденции приводят к необходимости решения соответствующих задач, которые должны быть решены во вновь проектируемых и модернизируемых ИПС для обеспечения их жизнеспособности. Коротко можно сказать, что такая ИПС должна быть легко масштабируемой, переносимой, тесно интегрированной с мировыми сетями и поддерживать ряд стандартов как в части форматов хранимых данных, так и в части доступа к этим данным. Наиболее просто решение этих задач достигается, если конкретная ИПС базируется на промышленно-стандартных СУБД "клиент-серверного" типа (Oracle, SQL Server, Ingres, Informix, Gupta, Sybase и т.п.). Однако в рамках любой такой СУБД можно реализовать лишь базовое хранилище данных, но не решение специфических задач, связанных с конкретным информационным поиском в конкретном информационном массиве.
   С другой стороны, в настоящее время интенсивно развиваются персональные ИПС, которые одновременно могут выступать, как "клиенты" больших удаленных банков данных.
   Нельзя не отметить, что создание новых (и модернизация существующих) ИПС (или их отдельных компонент) невозможно без использования всех особенностей современных вычислительных систем, поскольку именно ими в огромной степени определяется эффективность конкретной ИПС. Это связано с тем, что особенности обработки конкретных видов информации (текста, графики и т.п.) закладываются уже в архитектуру и электронные компоненты ЭВМ.
   В России исторически сложились два направления развития информационно-поисковых систем: классические ИПС, ориентированные на обработку больших массивов текстовой и фактографической документальной информации, и прикладные ИПС, ориентированные на обработку экспериментальных данных в той или иной области знаний. Благодаря усилиям отдельных научных коллективов и поддержке РФФИ в последнее время удалось ввести в эксплуатацию ряд информационно-поисковых систем для доступа к хранилищам данных, которые являются одними из крупнейших в мире (например, по проекту 93-07-26035 - руководитель О.В. Сюнтюренко). Эти ИПС интегрируют в себе многие из описанных выше тенденций и продолжают интенсивно развиваться. Кроме того, за последние годы произошел прорыв в построении прикладных ИПС для обработки экспериментальных данных, которые в настоящее время представляют собой сложные сетевые системы с развитыми поисковыми возможностями (в том числе и по сложно-структурированным массивам).
   Меньшая часть работ посвящена созданию развитых современных ИПС для обработки документальной информации классического типа. Как правило, эти системы создавались на базе крупных хранилищ документальной информации, обладают всеми чертами современной гетерогенной ИПС и в то же время обеспечивают все традиционные методы поиска. В этих ИПС, основанных на мощных сетевых вычислительных комплексах, реализованы отказоустойчивые хранилища информации, базирующиеся на универсальных многопользовательских СУБД архитектуры "клиент-сервер" (например, ИПС, основанная на технологии "клиент-сервер" с использованием в структуре большого банка данных (примерно 15 млн. документов) магнитооптической библиотеки (примерно 20 Гб) и возможностью доступа к нему через WWW-сервер - проект 93-07-26035 "Разработка комплекса информационных услуг на основе Банка данных отечественных и зарубежных публикаций по науке и технике для обеспечения фундаментальных исследований, ведущихся в Российской академии наук" -руководитель О.В. Сюнтюренко, ВИНИТИ). В силу масштабируемости архитектуры этих ИПС в них возможно использование разнородной информации, плавное наращивание мощности систем и легкий универсальный доступ. Эти системы обладают развитыми справочными подсистемами реального времени, подсистемами сбора и обработки статистики, подсистемами администрирования и т.п. Безусловно, каждая такая система универсальна с точки зрения поддержки национальных алфавитов.
   Наибольшую группу работ, финансируемых РФФИ, составляют работы, направленные на решение задач информационного поиска в массивах, содержащих специфические научные данные. При этом форма этих данных такова, что текстовое представление их невозможно и, как следствие, невозможно применить классические методы информационного поиска. Кроме того, здесь естественно возникает задача не только поиска информации, но и ее обработки: ввода, представления, визуализации, передачи по каналам связи и т.п. (например, при разработке открытой системы оперативного доступа на базе WWW-сервера к данным, поступающим с метеорологических спутников с использованием сети Internet: (проект 95-07-19329 "Гипермедийная ИС общего пользования с автоматическим накоплением данных, поступающих с метеорологических спутников" - руководитель Е.А. Лупян, Институт космических исследований РАН). Для нетекстовой (а зачастую и неграфической) информации эта задача является весьма нетривиальной.
   В рамках этой группы работ созданы оригинальные и развиты существующие методы работы со структурной химической информацией (проекты 93-07-04727, 93-07-18632, 94-07-00633), обеспечивающие простой и быстрый ввод такой информации, компактное представление ее и мощные поисковые средства, в том числе и поиск по аналогам. Все эти методы, как правило, не имеют аналогов в мировой практике и, в сочетании с громадными объемами накопленной структурной химической информации и современными методами доступа к ней, предоставляют развитый аппарат для ученых, работающих в этой области науки.
   Так информационная система с использованием метода формирования компактных линейных кодов молекулярных графов (проект 93-07-04727 "Банки данных по молекулярной спектроскопии органических соединений, прогнозирующие и информационно-логические системы на их основе" - руководитель В. А. Коптюг, Новосибирский институт органической химии СО РАН) обеспечивает не только быстрый поиск химических соединений с жестко заданным структурным признаком, но и поиск "структурных аналогов" в крупных базах структурных данных.
   Экспертная система поддержки экспериментов в области физико-химической кинетики KINTVT включает базы данных, средства информационно-математического моделирования, интерактивные средства организации вычислительного эксперимента (проект 94-07-00633 "Информационно-математическое моделирование в области физико-химической кинетики" - руководитель С.А. Лосев, НИИ механики МГУ).
   По проекту 93-07-18632 (руководитель Ю.М. Арский, ВИНИТИ) разработаны графический редактор структурной химической информации и подсистема быстрого подструктурного поиска (реализует поиск по произвольно заданному структурному фрагменту) со средствами генерации фильтровой (индексной) информации.
   Для работы с другими видами информации (географической, экологической, биологической) разработана группа оригинальных информационнопоисковых аппаратов, характеризующихся развитыми средствами работы с нетекстовой информацией, возможностями использования ее по каналам Internet и, как следствие, возможностью доступа к ней с использованием стандартных бесплатных программ-клиентов сети, что весьма актуально для широкого распространения научных данных.
   Так, разработанная по проекту 93-05-14668 ("Базы и банки данных петролого-геохимической информации магматических и метаморфических пород для определения геодинамических обстановок их формирования" — руководитель К.Х. Авакян, Геологический институт РАН) геоинформационная система (ГИС), использовалась для определения геодинамической обстановки формирования экзотических океанических террейнов Корякско-Камчатского аккреционного пояса, где были выявлены базальтовые серии, сформированные за счет плавления компонента глобальной геохимической аномалии DUPAL, локализованной вдоль 40 градусов южной широты и связанной с глубинными мантийными горизонтами.
   Из проектов РФФИ, выполненных по направлениям создания информационно-поисковых систем, полнотекстовых баз данныхи баз данных с экспериментальной информацией, следует выделить также:
- создание "Информационной системы по спектроскопии высокого разрешения высокосимметричных молекул T.D.S." (руководитель проекта В.Г. Тютерев, Институт оптики атмосферы СОРАН), содержащей фундаментальные спектроскопические данные, извлеченные из экспериментальных спектров (проект 94-07-20439);
- разработку "Инструментальных средств построения информационных систем" (руководитель проекта Н.Е. Емельянов, Институт системного анализа РАН), содержащих базу данных по СУБД и гипертекстовым системам (проект 93-08-26034);
- "Создание и формализованный анализ компьютерной базы геополей Урала" (руководитель проекта А.В. Овчаренко, Институт геофизики УрО РАН), обеспечившей возможность применения ГИС-технологий к анализу геолого-физических данных по территории Урала (проект 94-07-16135).
   Основу информационной системы по спектроскопии высокосимметричных молекул составляет база данных, содержащая подкаталоги для всех молекул и обеспечивающая высокую скорость выполнения запросов на выборку данных. ИС T.D.S. предоставляет пользователям интерактивный доступ к результатам исследований, в том числе выполнение вычислений не хранящихся в базе данных параметров спектральных линий. Существенным достоинством системы является поддержка механизма OLE2, что позволяет экспортировать информацию в другие приложения, использующие этот механизм, а также возможность обновления БД данными через сеть Internet. Большое значение имеет наличие в системе дружественного графического интерфейса.
   База данных по СУБД и гипертекстовым системам содержит рефераты и сведения о программных средствах и их версиях, проиндексированные по наименованиям СУБД и гипертекстовых систем, операционным системам, фирмам разработчиков, объемам оперативной и дисковой памяти и другим характеристикам. Весьма интересным представляется построение разработанной системы как объектноориентированной со сложной структурой взаимосвязанных объектов, в которой применяется единая система индексации атрибутов объектов различных уровней иерархии.
   Структура базы данных геополей Урала предусматривает разделение хранимой информации на объекты в растровом формате и на объекты в векторном формате - элементарными объектами БД являются регулярные числовые матрицы и их отображение в файлы изображений и векторные файлы данных. Простота форматов этих объектов позволяет согласовать их практически с любыми другими БД и системами обработки. Разработанная технология перевода картографической информации с бумажных носителей в компьютерную растровую (матричную) форму представляет собой хороший образец структурированности при решении важной проблемы ввода информации в базу данных.

1.2. Системы, поддерживающие гипертекст и гипермедиа

   В разработке и применении гипертекстовых систем сложилось несколько основных направлений:
- "электронная книга", обеспечивающая освоение материала с большим количеством ссылок и смысловых пересечений;
- компоновка крупных текстовых материалов из фрагментов, которые первоначально представлены в форме сети с указанием их взаимных смысловых связей;
- представление в форме единого гипертекста идей, аргументов и предложении, вносимых участниками коллективной работы. Наибольшую известность получили американские системы Guide, HyperCard и французская Hyperdoc.
   Новые подходы к манипулированию информацией открывают перспективы качественно иного использования постоянно возрастающего объема документальных источников информации. Принципиальной особенностью гипермедиа является распространение идеи гипертекста, т.е. ассоциативно связанной текстовой информации, на видео- и аудиоинформацию, хранящуюся в цифровой форме.
   Системы гипермедиа, как и гипертекстовые, могут рассматриваться в разных аспектах. Один из подходов заключается в том, чтобы сравнивать методы доступа к информации в гипертексте с соответствующими методами в СУБД. Эти методы различны: в гипертексте они опираются на ассоциативные связи между понятиями, в СУБД - на структуры данных. Между системами гипертекста и гипермедиа нет четкой границы. Если Guide является чисто гипертекстовой системой, то Hyper-card, ArchiText включают элементы гипермедиа. Такие системы, как Intermedia, NLS/Ogmen.t, NoteCard, Xanadu представляют собой этапное достижение в развитии информационной технологии, ориентированной в первую очередь на обработку знаний.
   Из проектов РФФИ, выполненных по направлениям создания гипертекстовых, гипермедийных и динамических баз данных, наиболее значительными являются:
- создание "Информационной системы для поддержки радиоинтерферометрических наблюдений" (руководитель проекта Ю.Н. Пономарев, Астрокосмический центр Физического института им. П.Н. Лебедева РАН), содержащей распределенную базу данных, используемую как в локальной сети, так и с подключением к сети Internet (проект 95-07-19203);
- создание "Информационных систем и баз данных для многоаспектного моделирования и логико-оптимизационного поиска решений задач динамики и управления природными ресурсами и эколого-экономической обстановкой региона" (руководитель проекта С.Н. Васильев, Иркутский вычислительный центр СО РАН) с развитыми средствами представления гипертекстовой и графической информации (проект 94-07-01491);
- создание "Информационной системы поддержки исследований в механике сплошных сред" (руководитель проекта В.Д. Горячев, Тверской государственный технический университет), содержащей развитые вычислительные и графические средства, а также базу данных для поддержки выполнения в этой среде исследовательских проектов(проект 94-07-01227).
   В проекте "Радиоастрон" Астрокосмического центра ФИ РАН, ядром которого является распределенная на локальной сети Астрокосмического центра "Основная база данных", информация технологического и справочного характера представляется в виде совокупности гипертекстовых документов. Круглосуточный прием и обработка данных поддерживается хорошими динамическими качествами распределенной базы данных, а подключение ее к сети Internet расширяет прямой доступ к данным проекта "Радиоастрон".
   В проекте Иркутского вычислительного центра СО РАН созданы гипертекстовые базы данных с элементами "мультимедиа" о природных и экологических характеристиках Байкальского региона, среди которых следует отметить базу данных о природно-производственной сфере региона (ее использует многоуровневая система соответствующих математических моделей), гипертекстовую базу данных об озере Байкал и набор баз данных, поддерживающих автоматизированную систему ведения территориальных земельных кадастров как подсистему создаваемой геоинформационной системы ГИС-Байкал. Созданию гипертекстовых баз данных способствовала разработка оригинальных инструментальных средств ведения гипертекстовых (алфавитно-цифровых, мультимедиа) баз данных и информационных структур, включающих компилятор интерактивного гипертекста в RTF-файлы и интерпретатор гипертекста. Оригинальным является также построение "сегментных" баз данных, основанное на идее описания изображения как системы взаимосвязанных сегментов, имеющих собственную семантику и описываемых координатно-списочной структурой, содержащей семантическую и графическую части.
   Созданная в результате выполнения проекта Тверского государственного технического университета информационно-вычислительная система SELIGER, поддерживающая исследования в механике сплошных сред, является автоматизированной системой научных исследований, настраиваемой пользователем на свой исследовательский проект. Система имеет четкую структуру с подразделением на вычислительное ядро и сервисные пакеты подготовки данных и обработки результатов моделирования. СУБД существенно поддерживает технологию "мультимедиа". Графический постпроцессор позволяет представлять визуальную информацию в виде OLE-объектов и встраивать в различные документы с использованием гипермедиа и мультимедиа технологий.

1.3. Интероперабельные информационные системы
1.3.1. Требования к создаваемым информационным системам и базам данных

   Настоящий раздел содержит анализ перспективных технологий создания интероперабельных информационных систем для их применения в проектах, разрабатываемых по грантам РФФИ.
   Решению связанных с этим научных и методических проблем посвящен проект 94-07-20453 "Объектные технологии для создания интероперабельных информационных и вычислительных систем" (руководитель Л.А. Калиниченко, ИПИ РАН).
   Рассмотренные технологии специально ориентированы на достижение целей - насущных потребностей разработки проектов ИС и БД по грантам РФФИ.
   Создаваемые по проектам РФФИ информационные системы и базы данных (ИС и БД) предназначены для широкого использования в разнообразных применениях в рамках науки, образования, культуры и других областях. ИС и БД разрабатываются и развиваются как автономные системы, не требующие какого-либо централизованного управления.
   Основные стандарты, которым нужно следовать с целью достижения открытости систем и их интероперабельности (совместной деятельности) в рамках различных применений, уровень предоставляемых для пользователей спецификаций, уровень применяемых средств проектирования, должны быть предметом анализа и выработки соответствующих рекомендаций для использования в проектах РФФИ.
   Известно, что для того, чтобы разрабатываемые автономно и независимо друг от друга ИС и БД могли стать подлинно открытыми для использования их функций и данных в разнообразных применениях, следует стремиться к удовлетворению ими следующих требований:
- способность систем функционировать в условиях информационной и реализационной неоднородности, распределенности и автономности информационных ресурсов системы;
- обеспечение интероперабельности, повторного использования неоднородных информационных ресурсов в разнообразных применениях;
- возможность объединения систем в более сложные, интегрированные образования, основанные на интероперабельном взаимодействии компонентов;
- признание реинженерии, реконструкции систем как непрерывного процесса формирования, I уточнения требований и конструирования, и др.
   Эти требования удается обеспечить при использовании специальных интероперабельных архитектур (например, CORBA 2.0).

1.3.2. Достижение интероперабельности систем на основе промежуточного архитектурного слоя

   Архитектура промежуточного слоя базируется на стандартах интероперабельных систем, разрабатываемых Object Management Group (OMG) - крупнейшим в мире консорциумом разработки программного обеспечения, включающим свыше 700 членов - компаний-производителей программного продукта, телекоммуникационных и компьютерных компаний, компаний-разработчиков прикладных систем и конечных пользователей. Целью ОМG является создание согласованной информационной архитектуры, опирающейся на теорию и практику объектных технологий, а также общедоступные спецификации интерфейсов информационных ресурсов для обеспечения интероперабельности. Эта архитектура должна обеспечивать повторное использование компонентов, их интероперабельность и мобильность, опираясь на коммерческие программные продукты.
   Другие организации, которые работают в кооперации с OMG, например, с целью доведения результатов OMG до официальных стандартов в различных аспектах, включают: ANSI, ISO, CCITT, ANSA, X/Open Company, Object Database Management Group (ODMG).
   Перспективные архитектурные решения среды погружения ИС и БД основаны на идее промежуточного архитектурного слоя (middleware), определяющей способность совместной деятельности (интероперабельности) компонентов систем для решения задач.
   Компонентами ИС и БД являются произвольные информационные ресурсы - программные компоненты, базы данных, базы знаний, файлы данных (включая мультимедийную информацию), компоненты существующих информационных систем, и др. независимо от аппаратурно/программных платформ их реализации и размещения в пространстве. Этот слой расположен обычно над сетевой архитектурой, являющейся необходимой предпосылкой такой совместной деятельности компонентов и обеспечивающей их взаимосвязь.
   Технически интepoперaбeльнocть компонентов (представляемых объектами) решена введением базовой объектной модели, унифицированного языка спецификации интерфейсов объектов, отделением реализации компонентов от спецификации их интерфейсов, введением общего механизма поддержки интероперабельности объектов (брокера объектных заявок, играющего роль "общей шины", поддерживающей взаимодействие объектов). Тем самым достигается однородность представления компонентов и их взаимодействия (на основе идеи "клиент-сервер") в глобальном объектном пространстве, в котором каждый информационный ресурс однородно представляется совокупностью объектов, полностью инкапсулирующих детали реализации. Далее, для формирования информационной архитектуры вводится слой унифицированных (ортогональных) служб, которые используются как при конструировании прикладных систем, так и для формирования функционально законченных средств промежуточного слоя, предлагающих конкретные виды услуг.
   Существенно, что и службы и средства представляются однородно своими объектными интерфейсами, что позволяет обеспечить их интероперабельность посредством брокера объектных заявок.

1.3.3. Общая архитектура интероперабельных систем

Архитектура промежуточного слоя должна вводиться в среде погружения информационных систем и баз данных постепенно, по мере разработки соответствующих стандартов и компонентов. Первоначально в качестве архитектурного компонента, призванного обеспечить интероперабельность разрабатываемых ИС и БД, целесообразно использовать версию 2.0 архитектуры CORBA (Общей Архитектуры Брокера Объектных Заявок = Common Object Request Broker Architecture).
   Ключевыми компонентами стандарта CORBA являются брокер объектных заявок, играющий роль посредника во взаимодействии объектов-клиентов и объектов-серверов, язык спецификации интерфейсов OMGIDL (Interface Definition Language), фиксированные отображения IDL в языки программирования (С, C++, Smalltalk, Ada, Java).
   Брокер представляет собой механизм, позволяющий объектам выдавать заявки и получать ответы прозрачным образом. Благодаря этому обеспечивается интероперабельность между приложениями на различных аппаратных платформах в неоднородных распределенных средах. CORBA 2.0 обеспечивает распространение архитектуры CORBA на компьютерные сети произвольного масштаба (включая Internet). CORBA 2.0 вводит более высокую степень неоднородности распределенной объектной среды, являющейся "областью действия" стандарта CORBA, а именно, допускается сосуществование в этой среде нескольких, возможно, неоднородных (разработанных различными компаниями) брокеров, и описываются механизмы их взаимодействия. Эти механизмы реализуются посредством протоколов межброкерного обмена сообщениями, в числе которых предусмотрен специальный протокол обмена в среде Internet, называемый протоколом ПОР (Межброкерный Протокол Internet = Internet Inter-ORB Protocol).
   В настоящее время существует ряд промышленных реализаций ORB, соответствующих стандарту CORBA. Имеются также свободно распространяемые реализации.

1.3.4. Интеграция CORBA и WWW-технологий

   Быстрое распространение всемирной паутины (WWW) происходило в тот период, когда распределенные объектные системы, в особенности архитектура CORBA, проходили стадию стабилизации и созревания. Принятие стандарта CORBA 2.0 позволяет обеспечить поддержку глобального объектного пространства в масштабе Internet.
   Существенное различие назначений WWW и CORBA заключается в том, что WWW облегчает жизнь поставщиков И потребителей информации, a CORBA облегчает задачу разработчиков систем и фирм-поставщиков инструментальных средств. Поэтому роли WWW и CORBA являются взаимно дополняющими, и в этой связи требуются специальные технологии, обеспечивающие их сопряжение. Такое сопряжение сулит очевидные преимущества. Разработчики программных продуктов, использующие CORBA, получают доступ к быстро растущему рынку на основе WWW, а мир WWW получает доступ к услугам, обеспечиваемым на основе возможностей CORBA, значительно более мощным, чем реализуемая WWW простая модель обмена HTML-страницами. Интеграция двух миров приведет к наилучшему использованию этих двух стандартов.
   Известны два основных подхода к интеграции CORBA и WWW. Первый из них основан на построении шлюзов между мирами WWW и CORBA, служащих для трансформации HTTP в протокол CORBA 2.0 ПОР. Другой подход заключается во встраивании функций CORBA в состав клиентов WWW (программ просмотра) и серверов. Реализация второго подхода возможна либо на основе новых WWW клиентов и серверов со встроенным ПОР, либо при помощи подгрузки (downloading) из сети модуля поддержки ПОР в клиенте или сервере.
   В новом поколении WWW клиентов и серверов, поддерживающих Java, модуль поддержки ПОР реализуется на Java. Достоинства этого подхода заключаются в обеспечении динамической "раскрутки" функций по отношению к CORBA. Так, для любого ресурса, доступного посредством CORBA, может быть разработан пользовательский интерфейс как апплет Java. Этот апплет использует модуль ПОР для взаимодействия с сервером CORBA. При первом доступе пользователя к какой-либо услуге, программа просмотра автоматически загружает и инсталлирует апплет пользовательского интерфейса. После этого пользователь имеет доступ к этой услуге посредством собственного апплета.
   Таким образом, услуги объектов-серверов оказываются доступными широчайшей аудитории, независимо от применяемых пользователями платформ и при сохранении для разработчика возможности усовершенствования реализации услуг и их интерфейсов.

1.3.5. Среда погружения информационных систем и баз данных

   Среда погружения разрабатываемых информационных систем базируется на Internet, определяется архитектурами WWW и CORBA 2.0, сопряженными на основе шлюзов, протоколов ПОР, клиентов и серверов WWW, поддерживающих язык (языки), подобные Java.
   Основными стандартами, определяющими эту среду, являются следующие: стандарт CORBA 2.0, в том числе, стандарт межброкерного протокола Internet (ПОР) CORBA 2.0 и их последующие модификации, архитектура WWW, предусматривающая поддержку языка Java, спецификация языка Java и архитектура средств его поддержки, стандарт отображения OMG IDL в Java.
   В период перехода от чисто реляционных СУБД к смешанным объектно-реляционным и чисто объектным базам данных следует отдавать предпочтение тем системам, которые соответствуют:
- Стандарту ODMG-93, разработанному Object Database Management Group (ODMG) в составе компаний ObjectDesign, Ontos, 02 Technology, Versant, Objectivity при одобрении SunSoft, HP, Itasca, Intellitic, DEC, Servio, TI. Стандартом определяется ОСУБД как СУБД, интегрирующая средства баз данных с объектно-ориентированными языками программирования. Основная цель стандарта заключается в том, чтобы обеспечить мобильность прикладных программ по отношению к ряду ОСУБД. Для этого схема базы данных, связывание языка программирования с языками баз данных, язык манипулирования данными и язык запросов должны стать мобильными. Другая, не менее важная цель стандарта,- обеспечить интероперабельность различных ОСУБД на основе взаимодействия неоднородных распределенных баз данных посредством среды CORBA.
- Формирующемуся стандарту SQL3. Многие фирмы (например, Informix, Oracle) уже сейчас предпринимают ряд мер для расширения объектно-ориентированных возможностей систем с целью смягчения перехода к SQL3.
   Общий принцип обеспечения доступа к базам данных заключается в их инкапсуляции в составе информационной системы, в определении эффективного интерфейса базы данных для решения задач ин-формационной системы, в реализации этого интерфейса и его инкапсуляции средствами CORBA. Тем самым будет обеспечена независимость информационной системы от применяемой СУБД.
   Другая возможность обеспечения частичной независимости от СУБД заключается в использовании стандарта SQL Call Level Interface (ISO/IEC 9075-3: 1995).

1.3.6. Заключение

   В разделе дан краткий анализ целесообразной архитектуры информационных систем на основе объектной технологии и принципов интеропера-бельности компонентов, развиваемых OMG.

1.4. Системы управления базами данных

   Проблематика исследовательских работ и конкретных практических разработок в области баз данных всегда отличалась особой широтой. В настоящее время, пожалуй, она широка как никогда. Это связано с тем, что одновременно ведутся исследования и в области традиционных реляционных баз данных, и в областях, которые, предположительно, должны придти на смену реляционным базам данных. Часто исследования, которые формально относятся к разным направлениям, на самом деле оказываются очень близки.
   Интересным явлением в современных исследованиях баз данных является широкое участие в них как ученых и исследователей из университетов, академических научно - исследовательских институтов, так и специалистов из научно-исследовательских лабораторий коммерческих компаний-производителей аппаратуры и/или программного обеспечения. Это весьма положительное явление, позволяющее университетам и научно-исследовательским институтам в большей степени оценивать практическую значимость своих исследований и дающее возможность компаниям использовать наиболее свежие достижения теоретиков. Кроме того, складывается все большее число полуобщественных научно-технических групп, в которых специалисты организаций разных типов совместно решают актуальные проблемы, связанные, например, со стандартизацией.
   Достаточно условно можно выделить четыре основных исследовательских области, связанных с проблематикой баз данных. Первая область наиболее близка к сегодняшним проблемам индустрии баз данных, основанных на реляционной модели данных. Хотя иногда кажется, что эта область настолько хорошо разработана, что в ней уже не осталось нерешенных проблем, на самом деле это не совсем так. Более того, те вопросы, решение которых еще не найдено, актуальны и для следующих поколений систем баз данных.
   Вторая область условно называется в литературе областью баз данных следующего (или третьего) поколения. Основными требованиями, объединяющими исследования в этой области, являются преемственность с системами реляционных баз данных (второго поколения) и расширение функциональных возможностей этих систем. Вместе с тем, эти требования носят настолько общий характер, что исследовательская область баз данных третьего поколения часто включает проекты, имеющие очень мало общего.
   В третью область выделяются исследования баз данных, базирующиеся на применении объектно-ориентированого подхода. Преследуя также основную цель расширения функциональных возможностей и области применения баз данных, направление ООБД с самого начала базировалось не на реляционной, а на объектно-ориентированной парадигме, и лишь в последние годы стали искать пути обеспечения преемственности с реляционными базами данных (в продуктах типа Odapter фирмы HP по отношению к Oracle2 в версии Oracle 8.0 и др.).
   Наконец, к четвертой области относится тесно примыкающее к базам данных направление исследований по интеграции разнородных распределенных информационных ресурсов. Актуальность этого направления на глазах возрастает в связи с реально существующей возможностью высокоэффективного транспортного доступа к удаленным ресурсам на основе, например, всемирной "сети сетей" Internet. Сейчас существует множество исследовательских проектов, посвященных решению этой проблемы на основе применения объектно-ориентированного подхода. Существенно, что примерно та же технология требуется для решения другой, хотя и близкой проблемы современности - проблемы "унаследованных" (legacy) систем.

Реляционные СУБД

   Реляционные СУБД в настоящий момент представляют собой основу индустрии обработки и хранения информации. Объем рынка реляционных СУБД за 1995 год составлял около 5 млрд. долл. Хотя современные коммерческие системы, основанные на языке SQL, называются реляционными системами, многие отмечают, что в действительности они настолько далеко отошли от реляционной модели данных, что правильнее было их называть просто системами второго поколения, или SQL-ориентированными системами. Эти терминологические дискуссии не мешают системам второго поколения получать все более широкое распространение, а производителям такого рода программных продуктов вести исследования, результаты которых служат улучшению качества производимых систем.
   Ниже приводится краткий обзор основных проблем и перспектив в области реляционных СУБД.

   Повышение эффективности и поддержка параллельных архитектур

   Конечно, наиболее важным показателем современной СУБД второго поколения является эффективность. Часто пользователи готовы смириться с недостаточно развитыми интерфейсными средствами и недостаточной функциональностью системы, если она показывает хорошую производительность.
   Несколько лет назад в сообществе исследователей баз данных было распространено мнение, что единственной реальной возможностью добиться существенного повышения эффективности реляционных СУБД является разработка и последующее использование специализированных аппаратно-программных средств машин баз данных. Естественно, стоимость такого рода систем и соотношение цена-производительность оказывались достаточно высоки.
   В последние десять лет практически полное завоевание мирового компьютерного рынка дешевыми микропроцессорами, устройствами оперативной и дисковой памяти привели к изменению в расстановке акцентов. Стало очевидно, что если научиться получать высокоэффективные серверы баз данных на основе применения массового компьютерного оборудования, то соотношение цена/производительность будет более приемлемым для потребителей.
   В наиболее производительных доступных сегодня на рынке серверах баз данных эффективность достигается, главным образом, за счет параллельного выполнения нескольких запросов, а также внутриоператорного распараллеливания на мультипроцессорных архитектурах.
   Вместе с тем, для наиболее эффективного использования серверов подобного рода необходимо научиться хорошо решать две задачи: физическое проектирование баз данных (т.е. правильное размещение данных на дисковых устройствах, которые могут параллельно использоваться разными процессорами) и оптимизация параллельных запросов (т.е. выбор наиболее оптимального параллельного способа выполнения запроса).
   Многие поставщики РСУБД поддерживают по крайней мере симметричную мультипроцессорную архитектуру (SMP). Лидерами по работам в области поддержки параллельных архитектур следует назвать фирмы Oracle и Informix Software. Обе фирмы выпустили варианты своих СУБД, поддерживающие массово-параллельные и кластерные архитектуры. При этом речь идет не только о распараллеливании сеансов работы СУБД, но и о распараллеливании обработки каждого запроса.

Оперативная аналитическая обработка сверхбольших баз данных

   Если 5 лет назад база данных в 100 Гб считалась достаточно большой, то в настоящее время этот предел увеличен до 1 Тб. Для того, чтобы подобные массивы информации не стали мертвым грузом, применяются специальные СУБД, ориентированные на работу со сверхбольшими базами - так называемые информационные хранилища. Подобные СУБД не только обеспечивают возможность добавления новых данных в базу, но и проведение всевозможных аналитических операций за приемлемое время (сбор статистики, выявление тенденций, многомерный анализ и пр.), причем одновременно с массовым добавлением в базу новых данных - собственно это и называется оперативной аналитической обработкой (ОLAP - On-line Analytical Processing). Хотя многие поставщики (например, Oracle) провозглашают свои СУБД готовыми для OLAP и поддерживающими сверхбольшие объемы данных, на деле существует особая категория СУБД, специально созданная для реализации информационных хранилищ.
   В первую очередь следует упомянуть применение битовых индексов (СУБД Red Brick). В обычных СУБД для индексирования чаще всего применяются вариации двоичных деревьев и хеш- таблиц. Эти технологии хорошо работают при индексировании полей, принимающих большое число различных значений, однако использование таких индексов для полей с небольшим числом значений может даже замедлить обработку. Технология битовых индексов как раз предназначена для решения этой проблемы. Для каждого из возможных значений поля в таком индексе заводится битовый массив, длина которого равна числу записей в таблице. Если поле имеет данное значение, то бит с номером, равным номеру этой записи в таблице, устанавливается в 1, иначе в 0. Тогда обработка запроса типа "выбрать все записи, в которых поле 'имя' равно 'Иван' или 'Петр'" сводится к проведению побитовой операции "или" с битовыми массивами индекса, соответствующим значениям 'Иван' и 'Петр'. В других информационных хранилищах реализуются также некоторые операции с массивами и матрицами.
   Несмотря на существование специализированных СУБД для создания информационных хранилищ и их реальную необходимость, по некоторым оценкам лишь 15% промышленных информационных хранилищ достигли своей проектной мощности (объема, быстродействия). Следовательно, исследования и разработки в области информационных хранилищ несомненно являются перспективными.
Обработка нестандартных типов данных

   Явный недостаток реляционных СУБД - не возможность расширения номенклатуры типов данных. Достаточно универсальным решением было бы расширение реляционной модели данных некоторыми чертами объектно-ориентированной модели (см. ниже "Гибридные СУБД"). Однако, многие поставщики идут по другому пути - пути встраивания в свои продукты механизмов, рассчитанных на обработку вполне конкретных типов данных: текста, видео, звука, поверхностных координат и пр. Так например, новый продукт фирмы Oracle Universal Server будет содержать такие компоненты как: Oracle Text Server (ConText) для полнотекстового индексирования и поиска; Oracle Video Server для обработки видео- и звуковой информации; Oracle Express Server - для многомерного анализа данных и др. Кроме того, в эту СУБД будут встроены механизмы обработки координатных данных (точек, фигур, операций над ними - пересечения, объединения, проверки вложенности и т.д.)

Возможности активных баз данных

   Принципиальная идея активных баз данных очень проста. Она состоит в том, что СУБД позволяет помещать в базу данных не только "пассивные" факты, относящиеся к предметной области, но и "активные" правила, которые при возникновении указанных ситуаций принуждают систему совершать специфицированные действия.
   Фактически, набор правил активной БД описывает семантику предметной области. Обычной структурой правила является комбинация "событие-условие-действие". Событие обычно характеризует некоторое действие, которое может быть совершено над БД. Примерами события в реляционной БД могут быть обновление некоторого поля некоторой таблицы, удаление кортежа таблицы, занесение в таблицу нового кортежа и т.д. Условие - это произвольное логическое выражение, включающее предикаты, определенные над БД. Наконец, действие - это произвольный оператор или набор операторов, допускаемых СУБД.
   Общая схема функционирования активной БД является следующей. Пользователь или прикладная программа выполняют некоторое действие над БД. Если это действие является событием для некоторого правила, то вычисляется условие этого правила. Если значением условия является "истина", то выполняется действие правила. Выполнение этого действия может явиться событием для некоторого другого правила и т.д. Очевидно, что СУБД, поддерживающая активные БД, должна обладать некоторой встроенной продукционной системой.

Объектно-ориентированные СУБД

   Первые промышленные образцы объектно-ориентированных СУБД (ОСУБД) появились менее 10 лет назад. Хотя в то время многие аналитики предсказывали быстрое вытеснение реляционных СУБД объектно-ориентированными, сегодня объем рынка объектно-ориентированных СУБД составляет менее 2% от объема рынка реляционных СУБД. Около 80% рынка ОСУБД принадлежит пяти поставщикам: Object Design (СУБД ObjectStore), 02 Technology (СУБД 02 System), Gemstone (СУБД GemStone), Objectivity (СУБД Objectivity DB) и Versant Technology (СУБД Versant).
   ОСУБД прочно занимают свою нишу - это приложения, требующие хранения данных сложной структуры со сложными взаимосвязями, когда превалирует требование доступа к отдельному экземпляру данных, а не к подмножеству, как в реляционной модели данных. Прежде всего это, приложения САХ (CAD, CAM, CASE и пр.), телекоммуникация, геоинформационные системы и т.п. Часто объектные СУБД используются в распределенных системах оперативного мониторинга, так, имеется достаточно много примеров применения таких систем в крупных больницах, следящих в реальном времени за состоянием больных и системами их жизнеобеспечения.
   Первые ОСУБД представляли собой просто библиотеку функций, рассчитанную на определенный объектно-ориентированный язык программирования (C++, SmallTalk) или даже на определенный компилятор, которая позволяла создавать хранилище долгоживущих объектов, которыми пользуется прикладная программа. Следует заметить, что например, ОСУБД Object-Store, занимающая первую строчку в списке по числу продаж, обладает именно этим свойством - сейчас существуют 2 версии этой СУБД - для языка C++ и для языка SmallTalk, при этом программы, написанные на разных языках не могут пользоваться одними и теми же хранимыми в этой СУБД объектами.
   Существуют, однако, поставщики, СУБД которых лишены этого недостатка, например 02 и Versant. Эти СУБД представляют собой объединенное хранилище объектов для различных объектно-ориентированных языков: C++, SmallTalk, Java3.
   Хотя в области ОСУБД ведутся интенсивные работы по стандартизации и выпущен обширный перечень стандартов (ODMG-93), полной реализации этих стандартов невозможно найти ни у одного поставщика ОСУБД4. Одной из важнейших проблем, которая пока не нашла приемлемого решения в мире ОСУБД, является создание стройной системы разграничения доступа к объектам. Насколько известно, из пяти основных поставщиков ОСУБД только продукт фирмы GemStone имеет систему безопасности.
   К сожалению, для ООБД общей модели данных не существует, и многие специалисты полагают, что общая объектная модель никогда не будет выработана. Конечно, это обстоятельство сильно мешает консолидации усилий по решению общих проблем ООБД.
   В то же время объектная модель данных безусловно более адекватно отражает реальный мир, чем, например, реляционная. Кроме того, обозначенные выше области применения ОСУБД являются гарантией того, что ОСУБД если и не займут в ближайшем будущем доминирующего положения, то и ни в коем случае не отомрут. Последнее реалное тому свидетельство - объявление гиганта программной индустрии фирмы Computer Associates о выпуске в сотрудничестве с компанией Fujitsu распределенной объектно-ориентированной СУБД Jasmine. Это позволяет сделать вывод о перспективности разработок в области объектноориентированных СУБД.

Гибридные СУБД

   Еще одна область в индустрии СУБД - гибридные СУБД-системы, обладающие одновременно свойствами реляционных и объектно-ориентированных СУБД. Первоначальным импульсом к созданию подобных СУБД послужил очевидный недостаток чисто реляционных СУБД - невозможность добавления новых типов данных и отсутствие механизма наследования отношений. В этой области также проводится работа по выработке стандарта на манипуляцию данными в гибридных СУБД.
   Существует еще не утвержденный проект стандарта на язык SQL (Structured Query Language) с объектными расширениями (SQL3). В этом языке содержатся конструкции наследования отношений, определения новых типов данных и определения методов обработки этих типов. Однако многие аналитики считают этот новый стандарт чрезвычайно сложным в реализации.
   Сейчас к гибридным технологиям явный интерес проявляют крупные поставщики реляционных СУБД. Так, фирма Illustra (один из лидеров рынка гибридных СУБД) не так давно была поглощена фирмой Informix, ради ее технологии Data Blades, позволяющей вводить в реляционную базу новые типы данных и средства их обработки. Было заявлено, что эта технология будет интегрирована в реляционную СУБД Informix, и на этой основе будет выпущена универсальная объектно-реляционная СУБД Informix Universal Server. Корпорация Oracle объявила о том, что следующая версия (8.0) ее основной СУБД будет содержать некоторые объектно-ориентированные расширения.

Интеграция информационных ресурсов

   Накопление громадного количества информационных ресурсов, реализованных с использованием разных технологий, в различных программно-аппаратных средах ставит на передний план проблемы интеграции. Необходимо найти пути к превращению изолированных и специфически реализованных ресурсов в интероперабельные, т.е. способные к совместной работе.

Internet и новые возможности интеграции

   До тех пор, пока технология публичных телекоммуникационных сетей не стала достаточно развитой, проблема интеграции информационных ресурсов носила большей частью исследовательский, а в практическом отношении, корпоративный характер (т.е. ее пытались решать в рамках корпоративных сетей). Теперь, когда существует интенсивно используемая эффективная "сеть сетей" Internet, проблема интеграции становится общечеловеческой.
   Технических возможностей сетей, входящих в состав Internet, оказывается достаточно, чтобы в принципе обеспечить доступ в режиме реального времени к любому серверу, подключенному в сети (файловому, серверу баз данных, серверу WWW и т.д.). Более того, уже сейчас или в ближайшем будущем публичные сети будут в состоянии поддерживать понастоящему распределенные информационные системы. Но для этого необходимо решить проблему интеграции и обеспечить реальную интероперабельность информационно-вычислительных компонентов Internet.
   Кажется, что быстрое развитие технических возможностей публичных сетей и интенсивное наращивание их информационно-вычислительной наполненности будет одним из наиболее существенных стимулов исследований и разработок в области интероперабельности. В решении этой проблемы заинтересованы как широкие исследовательские круги, так и компании, связанные с производством компьютеров и программного обеспечения, а также телекоммуникационные компании, заинтересованные в предоставлении своим клиентам новых видов сервиса.
   Для всех без исключения поставщиков СУБД в последнее время самым актуальным становится технология поддержки Internet. Многие поставщики СУБД выпустили на рынок компоненты, предназначенные для осуществления доступа к данным в СУБД через Internet. Одной из самых актуальных задач в этой области является обеспечение защиты передаваемой информации. С этой целью разработаны и разрабатываются стандарты на кодирование данных, аутентификацию данных, проведение коммерческих операций через Internet и пр. Также перспективной несомненно является разработка промежуточного интерфейсного программного обеспечения между СУБД и средой языка Java.

Проблемы "унаследованных" систем

   Близкой проблемой, которая также связана с обеспечением интероперабельности, является проблема "унаследованных" (legacy) компьютерных систем. Эта проблема является в основном корпоративной, но это не снижает ее масштабность. Суть проблемы состоит в том, что многие крупные компании, связанные с самыми разнообразными видами бизнеса (банки, телекоммуникационные компании, крупные государственные учреждения и т.д.), за время своего существования накопили громадное количество информационных систем, реализованных на основе разнообразных и большей частью устаревших программно-аппаратных средств. Системы делались и зачастую связывались между собой на основе неунифицированных ("ad hoc") решений.
   Понятно, что наличие такого разнородного информационного хозяйства мешает переходу компаний к использованию новых аппаратно программных технологий (например, многие системы были написаны на языках ассемблера). Основная проблема заключается в том, что в принципе невозможно быстро переделать унаследованные системы с использованием новых технологий в основном по той причине, что в них используются громадные объемы программ и данных. Например, в американской телекоммуникационной компании GTE используются 50 крупных и 1200 средних и мелких информационных систем, которые в совокупности связаны с обработкой нескольких терабайт данных. Недопустима даже временная приостановка работы любой из этих систем, поскольку это повлекло бы для компании громадные денежные потери.
   Необходимо выработать технологию, позволяющую привести унаследованные системы к такому внешнему (и крупноблочному структурному) представлению, которое соответствовало бы современным взглядам на архитектуру систем с такими функциями. После этого можно начинать постепенную покомпонентную переделку системы таким образом, чтобы не нарушать ее функционирование. Понятно, что при этом нужно постоянно обеспечивать интероперабельность компонентов на крупном и мелком уровнях.
   Наиболее распространенным подходом к решению проблем унаследованных систем, интеграции информационных ресурсов, обеспечения интероперабельности является объектно-ориентированный подход (ООП). Как кажется, основными преимуществами использования ООП являются принцип инкапсуляции, позволяющий при использовании объекта полностью абстрагироваться от его реализации, а также принципы наследования, полиморфизма и позднего связывания, которые, вообще говоря, позволяют единообразно использовать семантически эквивалентные объекты, которые могут быть поразному реализованы.
   К сожалению, ООП, конечно же, не решает всех проблем. Например, проблема семантической интероперабельности (т.е. взаимозаменяемости двух или более независимо и в разных средах реализованных объектов) все еще остается не только не решенной, но даже и не полностью формализованной.

Интеграция на основе "над"-моделей

   Понятно, что для решения проблемы интеграции и интероперабельности информационных ресурсов на основе ООП нужно решить задачу отображения моделей, в которых представлены разные взаимодействующие ресурсы. Одним из подходов к решению этой задачи является создание некоторой общей объектной модели, в которую отображается модель каждого взаимодействующего информационного ресурса. Каждый пользователь работает либо в терминах своей локальной модели, либо в терминах общей концептуальной модели. При этом взаимодействие объектов, представленных в разных моделях, происходит через общую объектную модель.
   Практической реализацией идеи интеграции на основе "над"-модели является методология и соответствующие продукты CORBA, разработанные OMG (Object Management Group). В случае использования CORBA "над"-моделью является так называемая Core Object Model, представленная в виде языка спецификации интерфейсов IDL (Interface Definition Language). К сожалению, при наличии в системе компонентов с существенно разными объектными моделями выработка соответствующей "накрывающей" над-модели становится проблематичной (это похоже на проблему выработки единой объектной модели данных для ООБД).

Интерфейсы

Программные интерфейсы

   В настоящий момент наибольшее влияние на программные интерфейсы СУБД оказывает Internet, точнее гипертекстовый сервис WWW. Практически все крупные поставщики СУБД (как реляционных, так и объектных) считают своим долгом выпускать либо Web-серверы собственной разработки (например, ORACLE Web-сервер), либо специальные интерфейсные библиотеки (шлюзы) для связи Web-серверов со своими СУБД (например, 02 Technology с ее продуктом 02 Web и многие другие). С другой стороны, происходит встречный процесс, заключающийся в расширении стандарта на язык описания гипертекстовых связей HTML (Hyper Text Markup Language) в сторону более гибкой связи гипертекстовых документов с СУБД.
   Еще один весьма важный фактор, влияющий на развитие программных интерфейсов - появление среды Java. Java - это объектно-ориентированный, интерпретируемый язык, созданный в корпорации Sun Microsystems специально для Internet. Сейчас две основные программы просмотра WWW-NetScape Navigator фирмы NetScape и Internet Explorer фирмы Microsoft -поддерживают Java. Прямая поддержка Java включена в операционные системы NetWare фирмы Novell и OS/2 фирмы IBM. Не так давно вышла первая версия комплекта программных интерфейсов JDBC (Java Database Connectivity) для связи Java-программ с СУБД, и буквально на днях появился первый продукт на основе JDBC - InterClient фирмы Borland, обеспечивающий связь Java-программ с реляционной СУБД InterBase. Поддержка языка Java программами просмотра Internet сделала их "универсальным клиентом", в каком-то смысле подменяющим собой всю операционную систему и приложения, так как все необходимые программы в принципе можно загрузить из Internet. В идеале, при достаточном распространении Java-приложений и качественной телекоммуникационной инфраструктуре может получить широкое распространение так называемый "сетевой компьютер" без всякой дисковой памяти и с одной лишь программой просмотра WWW вместо операционной системы. Следует заметить, что это совсем не пустые слова: например, фирма Corel планирует выпуск комплекта офисных приложений (текстовый процессор, электронные таблицы, презентационный пакет) на языке Java, фирма Sun Microsystems уже в 1997 году собирается выпустить микропроцессоры, реализующие систему команд виртуальной Java -машины, а консорциум из фирм IBM, Oracle, Sun и некоторых других действительно планирует выпуск сетевого компьютера, который будет стоить не дороже $500.

Пользовательские интерфейсы

   Коротко положение дел в пользовательских интерфейсах можно выразить следующим образом - во-первых, тренд в сторону объектной ориентированности, во-вторых, отображение всех доступных пользователю объектов в виде всевозможных иерархий. Еще одна тенденция в большинстве передовых инструментов - поддержка коллективной работы.
   Следует заметить, что "начинка" системы вовсе не обязана быть объектно-ориентированной: например, пользовательский интерфейс системы Windows95 является объектно-ориентированным, при том, что это определение никак нельзя отнести к внутренней архитектуре этой ОС. Объектно-ориентированный пользовательский интерфейс поддерживает и наследование, и полиморфизм. Например, окна управления свойствами любых объектов в Windows95 имеют схожий (узнаваемый) вид, отличаясь только числом страничек и параметрами (наследование); существуют полиморфные операции, применимые к группам или ко всем без исключения объектам (например, щелкнув правой кнопкой мыши, пользователь всегда вызывает появление контекстно-зависим ого меню и т.п.).
   Существует определенное противоречие между объектно-ориентированным пользовательским интерфейсом и доминирующей реляционной архитектурой СУБД. В реляционной модели отсутствуют наследование и полиморфизм. Задача корректного отображения реляционной модели данных в объектно-ориентированный пользовательский интерфейс является весьма трудоемкой, и поэтому в на-стоящее время получили распространение средства автоматизации разработки объектно-ориентированного интерфейса к реляционным СУБД. К этому классу средств в мире Windows можно отнести Visual Basic фирмы Microsoft, PowerBuilder фирмы Sybase, Delphi фирмы Borland. В мире UNIX следует назвать UniFace, JAM7 фирмы JYACC. Интересно также, что в этой области встречаются симбиозы реляционных и объектно-ориентированных СУБД. Например, NewEra -инструмент визуальной разработки приложений для реляционной СУБД Informix - в качестве хранилища объектов среды разработки использует объектную СУБД Versant.
   Еще один класс интерфейсных средств - инструменты для "добывания данных". К ним относятся средства построения запросов, анализа и создания отчетов. Примером передового инструмента анализа реляционных данных является продукция фирмы MicroStrategy: DSS Agent, DSS Architect, DSS Executive. Эти инструменты созданы для автоматизации процесса принятия решений (Decision Support). DSS Architect позволяет по готовой реляционной модели данных построить ее многомерный аналог и сохранять их "когерентность". DSS Agent на основе многомерной модели позволяет анализировать данные, просматривать их в различных измерениях и с разной степенью детализации и т.д. DSS Executive - средство подготовки интерфейса для высшего руководства, ответственного за принятие решений.
   Существует также класс средств, служащих для управления архивами данных определенного типа, например текста, изображений, двумерных и трехмерных пространственных данных. Примером может служить продукция фирмы Excalibur Technologies. Система служит для сбора со всех возможных устройств визуальной и текстовой информации. Для поиска используются полнотекстовая индексация, тематические базы знаний, поиск по образцу (в том числе и графических образов) и пр. Другой пример - модули Data Blade фирмы Illustra, расширяющие функциональность объектно-реляционной СУБД Illustra. Существуют, например, мо-дули для манипуляций дву- и трехмерными пространственными (spatial) данными, использующие оригинальную технологию индексирования на базе R-деревьев. Модуль для поиска визуальной информации позволяет искать по образцу графические образы и видео-фрагменты.
   Подавляющее большинство используемых в России СУБД являются разработками зарубежных фирм или адаптированными версиями.
   Из отечественных разработок последнего времени следует выделить СУБД "НИКА", разработанную лабораторией банков данных Института системного анализа РАН, которую возглавляет профессор Н.Е. Емельянов. Эта СУБД использует модель, в которой данные организуются в дерево, которое может быть "оплетено" сетью ссылок (указателей). Такая модель данных имеет ряд преимуществ по сравнению с реляционной моделью, в частности облегчается процесс проектирования БД.
   Проекты РФФИ по разработке СУБД в 1993/ 95 гг. не выполнялись.
   В то же время существенно новая технология сбора, хранения и обработки информации на базе "табличного подхода к обработке данных" представлена в разработке проекта 94-02-05296 "Технология сбора, хранения и обработки астрономической информации" (руководители Ф.А. Новиков, СВ. Крашенинников, Институт теоретической астрономии РАН). Новая технология нацелена на соединение возможностей СУБД и ППП и включает в себя динамический аспект рассмотрения таблицы как процесса перебора кортежей и выполнения действий обработки.

1.5. Системы, накапливающие и/или использующие знания

   "Включение" компьютерных технологий собственно в процесс осуществляемых человеком рассуждений (в рамках научного исследования, анализа данных и принятия управленческих решений и т.п.), с одной стороны, придает новое качество (например, надежность, аргументированность и высокий уровень релевантности) порождаемым результатам. С другой стороны, такое "включение" требует соответствующего процедурного "оформления" компьютерных технологий (например, построения компьютерных моделей рассуждений, пригодных для работы с разнородными и разнотипными данными - символьными, числовыми, представленными в виде неструктурированных текстов и т.п.). Дополнительные технические особенности в эту картину вносит необходимость решать названные задачи, используя распределенные структуры хранения и обработки информации, средства поддержки multimedia-функций, WWW-технологий и др.
   Представляется важным отнести к ведущим тенденциям развития обсуждаемой предметной области:

  • рост объемов накапливаемой в хранилищах данных информации и перенос внимания в их использовании от конкретного значения конкретного атрибута к обзорным характеристикам определенных фрагментов (в том числе - значительных по размеру) хранилища информации. При этом, как правило, такие обзоры необходимо порождать регулярно и в достаточно оперативном режиме;

  • развитие средств оперативной аналитической обработки информации, в том числе - для открытых (незамкнутых, пополняемых) предметных областей, где нет возможности оперировать фиксированной моделью рассматриваемого объекта (модели объекта исследования здесь порождаются из доступных данных в процессе машинного обучения - см., например, системы интеллектуального управления, системы обучения информационному поиску и навигации в гипертекстовых БД и др.);

  • развитие математических моделей и соответствующих программных средств поддержки компьютерных рассуждений (дедукции, абдукции, рассуждений по аналогии, так называемых рассуждений в духе здравого смысла и т.п.), способных оперировать разнородными типами данных (от соединения символьных и числовых методов анализа данных к обработке и "пониманию" неструктурированных текстов, от поддержки простейших multimedia-функций к WWW-технологиям и др.);

  • развитие средств автоматического "извлечения" знаний из неструктурированных текстов (автоматическое пополнение тематических баз данных "извлекаемой" из текстов информацией; управление документопотоками на основе автоматического тематического анализа и индексирования; информационный поиск на основе содержания документов, сходства и ассоциативных связей и др.).
       Наиболее ярко сформулированные тенденции представлены в исследованиях и разработках, группирующихся вокруг следующих четырех направлений:

  • технологии хранилища данных (Data WareHouse);

  • интеллектуальные информационные системы (Data WareHouse + Automatic Reasoning System);

  • основанные на знаниях и\или обучении системы интеллектуального управления: продукционные экспертные системы реального времени, включая интеллектуальные CASE (Computer Added Software Engineering) - системы и ВPR (Business Process Reengineering) - средства, системы с обучением на базе нейрокомпьютерных технологий, системы семиотического моделирования и ситуационного управления;

  • системы текст-процессинга, ориентированные на "глубокую" обработку полнотекстовых документов (в том числе - в распределенной информационной среде): лексический и тематический анализ, используемый для автоматической классификации документов и информационного поиска, учитывающего не только содержание документов, но и сходство по содержанию, ассоциативные связи и т.п.

1.6. Средства защиты информации

   В области защиты информации и компьютерной безопасности в целом наиболее актуальными являются три группы проблем, связанные с:
   1) нарушением конфиденциальности информации; 2) нарушением целостности информации; 3) нарушением работоспособности информационно-вычислительных систем.
   Приоритетными направлениями проводимых исследований и разработок, как у нас в стране так и за рубежом, являются:
- защита от несанкционированных действий и разграничение доступа к данным в информационно-вычислительных системах коллективного пользования;
- защита данных от утечки, несанкционированного искажения и уничтожения;
- идентификация и аутентификация пользователей и технических средств (в том числе "цифровая" подпись);
- обеспечение имитозащиты в системах связи и передачи данных;
- создание технического и системного программного обеспечения высокого уровня надежности и стандартов (международных и национальных) по обеспечению безопасности данных;
- защита информации в телекоммуникационных сетях;
- разработка правовых аспектов компьютерной безопасности.
   В связи с интенсивным развитием в нашей стране телекоммуникационной инфраструктуры и подключением к международным сетям особенно острой является проблема защиты от компьютерных вирусов. Сетевые вирусы (так называемые репликаторы) являются особым классом вирусов, имеющих логику, обеспечивающую их рассылку по всем или части пользователей сети.
   В последнее время отмечается большая международная активность в вопросе стандартизации способов и методов обеспечения без опасности данных в телекоммуникационных системах.
   Проекты РФФИ по проблематике защиты информации в 1993-1995 г.г. не выполнялись.

1.7. Выводы

   Разрабатываемые информационные системы должны ориентироваться на погружение в среду, базирующуюся на Internet и определяемую архитектурами WWW и CORBA 2.0, сопряженными на основе шлюзов, протоколов ПОР, клиентов и серверов, поддерживающих языки, подобные Java.
   Основными стандартами, определяющими эту среду, являются: стандарт CORBA 2.0, в том числе стандарт межброкерного протокола Internet (ПОР) CORBA 2.0, и их последующие модификации, архитектура WWW, предусматривающая поддержку языка Java, спецификация языка Java и средств его поддержки, стандарт отображения ОMG IDL в Java.
   В период перехода от реляционных к смешанным объектно-реляционным и объектным базам данных разрабатываемые системы должны соответствовать:
- стандарту ODMG-93, разработанному Object Database Management Group (ODMG) в составе компаний Object Design, Ontos, 02 Technology, Versant, Objectivity при одобрении SunSoft, HP, Itasca, Intellitic, DEC, Servio, TI. Стандартом определяется ОСУБД как СУБД, интегрирующая средства баз данных с объектно-ориентированными языками программирования. Основная цель стандарта заключается в том, чтобы обеспечить мобильность прикладных программ по отношению к ряду ОСУБД. Для этого схема базы данных, связывание языка программирования с языками баз данных, язык манипулирования данными и язык запросов должны стать мобильными. Другая, не менее важная цель стандарта,- обеспечить интероперабельность различных ОСУБД на основе взаимодействия неоднородных распределенных баз данных посредством среды CORBA.
- формирующемуся стандарту SQL3. Многие фирмы (например, Informix, Oracle) уже сейчас предпринимают ряд мер для расширения объектно-ориентированных возможностей систем с целью смягчения перехода к SQL3.
   Перспективным вариантом является использование среды программ просмотра и апплетов Java для программирования графических интерфейсов.
   Разрабатываемые информационные системы и базы данных должны сопровождаться развитыми спецификациями, включая:
- гипертекстовые спецификации, определяющие назначение, функциональные, информационные, архитектурные, интерфейсные и прочие возможности информационного ресурса,
- онтологические спецификации, определяющие понятийную базу применений, на которые рассчитан информационный ресурс,
- спецификации интерфейсов информационного ресурса, обеспечивающие возможности его интероперабельного использования посредством CORBA,
- спецификации, отражающие результаты различных этапов проектирования информационного ресурса при помощи CASE-средств (включающие спецификацию требований и результаты анализа предметной области).

Приложение 1
Список выполненных проектов РФФИ по тематике информационных систем и баз данных

   № 94-02-06184 Лебедев Виктор Сергеевич
АРХИСПЕКТР - создание базы данных спектрограмм высокого разрешения 6-метрового телескопа, редуцированных спектров, параметров спектральных линий и физических характеристик звезд

   № 94-07-01569 Злобин Владимир Константинович
Система межотраслевой обработки космических изображений поверхности Земли для оперативного информационного обеспечения научных учреждений и народного хозяйства страны.

   № 93-07-04727 Коптюг Валентин Афанасьевич
Банки данных по молекулярной спектроскопии органических соединений, прогнозирующие и информационно-логические системы на их основе.

   № 93-07-14668 Авакян Карен Хоренович
Базыи банки данных петролого-геохимической информации, магматических и метаморфических пород для определения геодинамических обстановок их формирования.

   № 93-07-14668 Авакян Карен Хоренович
Базыи банки данных петролого-геохимической информации, магматических и метаморфических пород для определения геодинамических обстановок их формирования.

   № 94-03-09323 Шляпочников Владимир Александрович.
Компактные высокоэнергетичные соединения. Анализ зависимостей и аномалий физико-химиче-ских свойств и классификация структур на основе теоретико-графового подхода установления зави-симостей "структура-свойство".

   № 94-07-06234 Панасюк Михаил Игоревич.
Информационная система "Космические аппараты и физические поля в околоземном космическом пространстве".

   № 94-07-00633 Лосев Сталий Андреевич.
Информационно-математическое моделирование в области физико-химической кинетики.

   № 94-07-01227 Горячев Валерий Дмитриевич.
Информационная система поддержки исследований в механике сплошных сред.

   № 95-07-19203 Пономарев Юрий Николаевич.
Информационная система для поддержки радио интерферометрических наблюдений (ИСПРИН).

   № 94-07-01491 Васильев Станислав Николаевич.
Информационные системы и базы данных для многоаспектного моделирования и логико-оптимизационного поиска решений задач динамики и управления природными ресурсами и эколого-экономической обстановкой региона.

   № 93-07-26035 Сюнтюренко Олег Васильевич.
Разработка комплекса информационных услуг на основе Банка данных отечественных и зарубежных публикаций по науке и технике для обеспечения фундаментальных исследований, ведущихся в Российской академии наук.

   № 94-07-20439 Тютерев Владимир Григорьевич.
Информационная система по спектроскопии высокого разрешения высоко симметричных молекул T.D.S.

   № 94-03-10543 Лунин Валерий Васильевич.
Инфраструктура информационного обеспечения фундаментальных исследований по химии.

   № 94-07-03903 Ныммик Рихо Альфредович.
База экспериментальных данных о потоках частиц галактических космических лучей и их обобщение в виде модельного представления.

   № 93-08-26034 Емельянов Николай Евгеньевич.
Инструментальные средства построения информационных систем.

   № 94-07-16135 Овчаренко Аркадий Васильевич.
Создание и формализованный анализ компьютерной базы геополей Урала.

   № 94-02-05296 Новиков Федор Александрович.
Технология сбора, хранения и обработки астрономической информации.

   № 93-07-08530 Зверев Сергей Митрофанович.
Возрождение старых материалов глубинного сейсмического зондирования (ГСЗ) земной коры и верхней мантии на морях и океанах.

   № 94-04-13510-в Левченко Владимир Федорович.
Создание баз данных по экологическим характеристикам Финского залива с целью оценки качества среды.

   № 93-07-22696 Рожкова Наталья Георгиевна, Фокин Александр Васильевич.
Создание компьютерной базы данных "Структура - пестицидная активность" для направленного синтеза биологически активных фторсодержащих и других органических соединений.

   № 95-07-19051 Алабян Андрей Михайлович.
Информационная система "Реки России: морфология и морфометрия русла, динамика потока, наносы".

   № 94-07-10532 Барачевский Валерий Александрович.
Структура и свойства фотохромных органических соединений.

   № 95-07-19196 Фирстов Павел Павлович.
Создание системы для хранения и обработки записей волновых возмущений в атмосфере от извержений вулканов Курило-Камчатского региона.

   № 95-07-19242 Черногривов Петр Николаевич, Стегний Владимир Николаевич.
Создание интегрированной ботанической информационной системы.

   № 94-04-12402-в Швытов Игорь Алексеевич.
Создание информационной системы по интродукции растений.

   № 95-07-19223 Снакин Валерий Викторович.
Доработка базы данных "Деметра" по составу жидкой фазы различных типов почв и сопряженным характеристикам экосистем.

   № 94-07-11705 Михеев Валерий Филиппович.
Близнецовый регистр.

   № 93-07-16658 Каленов Николай Евгеньевич.
Разработка системы "Наука России".

   № 93-07-08416 Белаковский Дмитрий Ильич.
Накопленные знания людям и науке. Создание информационной системы Минералогического музея им. А.Е. Ферсмана РАН

.    № 93-07-18918 Кочанова Нинель Николаевна.
Разработка и программная реализация информационных моделей неклассических соединений с целью их ввода, обработки и регистрации при создании Общегосударственной информационно-поисковой системы по структурам химических соединений и сопроводительной информации о них.

   № 93-07-14680 Рундквист Дмитрий Васильевич.
Распределенная геоинформационная система металлогенической диагностики Мирового океана.

   № 95-07-19329 Лупян Евгений Аркадьевич.
Гипермедийная ИС общего пользования с автоматическим накоплением данных, поступающих с метеорологических спутников.

   № 93-07-22634 Бушуев Георгий Иванович.
Методика научно обоснованного выбора решений по уголовно-правовому обеспечению безопасности населения, народнохозяйственных объектов и окружающей среды (разработка экспертной системы).

   № 94-07-1740 Добрецов Николай Николаевич.
Разработка системы ввода, хранения, обработки геологической информации на базе ПЭВМ.

   № 94-07-20444 Дурманов Дмитрий Николаевич.
Информационная система для обеспечения исследования аграрного развития.

   № 93-03-18632 Арский Юрий Михайлович.
Разработка комплекса информационных услуг на основе специализированного банка данных по химии для обеспечения фундаментальных исследований.

Разработка комплекса информационных услуг на основе специализированного банка данных по химии для обеспечения фундаментальных исследований.

2. Научные телекоммуникации
2.1. Общий анализ проблематики

   В последние три года наблюдается беспрецедентное развитие компьютерной сети Internet и, в частности, компьютерных сетей для науки и образования. Это развитие происходит как количественно - за счет постепенного увеличения числа подключенных к сети компьютеров, так и качественно - за счет появления и быстрого развития новых информационных услуг, предоставляемых системами типа Gopher, Wais, Archie и особенно WWW, сопрягаемой, в частности, с более традиционными системами управления базами данных типа Oracle.
   Следует отметить также развитие новых стандартов передачи данных - Radio-Ethernet, ATM и модернизацию некоторых из общепринятых стандартов.
   Следует подчеркнуть, что начало финансирования проектов по созданию для научного сообщества инфраструктуры отечественных сетей передачи данных удивительным образом совпало с началом бурного роста научных сетей в западных странах. Это позволило, в целом, начать строительство научной компьютерной сети с использованием новых информационных технологий и должно обеспечить современный уровень создаваемой сети передачи данных.
   Проблема состояла в том, что при наличии know-how (например, по созданию оригинальных интерфейсов между информационными системами и СУБД) у отечественных научных кадров, работавших в данном научном направлении, как правило не хватало средств не только для заведения собственных информационных серверов и их включения в мировую информационную сеть Internet, но даже просто для доступа к западным серверам по каналам с пропускной способностью, позволяющей, скажем, иметь эффективный доступ к мультимедийной информации. Даже после открытия фондового финансирования, достаточно ограниченного, проблема создания информационной подсети России, равномощной западным подсетям, остается, хотя и трудно найти сейчас серьезную научно-образовательную организацию, не имеющую доступа к сети серверов Internet: дороги мощные быстродействующие серверы, хорошо оснащенные внешней памятью (более 30 Гбайт дисковой памяти, несколько терабайт архивной памяти), дорого программное обеспечение развитых СУБД, и т.д. Все еще остается финансовая и техническая проблема увеличения пропускной способности внешних каналов связи (до 2 Мбит/с и выше).
   Может быть, в основном по указанным причинам, вклад российских научных кадров в развитиеуказанного научного направления хотя и значителен, но пока не является определяющим.
   Ниже приводится анализ завершенных в 1995 году проектов, поддержанных грантами РФФИ.

2.2. Исследования и разработки, поддержанные РФФИ

    В целом завершенные проекты можно условно разбить на четыре категории:
- создание информационных систем (проекты 94-01-01423, 95-07-19082 и 95-07-19350);
- создание локальных вычислительных систем (проекты 94-07-20006, 95-07-19387, 95-07-20098 и 95-07-20463);
- обеспечение подключения к сети Internet (95-07-20032, 95-07-20054, 95-07-20203, 95-07-20066, 95-07-20067, 95-07-20048, 95-07-20012, 95-07-20007 и 95-07-20205);
- создание инфраструктуры региональных компьютерных сетей (95-07-20084, 95-07-20019 и 93-07-22858).

2.2.1. Сетевые информационные системы

   Следует отметить высокий уровень работ по проекту 95-07-19082 по созданию многопротокольной информационной системы с поддержкой четырех вариантов представления кириллических текстов. В России делаются первые шаги по предоставлению сетевого доступа к современным реляционным базам данных (95-07-19350), а успешно ведущиеся по продолжающимся грантам работы позволяют надеяться, что в ближайшее время мы будем иметь несколько баз данных с достаточно современным уровнем доступа, хотя, возможно, и не вполне отвечающим тем требованиям, которые изложены в разделе 1.
   Сделана первая попытка предоставления в диалоговом режиме библиографической и полнотекстовой информации: оглавления журналов, перечень поступления книг в БЕН РАН, электронные версии книг и газет (94-01 -01423). Масштаб задачи в этом важном направлении явно превосходит возможности финансирования за счет РФФИ, требует создания коллектива работников на постоянной основе, а также перевода основного направления работ по сбору и обработке информации (в том числе реферативной) в одну из ведущих научных библиотек (например, БЕН) с сохранением преемственности методов, разработанных коллективом, и с обеспечением постоянного бюджетного финансирования.

2.2.2. Локальные вычислительные сети

   Общий подход проводимых работ по созданию локальных вычислительных сетей учреждений соответствует общепринятому - использование стандарта Ethernet ISO 8802.3 на коаксиальных кабелях (10Base2) и витых парах (lOBaseT) - номера проектов указаны выше.
   Особо отметим очень важную работу по исследованию эффективности перевода локальных сетей с технологии lOBase на технологию 100Base, проведенную в рамках проекта 94-07-20463. Выполненные исследования показали целесообразность использования технологии 1OOBase только при объединении высокоскоростных (более 200 MIPS) серверов. При объединении стандартных на сегодня для России компьютерных систем не следует ожидать увеличения производительности.
   Следует отметить, что высокопроизводительные системы могут быть объединены с использованием более современной технологии ATM при примерно тех же затратах на оборудование, но с достижением гораздо более высокого увеличения пропускной способности.
   Достаточно важный проект 94-07-20006, предусматривавший совершенствование средств связи ВИНИТИ с Internet для обеспечения эффективного доступа к банку данных ВИНИТИ, а также развитие локальной сети этого крупного информационного центра, отнесен к данному раздел}' только потому, что из-за задержек финансирования и решения ряда вопросов (в том числе правовых) по использованию северного участка Московской опорной сети была выполнена в основном лишь вторая часть проектных работ. Здесь можно было бы отметить и желательность решения вопроса о максимально льготном доступе к содержимому баз ВИНИТИ для пользователей, выполняющих исследования по грантам РФФИ.

2.2.3. Обеспечение подключения к сети Internet

   Большинство анализируемых проектов имеют своей задачей подключение уже созданных (или находящихся в стадии создания) локальных сетей научных учреждений к одному из научных сервис-провайдеров. Номера проектов перечислены выше. Для институтов, расположенных на юге Москвы на небольшом (2-3 км) расстоянии от Южной Московской оптоволоконной сети (ЮМОС) выбранный способ подсоединения является стандартным и современным - это передача информации на скорости 10 Мбит/сек по оптоволоконному носителю. Для удаленных на большее расстояние институтов (как московских, так и иногородних) использованы два варианта: промежуточный, с использованием высокоскоростных модемов ZyXEL или Motorola/Codex на коммутируемых линиях, и, окончательный, с использованием модемов такого же типа на выделенных 4-проводных линиях.
   Приходится заметить, что в ряде случаев (например, это относится к проектам 95-07-20203 и 95-07-20205) реализован первый этап (предпосылки) необходимых работ по эффективному подключению к Internet.
   Следует отметить определяющий вклад РФФИ в развитие инфраструктуры научной сети России - подавляющее большинство проводимых на настоящее время работ в этом направлении имеет поддержку через гранты РФФИ.

2.2.4. Создание региональных вычислительных сетей

   Анализируемые здесь проекты положили начало Программе РФФИ по созданию региональных компьютерных сетей для науки и образования.
   Лидирующий университет России - МГУ начал в 1995 году большую работу по созданию сети, объединяющей создаваемые локальные вычислительные сети всех факультетов (95-07-20084). Сеть позволит объединить информационные и вычислительные ресурсы МГУ и предоставит возможность эффективного выполнения научных работ и введения новых форм преподавания с использованием удаленных методов обучения. Важность проводимой работы и большой объем финансирования обусловили включение проекта создания сети МГУ в межведомственную программу.
   Такое же решение РФФИ принял в отношении пилотного проекта по созданию региональной сети в Научном центре РАН в Черноголовке (93-07-22858).
   Сеть, построенная на оптоволоконном кабеле и технологии Ethernet объединяет более десяти Локальных сетей институтов РАН. По этому комплексному проекту обеспечено подсоединение к сети Internet по выделенной 4-проводной линии и созданы информационные ресурсы по ряду направлений науки.

2.2.5. Методические рекомендации по организации структуры регионального информационного сетевого центра

   Структура регионального информационного сетевого центра должна включать в себя:
- административный центр;
- центр управления информационными ресурсами (WWW, FTP, Archie, Gopher...);
- центр управления вычислительными ресурсами;
- учебный центр;
- Web-лаборатория;
- группа по работе с пользователями.
   Связывающим звеном, а также основным средством доступа к ресурсам сетей в пределах региона и во внешних сетях должна стать WWW технология. Следует предусматривать включение региональных фрагментов в общую схему разделения ин-формационных и вычислительных ресурсов международных и российских сетей на основе технологий "клиент-сервер" с использованием современных сетевых средств Internet Gopher, WWW, LISTSERV, RELAY, WALS, WHOIS, Archie, Hytelnet, BITFTP, TRICKLE, СУБД Sybase (Solaris, SparcServer lOOOE).

2.3. Выводы

   Проблематика завершенных в 1995 году проектов в значительной степени отвечает тем практическим требованиям, которые возникают при постановке проблем обеспечения доступа к информационным системам и базам данных.
   Следует отметить, что продолжающиеся проекты, в которых принимают участие практически все известные российские научные школы; работающие по данному научному направлению, могут при достаточно регулярном и гарантированном финансировании успешно продолжить решение указанных проблем.

Приложение 2
Список выполненных проектов РФФИ по тематике научных телекоммуникаций

   № 94-07-20006 Сюнтюренко Олег Васильевич
Материально-техническое обеспечение комплекса работ по подключению банка данных ВИНИТИ РАН к опорной оптоволоконной IP-сети и развитию внутренней телекоммуникационной инфраструктуры.

   № 95-07-20032 Лаппо Сергей Сергеевич
Создание локальной сети Института и подключение к узлу Южной Московской Опорной Сети для организации работы на базе сети Internet (РКНСИ).

   № 95-07-20054 Забродин Алексей Валериевич
Оптоволоконное подключение ИПМ к Московской сети. Создание в сети EmNET регионального компьютерного узла на базе многопроцессорной супер-ЭВМ МВС-100.

   № 95-07-20203 Гапеев Анатолий Кононович
Создание телекоммуникационной системы в Геофизической обсерватории Борок, филиале Объединенного института физики Земли.

   № 95-07-20066 Берлин Александр Александрович
Проект создания телекоммуникационных серверов в ИХФ РАН и подключения их к Московской Опорной Сети.

   № 95-07-20084 Садовничий Виктор Антонович
Построение высокоскоростной оптоволоконной сети (backbone) Московского государственного университета.

   № 95-07-20067 Обливин Александр Николаевич
Создание базового сетевого информационно-вычислительного комплекса Московского государственного университета леса.

   № 95-07-20048 Михайлов Гурий Михайлович
Подключение локальной сети ВЦ РАН к Московской оптоволоконной опорной сети.

   № 95-07-20018 Голицын Георгий Сергеевич
Центр информационного обеспечения фундаментальных исследований "АТМОСФЕРА".

   № 95-07-20007 Сон Эдуард Евгеньевич
Развитие научно-образовательной сети МФТИ с выходом в международную компьютерную сеть Internet.

   № 95-07-20000 Марчук Александр Гурьевич
Развитие материально-технической базы локальной сети ИСИ СО РАН.

   № 95-07-19387 Коростелев Александр Дмитриевич
Создание локальной сети Института этнологии и антропологии РАН и ее интеграция в международную сеть Internet.

   № 95-07-20205 Хисамутдинов Вильям Ризатдинович
Подключение баз данных ИНИОН РАН к Южной Московской опорной сети.

   № 95-07-20019 Алдошин Сергей Михайлович
Создание территориально распределенной научной компьютерной сети Института химической физики в Черноголовке.

   № 95-07-20098 Осипьян Юрий Андреевич
Развитие локальной компьютерной сети в Институте физики твердого тела РАН и ее интеграция с региональной сетью НЦЧ и Московской опорной сетью.

   № 95-07-19350 Соддатов Алексей Анатольевич
Информационная система для работы с базой данных ядерно-физических констант в Российской научной академической сети RELARN.

   № 95-07-19082 Кузьминский Михаил Борисович
Создание сетевой многопротокольной информационной системы и интеграция в нее базы данных ИВТАНТЕРМО.

   № 93-07-22858 Щур Лев Николаевич
Создание компьютерной сети Ногинского научного центра РАН.

   № 94-07-20463 Смелянский Руслан Леонидович
Создание высокоскоростной магистральной сети факультета ВМиК МГУ для исследования проблем доступа к мультимедиа-информации и дистанционного обучения.

   № 94-01-01423 Веселаго Виктор Георгиевич
Создание системы рассылки оглавлений научных журналов по электронным сетям (служба ИНФОМАГ).

Заключение

    Будущее столетие многие специалисты определяют как "век связи и информации", но уже сегодня мы являемся очевидцами информационного взрыва, яркое тому подтверждение - мировые тенденции развития информационных технологий и проблематика проектов РФФИ по информационным системам, базам данных и научным телекоммуникациям.
   Два основных направления- "Информационные системы и базы данных" и "Научные телекоммуникации" - развивались практически независимо друг от друга. Это было вполне естественно на первом этапе, когда телекоммуникационная среда для фундаментальной науки только создавалась. Сейчас, когда основной "скелет" этой среды существует, необходимо обратить особое внимание на то, чтобы создаваемые в рамках проектов РФФИ информационные и вычислительные ресурсы были доступны через сеть. Представляется целесообразным наряду с развитием телекоммуникационных средств максимально поддерживать те проекты по информационным системам и базам данных, которые предусматривают удаленный доступ к создаваемому ресурсу. При этом должна быть разработана четкая система (в организационном и правовом аспектах) по информационному наполнению "российского" Internet.
   Проекты в области ИС и БД характеризуются тематической направленностью и, в основном, используют готовые технологические решения. Основное внимание специалистов сосредоточено на освоении зарубежных систем путем создания ИС и БД в предметной области. Совсем нет проектов по защите информации как у локальных пользователей, так и на сетевом уровне.
   Анализ проектов РФФИ по созданию предметно-ориентированных ИС и БД показывает, что в подавляющем большинстве случаев эти проекты не следуют основным стандартам, упомянутым в разделе 1.3 настоящего обзора. Во многом это определяется тем, что специалисты-предметники, а именно они в основном занимаются разработкой предметно ориентированных ИС и БД, пока еще не чувствуют в этом острой необходимости. Однако, как только исполнители проектов будут поставлены перед необходимостью предоставлять создаваемые информационные ресурсы в удаленный доступ через российский Internet, ситуация резко изменится. Понимая это и предвидя возможные методические трудности, которые возникнут перед разработчиками предметно-ориентированных ИС и БД, по инициативе Экспертного совета РФФИ был организован консультативный центр по интероперабельным информационным системам.
   Полное использование подходов и реализация требований к созданию интероперабельных объектно-ориентированных систем сдерживается целым рядом факторов, таких как:
   1) новизна проблематики (не только в России) и соответствующих стандартов для создания интероперабелъных систем, не вполне решенные вопросы миграции данных из систем "классического " типа и преемственности двух подходов (есть лишь частные решения, предусмотренные, например, в версии Oracle8.0 и Odapter фирмы HP). Доля потребления средств типа ООБД на рынке СУБД пока не превышает нескольких процентов;
   2) финансовые проблемы приобретения и освоения готовых промышленных продуктов. Эти проблемы достаточно хорошо известны авторам работ, начавших применять реляционные СУБД типа Oracle и их полное фирменное программное окружение для серверных установок: даже поддержка РФФИ при ограниченности средств не может полностью решить данной частной задачи;
   3) технические и финансовые затруднения в реализации сетевой среды передачи, в достаточной степени отвечающей требованиям практического внедрения распределенных интероперабельных объектнориентированных систем в рамках локальных сетей Internet (особенно в Intranet России).
   Следует отметить значительные успехи по созданию телекоммуникационной среды для российских научных исследований. Эти успехи во многом определялись выбранной РФФИ стратегией развития сетевой инфраструктуры. Эта стратегия основывается на понимании того, что при имеющихся финансовых возможностях следует поэтапно:

  • развивать локальные сети, объединяющие информационные и вычислительные ресурсы конкретной научной организации;
  • объединять локальные сети в глобальные (по географическому и/или предметному признаку);
  • интегрировать региональные и предметно-ориентированные сети в единую национальную инфраструктуру (российский Internet);
  • обеспечить интеграцию российского Internet в мировое информационное пространство - глобальный Internet;
  • обеспечивать наполнение российского Internet информационными и вычислительными ресурсами.

   В настоящее время существуют стандартные технические решения по созданию локальных сетей и значительное число отечественных НИИ имеют более или менее развитые локальные сети. Таким образом, в целом, первый этап можно считать завершенным. Сегодня основная проблема, связанная с локальными вычислительными сетями, состоит в том, что во многих НИИ они развивались стихийно и требуют определенной "архитектурной" перестройки для того, чтобы отвечать современным стандартам.
   За последние годы сделан существенный рывок в решении проблемы подключения российских ученых к международной сети Internet (в частности, путем создания региональных опорных сетей, в том числе Московской опорной оптоволоконной сети).
   Проекты РФФИ стимулировали развитие систем обработки и использования научных знаний и фактических данных. Экспертный совет РФФИ по телекоммуникациям и информационным системам поддерживает работы, в которых используются и развиваются современные информационные технологии, что помогает укреплению междисциплинарных связей и дальнейшей интеграции исследований.

"Вестник РФФИ", N3 (9), сентябрь 1997, стр. 6-27.