Обычно, распределенной считают такую систему, в которой функционирует более одного сервера БД. Это применяется для уменьшения нагрузки на сервер и обеспечения работы территориально удаленных подразделений. Различная сложность создания, модификации, сопровождения, интеграции с другими системами позволяют разделить ИС на классы малых, средних и крупных распределенных систем. Малые ИС имеют небольшой жизненный цикл (ЖЦ), ориентацию на массовое использование, невысокую цену, невозможность модификации без участия разработчиков, использующие в основном настольные системы управления базами данных (СУБД) , однородное аппаратно-программное обеспечение, не имеющие средств обеспечения безопасности. Крупные корпоративные ИС, системы федерального уровня и другие имеют длительный жизненный цикл, миграцию унаследованных систем, разнообразие аппаратно-программного обеспечения, масштабность и сложность решаемых задач, пересечение множества предметных областей, аналитическую обработку данных, территориальную распределенность компонент.

Распределённые базы данных (РБД) - совокупность логически взаимосвязанных баз данных, распределённых в компьютерной сети.

РБД состоит из набора узлов, связанных коммуникационной сетью, в которой:

каждый узел - это полноценная СУБД сама по себе;

узлы взаимодействуют между собой таким образом, что пользователь любого из них может получить доступ к любым данным в сети так, как будто они находятся на его собственном узле.

Каждый узел сам по себе является системой базы данных. Любой пользователь может выполнить операции над данными на своём локальном узле точно так же, как если бы этот узел вовсе не входил в распределённую систему. Распределённую систему баз данных можно рассматривать как партнёрство между отдельными локальными СУБД на отдельных локальных узлах.

Фундаментальный принцип создания распределённых баз данных («правило 0»): Для пользователя распределённая система должна выглядеть так же, как нераспределённая система.

Фундаментальный принцип имеет следствием определённые дополнительные правила или цели. Таких целей всего двенадцать:

Локальная независимость. Узлы в распределённой системе должны быть независимы, или автономны. Локальная независимость означает, что все операции на узле контролируются этим узлом.

Отсутствие опоры на центральный узел. Локальная независимость предполагает, что все узлы в распределённой системе должны рассматриваться как равные. Поэтому не должно быть никаких обращений к «центральному» или «главному» узлу с целью получения некоторого централизованного сервиса.

Непрерывное функционирование. Распределённые системы должны предоставлять более высокую степень надёжности и доступности.

Независимость от расположения. Пользователи не должны знать, где именно данные хранятся физически и должны поступать так, как если бы все данные хранились на их собственном локальном узле.

Независимость от фрагментации. Система поддерживает независимость от фрагментации, если данная переменная-отношение может быть разделена на части или фрагменты при организации её физического хранения. В этом случае данные могут храниться в том месте, где они чаще всего используются, что позволяет достичь локализации большинства операций и уменьшения сетевого трафика.

Независимость от репликации. Система поддерживает репликацию данных, если данная хранимая переменная-отношение - или в общем случае данный фрагмент данной хранимой переменной-отношения - может быть представлена несколькими отдельными копиями или репликами, которые хранятся на нескольких отдельных узлах.

Обработка распределённых запросов. Суть в том, что для запроса может потребоваться обращение к нескольким узлам. В такой системе может быть много возможных способов пересылки данных, позволяющих выполнить рассматриваемый запрос.

Управление распределёнными транзакциями. Существует 2 главных аспекта управления транзакциями: управление восстановлением и управление параллельностью обработки. Что касается управления восстановлением, то чтобы обеспечить атомарность транзакции в распределённой среде, система должна гарантировать, что все множество относящихся к данной транзакции агентов (агент - процесс, который выполняется для данной транзакции на отдельном узле) или зафиксировало свои результаты, или выполнило откат. Что касается управления параллельностью, то оно в большинстве распределённых систем базируется на механизме блокирования, точно так, как и в нераспределённых системах.

Аппаратная независимость. Желательно иметь возможность запускать одну и ту же СУБД на различных аппаратных платформах и, более того, добиться, чтобы различные машины участвовали в работе распределённой системы как равноправные партнёры.

Независимость от операционной системы. Возможность функционирования СУБД под различными операционными системами.

Независимость от сети. Возможность поддерживать много принципиально различных узлов, отличающихся оборудованием и операционными системами, а также ряд типов различных коммуникационных сетей.

Независимость от типа СУБД. Необходимо, чтобы экземпляры СУБД на различных узлах все вместе поддерживали один и тот же интерфейс, и совсем необязательно, чтобы это были копии одной и той же версии СУБД.

Типы распределённых баз данных

Распределённые базы данных

Мультибазы данных с глобальной схемой. Система мультибаз данных - это распределённая система, которая служит внешним интерфейсом для доступа ко множеству локальных СУБД или структурируется, как глобальный уровень над локальными СУБД.

Федеративные базы данных. В отличие от мультибаз не располагают глобальной схемой, к которой обращаются все приложения. Вместо этого поддерживается локальная схема импорта-экспорта данных. На каждом узле поддерживается частичная глобальная схема, описывающая информацию тех удалённых источников, данные с которых необходимы для функционирования.

Мультибазы с общим языком доступа - распределённые среды управления с технологией «клиент-сервер»

Каждая организация разрабатывает более или менее весомую часть а не все информационное наполнения своей ГИС. Потребность в данных является стимулом для пользователей получать новые данные наиболее эффективными и быстрыми способами в том числе приобретая части баз данных для своих ГИС у других ГИС пользователей. Таким образом управление данными ГИС осуществляется несколькими пользователями.

Поделитесь работой в социальных сетях

Если эта работа Вам не подошла внизу страницы есть список похожих работ. Так же Вы можете воспользоваться кнопкой поиск

12. ГИС РАСПРЕДЕЛЕННАЯ ИНФОРМАЦИОННАЯ СИСТЕМА

12.1. Общие сведения

Сейчас в большинстве географических информационных систем данные слоев и таблиц поступают из разных организаций. Каждая организация разрабатывает более или менее весомую часть, а не все информационное наполнения своей ГИС. Обычно хотя бы некоторые слои данных поступают из внешних источников. Потребность в данных является стимулом для пользователей получать новые данные наиболее эффективными и быстрыми способами, в том числе приобретая части баз данных для своих ГИС у других ГИС-пользователей. Таким образом, управление данными ГИС осуществляется несколькими пользователями.

12.2. Возможности взаимодействия

Распределенная сущность ГИС подразумевает широкие возможности для взаимодействия между многими ГИС-организациями и системами. Сотрудничество и совместная работа пользователей очень важны для ГИС.

ГИС-пользователи в своей работе давно опираются на взаимовыгодную деятельность по обмену данными и их совместному использованию. Реальным отражением этой фундаментальной потребности являются непрекращающиеся усилия в области создания ГИС стандартов. Приверженность отраслевым стандартам и общим принципам построения ГИС критически важна для успешного развития и широкого внедрения этой технологии. ГИС должна поддерживать наиболее важные стандарты и иметь возможность адаптации при появлении новых стандартов.

12.3. ГИС-сети

Многие географические наборы данных могут компилироваться и управляться как общий информационный ресурс и совместно использоваться сообществом пользователей. К тому же пользователи ГИС имеют собственное видение того, каким образом можно обеспечить обмен популярными наборами данных через Web.

Ключевые web-узлы, называемые порталами каталогов ГИС, предоставляют возможность пользователям как выкладывать собственную информацию, так и искать доступную для использования географическую информацию. В результате ГИС-системы все в большей степени подключаются к Всемирной паутине и получают новые возможности обмена и использования информации.

Это видение внедрилось в сознание людей за последнее десятилетие и нашло отражение в таких понятиях, как Национальная инфраструктура пространственных данных (NSDI) и Глобальная инфраструктура пространственных данных (GSDI). Эти концепции постоянно развиваются и постепенно внедряются, причем не только на национальном и глобальном уровнях, но также на уровне округов и муниципальных образований. В обобщенном виде эти концепции включены в понятие Инфраструктуры пространственных данных (SDI, Spatial Data Infrastructure).

ГИС-сеть по сути является одним из методов внедрения и продвижения принципов SDI. Она объединяет множество пользовательских сайтов, способствует публикации, поиску и совместному использованию географической информации посредством World Wide Web.

Географическое знание изначально является распределенным и слабо интегрированным. Вся необходимая информация редко содержится в отдельном экземпляре базы данных с собственной схемой данных. Пользователи ГИС взаимодействуют друг с другом с целью получить недостающие части имеющихся у них ГИС- данных. Посредством ГИС- сетей пользователям проще наладить контакты и обмен накопленными географическими знаниями.

В состав ГИС-сети входят три основных строительных блока:

Порталы каталогов метаданных, где пользователи могут провести поиск и найти ГИС-информацию в соответствии с их потребностями
ГИС-узлы, где пользователи компилируют и публи куют наборы ГИС-информации
Пользователи ГИС, которые ведут поиск, выявляют, обращаются и используют опубликованные данные и сервисы

12.4. Каталоги ГИС-порталов

Важным компонентом ГИС-сети является каталог ГИС-портала с систематизированным реестром разнообразных мест хранения данных и информационных наборов. Часть ГИС-пользователей действует в качестве распорядителей данных, они компилируют и публикуют свои наборы данных для совместного использования в разных организациях. Они регистрируют свои информационные наборы в каталоге портала. Проводя поиск по этому каталогу, другие пользователи могут найти нужные им информационные наборы и обратиться к ним.

Портал ГИС-каталога - это Web-сайт, где ГИС пользователи могут искать и находить нужную им ГИС-информацию. Предоставляемые возможности зависят от комплекса предлагаемых сетевых сервисов ГИС-данных, картографических сервисов и сервисов метаданных. Периодически сайт портала ГИС-каталога может проводить обследование каталогов связанных с ним сайтов-участников с целью опубликования и обновления одного центрального ГИС-каталога. Таким образом, ГИС-каталог может содержать ссылки на источники данных, имеющиеся как на этом, так и на других сайтах. Предполагается, что будут созданы серии таких каталожных узлов, и на их основе сформируется общая сеть - Инфраструктура пространственных данных.

ГИС-данные и сервисы документируются в виде каталожных записей в каталоге ГИС-портала, по которому можно проводить поиск кандидатов для использования в разных ГИС-приложениях.

Одним из примеров портала ГИС-каталога является портал правительства США (Geospatial One-Stop, см. www.geodata.gov). Этот портал позволит правительственным органам всех уровней и широкой общественности проще, быстрее и с меньшими затратами обращаться к географической информации.

Другие похожие работы, которые могут вас заинтересовать.вшм>
4627.		Информационная система Клиника	436.13 KB
	Главная цель создания баз данных состоит в объединении функций обновления, ведения и пополнения хранимой информации, а также справочной функции. Основное характерное свойство базы данных - ее независимость от рабочих программ, с которыми она взаимодействует.
6245.		Корпоративная информационная система (КИС)	39.86 KB
	Корпоративная информационная система КИС это совокупность информационных систем отдельных подразделений предприятия объединенных общим документооборотом таких что каждая из систем выполняет часть задач по управлению принятием решений а все системы вместе обеспечивают функционирование предприятия в соответствии со стандартами качества ИСО 9000. Модульность Позволяет распараллелить облегчить и соответственно ускорить процесс инсталляции подготовки персонала и запуска системы в промышленную эксплуатацию. Это требование приобретает...
1001.		Информационная система в ОАО Газпромнефть	44.35 KB
	Цели и задачи информационного обеспечения управления. Стратегия развития информационных систем управления. Информационное обеспечение управления деятельности руководителя организации Введение Об информации очень много говорят и лишь немногие организации четко и внятно формулируют требования к этому ресурсу необходимому для принятия эффективных управленческих решений.
7405.		Маркетинговая информационная система ООО «Ривьера-Сочи»	1.96 MB
	Объектом исследования является маркетинговая информационная система ООО Ривьера-Сочи. Цель исследования разработка и внедрение маркетинговой системы сбора обработки и анализа информации с целью эффективного и рационального использования ресурсов предприятия. В процессе работы проводились исследования структуры организации анализ ее экономических показателей. В результате исследования был разработан модуль Опрос который функционирует на сайте компании ООО Ривьера-Сочи с целью получения необходимой информации от потребителей...
11460.		Управленческий учет как информационная система предприятия	64.49 KB
	Переход на МСФО это новый взгляд на бухгалтерский учет. Теперь действия бухгалтера уже не выполнение указаний а собственное профессиональное суждение по всем вопросам связанным с учетом ограниченное определенными принципами предлагаемыми МСФО.
17542.		Информационная управляющая система товарного снабжения для супермаркета	79.67 KB
	В программах сохраняются электронные данные о запасах которые постоянно используются для быстрого решения стандартных вопросов для чего в противном случае пришлось бы работать непосредственно с запасами. Для современных супермаркетов характерным является наличие следующих признаков: - значительный объем торговой площади от 200 м2 и более; - значительное количество отделов в которых представлена разнообразная продукция мясные фруктово-овощные молочные продукты хлеб хлебобулочные изделия и выпечка кондитерские табачные парфюмерные...
19833.		Информационная система. Классификация ИС. Структурные составляющие корпоративных ИС	33.24 KB
	Для бизнеса такими задачами являются повышение рентабельности рост продаж снижение издержек снижение рисков и общая стабилизация положения на рынке. Для государства важно с наименьшими затратами решить спектр социальных экономических оборонных и других задач. Определенный прорыв произошел в 2005 году когда впервые для автоматизации бизнес-процессов было внедренное полномасштабное компьютерное управление. Для примера можно упомянуть новейшие информационные технологии которые характеризуются относительно небольшими объемами требуемых...
12160.		Информационная система «Архивы Российской академии наук» (ИСАРАН)	17.86 KB
	Краткое описание разработки. Программное обеспечение ИСАРАН создано в популярной среде визуальной разработки Delphi Дельфи клиентсерверная версия и адаптировано к специфике ведомственного Архивного фонда РАН. Преимущества разработки и сравнение с аналогами. Области коммерческого использования разработки.
12142.		Информационная система мониторинга научно-технического потенциала региона	17.24 KB
	Информационная система представляет собой программноинформационный комплекс предназначенный для оперативного аналитического учета и контроля показателей научнотехнического потенциала на основе данных различных статистических показателей анализируемых по авторской методике. Разработанная прикладная ИС обладает следующими преимуществами: адаптируемость для широкого класса показателей преемственность новых информационных технологий автоматизация значительного числа функций осуществляемых при оценке научнотехнического потенциала. Продукт...
12060.		Многофункциональная интегрирующая информационная система мониторинга водных объектов (МИСМ ВО)	17.91 KB
	Многофункциональная интегрирующая информационная система мониторинга водных объектов МИСМ ВО разработана на базе портальной webтехнологии и позволяет интегрировать и обрабатывать данные о состоянии водных объектов ВО получаемые от всех возможных источников контроля состояния ВО включая автоматические посты мониторинга АПМ на различных уровнях отдельные ВО их гидрографическая сеть в пределах административного региона и страны в целом комплекс ВО например каскад водохранилищ водный бассейн для обеспечения оптимального управления...

Источник: Журнал «Перспективы науки и образования» Выпуск №6(12)/2014 http://cyberleninka.ru/article/n/problemy-raspredelennyh-sistem

Аннотация

Статья описывает особенности распределенных систем. Раскрывается понятие распределенной системы и распределенной информационной системы.

Дается классификация распределенных систем. В частности, по типу предоставляемых ресурсов: распределенные вычислительные системы, распределенные информационные системы, семантический Трид. По количеству элементов в системе: кластер, распределенная система корпоративного уровня, глобальная система.

Описаны требования, предъявляемые к распределенным системам: прозрачность распределенной системы, прозрачность местоположения, прозрачность доступа, прозрачность параллелизма доступа, прозрачность масштабируемости распределенной системы, прозрачность репликации, открытость системы, безопасность, надежность РС.

Статья описывает проблемы при создании и эксплуатации распределенных систем, такие как: проблемы администрирования системы, проблемы балансирования нагрузки, проблемы восстановления данных в случае возникновения ошибок, проблемы ограниченности масштабируемости (проблема увеличения количество узлов системы, проблема ограниченности возможностей сервера, проблема ограниченности сетей передачи данных, проблема ограниченности алгоритмов обработки данных), проблема переносимости ПО.

Ключевые слова: вычисления,распределенные системы,распределенные вычислительные системы,распределенные информационные системы

Введение

В современном обществе существует необходимость в повышении качества и скорости обработки в первую очередь «больших данных» и во вторую очередь данных в распределенных системах . В связи с этим возрастает значение распределенных систем хранения и обработки данных , как средства решения этой проблемы. Одной из основных задач любой распределенной системы является анализ свойств полученных данных, которые, в силу ряда причин, не могут быть оценены на одном узле. Для достижения поставленной цели и ускорения времени обработки необходимо на первом этапе разослать данные на распределенные узлы системы, а на втором собрать данные из распределенных узлов и агрегировать эти данные в общее глобальное представление. Это является сложной задачей из-за часто встречающего в таких типах задач динамики, что накладывает очень частые изменения в локальные значения, которые влияют на общие глобальные свойства всей задачи. Создание эффективных и адаптивных распределенных систем позволяет значительно ускорить скорость обработки данных. С целью рассмотрения данного вопроса проведем анализ проблем возникающих в ходе проектирования и эксплуатации распределенных систем.

Понятие распределенной системы

На сегодняшний момент в литературе существует большое количество определений понятия «распределенная система». Наиболее полное определение предложил AS Tanenbaum : «Распределенная система (РС) – это набор независимых компьютеров, который воспринимается его пользователям как единственная последовательная система.» Другое определение предложено в работе : Распределенными системами называются программно-аппаратные системы, в которых исполнение операций (действий, вычислений), необходимых для обеспечения целевой функциональности системы, распределено(физически или логически) между разными исполнителями. В вычислительной сфере под РС в нашем исследовании будем понимать программно–аппаратную систему, созданную для конкретного практического применения, функционал которой распределен на различных узлах.

Классифицировать распределенные системы можно по различным признакам: по количеству элементов в системе, по уровню организации распределенных систем, по типу предоставляемых ресурсов, а также ряду других признаков. По типу предоставляемых ресурсов различают:

распределенные вычислительные системы (Computational Grid)
распределенные информационные системы (Data Grid)
семантический Грид (Semantic Grid)

Основная характеристика вычислительных систем (Computational Grid) заключается в том, что в качестве основного ресурса предоставляется вычислительная мощность всей системы. Основное направление развития систем подобного типа заключается в наращивании вычислительных мощностей системы, посредством увеличения числа вычислительных узлов. Примером распределенных вычислительных систем являются кластеры.

Распределенные информационные системы (Data Grid) предоставляют вычислительные ресурсы для обработки больших объемов данных, для задач не требующих больших вычислительных ресурсов. Семантический Грид предоставляет не только отдельные вычислительные мощности (базы данных, сервисы), но и совокупность вычислительных систем и информационных систем, для каждой конкретной предметной области .

По количеству элементов в системе различают распределенные системы: кластер, распределенная система корпоративного уровня, глобальная система. Распределенная система является кластером, если общее количество элементов не превышает несколько десятков. Распределенная система корпоративного уровня содержит в своем составе уже сотни, а в некоторых случаях, и тысячи элементов. Глобальной системой называется распределенная система с количеством элементов, входящим в ее состав, более 1000. При этом, зачастую, элементы таких систем глобально распределены. Примером глобальной распределенной сети является Интернет, где в качестве предоставляемого ресурса является информационное поле.

Основные требования, предъявляемые к распределенным системам

Основными требованиями, предъявляемыми к распределенным системам, являются: прозрачность, открытость системы, безопасность, масштабируемость РС, надежность. Рассмотрим каждую характеристику подробнее.

Прозрачность распределенной системы. Прозрачность, в общем случае, заключается в том, что распределенные системы должны быть восприняты пользователями системы как однородный объект, а не как набор автономных объектов, которые взаимодействуют между собой между собой. Проектирование распределенной системы является сложной задачей, и соблюдение необходимой прозрачности, является необходимым условием функционирования системы. Существуют различные виды прозрачности .

Прозрачность местоположения. В распределенных системах прозрачность местоположения заключается в том, что пользователь не должен знать, где расположены необходимые ему ресурсы. Файлы могут перемещаться на различные узлы распределенной системы, например, если на узле РС произошел сбой, и данные были восстановлены на другом узле РС, но при этом, пользователь не должен замечать эти перемещения. Например, в распределенных информационных файловых системах, пользователь должен видеть лишь единое файловое пространство, притом, что данные могут располагаться физически на разных серверах.

Прозрачность доступа. В распределенных системах наиболее важную роль играет принцип прозрачности доступа. Прозрачность в данном случае заключается в обеспечении сокрытия различий доступа и предоставлении данных.

Прозрачность параллелизма доступа. Различные пользователи распределенных систем должны иметь возможность параллельного доступа к общим данным. При этом необходимо обеспечить параллельное совместное использование ресурсами системы, а соответственно, обеспечить сокрытие факта совместного использования ресурсов.

Прозрачность репликации. В целях обеспечения сохранности данных, особенно на распределенных файловых системах, необходимо обеспечить репликацию данных. Пользователю не должно быть известно, что репликация данных существует. Для сокрытия данного фактора, необходимо, чтобы у предоставляемых данных или ресурсов, были одинаковые имена.

Открытость системы. В отличие от ранних распределенных систем, которые по своей сути были ограниченными и закрытыми, так как они создавались в основном в пределах отдельных организаций и для решения конкретных задач, современные распределенные системы создаются все более открытыми. Применение принципа открытости к распределенным системам стало возможным благодаря развитию линий передачи данных, увеличение производительности процессоров, а также общего развития информационных технологий. Под открытостью распределенных систем понимается возможность взаимодействия с другими открытыми системами. Открытые системы должны иметь следующие характеристики:

РС должны соответствовать четко определенными интерфейсами
Системы, входящие в состав РС должны легко взаимодействовать между собой
Системы должны обеспечивать переносимость приложений.

Открытость системы может быть достигнута с помощью: языков программирования, аппаратных платформ, программного обеспечения.

Безопасность. Особое место в современных распределенных системах занимает их безопасность. Безопасность РС является, в общем случае, совокупностью 3 факторов :

Обеспечение конфиденциальности данных и ресурсов;
Обеспечение конфиденциальности доступа к ресурсам для множества пользователей;
Обеспечение целостности ресурсов и данных.

Необходимость создания распределенных систем, которые обеспечивают необходимую безопасность данных и всей структуры РС, возникает повсеместно. Многие вопросы безопасности могут быть решены на уровне отдельных узлов РС, например, путем установки фаерволов и антивирусного ПО на отдельные узлы системы, введением политики аутентификации пользователей и другими методами. Но в силу особенности архитектуры большинства РС, данный подход не всегда является эффективным. Программное обеспечение не всегда может обеспечить необходимую конфиденциальность данных в распределенной системе. Например, программное обеспечение не всегда может полноценную защиту от MIMT и DDOS атак на распределенную сеть. Зачастую методы защиты от подобных атак не всегда являются приемлемыми для узлов вычислительной сети. Важным показателем, при организации защиты РС, является уровень доступности системы. Уровень доступности распределенной системы определяется не только доступностью ресурса в момент времени t, но и принципами организации защиты РС, так как большинство программных средств, обеспечивающие защиту от атак, направлены на отказ в обслуживании. Большое внимание данному вопросу уделяется многими производителями антивирусного ПО.

Надежность РС. В связи с появлением новых методов и алгоритмов, требовательных к вычислительным ресурсам и, самое главное, к ресурсам времени, необходимость в доступности распределенных систем в момент времени t становится крайне актуальным. Основным показателем, определяющим надежность всей РС, является отказоустойчивость. Отказоустойчивость это важнейшее свойство вычислительной системы, которое заключается в возможности продолжения действий, заданных программой, после возникновения неисправностей.

Проблемы эксплуатации распределенных систем

Несмотря на все достоинства распределенных систем по сравнению с традиционными централизованными системами (РС обеспечивают значительно меньшую стоимость развертывания и простоту реализации), РС имеют и ряд существенных недостатков. Основными проблемами распределенных систем по сравнению с традиционными системами являются:

проблемы администрирования системы;
проблемы ограниченности масштабируемости РС;
проблемы переносимости программного обеспечения.

Проблемы администрирования системы включают проблемы: проблемы балансирования нагрузки на узлы системы; проблемы восстановления данных в случае возникновения ошибок. Фрагментация ресурсов в распределенных системах предписывает необходимость создания гибких настраиваемых средств администрирования. Так как в глобально распределенных системах администрирование должно происходить в автоматическом режиме, то в связи с этим возникают следующие основные проблемы администрирования распределенных систем:

балансировка нагрузки на узлы системы;
восстановление данных в случае возникновения ошибки;
сбор статистики с узлов системы;
обновление программного обеспечения на узлах системы в автоматическом режиме.

Стоит понимать, что данный список является обобщенным, т.е. для каждой конкретной РС возможно возникновение проблем, которые не описаны в данной работе. Но данные проблемы являются наиболее часто встречающимися на практике и заслуживают особого внимания при проектировании РС. Последние две проблемы хорошо изучены, и на рынке программного обеспечения распределенных систем существует множество разработанных программных средств, которые обеспечивают как сбор статистики, так и обновление программного обеспечения. Научный же интерес представляют методы балансирования нагрузки на узлы системы и методы восстановления данных в случае возникновения ошибок. В силу специфики РС, а также гетерогенности оборудования и архитектуры РС, не существует единого метода проектирования, который обеспечивал бы решение этих проблем.

Проблемы балансирования нагрузки. Важной проблемой при проектировании РС является обеспечение эффективной балансировки нагрузки на узлы системы. Правильно выбранная стратегия балансировки нагрузки оказывает решающее влияние на общую эффективность и скорость работы распределенной системы. На сегодняшний момент существует множество подходов к решению данной проблемы.

В общем случае можно выделить обобщенную классификацию методов балансировки загрузки вычислительных узлов. По характеру распределения нагрузки на вычислительные узлы различают: динамическую балансировку (перераспределение); статическую балансировку.

Статическая балансировка, зачастую, выполняется в результате априорного анализа. При распределении ресурсов по вычислительным узлам анализируется модель распределенной системы, с целью выявления наилучшей стратегии балансировки. При этом необходимо учитывать структуру РС, а также конфигурацию вычислительных узлов. Основной недостаток данного метода балансирования нагрузки заключается в необходимости ассоциации узлов с различной конфигурацией оборудования с вычислительной сложностью задачи, что не всегда представляется возможным.

Динамическая балансировка распределенной системы заключается в адаптации нагрузки на узлы распределенной системы в ходе работы, что в свою очередь позволяет эффективнее использовать ресурсы сети. Необходимость динамической балансировки возникает в том случае, когда не возможно изначально априорно предположить общую загрузку сети. Такие ситуации наиболее часто возникают, например, в задачах математического моделирования, когда в ходе вычислений на каждой итерации, сложность вычисления повышается и, соответственно, общее время вычислений также увеличивается. Также динамическая балансировка позволяет использовать программное обеспечение, которое будет инвариантно к архитектуре распределенной системы.

Проблемы восстановления данных в случае возникновения ошибок. В ходе эксплуатации распределенных систем наиболее часто возникает проблема отслеживания сбоев и последующее восстановление данных. Данная ситуация может возникнуть, например, в ходе сбоя питания одного из узлов РС. Автоматическое восстановление данных является сложной задачей, которая включает в себя множество проблем. В ходе восстановления необходимо выяснить характер возникшей ошибки, классифицировать ее и в автоматическом режиме произвести восстановление всех данных. При этом должна быть сохранена не только вся целостность связанных данных, но и доступность остальных данных, так как восстановление должно происходить без блокирования основных ресурсов на чтение-запись, т.е. распределенная система должна функционировать без остановки. На сегодняшний момент существует множество подходов к решению данной проблемы. Например, одним из методов восстановления в информационных распределенных системах (распределенных СУБД) является использование так называемого журнала транзакций, в котором хранится вся информация обо всех изменениях, произошедших в базе данных. Сложность в данном случае заключается в правильной классификации ошибок и правильности применения методов восстановления данных в автоматическом режиме.

Проблемы ограниченности масштабируемости. Масштабируемость распределенных систем одна из первоочередных задач при проектировании РС. Распределенные системы позволили избежать главного недостатка централизированных систем – ограниченности наращивания вычислительных мощностей системы. Существуют три основных показателя масштабируемости системы:

масштабируемость РС по отношению к ее размеру. Система считается масштабируемой по отношению к ее размеру, если она обеспечивает простоту подключения к ней новых узлов.
Географическая масштабируемость. Система считается географически масштабируемой, если к ее сети возможно подключение новых узлов, без привязки к конкретной географической зоне (страна, город, дата – центр и т.д.), то есть глобально распределенных узлов.
Масштабируемость управления. Система считается масштабируемой в плане управления ресурсами, если при росте общего количества узлов системы, администрирование системы не усложняется.

При решении задачи масштабируемости системы необходимо решить множество проблем. Выделим основные проблемы масштабируемости распределенных систем.

Проблема увеличения количество узлов системы, что не всегда предоставляется возможным, в связи с ограниченностью служб, алгоритмов, так как зачастую многие службы настроены на использование на конкретное количество оборудования, например, на использование только одного конкретного сервера, конкретной архитектуры. То есть мы сталкиваемся с проблемой централизации, как ресурсов, так и служб.

Проблема ограниченности возможностей сервера, который осуществляет агрегирование данных, собранных с узлов системы в общее глобальное представление.

Проблема ограниченности сетей передачи данных. Так как при географической масштабируемости узлы распределенной системы могут находиться в географически отдаленных точках Мира, то при проектировании и эксплуатации РС мы сталкиваемся с проблемами надежности сетей передачи данных. При низких скоростях передачи данных возможно снижение общей надежности и производительности РС.

Проблема ограниченности алгоритмов обработки данных. Необходимо использовать методы и алгоритмы сбора данных с узлов системы, которые минимально перегружают коммуникационную сеть.

Проблема переносимости ПО. Проблема переносимости программного обеспечения является одним из ключевых сдерживающих факторов развития и дальнейшего масштабирования распределенных систем. Проблема переносимости заключается в невозможности запуска созданного приложения на различных архитектурах. Стремительное развитие программных архитектур, языков программирования, а также общее развитие всей IT-индустрии в целом — все это привело к необходимости создания методологий переносимости программного кода.

Особенно остро вопрос переносимости ПО встает в глобально распределенных системах, где в качестве узлов, зачастую, используют различное гетерогенное оборудование с различными операционными системами. Например, для объединения вычислительных машин в одну глобальную вычислительную GRID – сеть требуется написать клиентское приложение для каждого вычислительного узла, с учетом специфики его архитектуры и установленной ОС, что является сложной задачей. Постоянно растущие требования к увеличению мобильности программных продуктов, приводит к необходимости проведения исследований в данном направлении. Проблемам обеспечения кроссплатформенности программного обеспечения посвящено множество опубликованных научных работ, в которых показаны основные подходы и методы, позволяющие создавать переносимые приложения .

Заключение

С одной стороны распределенные системы являются инструментарием позволяющим решать большое количество сложных задач, большинство из которых другими методами не решается. Распределенные системы позволяют устранить главный недостаток централизированных систем – ограниченности наращивания вычислительных мощностей. В то же время анализ выявил ряд проблем, требующих решения.

Ограниченность использования распределенных систем осложняется использованием в их составе оборудования различных производителей с различными типами архитектур. В связи с большим разнообразием аспектов построения вычислительных систем, а также разнообразие существующих операционных систем, возникает необходимость в создании методов адаптивного планирования распределения потоков в распределенной системе, что позволит значительно ускорить скорость обработки поступающих заявок на обслуживание и увеличению общей производительности системы. Однако в целом существует положительная тенденция к решению проблем и следует считать, что в ближайшие годы в этом направлении произойдет качественный технологический скачек.

ЛИТЕРАТУРА

Tsvetkov V. Yа., Lobanov A. A. Big Data as Information Barrier // European Researcher. 2014. Vol.(78). № 7-1. p. 1237-1242.
Мартин Д. Вычислительные сети и распределенная обработка данных: Программное обеспечение, методы и архитектура: [В 2-х вып.]: Пер. с англ. Вып. 1. Финансы и статистика, 1985.
Цветков В.Я. Базы данных. Эксплуатация информационных систем с распределенными базами данных. М.: МИИГАиК, 2009. 88 с.
Шокин Ю.И. и др. Распределенная информационно-аналитическая система для поиска, обработки и анализа пространственных данных // Вычислительные технологии. 2007. Т. 12. №. 3. С. 108-115.
Tanenbaum A., Van Steen M. Distributed systems. Pearson Prentice Hall, 2007.
И.Б. Бурдонов, А.С. Косачев, В.Н. Пономаренко, В.З. Шнитман. Обзор подходов к верификации распределенных систем. М.: Российская Академия Наук. Институт системного программирования (ИСП РАН) 2003. 51 с.
Вовченко А.Е., Калиниченко Л.А., Ступников С.А. Семантический грид, основанный на концепции предметных посредников. Институт проблем информатики РАН. URL: http://83.149.245.107/synthesis/publications/10semgrid/10semgr id.pdf (дата обращения 20.09.2014).
Родин А.В., Бурцев В.Л. Параллельные или распределенные вычислительные системы? // Труды Научной сессии МИФИ- 2006. Т. 12 Информатика и процессы управления. Компьютерные системы и технологии. с. 149-151.
George Coulouris, Jean Dollimore, Tim Kindberg, “Distributed Systems Concepts and Design” 3 rd edition, Addison-Wesley.
Blaze M. et al. The role of trust management in distributed systems security // Secure Internet Programming. Springer Berlin Heidelberg, 1999. С. 185-210.
Бабич А.В., Берсенев Г.Б. Алгоритмы динамической балансировки нагрузки в распределенной системе активного мониторинга // Известия ТулГУ. Технические науки. 2011. №. 3. С. 251-261.
Daryapurkar A., Deshmukh M. V. M. Efficient Load Balancing Algorithm in Cloud Environment // International Journal Of Computer Science And Applications. 2013. Т. 6. №. 2. p. 308-312.
Распределенные системы. Принципы и парадигмы Э. Таненбаум, М. Bан Стеен. СПб.: Питер, 2003.
Tanenbaum A. S., Klint P., Bohm W. Guidelines for software portability // Software: Practice and Experience. 1978. Т. 8. №. 6. С. 681-698.
James D. Mooney. "Bringing Portability to the Software Process". Technical Report TR 97-1, Dept. of Statistics and Computer Science, West Virginia University, Morgantown WV, 1997.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

Государственное образовательное учреждение высшего профессионального образования

РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ ГУМАНИТАРНЫЙ УНИВЕРСИТЕТ

Филиал РГГУ в г. Калининграде

Кафедра экономическо-управленческих и правовых дисциплин

Контрольная работа по «ИНФОРМАЦИОННЫМ ТЕХНОЛОГИЯМ УПРАВЛЕНИЯ»

«Распределенные информационные системы »

Афанасьев Олег Александрович

3-го курса заочной формы обучения

специальность 080507

«Менеджмент организации»

Руководитель:

К.ф-м.н., доцент

Корнев К.П.

Калининград 2010

Введение 3
1. 4
2. Понятие распределенной базы данных. 6
3. Методы поддержки целостности распределенной базы данных. 7
4.Стандартизация цифрового представления документальной информации. 8
5. Стандартизация определения архитектуры документа и процессов обработки(ODA/ODIF). 13
6. Стандарты представления знаний. 14
Заключение. 18
Список используемой литературы. 19

Введение

Распределенные базы данных невозможно рассматривать вне контекста более общей и более значимой темы распределенных информационных систем. Процессы децентрализации и информационной интеграции, происходящие во всем мире, неизбежно должны рано или поздно затронуть нашу страну. Россия, в силу своего географического положения и размеров "обречена" на преимущественное использование распределенных систем. Наша работа посвящена изучению архитектуры распределённой обработки данных, методам поддержки целостности распределенной базы данных, стандартизации определения архитектуры документа и процессов обработки, а также рассмотрим различные стандарты представления данных.

1. Распределенная обработка данных.

Распределенная обработка данных - методика выполнения прикладных программ группой систем. При этом пользователь получает возможность работать с сетевыми службами и прикладными процессами, расположенными в нескольких взаимосвязанных абонентских системах.

Распределённую обработку данных используют распределенные системы обработки данных.

Распределенные системы - это системы типа "клиент-сервер".

Рис.1. обработка данных в архитектуре клиент/сервер

Итак, клиент-серверная информационная система состоит в простейшем случае из трех основных компонентов:

· сервер баз данных, управляющий хранением данных, доступом и защитой, резервным копированием, отслеживающий целостность данных в соответствии с бизнес-правилами и, самое главное, выполняющий запросы клиента;

· клиент, предоставляющий интерфейс пользователя, выполняющий логику приложения, проверяющий допустимость данных, посылающий запросы к серверу и получающий ответы от него;

· сеть и коммуникационное программное обеспечение, осуществляющее взаимодействие между клиентом и сервером посредством сетевых протоколов.

Основные особенности архитектуры «клиент-сервер»

Одна из моделей взаимодействия компьютеров в сети получила название «клиент-сервер» (Рис. 2.). Каждый из составляющих эту архитектуру элементов играет свою роль: сервер владеет и распоряжается информационными ресурсами системы, клиент имеет возможность воспользоваться ими.

Рис. 2. Архитектура «клиент-сервер»

Сервер базы данных представляет собой мультипользовательскую версию СУБД, параллельно обрабатывающую запросы, поступившие со всех рабочих станций. В его задачу входит реализация логики обработки транзакций с применением необходимой техники синхронизации - поддержки протоколов блокирования ресурсов, обеспечение, предотвращение и/или устранения тупиковых ситуаций.

В ответ на пользовательский запрос рабочая станция получит не «сырье» для последующей обработки, а готовые результаты. Программное обеспечение рабочей станции при такой архитектуре играет роль только внешнего интерфейса (Front - end) централизованной системы управления данными. Это позволяет существенно уменьшить сетевой трафик, сократить время на ожидание блокированных ресурсов данных в мультипользовательском режиме, разгрузить рабочие станции и при достаточно мощной центральной машине использовать для них более дешевое оборудование.

Как правило, клиент и сервер территориально отделены друг от друга, и в этом случае они входят в состав или образуют систему распределенной обработки данных.

Для современных СУБД архитектура «клиент-сервер» стала фактически стандартом. Если предполагается, что проектируемая информация будет иметь архитектуру «клиент-сервер», то это означает, что прикладные программы, реализованные в ее рамках, будут иметь распределенный характер, т. е. часть функций приложений будет реализована в программе-клиенте, другая - в программе-сервере. Основной принцип технологии «клиент-сервер» заключается в разделении функций стандартного интерактивного приложения на четыре группы:

· функции ввода и отображения данных;

· прикладные функции, характерные для предметной области;

· фундаментальные функции хранения и управления ресурсами (базами данных);

· служебные функции.

2. Понятие распределенной базы данных

Распределенная база данных (DDB - distributed database) - это совокупность логически взаимосвязанных баз данных, распределенных в компьютерной сети. Распределенная система управления базой данных определяется как программная система, которая позволяет управлять распределенной базой данных таким образом, чтобы ее распределённость была прозрачна для пользователей. В этом определении следует уточнить две отличительных архитектурных особенности. Первая из них заключается в том, что система состоит из (возможно, пустого) множества узлов приема запросов (query site) и непустого множества узлов данных (data site). Узлы данных обладают средствами для хранения данных, а узлы приема запросов - нет. В узлах приема запросов лишь выполняются программы, реализующие пользовательский интерфейс для доступа к данным, хранящимся в узлах данных. Вторая особенность состоит в том, что узлы логически представляют собой независимые компьютеры. Следовательно, у такого узла имеется собственная основная и внешняя память, установлена собственная операционная система (может быть, одна и та же на всех узлах, а возможно, и нет) и имеется возможность выполнять приложения. Узлы связаны компьютерной сетью, а не входят в мультипроцессорную конфигурацию. Важно подчеркнуть слабую связанность процессоров, которые обладают собственными операционными системами и функционирует независимо.

3. Методы поддержки целостности распределенной базы данных

Поддержка целостности в реляционной модели данных в ее классическом понимании включает в себя 3 метода:

Первый метод это поддержка структурной целостности, которая трактуется как то, что реляционная СУБД должна допускать работу только с однородными структурами данных типа "реляционное отношение". При этом понятие "реляционного отношения" должно удовлетворять всем ограничениям, накладываемым на него в классической теории реляционной БД (отсутствие дубликатов кортежей, соответственно обязательное наличие первичного ключа, отсутствие понятия упорядоченности кортежей).

Второй метод это поддержка языковой целостности, которая состоит в том, что реляционная СУБД должна обеспечивать языки описания и манипулирования данными не ниже стандарта SQL. Не должны быть доступны иные низкоуровневые средства манипулирования данными, не соответствующие стандарту.

Именно поэтому доступ к информации, хранимой в базе данных, и любые изменения этой информации могут быть выполнены только с использованием операторов языка SQL.

Третий метод это поддержка ссылочной целостности (Declarative Referential Integrity, DRI), означает обеспечение одного из заданных принципов взаимосвязи между экземплярами кортежей взаимосвязанных отношений:

· кортежи подчиненного отношения уничтожаются при удалении кортежа основного отношения, связанного с ними.

· кортежи основного отношения модифицируются при удалении кортежа основного отношения, связанного с ними, при этом на месте ключа родительского отношения ставится неопределенное Null значение.

Ссылочная целостность обеспечивает поддержку непротиворечивого состояния БД в процессе модификации данных при выполнении операций добавления или удаления.

Кроме указанных ограничений целостности, которые в общем виде не определяют семантику БД, вводится понятие семантической поддержки целостности .

Структурная, языковая и ссылочная целостность определяют правила работы СУБД с реляционными структурами данных. Требования поддержки этих трех видов целостности говорят о том, что каждая СУБД должна уметь это делать, а разработчики должны это учитывать при построении баз данных с использованием реляционной модели.

4.Стандартизация цифрового представления документальной информации

Правовое регулирование вопросов работы с электронными документами предполагает закрепление в нормативных правовых актах, прежде всего, понятия «электронный документ» и возможности использования электронных документов наравне с традиционными документами в различных сферах деятельности, особенно в сфере государственного управления. Применение электронных документов требует законодательного обеспечения их юридической силы, то есть установления порядка их удостоверения (состава и способов оформления реквизитов), а также защиты от искажений в процессе электронного обмена. В связи с этим в современном законодательстве предпринимаются попытки создания определенных условий для использования в этих целях технологии электронной подписи.

Техническое регулирование (стандартизация) в области электронного документооборота направлено на разработку, принятие, применение и исполнение требований к электронным документам и различным технологическим процессам, связанным с применением электронных документов, например, процессам формирования и проверки электронной подписи, процедурам хранения, транспортировки и эксплуатации носителей, используемых при обработке данных и хранении информации в электронном виде.

Стандартизация массивов метаданных об информационных ресурсах, развитие систем их классификации и каталогизации должны стать основой создания эффективных средств навигации в российском информационном пространстве, а также постоянно действующего мониторинга информационных ресурсов (прежде всего, государственных) и информационной деятельности.

В связи с вышеизложенным, в 1999 г. был принят национальный стандарт ГОСТ Р 51353, определяющий состав и содержание метаданных электронных карт в геоинформационных системах, а в 2003 г. принят непосредственно в качестве национального стандарта Российской Федерации межгосударственный стандарт ГОСТ 7.70, устанавливающий состав, содержание и представление реквизитов описания электронных информационных ресурсов, являющихся базами данных и машиночитаемыми информационными массивами. Стандарт ГОСТ 7.70 рекомендован как для регистрирующих органов, составляющих каталоги информационных ресурсов, так и для разработчиков и распространителей электронных информационных ресурсов (на сменных носителях, в глобальных и локальных сетях).

Национальные стандарты, входящие в Систему стандартов по информации, библиотечному и издательскому делу (СИБИД), нормативно упорядочивают информационные процессы, обеспечивающие доступ к информационным фондам. Например, правила библиографического описания электронных изданий устанавливает государственный стандарт ГОСТ 7.82, согласно которому описание электронных ресурсов максимально приближено к описанию традиционных документов, закрепленному в ГОСТ 7.1.

Создание и эксплуатация компьютерных систем и технологий обработки документации осуществляется на основе правил, изложенных в комплексе стандартов на автоматизированные системы и других стандартах серии «Информационная технология». Также на государственном уровне стандартизированы вопросы защиты информации и использования электронной цифровой подписи.

В частности, стандарт ГОСТ 34.601 выделяет восемь стадий в создании автоматизированных систем (АС), используемых в различных сферах деятельности, в том числе в управленческой: формирование требований к АС, разработка концепции АС, техническое задание, эскизный проект, технический проект, рабочая документация, ввод в действие, сопровождение АС.

Стандарт ГОСТ 34.602 устанавливает состав, содержание, правила оформления документа «Техническое задание на создание (развитие или модернизацию) системы», а также порядок его разработки, согласования и утверждения. В этом стандарте отмечено, что включаемые в техническое задание требования должны «не уступать аналогичным требованиям, предъявляемым к лучшим современным отечественным и зарубежным аналогам».

Разработанный в 2004 году национальный стандарт ГОСТ Р 52294 определяет основные положения по созданию, внедрению, эксплуатации и сопровождению электронного регламента административной и служебной деятельности организаций. Он распространяется на автоматизированные системы обработки информации и управления учреждений, предприятий и организаций независимо от формы собственности и подчинения. Положения этого стандарта следует учитывать при создании новых или совершенствовании существующих технологий управления организацией. Стандарт ГОСТ 52294 содержит определения терминов «регламент» (это «совокупность правил, устанавливающих порядок проведения работ или осуществления деятельности»), «рабочий процесс» (это «совокупность взаимосвязанных или взаимодействующих видов деятельности, преобразующих входы в выходы и реализуемых в пределах организации»), «операция (работа)» (это «часть рабочего процесса, создающая воспроизводимый результат в рамках рабочего процесса»).

В национальных стандартах также закреплены требования к управлению документами, проведению унификации и применению унифицированных систем документации, оформлению организационно-распорядительной документации, терминологии в области делопроизводства и архивного дела, терминологии в области электронного обмена информацией.

Следует отметить, что отраслевой терминологический стандарт по делопроизводству и архивному делу ГОСТ Р 51141, действующий с 1 января 1999 г., не в полной мере отражает новую международную терминологию и не учитывает новую техническую терминологию, возникшую в связи с применением компьютерных информационных технологий в сфере работы с информацией и документацией. Он требует актуализации на основе использования стандартов ИСО и отечественного опыта работы с документацией.

Национальную систему стандартизации составляют, помимо национальных стандартов, общероссийские классификаторы технико-экономической и социальной информации и другие применяемые в установленном порядке классификации. Общероссийские классификаторы - это нормативные документы, распределяющие технико-экономическую и социальную информацию в соответствии с ее классификацией (классами, группами, видами и др.). В отличие от национальных стандартов, применяемых на добровольной основе, общероссийские классификаторы являются обязательными для применения при создании государственных информационных систем и информационных ресурсов, а также при межведомственном обмене информацией.

Утвержденное Правительством РФ «Положение о разработке, принятии, введении в действие, ведении и применении общероссийских классификаторов технико-экономической и социальной информации в социально-экономической области» содержит перечень общероссийских классификаторов, а также органов исполнительной власти, обеспечивающих разработку, ведение и применение каждого из классификаторов.

Сами унифицированные формы документов утверждаются министерствами (ведомствами) РФ - разработчиками унифицированных систем документации. Например, федеральный орган государственной статистики в рамках первичной учетной документации ведет подсистему документации по учету труда и его оплаты, разрабатывает и утверждает альбомы унифицированных форм первичной учетной документации и их электронные версии.

Следует отметить, что Росархивом и ВНИИДАД в 2007 г. разработан и введен в действие Единый классификатор документной информации Архивного фонда Российской Федерации. Этот классификатор устанавливает и закрепляет единый для всех государственных и муниципальных архивов РФ систематизированный перечень наименований и индексов объектов классификации, что создает прочную основу для формирования единого архивного информационного пространства нашей страны.

Требования к электронным документам могут содержать законодательные и иные нормативные правовые акты, определяющие статус различных юридических лиц или их деятельность в определенной сфере. Например, в соответствии с Федеральным законом «Об индивидуальном (персонифицированном) учете в системе государственного пенсионного страхования» в Пенсионный фонд РФ может представляться информация как в виде документов в письменной форме, так и в электронной форме (на магнитных носителях или по каналам связи).

5. Стандартизация определения архитектуры документа и процессов обработки(ODA/ODIF)

ODA/ODIF - Office Document Architecture / Office Document Interchange Format (Архитектура офисных документов / Форма обмена офисными документами)

Открытый стандарт архитектуры документов и формата обмена, позволяет обмениваться сложными документами (т.е. документами, несущими в себе одновременно несколько различных типов содержания, например буквы, растровую графику и геометрическую [компьютерную] графику).

В мире сформировалась информационная среда, инфраструктура которой базируется на компьютерах и телекоммуникациях. Эта среда, построенная по технологии “клиент-сервер”, обеспечивает возможность интеграции разнородных технических и программных решений. Наряду с уже хорошо известным словом Интернет несколько лет назад появилось понятие intranet, под которым понимается применение в корпоративных сетях и системах средств и стандартов, разработанных для глобальных сетей. И для организации электронного документооборота в этих системах существуют свои стандарты и программные средства. Вероятно, разработчики систем передачи электронных документов в библиотеках должны обязательно учесть стандарт ISO 8613 (parts 1-6) “Архитектура и обменный формат для офисных документов” (Office Document Architecture (ODA) and Interchange Format (ODIF)). Этот стандарт задает метод описания электронных документов и само описание структурированной информации в виде, удобном для машинной обработки и автоматизированного обмена.

Далее следует сказать, что документы или их копии, предоставляемые пользователю, могут быть разной природы: электронные графические копии, электронные файлы в одном из текстовых форматов, ксерокопии или оригиналы, выдаваемые по МБА. Соответственно, мы должны учесть все необходимые стандарты, описывающие их форматы и кодировку (TIFF, GIF, JPEG, PDF, PostScript, CCITT Group 3/Group4 Facsimile Standard, ISO 2022 "Information Processing - 7-bit/8-bit character sets", ISO 4873 “8-bit code for Information Interchange - Structure and Rules for Implementation", ISO 6937 “Coded characters for Text Communication", ISO 8859 “8-bit single byte coded graphics character sets", CP Windows-1251, и др.). Мы должны также учесть и использовать возможности представления документов на языках HTML ("HyperText Mark-up Language") и SGML (ISO 8859 "Information Processing - Text and Office Systems - Standard Generalized Mark-up Language") с соответствующими кодовыми таблицами (UNICODE, UTF-8, ISO 10646). Технологическое обеспечение и функциональные программы электронного МБА должны предусматривать не только различные форматы, но различные способы транспортировки документов, как-то: передача данных по электронной почте, через FTP-сервер, возможно, использование каких-то других протоколов сетей передачи данных, пересылка документов по факсу или обычной почтой и т.п.

6. Стандарты представления знаний

Одной из проблем в представлении знаний является то, как хранить и обрабатывать знания в информационных системах формальным способом так, чтобы механизмы могли использовать их для достижения поставленных задач. Примеры применения здесь экспертные системы, Машинный перевод, компьютеризированное техническое обслуживание и системы извлечения и поиска информации (включая пользовательские интерфейсы баз данных).

Для представления знаний можно использовать семантические сети. Каждый узел такой сети представляет концепцию, а дуги используются для определения отношений между концепциями. Одна из самых выразительных и детально описанных парадигм представления знаний основанных на семантических сетях это MultiNet (акроним для Многослойные Расширенные Семантические Сети англ. Multilayered Extended Semantic Networks).

Начиная с 1960-х годов, использовалось понятие фрейма знаний или просто фрейма. Каждый фрейм имеет своё собственное имя и набор атрибутов, или слотов которые содержат значения; например фрейм дом мог бы содержать слоты цвет, количество этажей и так далее.

Использование фреймов в экспертных системах является примером объектно-ориентированного программирования, с наследованием свойств, которое описывается связью «is-a». Однако, в использовании связи «is-a» существовало немало противоречий: Рональд Брахман написал работу озаглавленную «Чем является и не является IS-A», в которой были найдены 29 различных семантик связи «is-a» в проектах, чьи схемы представления знаний включали связь «is-a». Другие связи включают, например, «has-part».

Фреймовые структуры хорошо подходят для представления знаний, представленных в виде схем и стереотипных когнитивных паттернов. Элементы подобных паттернов обладают разными весами, причем большие весы назначаются тем элементам, которые соответствую текущей когнитивной схеме). Паттерн активизируется при определённых условиях: Если человек видит большую птицу, при условии что сейчас активна его «морская схема», а «земная схема» -- нет, он классифицирует её скорее как морского орлана, а не сухопутного беркута.

Фреймовые представления объектно-центрированы в том же смысле что и Семантическая сеть: Все факты и свойства, связанные с одной концепцией, размещаются в одном месте, поэтому не требуется тратить ресурсы на поиск по базе данных.

Скрипт - это тип фреймов, который описывает последовательность событий во времени; типичный пример описание похода в ресторан. События здесь включают ожидание места, прочитать меню, сделать заказ, и так далее.

В информатике (главным образом в области искусственного интеллекта) для структурирования информации, а также организации баз знаний и экспертных систем были предложены несколько способов представления знаний. Одно из них -- представление данных и сведений в рамках логической модели баз знаний, на основе языка логического программирования Пролог.

Под термином «Представление Знаний» чаще всего подразумеваются способы представления знаний, ориентированные на автоматическую обработку современными компьютерами, и в частности, представления, состоящие из явных объектов ("класс всех слонов", или "Клайд -- экземпляр"), и из суждений или утверждений о них ("Клайд слон", или "все слоны серые"). Представление знаний в подобной явной форме позволяет компьютерам делать дедуктивные выводы из ранее сохраненного знания ("Клайд серый").

В 1970-х и начале 1980-х были предложены, и с переменным успехом опробованы многочисленные методы представления знаний, например эвристические вопросно-ответные системы, нейросети, доказательство теорем, и экспертные системы. Главными областями их применения в то время были медицинская диагностика (к примеру MYCIN) и игры (например шахматы).

В 1980-х годах появились формальные компьютерные языки представления знаний. Основные проекты того времени пытались закодировать (занести в свои базы знаний) огромные массивы общечеловеческого знания. Например в проекте «Cyc» была обработана большая энциклопедия, и кодировалась не сама хранящаяся в ней информация, а знания, которые потребуются читателю чтобы понять эту энциклопедию: наивная физика, понятия времени, причинности и мотивации, типичные объекты и их классы. Проект Cyc развивается компанией Cycorp, Inc.; большая часть (но не вся) их базы свободно доступна.

Эта работа привела к более точной оценке сложности задачи представления знаний. Одновременно в математической лингвистике, были созданы гораздо более объёмные базы языковой информации, и они, вместе с огромным приростом скорости и объёмов памяти компьютеров сделали более глубокое представление знаний более реальным.

Было разработано несколько языков программирования ориентированных на представление знаний. Пролог, разработанный в 1972 , но получивший популярность значительно позже, описывает высказывания и основную логику, и может производить выводы из известных посылок. Ещё больше нацелен на представление знаний язык KL-ONE (1980-е).

В области электронных документов были разработаны языки явно выражающие структуру хранимых документов, такие как SGML а впоследствии XML. Они облегчили задачи поиска и извлечения информации, которые в последнее время всё больше связаны с задачей представления знаний. Веб-сообщество крайне заинтересованно в семантической паутине, в которой основанные на XML языки представления знаний, такие как RDF, Карта тем и другие используются для увеличения доступности компьютерным системам информации, хранящейся в сети.

Сегодня широко используются гиперссылки, однако близкое понятие семантической ссылки ещё не вошло в широкое употребление. Со времён Вавилона использовались математические таблицы. Позже эти таблицы использовались чтобы представлять результат логических операций, например таблицы истинности использовались для изучения и моделирования Булевой логики. Табличные процессоры являются другим примером табличного представления знаний. Другими методами представлениями знаний являются деревья, с помощью которых можно показать связи между фундаментальными концепциями и их производными.

Заключение

В настоящий момент перед многими организациями, имеющими территориально-распределенную структуру, остро встает проблема интеграции данных и приложений в рамках единого информационного пространства. Всем надоело возить дискеты на троллейбусе и мучиться, конвертируя данные из формата одного приложения в формат другого.

Возникает острое желание заниматься своим делом т.е. своевременно иметь информацию в нужной точке в нужное время, а не разбираться с измученными программистами по поводу того, какая информация и куда не дошла, а также, почему данные, введенные в одном приложении, никак не хотят попасть в другое.

В данном случае, потребуется применить технологию Распределенных Информационных Систем. Эта технология позволяет в ограниченные сроки разрабатывать и внедрять информационные системы компании в рамках единого информационного пространства, а также экономить существенные средства на ее сопровождение.

Список используемой литературы

1.Основы Web-технологий./ П.Б. Храмцев, С.А. Брик, А.М. Русак, А.И. Сургин / Под редакцией П.Б. Храмцова. - М.: ИНТУИТ.РУ «Интернет-университет информационных технологий», 2003. -512с.

2. Глухов В.А., Лаврик О.Л. Электронная доставка документов. - М.: ИНИОН РАН, 1999. - 132 с.

3. Фридланд А.Я. Информатика и компьютерные технологии/ А.Я. Фридланд, Л.С. Ханамирова.- М.: Астрель. 2003.- 204 с.

4. Сахаров А. А. Концепция построения и реализации информационных систем, ориентированных на анализ данных // СУБД. - 1996. - № 4. - С. 55-70.

5. Коровкин С. Д., Левенец И. А., Ратманова И. Д., Старых В. А., Щавелёв Л. В. Решение проблемы комплексного оперативного анализа информации хранилищ данных // СУБД. - 1997. - № 5-6. - С. 47-51.

6. Энсор Д., Стивенсон Й. - М.: Oracle. Проектирование баз данных: Пер. с англ. - К.: Издательская группа BHV, 1999. - 560 с.

Подобные документы

Блок обработки данных: общее устройство, выбор элементной базы. Структура операционного автомата. Расчет нагрузочной способности шины данных. Расчет длительности такта управляющего автомата. Память: построение, контроллер. Интерфейс шины процессор-память.

курсовая работа , добавлен 07.01.2015

Инерциальные системы навигации и существующие пути их реализации. Описание архитектуры приложения для сбора и разметки данных, структура и взаимосвязь компонентов. Основные функции анализатора данных. Искусственные нейронные сети и их назначение.

курсовая работа , добавлен 04.09.2016

Основные понятия, определения и классификация информационных систем, базы данных. Анализ современных мейнфреймов компании IВМ и их особенности. Виды связи в железнодорожном транспорте и ее назначение; информационные потоки в транспортных системах.

учебное пособие , добавлен 01.10.2013

Назначение базы данных и ее основные функции. Категории пользователей, инфологическое и даталогическое проектирование базы данных "Интернет-магазин". Учет специфики предметной области, ограничения и бизнес-правила. Описание пользовательского интерфейса.

курсовая работа , добавлен 30.09.2011

Компоненты аппаратного обеспечения телекоммуникационных вычислительных сетей. Рабочие станции и коммуникационные узлы. Модули, образующие область взаимодействия прикладных процессов и физических средств. Направления методов обработки и хранения данных.

лекция , добавлен 16.10.2013

Функциональная схема и механизм работы цифрового устройства обработки данных. Синтез управляющего автомата, выбор типа триггера, описание управляющего автомата и счётчиков на языке Verilog. Процесс тестирования и моделирования управляющего автомата.

курсовая работа , добавлен 05.12.2012

Общие и тактико-технические требования к конструкции бортовой аппаратуры. Блок ввода данных для энергонезависимого хранения и выдачи в бортовую ЭВМ данных полетного задания, а также приема данных регистрации. Структурная схема и разработка конструкции.

дипломная работа , добавлен 16.04.2012

Изучение топологии локальной вычислительной сети - совокупности компьютеров и терминалов, соединённых с помощью каналов связи в единую систему, удовлетворяющую требованиям распределённой обработки данных. Разработка ЛВС фотолаборатории. Сетевые протоколы.

курсовая работа , добавлен 02.12.2010

Основные понятия безопасности информационной системы. Свойства конфиденциальности, доступности и целостности данных. Защита данных в момент их передачи по линиям связи, от несанкционированного удаленного доступа в сеть. Базовые технологии безопасности.

презентация , добавлен 18.02.2010

Тензометрический метод оценки состояния двигательных отделов центральной нервной системы. Структурная организация тензометрического треморографа. Основные задачи статистической обработки изометрических данных. Методы корреляции и главных компонент.

Главная > Документ

РАСПРЕДЕЛЕННЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ

Ю.А. Илларионов

ГЛАВА 1. АНАЛИЗ СОСТОЯНИЯ РАЗВИТИЯ ОСНОВНЫХ КОНЦЕПЦИЙ И АЛГОРИТМОВ УПРАВЛЕНИЯ ДЛЯ РАСПРЕДЕЛЁННЫХ ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМ НА БАЗЕ ЛОКАЛЬНЫХ СЕТЕЙ. 1.1. Определение области исследования. Распределённой вычислительной системой (РВС) будем называть систему, состоящую из двух компонентов: множества электронно вычислительных машин (ЭВМ) и сети связи (или сети передачи данных), объединяющей все ЭВМ, входящие в РВС. Всю полезную обработку информации производят вычислительные процессы, выполняющиеся на хост ЭВМ . Всю обработку информации, связанную с необходимостью её передачи через сеть связи, выполняют процессы, расположенные на коммуникационных ЭВМ .Коммуникационные ЭВМ необходимы в сетях связи, имеющих сложную многосвязную топологию, при условии, что прямые физические соединения (каналы) между взаимодействующими посредством передачи информации хост ЭВМ отсутствуют. Таким образом, учитывая, что для эффективной обработки информации в РВС необходимо не только эффективно её обрабатывать на хост ЭВМ , но и эффективно (т.е. с наименьшими задержками) передавать её через сеть связи, работы в области РВС разделились на две группы: 1. Работы в области организации взаимодействия вычислительных процессов в РВС. В этих работах предполагается, что сеть связи уже существует и удовлетворяет определённым требованиям, выдвигаемым к ней. Таким образом, остаётся только решить задачу организации взаимодействия вычислительных процессов, учитывая, что:

в РВС существует множество вычислительных процессов; в РВС существует множество вычислительных ресурсов; процессы и ресурсы могут располагаться на разных хост ЭВМ; процессы могут выполняться параллельно; в системе существует конкуренция распределённых параллельных процессов за ресурсы ЭВМ; в РВС существует неоднородность хост ЭВМ и их оперативных систем; существует тенденция к децентрализации управления взаимодействием вычислительных процессов в РВС с целью повышения надёжности последних. 2. Работы в области организации процессов передачи информации через сети связи. Для этих работ характерно представление о сети как о множестве портов ввода вывода, между которыми существуют логические соединения. Кто поставляет информацию в эти порты и кто её оттуда забирает, не является в данном случае объектом исследования. Задача состоит только в том, как наиболее эффективно осуществить передачу информации по сети связи от одного порта к другому, при условии, что:

соединения между портами не являются фиксированными, и структура логических связей в сети может динамически изменяться; сеть может иметь многосвязную топологию, в которой отсутствуют непосредственные физические соединения между портами; информация в процессе передачи может искажаться; потоки информации, включая их объём и направление, заранее не определены; для организации передачи информации через сеть связи требуется организовать разделение коммуникационных ресурсов между потоками информации в условиях недостатка этих ресурсов; управление разделением коммуникационных ресурсов имеет тенденцию к децентрализации. Настоящая диссертация относится к работам первой группы и посвящена только вопросам организации взаимодействия вычислительных процессов в РВС. Определим область исследования более точно. Учитывая, что с точки зрения возможностей технических средств РВС в основном различаются по применяемым в них сетям связи, распределённые системы можно разбить на две большие группы: РВС, построенные на базе сетей с маршрутизацией и РВС, построенные на базе сетей с селекцией информации, или сетей с общим каналом связи. Настоящая работа посвящена вопросам организации разделения вычислительных ресурсов в РВС, предназначенных для управления производственными процессами в реальном времени и построенных на базе локальных сетей связи с децентрализованным приоритетным управлением доступом к общему каналу. Вопросы децентрализованного приоритетного управления доступом (ДПУ) рассмотрены в работах. В этих же работах впервые была высказана мысль о том, что наличие средств ДПУ и средств обработки информации непосредственно в общем канале в процессе передачи может по новому организовать управление взаимодействием распределённых вычислительных процессов в РВС. Другими словами, локальные сети с ДПУ можно рассматривать не только как систему связи, но и как дополнительное средство управления распределёнными системами. Однако, этот вопрос не был до конца исследован. Итак, основной целью настоящей работы является исследование вопросов разделения ресурсов РВС между вычислительными процессами в условиях существующей распределённости как ресурсов, так и процессов, при наличии множества параллельно возникающих в неопределённые моменты заявок на использование ресурсов; на основании проведённых исследований в работе должны быть разработаны новые высокоскоростные алгоритмы разделения ресурсов для РВС, построенных на базе локальных сетей с ДПУ и средствами вычислений в общем канале (ВОК).Как уже было отмечено, исследования будут вестись в области РВС для промышленного применения, т.е. для систем реального времени. С точки зрения вычислительных мощностей этой системы, построенные в основном на базе микропроцессорной техники, поэтому в дальнейшем будем называть такие РВС распределёнными микропроцессорными управляюще вычислительными системами (РМУВС). Учитывая существующие особенности сетей связи для исследуемых систем, проанализируем эти особенности в сравнении с другими известными сетями.1.2. Особенности локальных сетей с децентрализованным приоритетным управлением доступом к каналу. Первые публикации, посвящённые принципам передачи информации через общий канал связи в режиме его разделения многими абонентами (с точки зрения сети, абонент – это хост ЭВМ, имеющая доступ к каналу через сетевой контроллер; в более широком смысле абонентом может быть и отдельный процесс, выполняемый на хост ЭВМ), появились в начале 70 х годов. К этому моменту был накоплен достаточно большой опыт по созданию РВС на базе глобальных сетей, и это отразилось на решениях, которые в дальнейшем были использованы в РВС на базе локальных сетей (или локальных РВС ЛРВС). В некоторых работах до сих пор не делается различия между организацией управления в глобальных РВС и ЛРВС, а считается, что эти два класса различаются только по протяжённости их линий связи. Появление стандартов IEEE 802 и ECMA внесло некоторую ясность в этот вопрос, однако только в отношении организации связи с ЛРВС. Поэтому в большинстве работ, посвящённых организации взаимодействия вычислительных процессов в ЛРВС, не учитывается специфика таких систем, которая будет отражена ниже. Однако, ряд авторов считает, что ЛРВС в их современном понимании являются системами, по своим архитектурным особенностям приближающимся скорее к многопроцессорным системам, чем к «вычислительным сетям» в их традиционном понимании. В особенности это относится к исследуемым в настоящей работе системам – ряд отличительных признаков позволяет рассматривать их как совершенно новый класс РВС, построенных на базе локальных сетей связи с уникальными возможностями, недоступными в других распределённых системах. Отметим основные архитектурные особенности локальных сетей связи с ДПУ и ВОК, которые будут иметь значение в дальнейшем исследовании.

Наличие общего высокоскоростного канала связи. Наличие общего канала делает локальную связь вырожденной, т.к. в такой сети нет необходимости производить основную сетевую процедуру – маршрутизацию пакетов при передаче информации. Кроме того, как будет показано в дальнейшем, наличие общего канала в соединении с ДПУ и ВОК позволяют использовать канал не только как средство передачи информации, но и как эффективное средство управления распределённой системой. Высокая скорость передачи информации по каналу позволяет строить сетевые протоколы, используя заголовки довольно большой длины для упрощения протоколов. Другими словами, при такой скорости нет необходимости в минимизации длины передаваемых пакетов. Большие пакеты позволяют перейти к методу коммутации сообщений, более простому с точки зрения организации системного программного обеспечения на транспортном уровне. Кроме того, возможность передачи заголовков большой длины позволяет, как будет показано в дальнейшем, использовать в ЛРВС принципиально новые способы обмена информацией, отличающиеся более высокой эффективностью и простой реализацией по сравнению с существующими. Управление доступом к каналу. Механизм управления доступом к каналу во многом определяет характеристики локальных сетей связи. Однако, до последнего времени исследовалось в основном влияние способов управления доступом на пропускную способность канала. Вместе с тем, как отмечалось в работах механизм управления доступом оказывает гораздо большее влияние на ЛРВС. В частности, применение ДПУ позволяет решить на низких уровнях ряд задач, которые традиционно решались на верхних уровнях при помощи обмена сообщениями. Вместе с тем, исследования в этой области только начинаются. Вычисления в общем канале. Алгоритмы вычислений в общем канале (ВОК) предложены в работах. Суть их состоит в том, что информация, проходящая по каналу связи, может быть обработана абонентами распределённой системы без задержки на её обработку. Применение ВОК позволяет осуществлять в ЛРВС групповую обработку информации всеми абонентами в процессе её передачи и даёт возможность получения группового ответа от всех абонентов за одну пересылку информации по каналу, что недоступно в других распределённых системах. Перечисление особенности сетей связи с ДПУ и ВОК даёт основания считать, что ЛРВС, построенные на базе таких сетей, нельзя рассматривать как «те же большие вычислительные сети, только маленькие», хотя вообще такая позиция в настоящее время широко распространена. Перейдём к рассмотрению основных задач и концепций управления в распределённых системах.1.3. Основные задачи и концепции управления в распределённых вычислительных системах. Основной задачей управления в любой вычислительной системе является задача разделения ресурсов в условиях недостатка последних. В РВС задача разделения имеет свои особенности, связанные с распределением ресурсов и процессов по различным абонентам системы. Перечислим эти особенности.

Поскольку в РВС входит множество ЭВМ, то каждая из них может иметь свои ресурсы, доступные для процессов, выполняющихся как локально (т.е. на этой же ЭВМ), так и удалённо (т.е. на другой ЭВМ). Если ресурс является локальным (т.е. полностью принадлежит отдельной ЭВМ), то ответственность за корректную синхронизацию процессов при доступе к такому ресурсу полностью возлагается на эту ЭВМ. В этом случае проблемы синхронизации не возникает, если ресурс является монопольно используемым. Если же ресурс является коммунальным, то в РВС возникает проблема разделения такого ресурса из за того, что если в сосредоточенных централизованных системах большинство накладных расходов на организацию разделения (т.е. выделение памяти для буферов и т.д.) берут на себя сами процессы по принципу «кому нужно, тот и платит», то в РВС эти расходы возлагаются на обслуживающую ЭВМ и получается, что «кто обслуживает, тот ещё и платит». В РВС ресурс может быть организован таким образом, что для решения о его предоставлении некоторому процессу необходимо коллективное согласие всех ЭВМ, которым принадлежат отдельные части такого ресурса, называемого распределённым. Эта задача возникла первоначально в распределённых базах данных, в которых для обеспечения высокой надёжности хранения информации применялось её многократное копирование и распределение копий по системе. Возникающая при этом задача синхронизации при обновлении многих копий распределённой информации является базовой задачей распределённого управления в РВС, и от эффективности её решения зависит в конечном итоге эффективность управления в целом. Традиционно в любых вычислительных системах управление разделением ресурсов возлагается на системное программное обеспечение – операционные системы (ОС). Для РВС это также справедливо – подобное программное обеспечение называется распределёнными операционными системами (РОС). Несмотря на большое разнообразие существующих в настоящее время РОС и различие в применяемых в них алгоритмов управления, их можно классифицировать на основании нескольких базовых моделей, приводимых ниже.Модель МРММ (много ресурсов – много мониторов). Основной идеей, положенной в основу этой модели, является принцип автономности, согласно которому любая ЭВМ, входящая в РОС, является «хозяином» своих собственных локальных ресурсов и только она имеет право решать задачу их разделения. При таком подходе на каждой ЭВМ имеется процесс, являющийся монитором ресурсов этой ЭВМ. Все остальные процессы связаны с мониторами посредством механизма обмена сообщениями через транспортную сеть согласно семиуровневой архитектуре |SO/OSI.Модель МРММ является моделью вычислительной сети в её традиционном понимании; системы, построенные в соответствии с этой моделью, предназначены в основном для реализации «электронной почты» и организации доступа к ресурсам удалённых ЭВМ. Задача управления разделением распределённых ресурсов в таких системах не решается.Модель МРОМ (много ресурсов – один монитор). Полностью централизованная модель. В систему вводится центральный процесс, являющийся монитором всей системы и в частности, монитором распределённых ресурсов. Все остальные процессы имеют доступ к мониторам только посредством обращения к центральному монитору. Управление разделением распределённых ресурсов в этом случае не составляет трудности, но введение центрального процесса резко снижает надёжность работы РВС. Поэтому централизованные способы управления применяются, как правило, только в самых простых распределённых системах, не предназначенных для ответственных применений.Модель ОРММ (один ресурс – много мониторов). Модель основана на предположении, что в системе имеется ресурс, надёжность которого намного больше, чем надёжность любого монитора. В действительности, как уже было сказано, такие ресурсы образуются за счёт копирования наиболее важных системных ресурсов и распределения копий по различным абонентам РВС; причём каждая копия имеет свой монитор. Считывать информацию можно параллельно с любой работоспособной копии ресурса, обновлять информацию необходимо на всех копиях. В этих условиях при обновлении информации все мониторы копий должны взаимодействовать с целью с целью принятия коллективного решения о предоставлении ресурса для операции обновления или записи. Такие РВС называются системами с распределённым (децентрализованным коллективным) управлением; их развитию и посвящена настоящая работа. Ключевым вопросом для таких систем является проблема синхронизации мониторов при выработке или коллективного решения. В зависимости от методов, используемых в настоящее время для синхронизации мониторов, РВС этого класса можно разбить на две группы. В РВС первой группы мониторы взаимодействуют, обмениваясь сообщениями через транспортную сеть. Основное достоинство подобных систем состоит в том, что алгоритмы синхронизации мониторов в этом случае не зависят от структуры сети (топологии, методов доступа и т.д.) и могут быть использованы в любых РВС. Однако, как будет показано в дальнейшем, алгоритмы этого класса требуют пересылки значительного количества сообщений через транспортную сеть, что приводит к большим временным расходам на синхронизацию. При оценке эффективности алгоритмов следует учитывать то, что накладные расходы на пересылку одного сообщения через транспортную сеть составляют около 20 мс для широкого круга распределённых систем. Тем не менее, такой подход к синхронизации широко используется из за отсутствия в настоящее время подходящих альтернативных способов для сетей ЭВМ. В РВС второй группы для синхронизации мониторов применяются специально выделенные линии связи, по которым возможна передача только синхронизирующей управляющей информации (импульсов, потенциалов на линиях и т.д.). Такой принцип используется в мультимикропроцессорных системах с сетевой организацией, имеющих небольшую протяжённость линий связи. Однако для РВС на базе локальных сетей большой протяжённости (до 2 км) такой подход неприемлем из за значительного увеличения кабельной продукции, поскольку число линий синхронизации может зависеть как от числа распределённых продуктов, так и от числа абонентов системы. Перейдём к рассмотрению известных алгоритмов разделения ресурсов в РВС с распределённым управлением.1.4. Алгоритмы разделения ресурсов для систем с распределённым управлением. Все алгоритмы разделения ресурсов для систем с распределённым управлением можно разбить на три группы: алгоритмы с использованием голосования, алгоритмы с использованием предварительной блокировки и алгоритмы с циркулирующей привилегией.Алгоритмы с использованием голосования основаны на процессе обмена сообщениями между процессами контроллерами с целью прихода к соглашению относительно последовательности транзакций в распределённой системе. Под транзакцией понимается последовательность операций чтения информации из некоторой базы данных, обновления (изменения) считанной информации и записи обновлённой информации в базу данных. Если голосования и выполнение транзакций производителя одними и теми же контроллерами, то голосование называется синхронным; если разными, то голосование называется асинхронным. В алгоритме синхронного голосования контроллер, контроллер, принявший запрос на транзакцию, присоединяет тег – временной штамп из сообщения, содержащего суть запроса и идентификатор пославшего запрос абонента. Далее, если не было инициировано голосование предыдущей транзакции, этот контроллер посылает широковещательное сообщение со своим голосом всем остальным контроллерам (рис. 1.1.). Если предположить, что можно отличить более высокий приоритет некоторой транзакции Т а от приоритета транзакции Т с, то система из трёх контроллеров будет работать следующим образом. 1. Контроллер В: если голос для транзакции Т с принят раньше, чем некоторый голос для Т а, то контроллер В широковещательно посылает свой голос, отдавая его Т с (рис. 1.1а.). При получении запроса на транзакцию Т а В уничтожает Т с и широковещательно отдаёт свой голос транзакции Т а (рис. 1.1б.). Если голос за транзакцию Т а принят раньше, В сразу отдаёт свой голос за Т а, отбрасывая голоса за Т с, пришедшие позднее.Рис 1.1. 2. Контроллер С: отдаёт свой голос за Т а при приёме голоса за Т а. 3. Контроллер А: отбрасывает все голоса за Т с. После приёма голосов от всех контроллеров за одну и ту же транзакцию (в рассмотренном случае Т а) каждый из контроллеров начинает выполнение этой транзакции. В другом алгоритме синхронного голосования явно выделяется инициирующий контроллер. Если транзакция поступила к контроллеру на выполнение (т.е. от пользователя), то этот контроллер инициирует голосование, посылая запрос на начало голосования остальным контроллерам. Если все остальные контроллеры ответят на этот запрос передачей сообщения АСК + , то транзакция принимается и инициирующий контроллер широковещательно посылает UPD сообщение для локальных инициаций транзакции всеми остальными контроллерами. Контроллеры, закончившие локальное выполнение транзакции (или вообще не начинавшие её выполнение) сигнализируют ответом END инициатору. После приёма END – сообщений от всех контроллеров, инициатор переходит в начальное состояние. Контроллеры, завершившие очередную транзакцию, также переходят в начальное состояние и готовы для новых транзакций. Каждый из контроллеров, приняв запрос на новую транзакцию, может начать её выполнение только в том случае, если она совместима с текущей транзакцией, выполняемой контроллером. Только в этом случае сообщение АСК + может быть послано инициатору, и начаться выполнение новой транзакции после приёма UPD. Транзакции считаются совместимыми, если они запрашивают различные наборы чтения и записи для своего выполнения. Приоритеты транзакций различаются согласно алгоритму, приведённому в работе.На рис. 1.2. показано, как различается конфликт в том случае, когда две совместимые транзакции инициируют запрос на голосование. Контроллеры А и С голосуют за Т а и Т с конкурентно. Контроллер В голосует за обе транзакции, т.к. он находится в начальном состоянии. А и С голосуют друг за друга после проверки, что транзакции Т а и Т с совместимы (б). Инициируется локальное выполнение транзакций (в) и после завершения локального выполнения сигнализируется окончание (г). Алгоритмы асинхронного голосования были использованы в распределённой базе данных SDD 1. В этой системе транзакции группируются в набор классов транзакций в соответствии сих наборами чтения и записи. Классы транзакций предварительно определяются администратором базы данных. С целью уменьшения затрат на синхронизацию разработаны четыре различных протокола синхронизации. Протокол Р1 предоставляет управление на нижнем уровне, обладая минимальной стоимостью и высокой эффективностью, в то время, как протокол Р4 обеспечивает верхний уровень управления, обладая большими накладными расходами. Протоколы выбираются в соответствии с классами транзакций. Упорядочивание запросов чтения/записи от различных параллельных транзакций осуществляется путём присваивания временных штампов транзакциям и записи этих временных штампов во все запрошенные элементы базы данных, к которым конкретная транзакция имеет доступ.Изменение копии элемента базы данных предоставляется транзакции только в том случае, если временной штамп запроса транзакции на изменение более новый по сравнению с временным штампом копии. Это гарантирует, что все копии приходят в одинаковое состояние одновременно с прекращением процедур их обновления. Класс транзакций в SDD 1 определён как набор транзакций, связанных с отдельной хост ЭВМ, на которой расположена новая база данных. Все транзакции, принадлежащие характеризуются взаимоисключающими наборами чтения

и взаимоисключающими наборами записи

.Транзакции обрабатываются в двух стадиях следующим образом. В течение первой стадии каждая транзакция обрабатывается локально на той хост ЭВМ, где она была инициирована; при этом используется копия базы данных, принадлежащая этой ЭВМ. Все необходимые операции чтения/записи выполняются локально; генерируется и сохраняется список изменений базы данных. Локальное выполнение транзакции определяется как примитивная акция

. Как только первая стадия транзакции завершена, контроллер широковещательно посылает список изменения базы данных всем остальным контроллерам, которые обновляют свои копии согласно присланному списку. Эти действия определяются как другая примитивная акция

. Примитивы и неделимы, в то время как комбинация L и U транзакции t не нуждаются в неделимости. В SDD 1 возможна такая последовательность примитивов L и U при условии, что история выполнения трёх транзакций t1,t2 и t3 сохраняется .Для определения возможного взаимовлияния транзакций из разных классов, вызванного перекрытием наборов записи и чтения, предлагается конструкция, названная L U графом. Этот граф соединяет пары узлов, отмеченных как L и U для каждого класса .Дуги между

и остальными узлами находятся в соответствии со следующими типами взаимовлияния транзакций: 1 .Дуга к узлу U, принадлежащему к тому же классу. 2 .Дуга к узлу

другого класса на той же хост ЭВМ m возникает при выполнении условий

или

(горизонтальная дуга). 3 .Дуга к узлу

того же класса, расположенному на другой хост ЭВМ возникает, если

(горизонтальная дуга). 4. Дуга к узлу U другого класса, расположенному на другой хост ЭВМ возникает, если

, . 5. Дуги между узлом U и другими узлами возникают по следующему правилу: к , если

и (диагональная дуга). На рис. 1.3. показан L U граф для транзакций классов

при условиях

Как только граф L U для данной системы построен, определяется таблица для выбора одного из четырёх протоколов Р1 Р4 для каждого класса транзакций в соответствии с топологией L U по следующим правилам. Протоколы Р2 и Р3 идентичны, за исключением правил присваивания временного штампа голосовательным сообщениям, которые широковещательно адресуются всем контроллерам. Протокол Р2 выбирает наиболее новый временной штамп из , в то время как Р3 выбирает временной штамп с текущим временем. На рис. 1.4. показана работа протоколов Р2 и Р3. Предположим, что две транзакции t a и t c конкурируют, причём транзакция t c имеет более новый временной штамп. Тогда контроллеры А,В и С взаимодействуют следующим образом при голосовании:

Если к А приходит голос за t c , он помещается в очередь.