18.11.2010 10334

Задачи и проблемы распределенной обработки данных

 

Появление сетей ЭВМ и их коммерциализация в середине 70-х годов прошлого века дало толчок к возникновению и развитию технологий распределенной обработки информации, положившим начало четвертому этапу развития автоматизированных систем управления, а именно - распределенных автоматизированных систем управления, построенных на основе распределенной обработки данных. Распределенная обработка данных подразумевает деление одной прикладной программы на несколько самостоятельных параллельно выполняемых процессов, которые работают на различных ЭВМ сети и выполняют одну общую задачу. В отличие от традиционной сети ЭВМ, где управлением ресурсами сети занимается сам пользователь, а совместное выполнение одной задачи несколькими различными процессами организуется с большим трудом, в распределенных автоматизированных системах (или просто - в распределенных системах) пользователь лишен необходимости самостоятельно решать вопросы управления ресурсами и процессами.

Распределенная система - это сеть ЭВМ, ресурсы которой представляются пользователям рабочих станций сети как виртуальная ЭВМ с неограниченными ресурсами. Сеть ЭВМ - это две или более электронно-вычислительные машины, соединенные между собой для передачи информации.

В распределенной системе от пользователя скрыты:

1. Физическое местоположение ресурсов сети;

2. Способы связи между ресурсами в сети;

3. Организация взаимодействия между ресурсами сети.

Идеальная распределенная система с точки зрения конечного пользователя ведет себя как классическая однопроцессорная локальная ЭВМ. Основная задача распределенной системы заключается в облегчении пользователям доступа к удаленным ресурсам и обеспечении бесконфликтного их совместного использования. Выполнение основной задачи достигается путем реализации следующих свойств распределенной системы:

1. Прозрачность - свойство сокрытия факта того, что процессы и ресурсы физически распределены по различным ЭВМ сети. Исторически свойством прозрачности обладали материалы, предназначенные для использования в окнах зданий в качестве преграды неблагоприятным атмосферным воздействиям. Такие преграды должны обеспечивать проникновение солнечного света в помещения и, одновременно, не мешать беспрепятственному обзору из помещения обстановки на улице. Для выполнения этих требований необходимо сокрытие факта наличия преграды в оконном проеме, что с успехом выполняет такой прозрачный материал, в частности, как стекло.

Виды прозрачности:

а) Прозрачность доступа. Прозрачность доступа призвана скрыть разницу в представлении данных и в способах доступа пользователей к ресурсам;

б) Прозрачность местоположения. Прозрачность местоположения призвана скрыть от пользователей, где именно физически расположен в системе нужный им ресурс;

в) Прозрачность переноса. Прозрачность переноса призвана скрыть от пользователей факт перемещения ресурса в другое место системы;

г) Прозрачность смены местоположения. Прозрачность смены местоположения призвана скрыть от пользователей факт перемещения ресурса в процессе обработки в другое место системы. Основное отличие этого вида прозрачности от прозрачности переноса состоит в том, что прозрачность переноса не требует функционирования ресурса в момент его переноса в другое место системы. Прозрачность смены местоположения, напротив, скрывает факт перемещения ресурса в другое место системы именно в процессе обработки (например: при перемещении мобильной базы данных из одной соты в другую);

д) Прозрачность репликации. Прозрачность репликации призвана скрыть от пользователей тот факт, что в системе существует несколько копий ресурса;

е) Прозрачность параллельного доступа. Прозрачность параллельного доступа призвана скрыть факт возможного совместного использования ресурса несколькими конкурирующими пользователями;

ж) Прозрачность отказа. Прозрачность отказа призвана скрыть от пользователей факт отказа и восстановления системы;

з) Прозрачность сохранности. Прозрачность сохранности призвана скрыть от пользователей месторасположение информационных ресурсов - в оперативной памяти или на долговременных носителях;

2. Открытость - свойство стандартизации доступа к ресурсам системы. Характеристики открытости системы:

а) Способность к взаимодействию. Способность к взаимодействию характеризует, насколько две реализации систем или их компонент от разных производителей в состоянии совместно работать, полагаясь только на то, что их интерфейс соответствует стандарту;

б) Переносимость. Переносимость характеризует, насколько прикладная программа, разработанная для одной распределенной системы, может без изменения выполняться в другой распределенной системе, реализуя одни и те же интерфейсные средства;

в) Гибкость. Гибкость характеризует, насколько легко конфигурируются системы, состоящие из различных компонент от разных производителей;

3. Масштабируемость. Масштабируемость - это свойство расширения системы.

Виды масштабируемости:

а) Масштабируемость по размеру. Масштабируемость по размеру определяет легкость подключения дополнительных пользователей и ресурсов. Проблема масштабируемости по размеру заключается в централизации служб, данных и алгоритмов;

б) Пространственная масштабируемость. Пространственная масштабируемость определяет легкость разнесения пользователей и ресурсов в пространстве. Проблема пространственной масштабируемости заключается в синхронизации процессов;

в) Административная масштабируемость. Административная масштабируемость определяет легкость в управлении множеством независимых компонент системы. Проблема административной масштабируемости заключается в безопасности доступа к ресурсам.

Технологии масштабирования:

а) Сокрытие времени ожидания связи при пространственном масштабировании;

б) Распределение. Распределение - это разбиение компонентов ресурсов на мелкие части с последующим разнесением этих частей по системе;

в) Репликация - создание копий ресурса его владельцем. Проблема репликации заключается в сохранении непротиворечивости копий ресурса.

Аппаратно распределенная система представляет собой многомашинный вычислительный комплекс, построенный на основе сети ЭВМ. Логическая структура многомашинного вычислительного комплекса (сети ЭВМ) может быть шинная или коммутируемая звездообразная. Сети с кольцевой топологией рассматриваются как частный случай шинной структуры.

Аппаратно распределенные системы могут быть двух видов:

1. Гомогенные распределенные системы - используют одну сетевую технологию на ЭВМ с одинаковыми аппаратными платформами;

2. Гетерогенные распределенные системы - используют одновременно несколько сетевых технологий на ЭВМ с одинаковыми или различными аппаратными платформами.

Программно распределенная система представляет собой операционную систему, выступающую как менеджер ресурсов виртуальной ЭВМ, представляемой пользователю. Основная цель распределенной операционной системы - сокрытие тонкостей управления аппаратным обеспечением, одновременно используемым многими процессами. Рассмотрим различия в функционировании локальной операционной системы, в качестве которой представляется распределенная операционная система, сетевой операционной системы, в качестве которой распределенная операционная система физически является, и собственно самой распределенной операционной системы.

Локальная операционная система осуществляет управление ресурсами одной ЭВМ.

Сетевая операционная система обеспечивает доступ к ресурсам удаленных ЭВМ сети и предоставляет ресурсы своей ЭВМ удаленным пользователям.

Распределенная операционная система работает с точки зрения пользователя как локальная операционная система ЭВМ с неограниченными ресурсами. Для обеспечения такой работы к существующим службам сетевых операционных систем добавляются программные средства, называемые системами промежуточного уровня. Под сетевой службой понимается сетевой компонент, реализующий некоторый набор услуг (напр.: файловая служба, служба печати и т.п.). Добавление промежуточного уровня видоизменяет классическую модель OSI, так как протоколы промежуточного уровня фактически подменяют протоколы сеансового и представительного уровней модели OSI и иерархически располагаются между прикладным и транспортным уровнями.