5.2. БАЗЫ ДАННЫХ

■           I            I

Рис. 5.2. Информационный граф Сц (Б,Я)

л/,

База данных (БД) определяется как совокупность взаимосвя­занных данных, характеризующихся возможностью использова­ния для большого количества приложений, возможностью быст­рого получения и модификации необходимой информации, ми­нимальной избыточностью информации, независимостью от прикладных программ, общим управляемым способом поиска [10].

 

Возможность применения баз данных для многих прикладных программ пользователя упрощает реализацию комплексных запро­сов, снижает избыточность хранимых данных и повышает эффектив­ность использования информационной технологии. Минимальная избыточность и возможность быстрой модификации позволяют под­держивать данные на одинаковом уровне актуальности. Основное свойство баз данных — независимость данных и использующих их программ. Независимость данных подразумевает, что изменение дан­ных не приводит к изменению прикладных программ и наоборот.

Модели баз данных базируются на современном подходе к об­работке информации, состоящем в том, что структуры данных об­ладают относительной устойчивостью. Действительно, типы объек­тов предприятия, для управления которым создается информаци­онная технология, если и изменяются во времени, то достаточно редко, а это приводит к тому, что структура данных для этих объек­тов достаточно стабильна. В результате возможно построение ин­формационной базы с постоянной структурой и изменяемыми значениями данных. Каноническая структура информационной базы, отображающая в структурированном виде информационную мо­дель предметной области, позволяет сформировать логические за­писи, их элементы и взаимосвязи между ними. Взаимосвязи могут быть типизированы по следующим основным видам:

      "один к одному", когда 'одна запись может быть связана только с одной записью;

     "один ко многим", когда одна запись взаимосвязана со мно­гими другими;

      "многие ко многим", когда одна и та же запись может вхо­дить в отношения со многими другими записями в различных вариантах.

Применение того или иного вида взаимосвязей определило три основные модели баз данных: иерархическую, сетевую и ре­ляционную.

Для пояснения логической структуры основных моделей баз данных рассмотрим такую простую задачу: необходимо разра­ботать логическую структуру БД для хранения данных о трех поставщиках:                               Пз, которые могут поставлять товары

Т2 и Тз в следующих комбинациях: поставщик Пі — все три вида товаров, поставщик П2 — товары Ті и Тз, поставщик Пз — това­ры Т2 и Тз. Сначала построим логическую модель БД, основан­ную на иерархическом подходе.

Иерархическая модель представляется в виде древовидного графа, в котором объекты выделяются по уровням соподчинен- ности (иерархии) объектов (рис. 5.3).

Рис. 5.3. Иерархическая модель БД


На верхнем, первом уровне находится информация об объекте "поставщики" (П), на втором — о конкретных поставщиках Пь П2 и Пз, на нижнем, третьем, уровне — о товарах, которые могут поставлять конкретные поставщики. В иерархической модели дол­жно соблюдаться правило: каждый порожденный узел не может иметь больше одного порождающего узла (только одна входящая стрелка); в структуре может быть только один непорожденный узел (без входящей стрелки) — корень. Узлы, не имеющие входных стре­лок, носят название листьев. Узел интегрируется как запись. Для поиска необходимой записи нужно двигаться от корня к листьям, т.е. сверху вниз, что значительно упрощает доступ.

Достоинство иерархической модели данных состоит в том, что она позволяет описать их структуру как на логическом, так и на физическом уровне. Недостатками данной модели являются жесткая фиксированность взаимосвязей между элемен­тами данных, вследствие чего любые изменения связей требуют изменения структуры, а также жесткая зависимость физической и логической организации данных. Быстрота доступа в иерархи­ческой модели достигнута за счет потери информационной гиб­кости (за один проход по дереву невозможно получить информа­цию о том, какие поставщики поставляют, например, товар Указанные недостатки ограничивают применение иерархической структуры.

В иерархической модели используется вид связи между элемен­тами данных "один ко многим". Если применяется взаимосвязь вида "многие ко многим", то приходят к сетевой модели данных.

Сетевая модель базы данных для поставленной задачи пред­ставлена в виде диаграммы связей (рис. 5.4). На диаграмме указа­ны независимые (основные) типы данных Пі, П2 и Пз, т.е. ин­формация о поставщиках, и зависимые — информация о товарах Т], Т, и Т3. В сетевой модели допустимы любые виды связей меж­ду записями и отсутствует ограничение на число обратных свя­зей. Но должно соблюдаться одно правило: связь включает ос­новную и зависимую записи.

Рис. 5.4. Сетевая модель БД


Достоинство сетевой модели БД — большая информаци­онная гибкость по сравнению с иерархической моделью. Однако сохраняется общий для обеих моделей недостаток — доста­точно жесткая структура, что препятствует развитию информа­ционной базы системы управления. При необходимости частой реорганизации информационной базы (например, при исполь­зовании настраиваемых базовых информационных технологий) применяют наиболее совершенную модель БД — реляционную, в которой отсутствуют различия между объектами и взаимосвязями.

В реляционной модели базы данных взаимосвязи между элемен­тами данных представляются в виде двумерных таблиц, называе­мых отношениями. Отношения обладают следующими свойства­ми: каждый элемент таблицы представляет собой один элемент данных (повторяющиеся группы отсутствуют); элементы столб­ца имеют одинаковую природу, и столбцам однозначно присво­ены имена; в таблице нет двух одинаковых строк; строки и стол­бцы могут просматриваться в любом порядке вне зависимости от их информационного содержания.

Преимуществами реляционной модели БД являются про­стота логической модели (таблицы привычны для представления информации); гибкость системы защиты (для каждого отноше­ния может быть задана правомерность доступа); независимость данных; возможность построения простого языка манипулиро­вания данными с помощью математически строгой теории реля­ционной алгебры (алгебры отношений). Собственно, наличие строгого математического аппарата для реляционной модели баз данных и обусловило ее наибольшее распространение и перспек­тивность в современных информационных технологиях.

Для приведенной выше задачи о поставщиках и товарах логи­ческая структура реляционной БД будет содержать три таблицы (отношения): Л\, Яз, состоящие соответственно из записей о поставщиках, о товарах и о поставках товаров поставщиками (рис. 5.5).

Рис. 5.5. Реляционная модель БД


Учитывая широкое применение реляционных моделей баз дан­ных в информационных технологиях (особенно экономических), дадим более подробное описание этой структуры.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 
25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47  Наверх ↑