5.1. ВЫБОР ХРАНИМЫХ ДАННЫХ
Информационный фонд системы управления должен обеспечивать получение выходных наборов данных из входных с помощью алгоритмов обработки и корректировки данных. Это возможно, если создана инфологическая модель предметной области, которая вместе с наборами хранимых данных и алгоритмами их обработки позволяет построить каноническую модель (схему) информационной базы, а затем перейти к логической схеме и далее — к физическому уровню реализации.
Инфологической (концептуальной) моделью предметной области называют описание предметной области без ориентации на используемые в дальнейшем программные и технические средства. Однако для построения информационной базы инфологической модели недостаточно. Необходимо провести анализ информационных потоков в системе в целях установления связи между элементами данных, их группировки в наборы входных, промежуточных и выходных элементов данных, исключения избыточных связей и элементов данных. Получаемая в результате такого анализа безызбыточная структура носит название канонической структуры информационной базы и является одной из форм представления инфологической модели предметной области.
Для анализа информационных потоков в управляемой системе исходными являются данные о парных взаимосвязях, или отношениях (т.е. есть отношение или нет отношения), между наборами информационных элементов. Под информационными элементами понимают различные типы входных, промежуточных и выходных данных, которые составляют наборы входных промежуточных Л'2 и выходных А'з элементов данных.
Формализованно связи (парные отношения) между наборами информационных элементов отображаются в виде матрицы смежности В, под которой понимают квадратную бинарную матрицу, проиндексированную по обеим осям множеством информационных элементов Б = {с1\ с12,~.,с15}. где .? — число этих элементов:
|
|
. |
|
• |
4 |
«11 |
Ч\2 • |
■ чм - |
Яь |
|
921 |
«22 • |
• «V ■ |
• 42, |
|
9п |
412 • |
•я, .. |
■ ЙЫ |
|
|
• |
• |
|
1, если между с/, и с1. • отношение существует;
О, в противном случае;
В позиции (/, ]) матрицы смежности записывают 1 (т.е. = 1), если между информационными элементами ф и й] существует отношение Ло, такое, что для получения значения информационного элемента необходимо непосредственное обращение к элементу с1]. Наличие такого отношения между с1{ и ^ обозначают в виде чему соответствует = а отсутствие — в виде
Щ ^, т.е. ду = 0. Для простоты принимают, что каждый информационный элемент недостижим из самого себя:
Матрице В ставится в соответствие информационный граф О - (Л, Яо). Множеством вершин графа О - (А /?о) является множество Б информационных элементов, а каждая дуга (йи <г//) соответствует условию 4' Ро Ф, т.е. записи 1 в позиции (г/) матрицы В.
Например, задано множество Б из четырех наборов информационных элементов, т.е. Б = й?2, ^з, й4}. Пусть матрица смежности В этих элементов имеет вид:
Из этой матрицы видно, что для вычисления элемента ^з необходимо обращение к элементам й\ и ^ а для получения элемента й/4 — к элементу (1у Чтобы получить элемент й\ надо обратиться к Элемент не зависит от других элементов матрицы. Информационный граф в этом простейшем случае будет соответствовать рис. 5.1.
Рис. 5.1. Информационный граф О = (ДЛо) |
В общем случае структура графа О = (А^о) вследствие неупорядоченности сложна для восприятия и анализа. Составлейная на основе инфологической модели, она не гарантирована от неточностей, ошибок, избыточности и транзитивности. Для формального выделения входных, промежуточных и выходных наборов информационных элементов, определения последовательности операций их обработки, анализа и уточнения взаимосвязей на основе графа О = (А/? о ) строят матрицу достижимости.
Матрицей достижимости М называют квадратную бинарную матрицу, проиндексированную по обеим осям множеством информационных элементов Б аналогично матрице смежности В. Запись 1 в каждой позиции (у) матрицы достижимости соответствует наличию для упорядоченной пары информационных элементов (й], й]) смыслового отношения достижимости Я. Элемент ^ достижим из элемента й], т.е. выполняется условие й] Я0 й], если на графе О - (А^о) существует направленный путь от вершины к вершине (в процессе получения значения элемента
используется значение элемента й]). Если Л/Я0 й], то отношение достижимости между элементами й] и с/, отсутствует и в позиции (у) матрицы М записывают 0. Отношение достижимости транзитивно, т.е. если и йк Я о й], то й]Я
йр г,], к = 1,
Записи 1 в столбце матрицы М соответствуют информационным элементам которые необходимы для получения значений элементов и образуют множество элементов предшествования для этого элемента. Записи 1 в строке матрицы М соответствуют всем элементам достижимым из рассматриваемого элемента й] и образующим множество достижимости этого элемента. Информационные элементы, строки которых в матрице М не содержат единиц (нулевые строки), являются выходными информационными элементами, а информационные элементы, соответствующие нулевым столбцам матрицы М, являются входными. Это условие может служить проверкой правильности заполнения матриц если наборы входных и выходных информационных элементов известны. Информационные элементы, не имеющие нулевой строки или столбца, являются промежуточными.
Для полученного графа (см. рис. 5.1) матрица М будет выглядеть следующим образом:
|
Отличие столбцов матриц М и В объясняется тем, что в матрице Мучитывается смысловое отношение Я между информационными элементами, а в матрице В — только непосредственно /?0- Например, элемент (1$ в матрице Мдостижим из элементов и с1% т.е. d\Rd4, и в то время как в матрице В
для этих элементов </4 достижим только из й-!), т.е. только й?з/?0^4- Из анализа матрицы М следует, что элемент является входным, ^4— выходным, остальные — промежуточные. На основе матрицы М строится информационный граф Оя (А Я) системы, структурированный по входным (Ы\), промежуточным (N2) и выходным наборам информационных элементов и полученный из анализа множества элементов предшествования и достижимости Я (й]) (рис. 5.2).
В общем случае информационный граф системы в отличие от вычисленного графа может иметь контуры и петли, что объясняется необходимостью повторного обращения к отдельным элементам данных.
Информационный граф системы структурируется по
уровням (N1, N2, N3) с использованием итерационной процедуры, что позволяет определить информационные входы и выходы системы, выделить основные этапы обработки данных, их последова-
6-1909
тельность и циклы обработки на каждом уровне. Кроме того, удаляются избыточные (лишние) дуги и элементы. Граф, получаемый после структуризации по наборам информационных элементов и удаления избыточных элементов и связей, определяет каноническую структуру информационной базы. Таким образом, каноническая структура задает логически неизбыточную информационную базу. Выделение наборов элементов данных по уровням позволяет объединить множество значений конечных элементов в логические записи и тем самым упорядочить их в памяти ЭВМ.
От канонической структуры переходят к логической структуре информационной базы, а затем к физической организации информационных массивов. Каноническая структура служит также основой для автоматизации основных процессов предпроект- ного анализа предметных областей систем управления.
Процедуры хранения, актуализации и извлечения данных непосредственно связаны с базами данных, поэтому логический уровень этих процедур определяется моделями баз данных.
25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 Наверх ↑