Глава 4. Проектирование классификаторов технико-экономической информации 4.1. Основные понятия классификации экономической информации

В условиях рыночной экономики возрастает роль информации как одного из наи­более важных ресурсов предприятия, необходимого для принятия эффективных и свое­временных управленческих решений. Одной наиболее существенных компонент этого ре­сурса является экономическая информация, основными особенностями которой являются:

большие объёмы, ежегодно создаваемой, обрабатываемой и хранимой информа­ции (до нескольких сотен млн. символов в год для среднего предприятия);

большая часть этой информации имеет символьное представление, слабо приспо­собленное для логической и арифметической обработки;

высокий уровень стоимостных и трудовых затрат на поиск и ее обработку.

Для того чтобы приспособить экономическую информацию для эффективного по­иска, обработки на ЭВМ и передачи по каналам связи, её необходимо представить в циф­ровом виде, с этой целью её нужно сначала упорядочить (классифицировать), а затем формализовать (закодировать) с использованием классификатора. Классификатор - это документ, с помощью которого осуществляется формализованное описание экономиче­ской информации в ЭИС, содержащий наименования объектов, наименования классифи­кационных группировок и их кодовые обозначения.

Экономическая информация существует в двух формах: в форме экономических показателей и документов.

Экономический показатель является составной единицей информации, отражаю­щей количественную характеристику некоторого процесса предметной области - рекви­зит-основание вместе с однозначно определяющими его качествами реквизитами- признаками [ ]. Структура показателя представлена на рис. 4.1.

Рис. 4.1. Схема структуры экономического показателя

Реквизиты-основания подразделяются по типу алгоритмов их получения на коли­чественные, стоимостные, проценты, удельные веса и др. Множество реквизитов- признаков по степени формализации делится на два подмножества:

справочные реквизиты-признаки, как правило, наименования, предназначенные для понимания показателя пользователем-экономистом;

группировочные, являющиеся, как правило, закодированными аналогами спра­вочных признаков и предназначенными для логической обработки информации на ЭВМ.

Основными объектами классификации и кодирования являются справочные ре­квизиты-признаки, описывающие процессы, место, время выполнения процессов, субъек­ты и объекты действия, отражаемые в показателе. Например, к числу наименований эле­ментов можно отнести наименования материальных, трудовых, денежных, энергетических ресурсов, основных средств, готовой продукции и услуг. К числу наименований процес­сов относятся наименования функций управления, деловых процессов, операций поступ­ления сырья и материалов, отпуска их в производство, производства и выпуска готовой продукции или оказания услуг, процессов выполнения заказов, обслуживания клиентов, хранения, реализации готовой продукции, расчетов с поставщиками и покупателями, по­лучения оплаты за реализованную продукцию и т. д.

К числу объектов классификации и кодирования относятся также наименования показателей и документов. Помимо этого к числу объектов классификации и кодирования относят также наименования компонент проекта ЭИС, в том числе файлов, задач, подсис­тем, программных модулей и др.

Целью разработки классификаторов является установление соответствия между значениями справочных или описательных признаков какого-либо элемента или процесса и значениями группировочных признаков, например, между значением реквизита «Фами­лия И.О. рабочего» и значением «Табельный номер» рабочего или между значениями «Наименование материала» и «Код материала».

Для кодирования объектов необходимо их упорядочить по некоторым признакам. Результат упорядоченного распределения объектов заданного множества носит название классификации, а совокупность правил распределения объектов множества на подмно­жества носит название системы классификации. Процесс распределения объектов клас­сификации в соответствии с принятой системой классификации носит название процесса классифицирования. То свойство или характеристика объекта классификации, которое позволяет установить его сходство или различие с другими объектами классификации но­сит название признака классификации. Множество или подмножество, объединяющее часть объектов классификации по одному или нескольким признакам носит название классификационной группировки.

Основанием классификации называется тот признак, по которому ведётся раз­биение множества на подмножества на определенной ступени классификации. Ступень классификации - это результат очередного распределения объектов одной классифика­ционной группировки. Уровень классификации - это совокупность классификационных группировок, расположенных на одних и тех же ступенях классификации. Глубина сис­темы классификации - это количество уровней классификации, допустимое в данной системе.

Каждая система классификации характеризуется следующими свойствами:

гибкостью системы,

ёмкостью системы,

степенью заполненности системы (коэффициент заполненности).

Гибкость системы - это способность допускать включение новых признаков, объ­ектов без разрушения структуры классификатора. Гибкость определяется временем жизни (Тж) системы.

Емкость системы - это наибольшее количество классификационных группировок, допускаемое в данной системе классификации (Р).

Степень заполненности системы (Кзап) определяется как частное от деления фак­тического количества группировок (Оф) к величине ёмкости системы (Р):

Кзап = Оф/Р.

В настоящее время чаще всего применяются два типа систем классификации: ие­рархическая и многоаспектная.

Характерными особенностями иерархической системы являются:

наличие в системе неограниченного количества признаков классификации;


соподчинённость признаков классификации, что выражается в разбиении каждой классификационной группировки, образованной по одному признаку, на множество клас­сификационных группировок по нижестоящему (подчинённому) признаку.

При построении иерархической системы классификации сначала выделяется неко­торое множество объектов, подлежащее классифицированию - (Мо), для которого опре­деляется полное множество признаков классификации (О) и их соподчиненность друг другу, затем производится разбиение исходного множества объектов на классификацион­ные группировки на каждой ступени классификации (см. рис. 4.2).

При использовании иерархической системы классификации необходимо соблюдать следующие ограничения:

получающиеся на каждом уровне классификационные группировки должны со­ставлять исходное множество объектов - Мо;

классификационные группировки Х]к на каждой ступени не должны пересекаться;

классификация на каждой ступени должна проводиться только по одному призна­ку (О).

К положительным сторонам данной системы следует отнести логичность, простоту ее построения и удобство логической и арифметической обработки.

Мо={х1,х2,...,х1,...,хп} - мощность классифицируемого множества

g1,g2,... - признаки классификации.

Рис. 4.2. Схема построения иерархической системы классификации

Однако эта система характеризуется жёсткой структурой классификации, не позво­ляющей вносить новые признаки или изменять их последовательность. Гибкость этой сис­темы обеспечивается только за счёт ввода большой избыточности в ветвях, что приводит к слабой заполненности структуры классификатора.

Недостатки, отмеченные в иерархической системе, отсутствуют в других системах, которые относятся к классу - многоаспектных систем классификации. Аспект - точка зрения на объект классификации, который характеризуется одним или несколькими при­знаками. Многоаспектная система - это система классификации, которая использует па­раллельно несколько независимых признаков (аспектов) в качестве основания классифи­кации. Существует два типа многоаспектных систем: фасетная и дескрипторная. Фасет - это аспект классификации, который используется для образования независимых класси­фикационных группировок. Дескриптор - ключевое слово, определяющее некоторое по­нятие, которое формирует описание объекта и даёт принадлежность этого объекта к клас­су, группе и т. д.

Фасетная система характеризуется следующими особенностями построения:

имеется некоторое множество классифицируемых объектов (Мо);

это множество можно рассматривать в нескольких аспектах, каждый из которых может характеризоваться одним или несколькими признаками, образующими фасет - Фг;

устанавливается некоторый порядок следования фасетов с помощью фасетной формулы (при этом последовательность фасетов определяется по частоте обращения к этим фасетам на некотором множестве заданных задач):

Б = (Ф1,Ф2,...,Фг,...,ФЯ),

- определяется количество подмножеств классификационных группировок, число которых определяется числом задач, обращающихся при своем решении к тем или иным фасетам (см. рис.4.3)

Рис. 4.3. Схема построения фасетной системы классификации

Внутри фасета значения признаков могут просто перечисляться по некоторому по­рядку или образовывать сложную иерархическую структуру, если существует соподчи- нённость выделенных признаков.

К преимуществам данной системы следует отнести большую ёмкость системы и высокую степень гибкости, поскольку при необходимости можно вводить дополнитель­ные фасеты и изменять их место в формуле. К числу недостатков, характерных для данной системы можно отнести сложность структуры и низкую степень заполненности системы.

Рассмотренные выше системы классификации хорошо приспособлены для организа­ции поиска с целью последующей логической и арифметической обработки информации на ЭВМ и лишь частично решают проблему содержательного поиска экономической инфор­мации при принятии управленческих решений. Это объясняется далеко не полным охватом этими системами всех понятий и терминов, используемых для выражения смысла экономи­ческих показателей и документов. Помимо этого, в этих системах не решается проблема обеспечения однозначности используемой терминологии, идентификации роли отдельных терминов в их общей последовательности при формировании наименований экономических показателей. К числу недостатков этих систем классификации можно отнести также и то, что в них не отражаются все отношения между терминами, необходимые для формализации содержания показателей и документов и установления взаимосвязей между показателями и документами, используемых на этапе принятия управленческих решений.

Для поиска показателей и документов по набору содержательных признаков ис­пользуется информационный язык дескрипторного типа, который характеризуется сово­купностью терминов, дескрипторов, или лексикой, и набором отношений между термина­ми. Эти отношения могут быть двух типов:

постоянные логические отношения между терминами, вытекающие из отноше­ний между отображаемыми объектами, которые называются парадигматическими отно­шениями;

переменные отношения между понятиями, возникающие в процессе построения конкретного высказывания, например, показателя, называемые синтагматическими отно­шениями.

Парадигматические отношения между терминами отражают статику языка. К числу этих отношений относятся, например, родовидовые отношения. При этом родовым называется термин или понятие, выражающее существенные признаки класса предметов, в состав которого входят предметы, являющиеся видами этого рода. Видовое понятие выражает существенные признаки подкласса предметов, являющегося видом какого-либо другого класса предметов и входящего в состав этого класса. Например, понятие «машин­ный носитель» является родовым по отношению к понятиям «жесткий магнитный диск», «гибкий диск», «магнитная лента» и т.д. Отношения этого типа отражаются в классифика­торах экономической информации.

Синтагматические отношения составляют грамматику этого языка, т.е. правила построения высказываний из набора терминов или понятий. Такие отношения использу­ются в динамике при вводе данных и формулировании запросов.

В зависимости от того, на каком этапе фиксируются все возможные выражения, языки делятся на предкоординированные и посткоординируемые. Предкоординирован- ными называются языки, в которых на стадии разработки выделяются все высказывания в терминах этих языков и тем самым заранее определяются постоянные отношения между терминами. Для посткоординируемых языков характерна предварительная фиксация лишь постоянных отношений. Все высказывания образуются при использовании лексики данного языка и его грамматики. Языки предкоординированного типа менее гибки при использовании, так как с их помощью можно описывать только те выражения, которые были заранее зафиксированы. Использование посткоординированных языков позволяет образовывать с их помощью значительно большее число высказываний.

Наиболее типичным примером предкоординированных языков являются классифи­кационные языки, основанные на использовании иерархической и многоаспектной систем классификации, преимущества и недостатки которых были рассмотрены ранее. К числу языков классификационного типа можно отнести разрабатываемый ныне общесистемный классификатор технико-экономических показателей (ОКТЭП). Этот классификатор пред­ставляет собой способ упорядоченного представления системы показателей и средства их взаимной увязки на основе многоаспектной классификации этих показателей, которая должна отражать наиболее существенные с точки зрения народного хозяйства методоло­гические особенности их расчета, взаимосвязи показателей, наиболее важные признаки группировки показателей и их поиска в ЭИС.

Общим недостатком информационных языков классификационного типа является их слабая приспособленность к новым, заранее не предусмотренным условиям функцио­нирования систем, возможность составления запросов на этих языках регламентированно­го содержания. Эти недостатки отсутствуют у языков посткоординированного типа, к числу которых относятся дескрипторные языки, основанные на применении метода «ко­ординатного» или ассоциативного индексирования.

Согласно идее координатного индексирования предполагается, что содержание до­кументов или показателей можно достаточно полно и точно отразить с помощью списка ключевых слов - дескрипторов. Дескриптор - это термин естественного языка (слово или словосочетание), используемый при описании документов или показателей, который име­ет самостоятельный смысл и неделим без изменения своего значения. Например, показа­тель «Количество продукции, выработанное фактически цехом за смену», записанный на естественном языке, при использовании метода координатного индексирования будет иметь вид: «Количество, продукция, выработка, фактический, цех, смена».

Для того чтобы обеспечить точность и однозначность поиска с помощью такого языка, необходимо предварительно определить все постоянные отношения между терми­нами: родовидовые, отношения синонимии, омонимии и полисемии, а также ассоциатив­ные отношения. Характеристика родовидовых отношений была дана выше. Особый вид парадигматических отношений представляют отношения синонимии, омонимии и поли­семии, всегда присутствующие в естественных языках.

Синонимия - это отношение между двумя и более различными ключевыми слова­ми, когда они имеют одинаковое значение, обозначают один и тот же предмет или поня­тие. Можно выделить синонимы с одним корнем, но с различным морфологическим со­ставом (например, «производство» и «произведено»), с различными корнями (например, «издержки» и «расходы»). К синонимам относятся также термины, которые могут суще­ствовать как в полном, так и в сокращенном виде, например, «научно-исследовательские работы» и «НИР», «кубические метры» и «куб. м.».

Омонимия - это такое отношение между одинаковыми по звучанию и написанию ключевыми словами, когда они имеют разное значение и обозначают разные предметы и понятия. Можно выделить термины, обозначающие такие разные понятия, объемы кото­рых не пересекаются, и называемые полными омонимами. Например, термин «прокат» используется в двух различных смыслах: «прокат тонкой листовой стали» и «сдача пред­метов во временное пользование», поэтому он относится к числу полных омонимов. Од­нако встречаются термины, обозначающие разные понятия, объемы которых пересекают­ся. Такие термины называются частичными омонимами. Явление частичной омонимии носит название полисемии.

Большое значение для построения дескрипторного языка имеет выявление и фик­сирование ассоциативных отношений между терминами, которые позволяют выдавать бо­лее точные ответы на запросы пользователей. К числу ассоциативных отношений относят такие, как: отношение части к целому (например, «цех» - «участок»), причинно- следственные отношения (например, «прогул» - «невыполнение»), связи предмета и про­цесса (например, «план» - «планирование») и др.

Все выделенные отношения явно описываются в систематическом словаре понятий - тезаурусе, который разрабатывается с целью проведения индексирования документов, показателей и информационных запросов.

В свою очередь дескрипторные языки различаются по семантической силе, которая определяется тем, какой объем сведений может индексироваться с их применением. Се­мантическая сила языка зависит от числа типов постоянных отношений, фиксируемых в тезаурусе, а также от наличия средств грамматики и степени их сложности. В соответст­вие с этим признаком дескрипторные языки подразделяются на языки без грамматики, языки с неполной грамматикой и языки с развитой грамматикой. При этом языки первого вида содержат только словари используемых ключевых слов и тезаурусы. В языках с не­полной грамматикой помимо словарей и тезаурусов имеются правила взаимосвязи только некоторых категорий терминов. Языки с развитой грамматикой позволяют описывать с помощью всех средств сложные высказывания.

В том случае, если объектом поиска в ЭИС является документ, для этих целей ис­пользуют информационные языки дескрипторного типа без грамматики. При необходимо­сти хранения и осуществления поиска экономических показателей проектировщики отда­ют предпочтение языкам второго и третьего типа.

4.2. Понятие и основные системы кодирования экономической информации

Для полной формализации экономической информации недостаточно простой классификации, поэтому проводят следующую процедуру - кодирование. Кодирование - это процесс присвоения условных обозначений объектам и классификационным группам по соответствующей системе кодирования. Система кодирования - это совокупность правил обозначения объектов и группировок с использованием кодов. Код - это условное обозначение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой. Код базируется на определенном алфавите (некоторое множество знаков). Число знаков этого множества называется основанием кода. Различают следую­щие типы алфавитов: цифровой, буквенный и смешанный.

Код храктеризуется следующими параметрами:

длиной (Ь);

основанием кодирования (А);

структурой кода, под которой понимают распределение знаков по признакам и объектам классификации;

степенью информативности (I) , рассчитываемой как частное от деления общего количества признаков(Я) к длине кода (Ь):

I = Я/Ь;

коэффициентом избыточности (Кизб), который определяется как отношение мак- симльного количества объектов (Омах) к фактическому количеству объектов(Офакт):

Кизб = Омах/ Офакт.

Все системы кодирования можно сгруппировать в два подмножества (см. рис.4.4): регистрационных и классификационных систем кодирования.

Особенностью регистрационных систем кодирования является их независимость от применяемых систем классификации. Регистрационные коды используются для иден­тификации объектов и передачи информации об объектах на расстояние, поэтому они должны удовлетворять следующим требованиям: минимальности длины кода, однознач­ности соответствия наименования объекта и его кода в течение длительного периода вре­мени и защищённость кода от помех и ошибок.

Рис 4.4. Схема классификации систем кодирования

Регистрационные коды состоят из двух частей: информационной и контрольной, предназначенной для защиты передаваемой информации от ошибок. Контрольная часть может рассчитываться по различным алгоритмам, в частности наиболее употребляемыми являются следующие формулы их расчета:

К = М - [ЕХ / М] ,

К = М - [Е XI * В1 / М],

где М - модуль (простое число, делящееся на единицу и на само себя), XI - информационные разряды, 1- номер разряда, В1 - вес информационного разряда.

К регистрационным системам относятся порядковая и серийная системы кодирования.

Порядковая система - это наиболее простая по своему построению система коди­рования, суть использования которой заключается в последовательном присвоении каждо­му объекту кодируемого множества - Мо номера его порядка, т.е. в присвоении цифр нату­рального ряда в порядке расположения объектов. Этот порядок может быть случайным или определяться после предварительной группировки объектов, например, по алфавиту.

Как правило, порядковую систему применяют для кодирования малозначных, усто­явшихся и простых множеств объектов, не требующих предварительной классификации.

Серийная (серийно-порядковая) система кодирования отличается от порядковой тем, что номенклатура кодируемых объектов - Мо предварительно должна быть разбита на группировки по одному признаку и каждой группировке должна быть отводена серия кодовых обозначений, в пределах которой каждому элементу присваивается свой код по порядку. Серия обозначений для каждой группировки определяются таким образом, что­бы после присваивания кодов элементам этой группы в ней оставались бы еще свободные номера на случай появления новых объектов.

Классификационные коды используют для отражения классификационных взаи­мосвязей объектов и группировок и применяются в основном для сложной логической об­работки экономической информации на ЭВМ, отсюда вытекают требования: однозначно­сти отображения классификационных взаимосвязей объектов и их группировок и обеспечение максимальной простоты программирования. Группу классификационных систем кодирования можно разделить на две подгруппы в зависимости от того, какую систему классификации используют для упорядочения объектов.

Последовательные системы кодирования характеризуются тем, что они базирует­ся на предварительной классификации по иерархической системе классификации, в ре­зультате использования которой коды нижестоящих группировок образуются путём до­бавления кодов к кодам вышестоящих группировок.

Параллельные системы кодирования характеризуется тем, что они строятся на основе использования фасетной системы классификации и коды группировок по фасетам формируются независимо друг от друга.

Последовательные и параллельные системы кодирования строятся на базе разряд­ной или комбинированной систем кодирования.

Разрядная система применяется для кодирования объектов, определяемых несколькими соподчиненными признаками, используемыми для решения экономических задач. Кодируемые объекты систематизируются по классификационным признакам на ка­ждой ступени классификации, каждому признаку отводится определенное число разрядов, в пределах которых кодирование группировок начинается с единицы. При разрядной системе кодирования имеет место так называемое «зависимое» кодирование. Это значит, что классификационные группировки по младшим признакам кодируются в зависимости от кода группировки, образованной по старшему признаку. Запас свободных позиций определяется структурой кода.

Код объекта, построенный по этой системе, состоит из такого числа позиций (или числа групп разрядов), сколько было учтено признаков для объектов, поэтому разрядная система кодирования называется иногда позиционной системой. Конкретное значение признака, характеризующего объект, определяется позицией и значением определенного числа в структуре кода. Длина кода зависит от числа ступеней классификации, от числа классификационных группировок на каждой ступени и от основания кодирования.

Комбинированная система кодирования, обладая всеми преимуществами разряд­ного кода, применяется для кодирования больших номенклатур (перечней) объектов, ко­торые характеризуются многими соподчиненными или независимыми признаками. Эта система базируется на сочетании принципов построения таких систем кодирования, как разрядная, серийная, порядковая и кода повторения.

Код повторения (мнемокод) - это буквенные или буквенно-цифровые коды, кото­рые характеризуется тем, что в структуру кода переносят часть символьных обозначений объектов с целью повышения мнемоничности кода или для сокращения его длины.

Выбор конкретной системы кодирования зависит от объема кодируемой номенкла­туры, ее стабильности, от задач, стоящих перед системой, и от показателей эффективно­сти обработки информации при использовании какой-либо системы.

4.3. Состав и содержание операций проектирования классификаторов

Все классификаторы, разрабатываемые и используемые в ЭИС, имеют эталонную и рабочую формы. Эталонная форма классификатора - это официальное издание класси­фикатора на бумажном носителе, удобное для осуществления его ведения. Рабочая фор­ма классификатора - это весь классификатор или его раздел, занесённый на машинный носитель и удобный для обработки информации.

Весь процесс разработки системы классификаторов для ЭИС можно разбить на че­тыре этапа (на рис. 4.5 приведена блок-схема процесса разработки классификатора).

На первом этапе - «Разработка ТЗ на проектирование» выполняется две работы. Первая из них связана с определением состава, назначения и сферы действия классифика­торов, используемых в системе. Перечень классификаторов определяется на основе ана­лиза реквизитного состава первичных и результатных документов и выделения всей сово­купности реквизитов - признаков.

Далее определяют назначение классификаторов. Каждый классификатор может быть предназначен для однозначной идентификации объекта, передачи информации на расстояние по каналам связи или для поиска и логической обработки первичной инфор­мации с целью получения и выдачи результатной информации.

По сфере действия выделяют следующие виды классификаторов: международные, общегосударственные (общесистемные), отраслевые и локальные классификаторы.

Международные классификаторы входят в состав Системы международных эко­номических стандартов (СМЭС) и обязательны для передачи информации между органи­зациями разных стран мирового сообщества. СМЭС представляет собой множество стан­дартных решений по классификационным группировкам и кодированию специальной и экономической информации и формированию источников этой информации. В состав СМЭС входят классификации Организации Объединенных наций (ООН) и ее специализи­рованных образований, в том числе:

Международная стандартная отраслевая классификация всех видов экономиче­ской деятельности (МСОК);

Классификация основных продуктов (КОП);

Международная стандартная торговая классификация (МСТК);

Классификация по широким экономическим категориям (КШЭК);

Классификация функций органов управления (КФОУ);

Классификация функций правительства;

Классификации продовольственных и сельскохозяйственных организаций (RAO);

Классификации международной организации труда (МОТ);

Классификации ООН по вопросам образования, науки и культуры (ЮНЕСКО);

Международная стандартная классификация образования (МСКО).

К числу классификаций, разработанных другими международными организациями, относят:

Классификация международного энергетического агентства (МЭА);

Классификация Совета таможенного сотрудничества;

Система описания и кодирования товаров;

Классификация Всемирной туристической организации (ВТО);

Классификация деятельности, связанной с туризмом.

Классификации Европейского сообщества и других международных региональных организаций относят:

Классификацию Европейского сообщества (ЕС);

Общую отраслевую классификацию экономической деятельности в рамках ЕС (КДЕС) и другие.

Второй класс классификаторов образуют общегосударственные (общесистемные)

классификаторы, обязательные для организации процессов передачи и обработки инфор­мации между экономическими системами государственного уровня внутри страны, состав которых будет рассмотрен в другом разделе.

Для выполнения процедур обработки информации и передачи ее между организа­циями внутри отрасли используют отраслевые классификаторы. В пределах отдельных предприятий используют, как правило, локальные классификаторы.

Выполнение работ второго этапа связано с определением состава исходных данных и требований к разрабатываемым классификаторам.

К числу исходных данных, используемых в процессе проектирования, классифи­каторов относят:

состав задач, для которых разрабатывается классификатор;

состав объектов классификации и мощность множества;

состав признаков классификации и число значений каждого признака;

наименования отдельных группировок и объектов;

динамика процесса изменяемости состава задач, объектов и признаков.

Рис. 4.5. Схема разработки классификатора

К числу требований, которым должны удовлетворять разрабатываемые классифи­каторы, можно отнести:

полноту охвата объектов и признаков классификации каждым классификатором,

согласованность признаков деления множеств объектов с алгоритмами обработки экономической информации,

взаимную однозначность наименований объектов и их кодовых обозначений,

простоту кодирования и возможность автоматизации классификации и кодирования,

возможность увязки с другими классификаторами и системами обозначений,

эффективность использования классификатора при обработке информации.

Содержанием второго этапа является «Разработка методических материалов про­ектирования», который включает, прежде всего, разработку основных критериев и прин­ципов построения каждого классификатора. К числу критериев построения классифика­тора относятся такие, как:

критерий отнесения того или иного объекта к конкретному классифицируемому множеству;

степень охвата кодируемого множества объектов.

Принципы построения классификатора определяются структурой классификатора, т.е. количеством ветвей, выходящих из каждой классификационной группировки, количе­ством ступеней и числом уровней классификации. Классификатор считается однород­ным, если на каждой ступени из каждой классификационной группировки выходит оди­наковое количество ветвей. Кроме того, на этом этапе разрабатывается система взаимо­действия классификаторов разных уровней, предназначенных обеспечивать взаимодейст­вие ЭИС с внешней средой. Эта работа представляет собой разработку некоторого транслятора перехода от одного классификатора к другому. Но чтобы ее создать, необхо­димо провести выбор некоторой системы взаимодействия различных классификаторов, ориентированных на некоторую номенклатуру объектов. Существуют следующие систе­мы взаимодействия:

а)        Система равноправных классификаторов, которая характеризуется тем, что на каждом уровне управления для целей обработки информации используется свой локаль­ный классификатор, а для получения или передачи информации из внешней среды ис­пользуется соответствующий транслятор. Недостаток данной системы заключается в том, что та система, которая имеет на входе наибольшее количество потоков информации от различных организаций, должна иметь наибольшее количество трансляторов.

б)        Система приоритетных классификаторов, применяется для предприятий од­ной отрасли. При этой системе на каждом предприятии этой отрасли и на каждом уровне управления имеются локальные классификаторы. Обмен информацией осуществляется в терминах классификатора вышестоящего уровня. Эта система даёт уменьшение количест­ва трансляторов независимо от числа входных и выходных потоков. Однако трудности возникают при передаче потоков информации между предприятиями, относящимися к разным отраслям.

в)        Система классификаторов-посредников, применяется при межотраслевом управлении. На каждом объекте каждого уровня управления обработка ведётся в терми­нах своего локального классификатора, а обмен ведётся в терминах одного классификато­ра-посредника. Преимущества такой системы заключаются в необходимости создания только одного транслятора для каждого предприятия и в обеспечении возможности цен­трализованного ведения классификатора-посредника, что дает минимальное количество ошибок при кодировании информации и обеспечивает информационную совместимость ЭИС разных уровней.

г)         Система единого классификатора для обработки информации на всех предпри­ятиях, входящих в состав экономической макросистемы, и для передачи этой информации между ними возможна только гипотетически, но реально ее нельзя осуществить из-за не­обходимости осуществления кодирования всей информации, существующей в стране, ис­пользуя очень громоздкие классификаторы.

К числу факторов, влияющих на выбор способа увязки классификатора, относят следующие:

объем и характер обрабатываемой информации,

объем и характер потоков получаемой и передаваемой информации,

минимум трудовых и стоимостных затрат на разработку и эксплуатацию системы ведения классификаторов.

На этом же этапе осуществляется разработка методик построения классификато­ров, отражающих методы и последовательность выполнения отдельных операций по соз­данию классификаторов, содержание которых зависит от выбранных критериев и принци­пов их построения.

Третий этап связан с работами по организации сбора и обработки исходных дан­ных, необходимых для составления классификаторов. К их числу относится разработка инструктивных материалов по сбору и обработке исходных данных;

определению перечня решаемых задач, использующих классификаторы,

выделению классифицируемых объектов,

определению состава признаков классификации и значений признаков),

осуществлению лингвистической обработки этих данных (удаление синонимов, омонимов, полисемии, антонимов и др.),

согласованию используемой терминологии в исходных данных с ГОСТами.

Другой работой, которую выполняют на этом этапе, является осуществление сбора

и обработки данных согласно разработанным инструкциям.

На четвертом этапе «Составление классификаторов и системы их ведения» осу­ществляется построение эталонной и рабочей формы классификатора и системы ведения классификатора.

Эталонный классификатор должен быть согласован, отпечатан типографским спо­собом и распространен всем пользователям для кодирования информации первичных до­кументов.

Рабочие классификаторы наносятся на машинные носители в необходимых разре­зах, передаются пользователям и заносятся в файлы справочников баз данных для выпол­нения процедуры автоматического заполнения машинных форм первичных документов, и для декодирования результатной информации, получаемой после ее обработки.

К задачам, решаемым системой ведения классификатора, относятся следующие:

актуализация классификатора, т.е. постоянное пополнение объектов классифика­ции и кодирования;

своевременное оповещение всех пользователей о всех происходящих изменениях;

реструктуризация или пересмотр структуры классификатора, при котором осуще­ствляется контроль на дублирование объектов классификации, контроль и выявление ту­пиковых ветвей, не ведущих к объекту, оптимизация резервных ветвей по всем уровням иерархии или по всем аспектам классификации;

К числу проблем, связанных с проектированием системы ведения классификаторов относят:

разработка организационной структуры системы ведения, т. е. службы, которая отвечает за пополнение классификаторов;

разработка юридических основ внесения изменений в классификатор;

разработка информационного и программного обеспечения системы.

Все работы по проектированию классификаторов заканчиваются эксперименталь­ной проверкой и внесением корректив, утверждением, изданием и рассылкой классифи­каторов всем пользователям в функциональные подсистемы.

4.4. Понятие Единой системы классификации и кодирования (ЕСКК)

Для обеспечения информационной совместимости ЭИС разных уровней разработа­на Единая система классификации и кодирования (ЕСКК). ЕСКК предназначена для вы­полнения следующих функций:

централизованной разработки общесистемных (общегосударственных) классифи­каторов;

пополнения и обновления, своевременного и систематического оповещения орга­низаций обо всех изменениях, внесенных в классификаторы;

ответов на разовые запросы;

оптимизировать структуру классификаторов;

- проводить работы по созданию информационно-поисковых языков. Схема структуры ЕСКК приведена на рис 4.6.

Рис. 4.6. Схема структуры ЕССКК

В состав ЕСКК входит три составные части. Первая ее часть - «Комплекс норма­тивно-технических и методологических материалов» включает в себя документы, ко­торые регламентируют:

состав системы, цели системы, задачи и всю используемую терминологию системы;

принципы и методы классификации и кодирования;

категории и сферы действия классификаторов;

принципы сопряжения и взаимодействия классификаторов;

структуру работ по созданию и внедрению системы.

Второй частью является комплекс общесистемных классификаторов (ОК), в ко­торый входят следующие группы классификаторов:

Классификаторы о природных и трудовых ресурсах:

профессии рабочих;

должности служащих;

кадров;

специальностей;

полезных ископаемых и т. д.

Классификаторы о продуктах труда и производственной деятельности:

промышленной и сельскохозяйственной продукции;

строительной продукции;

деталей;

услуг: в промышленности, в строительстве, в сельском хозяйстве, транспорте, ма­териально-техническом снабжении;

услуг населению.

Классификаторы структуры народного хозяйства и объектов администра­тивно-территориального деления:

предприятий и организаций;

отраслей народного хозяйства;

стран;

органов государственного управления;

объектов административно-территориального деления;

пунктов погрузки и разгрузки.

Классификаторы управленческой информации и документации:

единиц измерения;

технико-экономических показателей;

управленческой документации;

технологической документации, обозначений стандартных и технических условий;

технологической документации;

операций и деталей.

Все общесистемные классификаторы в зависимости от используемой системы классификации в процессы их проектирования построены по двум принципам.

Первый принцип основывается на идентификации объектов внутри классифика­ционных группировок. Для примера рассмотрим структуру общесистемного классифика­тора промышленной и сельскохозяйственной продукции (ОКП), который основывается на использовании иерархической системы классификации и состоит из двух блоков: блока наименования и блока идентификации. Блок идентификации состоит из классификацион­ной, регистрационной и контрольной части кода (см. рис. 4.7) Классификационная часть включает группировки по следующим признакам:

класс,

подкласс,

группа,

подгруппа,

вид.

Рис. 4.7. Схема структуры ОКП

Второй принцип основан на применении раздельной идентификации и классифи­кации и фасетной системе классификации, что отражается в структурной формуле клас­сификатора, которая включает три блока: блока идентификации, классификации и наиме­нования. Для примера рассмотрим структуру общесистемного классификатора предприятий и организаций (ОКПО). Этот классификатор основан на использовании фа- сетной системы классификации. Состоит из трех блоков (см. рис. 4.8.):

Блок идентификации, состоит из:

кода отрасли,

регистрационного номера предприятия,

контрольной части кода;

Блок наименования;

Блок классификации, состоит из следующих фасетов:

фасет подчинённости Ф1, в которой можно выделить признаки: код министерства, код управления, код треста;

фасет административно-территориальной принадлежности Ф2;

фасет отраслевой принадлежности.

Рис. 4.8. Схема структуры ОКПО

В составе автоматизированной системы ведения общесистемных классифика­торов (АСВОК) можно выделить три типа подсистем:

объектные подсистемы,

функциональные подсистемы,

обеспечивающие подсистемы.

Объектные подсистемы, объединяют предприятия, отрасли, отраслевые институ­ты, которые отвечают за передачу информации об изменениях, происходящих в заданной номенклатуре, число которых может быть равно числу общесистемных классификаторов.

Функциональные подсистемы объединяют однотипные технологические процес­сы по ведению общесистемных классификаторов и включают в свой состав следующие подсистемы:

сбора, хранения, внесение корректив;

регулярного обслуживания абонентов;

обслуживания по разовым запросам;

развития АСВОК, включая оптимизацию структуры классификаторов, устранение недействительных ветвей классификаторов, стандартизацию терминологии.

Обеспечивающие подсистемы, состоят из типового набора подсистем, к которым относят программное, техническое, информационное и лингвистическое обеспечение.

В состав информационного обеспечения АСВОК входит тезаурус, сводные эталон­ные файлы классификаторов, дополнительные эталонные файлы дополнений и исключае­мых позиций, файлы поисковых образов позиций классификаторов, файлы незанятых по­зиций, таблицы сопряжений классификаторов, вспомогательный файл организаций, ответственных за ведение классификаторов, таблицы периодичности оповещения организаций, вспомогательные файлы интересов абонентов.

4.5. Технология использования штрихового кодирования экономической информации

Развитие международных торговых и производственных связей приводит к росту то­варных и информационных потоков, которые необходимо обрабатывать в условиях терри­ториальной разбросанности производителей и потребителей продукции. Трудности учета информации о свойствах товара на его упаковке, наличие неточностей в сопровождающей его документации, отсутствие достоверной и своевременной информации у поставщиков продукции о поступлении товара к покупателю вызывают необходимость автоматизации маркировки товаров, считывания информации и осуществления идентификации о них. Це­лью штрихового кодирования является отражение основных информационных характери­стик товара в штрих-кодах, которые обеспечивают реальную возможность проследить за их движением к потребителю, что дает повышение эффективности управления производством.

Технология штрихового кодирования предназначена для осуществления автома­тизированной записи, считывания и идентификации информации об объектах или дело­вых процессах [ ]. Эта технология основана на использовании двоичного кода для записи и запоминания, предварительно разработанных смысловых кодов в виде последовательно­стей, состоящих из нулей и единиц, отраженных кодированными штрихами. Поэтому штриховой код - это последовательность чередования широких и узких, темных и свет­лых полос, которым присвоены логические значения 1 и 0 (широким линиям и широким промежуткам присваивается логическое значение 1, узким - 0).

В различных странах мира применяют три системы штрихового кодирования:

UPC - универсальный товарный код, разработанный в США и применяемый в странах Америки;

EAN - товарный код, созданный в ЕС на базе UPC, соответствующий названию Европейской ассоциации товарной нумерации, получивший в настоящее время статус Международной организации (EAN International);

UCC/EAN - единый стандартизированный штриховой код, созданный организа­циями США и Канады (Uniform Code Council) и EAN International.

Коды типа EAN и UCC/EAN широко применяются во всех странах мира, включая Российскую Федерацию.

В каждой системе соответствуют свои виды кодов: UPC - 12, EAN - 8, EAN - 13, EAN - 14, UCC/EAN - 128 (Code 39).

UPC - 12 - это двенадцатиразрядный код, имеющий следующую структуру:

Ф = [Х]: [XXXXX]: [X]

                        Контрольная цифра

Номер производителя

Знак системы нуме­рации

EAN - 8 - восьмиразрядный код, который используется для кодирования малога­баритных упаковок, имеющий структуру:

Ф = [XXX]: [ХХХХ]: [X]

                        Контрольная цифра

Код продукта

Страна- производи­тель

EAN - 13 - тринадцатиразрядный код, используемый для кодирования продукции, имеющий следующую структуру:

Ф = [XXX]: [XXXX]: [XXXXX]: [X]

Контрольная цифра

Код продукта

Код предприятия- производителя

Код страны - производителя

EAN - 14 - четырнадцатиразрядный код с прямоугольным контуром, используе­мый для идентификации транспортной упаковки и имеющий такую же структуру, что и код EAN - 13, но включающий дополнительный первый разряд, предназначенный для ко­дирования от 1 до 8 специфики упаковки (например, 1 отражает групповую упаковку, 2 - упаковку партий в контейнер и т.д.).

Code 39 может варьироваться до 40 разрядов и не имеет фиксированной длины. Этот код получил свое название по сочетаемости трех широких элементов и шести узких в каждом знаке кода. Для отображения кода используются 43 символа, включая прописные буквы, цифры от 0 до 9 и семь особых знаков (- . $ / + % пробел).

UCC/EAN - 128 является современной версией кода Code 39, используемый для описания полной характеристики предмета поставки, не имеющий фиксированной длины и позволяющий комбинировать использование различных систем кодирования. В струк­туре кода можно выделить пробелы между компонентами кода, стартовый знак, обеспе­чивающий использование наиболее полного набора знаков, знак функции, позволяющий автоматически контролировать отличие символики кода от других символик, данные и контрольное число.

Применение штриховых кодов UPC - 12, EAN - 8, EAN - 13, EAN - 14 регулирует­ся международными и национальными организациями. В Российской Федерации такой организацией является Ассоциация автоматической идентификации, в состав которой входит более 2000 членов. Эта организация устанавливает номера предприятий в кодах EAN - 13 и EAN - 14 и коды продуктов в коде EAN - 8. Код страны присваивается EAN International. Использование кодов UCC/EAN - 128 (Code 39) регулируется соответст­вующими международными и национальными стандартами.

Использование штриховых кодов обеспечивает совместную деятельность произво­дителей и потребителей товаров на едином товарном рынке по всей цепочке взаимосвя­занных партнеров. Эта технология предоставляет защиту продукции путем ее оперативно­го учета, управление потоками информации о передвижении и использовании продукции, поиск сведений об этих процессах по запросу или в реальном масштабе времени на основе идентификации любого объекта, принимающего участие в этом процессе. Кроме того, эта технология ускоряет обмен информацией как внутри организации, так и между организа­циями с помощью методов и средств электронного обмена данными (ЭОД).

Вопросы для самопроверки:

С какой целью разрабатываются классификаторы?

Какие бывают классификаторы?

Чем отличается иерархическая система классификации от фасетной?

Что такое информационный язык? Что такое дескриптор и тезаурус? Перечисли­те типы отношений между терминами.

В каких случаях используются регистрационные системы кодирования и какие системы относятся к этому классу?

Для чего используются классификационные системы кодирования, какие систе­мы входят в эту группу?

Что включается в систему ведения классификаторов?

Что такое ЕСКК и его структура?

Каков состав ОК? Каковы принципы организации ОК?

Каково назначение АСВОК и ее структура?

Каково назначение штрихового кодирования?

Перечислите типы и виды штрих-кодов.


1 2 3 4 5 6 7 8 9 10 11 12 13  Наверх ↑