7.3. ПРИОБРЕТЕНИЕ И ФОРМАЛИЗАЦИЯ ЗНАНИЙ

Ключевой проблемой при построении системы искусственно­го интеллекта является приобретение знаний. От качества и пол­ноты знаний, введенных в БЗ, в решающей степени зависят эф­фективность работы СИИ и качество решения задач.

7.3.1. ЭЛЕМЕНТЫ ТЕХНОЛОГИИ ПРИОБРЕТЕНИЯ ЗНАНИЙ

В теории ЭС принята методология постепенно нарастающей разработки, которая базируется на концепции быстрого прото­типа.

Прототип ЭС представляет собой один или несколько вари­антов усеченной версии ЭС. демонстрирующих жизнеспособность выбранного подхода и правильность принятых решений. В усло­виях отсутствия формальных методов работы со знаниями тех­нология "быстрого прототипа" считается эффективной, так как она позволяет эмпирически проверить правильность принятых проектных решений на каждом этапе создания ЭС.

Технология разработки ЭС включает шесть этапов: выбор проблемы, разработку прототипа, доработку прототипа до про­мышленной ЭС, оценку ЭС, стыковку ЭС, поддержку ЭС. Вто­рой этап, в свою очередь, состоит из шести подэтапов: иденти­фикация проблемы, приобретение                                                         структурирование и формализация знаний, реализация прототипа и тестирование.

При проектировании экспертной системы разрабатывают де­монстрационный, исследовательский и действующий прототипы, в ходе которых производятся их модификация и (или) последова­тельное расширение.

Особую важность имеет процедура приобретения знаний (рис. 7.1), так как мощность ЭС зависит в первую очередь от ко­личества и качества знаний, хранимых в ней.

Процессу приобретения знаний присущи проблемы психоло­гического, гносеологического и лингвистического свойства. Ука­занные проблемы рассматриваются в плане облегчения и повы­шения эффективности взаимодействия                 и инженера по

Приобретение Преобразование Кодирование Ввод знаний

(обучение)

Рис. 7.1. Процедура приобретения знаний


знаниям, повышения степени адекватности модели знаний пред­метной области реальной ПрО, построения языка структуриза­ции и формализации относительно синтаксиса, семантики и праг­матики семиотических моделей представления знаний.

В данном процессе задействованы инженеры по знаниям, про­граммисты и источники знаний, в качестве которых могут высту­пать эксперты, материализованные источники (учебники, моно­графии, статьи, инструкции и т.п.) и (или) эмпирические факты, примеры и данные ПрО.

Инженеры по знаниям и эксперты в процессе приобретения знаний могут выполнять различные функции в зависимости от применяемых методов извлечения, получения и формирования знаний, а также наличия и степени развитости средств автома­тизации.

В общем случае инженер по знаниям в процессе получения зна­ний выполняет следующие основные взаимосвязанные функции: управления процессом коммуникации в форме последовательнос­ти содержательных сообщений; переработки, включающей все воз­можные способы, процедуры анализа и синтеза информации, иден­тификации и конструирования понятий, выяснения и фиксации их смысла, а также установления отношений между ними и когнитив­ными элементами; хранения информации путем запоминания, вы­борки и документирования.

Процесс приобретения знаний и разработки прототипа ЭС стремятся максимально автоматизировать. Основная задача ав­томатизации приобретения знаний состоит в облегчении труда эксперта и инженеров по знаниям — разработчиков СИИ. Эта задача может быть решена двумя путями:

    передачей части функций, выполняемых инженерами по зна­ниям в процессе приобретения знаний, автоматизированной системе;

    полного исключения экспертов и инженеров по знаниям из процесса с передачей их функций созданной автоматизирован­ной системе приобретения знаний.

Применение автоматизированных систем приобретения зна­ний позволяет реализовать три стратегии получения знаний. В рамках      стратегии основные функции по актуализации

и формированию знаний выполняет эксперт, обращаясь при этом за помощью к СИИ. Благодаря этой помощи эксперт структури­рует, систематизирует и формализует свои знания, используя не­который формализм. В результате получаются готовые формы знания для непосредственного кодирования и ввода в БЗ. Такая стратегия позволяет исключить инженеров по знаниям из техно­логической цепочки приобретения знаний и все его функции воз­ложить на автоматизированную систему.

В рамках            стратегии получения знаний ведущей сто­

роной в диалоге является автоматизированная система. По отве­там эксперта СИИ конструирует готовые формы знания и затем передает их в другие компоненты СИИ для включения в состав БЗ. Инженер по знаниям полностью исключается из рассмотрен­ной технологической цепочки получения знаний.

Третья стратегия приобретения знаний связана с исключе­нием из классической технологии и инженера по знаниям, и про­граммиста. Заполнение знаниями таких СИИ может быть осуще­ствлено без изменения механизма логического вывода с помощью редактора знаний. Основная функция редактора знаний — за­полнение БЗ нужными знаниями самим экспертом.

В технологическом плане крайне необходимым является ре­шение проблемы работы со знаниями в рамках единого подхода, реализующего выбор МПЗ, формализацию знаний и создание СИИ, реализующей идею автоформализации знаний самим экс­пертом.

7.3.2. МЕТОДЫ ПРИОБРЕТЕНИЯ ЗНАНИЙ

Рассматривая методы приобретения знаний, будем использо­вать следующие термины: извлечение, получение, формирование, приобретение знаний и обучение БЗ. Определим сущность ука­занных терминов. Под извлечением знаний будем понимать про­цесс приобретения материализованных знаний из текстологичес­ких источников информации с помощью некоторой ти методов и процедур, позволяющих переходить от знаний в текстовой форме к их аналогам для ввода в базу знаний СИИ. Получение знаний — это процесс приобретения вербализуемых и невербализуемых знаний эксперта, основанный на использова- 1нии непосредственно им самим или инженером по знаниям соот­ветствующих приемов, процедур, методов и инструментальных средств.

Формирование знаний — это процесс автоматического приоб­ретения (порождения) системой искусственного интеллекта или инструментальным средством нового, и полезного знания из ис­ходной и текущей информации, которое в явном виде не форми­руют эксперты, в целях освоения новых процедур решения при­кладных задач на основе использования различных моделей ма­шинного обучения. Под приобретением знаний будем понимать процесс, основанный на переносе знаний из различных источни­ков в базу знаний путем использования различных методов, мо­делей, алгоритмов и инструментальных средств.

Понятие получение знаний соотносится с понятиями извлече­ние, приобретение, формирование знаний как часть — целое.

Обучение базы знаний — это процесс ввода (переноса) приоб­ретенных знаний в СИИ на основе применения совокупности методов, приемов и процедур в целях ее заполнения, расширения и модификации. Термин обучение рассматривается как свойство базы данных, как совокупность методов, приемов и процедур ввода знаний в БЗ и как процесс переноса знаний в СИИ.

Большинство методов извлечения и получения знаний осно­вано на прямом диалоге с экспертом.

Методы извлечения знаний. Они состоят из текстологических методов и методов автоматической обработки текстов.

Текстологические методы предназначены для получения ин­женером по знаниям знаний из материализованных источников, в качестве которых выступают монографии, учебники, статьи, методики, инструкции и другие носители профессиональных зна­ний. Текстологические методы, несмотря на их простоту и три­виальность, являются наименее разработанными. Эти методы основываются не только на выявлении и понимании смысла тек­ста, но и на выделении базовых понятий и отношений, т. е. фор­мировании семантической (понятийной) структуры ПрО.

Процесс понимания является сложным и неформализуемым, на него существенно влияют когнитивный стиль инженера по знаниям и его интеллектуальные характеристики, В инженерии знаний разработана методика анализа текстов в целях извлече­ния и структурирования знаний. Методика предусматривает ов­ладение инженером по знаниям микроструктурой текста, вычле­нение им ключевых слов (компрессия или сжатие текста) и после­дующее формирование поля знаний.

Сжатие текста служит методологической основой для исполь­зования текстологических процедур извлечения знаний. Тексто­логические методы самые трудоемкие, они применяются, как пра­вило, на начальном этапе создания СИИ.

Существенное развитие получили методы извлечения знаний при использовании современных информационных технологий, в частности гипертекстовой технологии.

Гипертекст — это организация нелинейной последователь­ности записи и чтения информации, объединенной на основе ас­социативной связи. Синтез этой концепции и полиморфизма при­водит к новой концепции                          в рамках которой между информацией, представленной в различной форме (текстовой, графической и других), организуются ассоциативные связи.

Эти новые концепции работы со знаниями создают предпо­сылки для решения проблемы эффективности процесса приобре­тения знаний. Усилия исследователей в области инженерии зна­ний направлены на создание формальных методов извлечения знаний. К их числу можно отнести метод автоматической обра­ботки текстов на основе статистической обработки семантичес­ких единиц. Метод и программные средства автоматизирован­ного извлечения знаний из текстов базируются на формальных процедурах обнаружения в текстах семантических единиц различ­ной выраженности.

Семантические единицы получаются путем статистической обработки текстов, в основе которой лежат универсальные меха­низмы определения частотных характеристик терминов. Задача извлечения знаний решается в два этапа: сначала формируется терминологическая сеть (поле знаний), а затем определяется ас­социативная близость терминов на основе статистически опре­деленной меры ассоциации. Достоинство рассмотренного мето­да состоит в автоматическом выявлении значимых слов и связей с учетом статистической информации о гипертексте в целом.

Указанные новые подходы к автоматизации извлечения знаний пока находятся на стадии исследований и не нашли применения в практике создания СИИ. Однако результаты исследований позво­ляют надеяться на создание эффективных методов и систем искусст­венного интеллекта, позволяющих снизить трудозатраты при из­влечении знаний на начальном этапе синтеза баз знаний СИИ.

Методы получения экспертных знаний. К ним относятся, на­пример, коммуникативные методы (пассивные и активные), ос­нованные на прямом диалоге экспертов и инженеров по знаниям как без использования СИИ, так и с применением СИИ (техно­логии окон, меню).

Коммуникативные методы получения знаний рассматривают - ся как разновидности интервьюирования. Основные особеннос­ти коммуникативных методов:

1.    Не имеют формального определения и носят качественный характер. Полученные с их помощью знания несут отпечаток са­монаблюдений эксперта и субъективную интерпретацию инже­нера по знаниям.

2.    Требуют словесного выражения экспертом своих знаний, что является непростой задачей. Неточность и неадекватность словесных описаний мыслительных процессов и применяемых эвристических приемов, используемых при решении задач, ведут к серьезным последствиям.

3.    Сложность выражения процедурных знаний при их словес­ном описании.

4.    Крайняя сложность явного описания знаний, которые яв­ляются результатом компиляции и автоматизма процессов мыш­ления, а также интуиции эксперта. В психологии доказано, что интуиция на самом деле является способностью распознавать образы. Однако словесное описание способности к распознава­нию образов дать крайне трудно.

5.  Трудоемкость организации и неэффективность взаимодействия инженера по знаниям и эксперта. На них приходятся большие ин-

10-1909 теллектуальные нагрузки, связанные с вербализацией знаний, уп­равлением процессом коммуникации и необходимостью освоения, анализа и документирования больших объемов новых знаний.

Коммуникативные методы получения знаний отличаются сво­ей низкой эффективностью. Так, при непосредственном взаимо­действии инженера по знаниям и эксперта теряется до 76% ин­формации.

Один из путей совершенствования процесса приобретения знаний состоит в разработке                                                     позволяющих передать

часть функций, выполняемых инженером по знаниям, самому эк­сперту или СИИ.

Методы формирования знаний. Трудности извлечения знаний из текстовых источников и получения их от экспертов стимули­ровали развитие методов формирования знаний, известных, как методы машинного обучения.

Для развитых СИИ способность обучаться, т.е. самостоятель­но формировать новые знания на основе текущих знаний, соб­ственного опыта решения прикладных задач, является их суще­ственной характеристикой. Методы формирования знаний лежат в основе автоматических систем приобретения знаний.

Автоматические системы формирования знаний более предпоч­тительны, так как при этом уменьшается вероятность ошибок в приобретаемых знаниях и снижается время их приобретения.

Главный вопрос, на который должны ответить методы фор­мирования знаний, состоит в следующем: как от частного (при­мера) перейти к общему (обобщениям)?

Базисом всех методов формирования знаний является индук­ция, которая лежит в основе получения общих выводов из сово­купности частных утверждений.

7.3.3. ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ ПРОЦЕССА ПРЕДСТАВЛЕНИЯ ЗНАНИЙ

Основным направлением повышения эффективности процес­са представления знаний является его автоматизация.

Толчком к автоматизации процесса приобретения знаний послужили как сложность самого процесса, так и большие затра­ты времени и ресурсов. Процесс приобретения знаний поглоща­ет от 50 до 90% общего времени и ресурсов, затрачиваемых на построение СИИ. Одновременно применение программных обо­лочек уменьшает стоимость генерации единицы знания пример­но в 10 раз. С другой стороны, применяемые СИИ, в частности ЭС, дают значительный выигрыш в зависимости от сферы их применения: в проектировании они повышают производитель­ность труда в раз; ускоряют поиск неисправностей в техни­ческих системах в     раз; в профессиональной подготовке сни­жают затраты времени в    раз.

В практике проектирования СИИ имеется широкий парк средств автоматизации разработки ЭС и приобретения знаний, позволяющих существенно сократить трудозатраты на создание систем искусственного интеллекта.

В настоящее время ведется интенсивная разработка разнооб­разных средств автоматизации приобретения знаний. Выделяют следующие средства автоматизации, которые получили наимено­вание инструментальных средств: языки программирования, язы­ки символьной обработки, языки инженерии (представления) зна­ний, средства автоматизации проектирования ЭС (интегрирован­ные гибридные среды или комплексы) и оболочки ЭС (пустые или инструментальные ЭС).

Все многообразие существующих систем искусственного ин­теллекта используется для создания "быстрого прототипа". Не­которые СИИ являются демонстрационными и иллюстрируют границы ведущихся исследований.

Тенденция качественного совершенствования СИИ связана с возможностью реализации в них совокупности автоматизируе­мых функций управления процессом приобретения знаний, пере­работки знаний и их хранения.

Подводя итог краткому рассмотрению процесса представления знаний, можно утверждать, что для эффективного использования в системах управления интеллектуальная информационная техно­логия должна быть способной выполнять следующие функции:

   описывать знания с помощью языков представления знаний;

     организовывать накопление, хранение, анализ, обобщение и структурирование знаний;

     вводить новые знания и объединять их с существующими в СИИ;

     выводить новые знания из имеющихся, оперировать с не­полными и неточными знаниями;

     устранять устаревшие знания, быстро находить требуемые,

проверять непротиворечивость накопленных знаний;

   осуществлять интеллектуальный интерфейс между пользо­вателем и знаниями.

Вопросы для самопроверки

1.          В чем состоит особенность и чем определяется эффективность интеллектуальных информационных технологий?

2.          Что такое знания, каковы их основные свойства?

3.          Назовите типы знаний. В чем состоят их особенности?

4.          Определите понятие предметной области. Как она может быть описана?

5.          Какие модели представления знаний существуют в настоящее время? Каковы их особенности, достоинства и недостатки?

6.          Нарисуйте обобщенную схему процедуры приобретения знаний и объясните существо этой процедуры. Каковы стратегии автома­тизации процедуры приобретения знаний?

7.          Расскажите о методах приобретения знаний.

8.          Какие средства автоматизации создания экспертных систем су­ществуют в настоящее время?

9.          Перечислите основные функции, которые должна выполнять ин­теллектуальная информационная технология.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 
25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47  Наверх ↑