7.3. ПРИОБРЕТЕНИЕ И ФОРМАЛИЗАЦИЯ ЗНАНИЙ
Ключевой проблемой при построении системы искусственного интеллекта является приобретение знаний. От качества и полноты знаний, введенных в БЗ, в решающей степени зависят эффективность работы СИИ и качество решения задач.
7.3.1. ЭЛЕМЕНТЫ ТЕХНОЛОГИИ ПРИОБРЕТЕНИЯ ЗНАНИЙ
В теории ЭС принята методология постепенно нарастающей разработки, которая базируется на концепции быстрого прототипа.
Прототип ЭС представляет собой один или несколько вариантов усеченной версии ЭС. демонстрирующих жизнеспособность выбранного подхода и правильность принятых решений. В условиях отсутствия формальных методов работы со знаниями технология "быстрого прототипа" считается эффективной, так как она позволяет эмпирически проверить правильность принятых проектных решений на каждом этапе создания ЭС.
Технология разработки ЭС включает шесть этапов: выбор проблемы, разработку прототипа, доработку прототипа до промышленной ЭС, оценку ЭС, стыковку ЭС, поддержку ЭС. Второй этап, в свою очередь, состоит из шести подэтапов: идентификация проблемы, приобретение структурирование и формализация знаний, реализация прототипа и тестирование.
При проектировании экспертной системы разрабатывают демонстрационный, исследовательский и действующий прототипы, в ходе которых производятся их модификация и (или) последовательное расширение.
Особую важность имеет процедура приобретения знаний (рис. 7.1), так как мощность ЭС зависит в первую очередь от количества и качества знаний, хранимых в ней.
Процессу приобретения знаний присущи проблемы психологического, гносеологического и лингвистического свойства. Указанные проблемы рассматриваются в плане облегчения и повышения эффективности взаимодействия и инженера по
Приобретение Преобразование Кодирование Ввод знаний (обучение) Рис. 7.1. Процедура приобретения знаний |
знаниям, повышения степени адекватности модели знаний предметной области реальной ПрО, построения языка структуризации и формализации относительно синтаксиса, семантики и прагматики семиотических моделей представления знаний.
В данном процессе задействованы инженеры по знаниям, программисты и источники знаний, в качестве которых могут выступать эксперты, материализованные источники (учебники, монографии, статьи, инструкции и т.п.) и (или) эмпирические факты, примеры и данные ПрО.
Инженеры по знаниям и эксперты в процессе приобретения знаний могут выполнять различные функции в зависимости от применяемых методов извлечения, получения и формирования знаний, а также наличия и степени развитости средств автоматизации.
В общем случае инженер по знаниям в процессе получения знаний выполняет следующие основные взаимосвязанные функции: управления процессом коммуникации в форме последовательности содержательных сообщений; переработки, включающей все возможные способы, процедуры анализа и синтеза информации, идентификации и конструирования понятий, выяснения и фиксации их смысла, а также установления отношений между ними и когнитивными элементами; хранения информации путем запоминания, выборки и документирования.
Процесс приобретения знаний и разработки прототипа ЭС стремятся максимально автоматизировать. Основная задача автоматизации приобретения знаний состоит в облегчении труда эксперта и инженеров по знаниям — разработчиков СИИ. Эта задача может быть решена двумя путями:
♦ передачей части функций, выполняемых инженерами по знаниям в процессе приобретения знаний, автоматизированной системе;
♦ полного исключения экспертов и инженеров по знаниям из процесса с передачей их функций созданной автоматизированной системе приобретения знаний.
Применение автоматизированных систем приобретения знаний позволяет реализовать три стратегии получения знаний. В рамках стратегии основные функции по актуализации
и формированию знаний выполняет эксперт, обращаясь при этом за помощью к СИИ. Благодаря этой помощи эксперт структурирует, систематизирует и формализует свои знания, используя некоторый формализм. В результате получаются готовые формы знания для непосредственного кодирования и ввода в БЗ. Такая стратегия позволяет исключить инженеров по знаниям из технологической цепочки приобретения знаний и все его функции возложить на автоматизированную систему.
В рамках стратегии получения знаний ведущей сто
роной в диалоге является автоматизированная система. По ответам эксперта СИИ конструирует готовые формы знания и затем передает их в другие компоненты СИИ для включения в состав БЗ. Инженер по знаниям полностью исключается из рассмотренной технологической цепочки получения знаний.
Третья стратегия приобретения знаний связана с исключением из классической технологии и инженера по знаниям, и программиста. Заполнение знаниями таких СИИ может быть осуществлено без изменения механизма логического вывода с помощью редактора знаний. Основная функция редактора знаний — заполнение БЗ нужными знаниями самим экспертом.
В технологическом плане крайне необходимым является решение проблемы работы со знаниями в рамках единого подхода, реализующего выбор МПЗ, формализацию знаний и создание СИИ, реализующей идею автоформализации знаний самим экспертом.
7.3.2. МЕТОДЫ ПРИОБРЕТЕНИЯ ЗНАНИЙ
Рассматривая методы приобретения знаний, будем использовать следующие термины: извлечение, получение, формирование, приобретение знаний и обучение БЗ. Определим сущность указанных терминов. Под извлечением знаний будем понимать процесс приобретения материализованных знаний из текстологических источников информации с помощью некоторой ти методов и процедур, позволяющих переходить от знаний в текстовой форме к их аналогам для ввода в базу знаний СИИ. Получение знаний — это процесс приобретения вербализуемых и невербализуемых знаний эксперта, основанный на использова- 1нии непосредственно им самим или инженером по знаниям соответствующих приемов, процедур, методов и инструментальных средств.
Формирование знаний — это процесс автоматического приобретения (порождения) системой искусственного интеллекта или инструментальным средством нового, и полезного знания из исходной и текущей информации, которое в явном виде не формируют эксперты, в целях освоения новых процедур решения прикладных задач на основе использования различных моделей машинного обучения. Под приобретением знаний будем понимать процесс, основанный на переносе знаний из различных источников в базу знаний путем использования различных методов, моделей, алгоритмов и инструментальных средств.
Понятие получение знаний соотносится с понятиями извлечение, приобретение, формирование знаний как часть — целое.
Обучение базы знаний — это процесс ввода (переноса) приобретенных знаний в СИИ на основе применения совокупности методов, приемов и процедур в целях ее заполнения, расширения и модификации. Термин обучение рассматривается как свойство базы данных, как совокупность методов, приемов и процедур ввода знаний в БЗ и как процесс переноса знаний в СИИ.
Большинство методов извлечения и получения знаний основано на прямом диалоге с экспертом.
Методы извлечения знаний. Они состоят из текстологических методов и методов автоматической обработки текстов.
Текстологические методы предназначены для получения инженером по знаниям знаний из материализованных источников, в качестве которых выступают монографии, учебники, статьи, методики, инструкции и другие носители профессиональных знаний. Текстологические методы, несмотря на их простоту и тривиальность, являются наименее разработанными. Эти методы основываются не только на выявлении и понимании смысла текста, но и на выделении базовых понятий и отношений, т. е. формировании семантической (понятийной) структуры ПрО.
Процесс понимания является сложным и неформализуемым, на него существенно влияют когнитивный стиль инженера по знаниям и его интеллектуальные характеристики, В инженерии знаний разработана методика анализа текстов в целях извлечения и структурирования знаний. Методика предусматривает овладение инженером по знаниям микроструктурой текста, вычленение им ключевых слов (компрессия или сжатие текста) и последующее формирование поля знаний.
Сжатие текста служит методологической основой для использования текстологических процедур извлечения знаний. Текстологические методы самые трудоемкие, они применяются, как правило, на начальном этапе создания СИИ.
Существенное развитие получили методы извлечения знаний при использовании современных информационных технологий, в частности гипертекстовой технологии.
Гипертекст — это организация нелинейной последовательности записи и чтения информации, объединенной на основе ассоциативной связи. Синтез этой концепции и полиморфизма приводит к новой концепции в рамках которой между информацией, представленной в различной форме (текстовой, графической и других), организуются ассоциативные связи.
Эти новые концепции работы со знаниями создают предпосылки для решения проблемы эффективности процесса приобретения знаний. Усилия исследователей в области инженерии знаний направлены на создание формальных методов извлечения знаний. К их числу можно отнести метод автоматической обработки текстов на основе статистической обработки семантических единиц. Метод и программные средства автоматизированного извлечения знаний из текстов базируются на формальных процедурах обнаружения в текстах семантических единиц различной выраженности.
Семантические единицы получаются путем статистической обработки текстов, в основе которой лежат универсальные механизмы определения частотных характеристик терминов. Задача извлечения знаний решается в два этапа: сначала формируется терминологическая сеть (поле знаний), а затем определяется ассоциативная близость терминов на основе статистически определенной меры ассоциации. Достоинство рассмотренного метода состоит в автоматическом выявлении значимых слов и связей с учетом статистической информации о гипертексте в целом.
Указанные новые подходы к автоматизации извлечения знаний пока находятся на стадии исследований и не нашли применения в практике создания СИИ. Однако результаты исследований позволяют надеяться на создание эффективных методов и систем искусственного интеллекта, позволяющих снизить трудозатраты при извлечении знаний на начальном этапе синтеза баз знаний СИИ.
Методы получения экспертных знаний. К ним относятся, например, коммуникативные методы (пассивные и активные), основанные на прямом диалоге экспертов и инженеров по знаниям как без использования СИИ, так и с применением СИИ (технологии окон, меню).
Коммуникативные методы получения знаний рассматривают - ся как разновидности интервьюирования. Основные особенности коммуникативных методов:
1. Не имеют формального определения и носят качественный характер. Полученные с их помощью знания несут отпечаток самонаблюдений эксперта и субъективную интерпретацию инженера по знаниям.
2. Требуют словесного выражения экспертом своих знаний, что является непростой задачей. Неточность и неадекватность словесных описаний мыслительных процессов и применяемых эвристических приемов, используемых при решении задач, ведут к серьезным последствиям.
3. Сложность выражения процедурных знаний при их словесном описании.
4. Крайняя сложность явного описания знаний, которые являются результатом компиляции и автоматизма процессов мышления, а также интуиции эксперта. В психологии доказано, что интуиция на самом деле является способностью распознавать образы. Однако словесное описание способности к распознаванию образов дать крайне трудно.
5. Трудоемкость организации и неэффективность взаимодействия инженера по знаниям и эксперта. На них приходятся большие ин-
10-1909 теллектуальные нагрузки, связанные с вербализацией знаний, управлением процессом коммуникации и необходимостью освоения, анализа и документирования больших объемов новых знаний.
Коммуникативные методы получения знаний отличаются своей низкой эффективностью. Так, при непосредственном взаимодействии инженера по знаниям и эксперта теряется до 76% информации.
Один из путей совершенствования процесса приобретения знаний состоит в разработке позволяющих передать
часть функций, выполняемых инженером по знаниям, самому эксперту или СИИ.
Методы формирования знаний. Трудности извлечения знаний из текстовых источников и получения их от экспертов стимулировали развитие методов формирования знаний, известных, как методы машинного обучения.
Для развитых СИИ способность обучаться, т.е. самостоятельно формировать новые знания на основе текущих знаний, собственного опыта решения прикладных задач, является их существенной характеристикой. Методы формирования знаний лежат в основе автоматических систем приобретения знаний.
Автоматические системы формирования знаний более предпочтительны, так как при этом уменьшается вероятность ошибок в приобретаемых знаниях и снижается время их приобретения.
Главный вопрос, на который должны ответить методы формирования знаний, состоит в следующем: как от частного (примера) перейти к общему (обобщениям)?
Базисом всех методов формирования знаний является индукция, которая лежит в основе получения общих выводов из совокупности частных утверждений.
7.3.3. ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ ПРОЦЕССА ПРЕДСТАВЛЕНИЯ ЗНАНИЙ
Основным направлением повышения эффективности процесса представления знаний является его автоматизация.
Толчком к автоматизации процесса приобретения знаний послужили как сложность самого процесса, так и большие затраты времени и ресурсов. Процесс приобретения знаний поглощает от 50 до 90% общего времени и ресурсов, затрачиваемых на построение СИИ. Одновременно применение программных оболочек уменьшает стоимость генерации единицы знания примерно в 10 раз. С другой стороны, применяемые СИИ, в частности ЭС, дают значительный выигрыш в зависимости от сферы их применения: в проектировании они повышают производительность труда в раз; ускоряют поиск неисправностей в технических системах в раз; в профессиональной подготовке снижают затраты времени в раз.
В практике проектирования СИИ имеется широкий парк средств автоматизации разработки ЭС и приобретения знаний, позволяющих существенно сократить трудозатраты на создание систем искусственного интеллекта.
В настоящее время ведется интенсивная разработка разнообразных средств автоматизации приобретения знаний. Выделяют следующие средства автоматизации, которые получили наименование инструментальных средств: языки программирования, языки символьной обработки, языки инженерии (представления) знаний, средства автоматизации проектирования ЭС (интегрированные гибридные среды или комплексы) и оболочки ЭС (пустые или инструментальные ЭС).
Все многообразие существующих систем искусственного интеллекта используется для создания "быстрого прототипа". Некоторые СИИ являются демонстрационными и иллюстрируют границы ведущихся исследований.
Тенденция качественного совершенствования СИИ связана с возможностью реализации в них совокупности автоматизируемых функций управления процессом приобретения знаний, переработки знаний и их хранения.
Подводя итог краткому рассмотрению процесса представления знаний, можно утверждать, что для эффективного использования в системах управления интеллектуальная информационная технология должна быть способной выполнять следующие функции:
♦ описывать знания с помощью языков представления знаний;
♦ организовывать накопление, хранение, анализ, обобщение и структурирование знаний;
♦ вводить новые знания и объединять их с существующими в СИИ;
♦ выводить новые знания из имеющихся, оперировать с неполными и неточными знаниями;
• устранять устаревшие знания, быстро находить требуемые,
проверять непротиворечивость накопленных знаний;
• осуществлять интеллектуальный интерфейс между пользователем и знаниями.
Вопросы для самопроверки
1. В чем состоит особенность и чем определяется эффективность интеллектуальных информационных технологий?
2. Что такое знания, каковы их основные свойства?
3. Назовите типы знаний. В чем состоят их особенности?
4. Определите понятие предметной области. Как она может быть описана?
5. Какие модели представления знаний существуют в настоящее время? Каковы их особенности, достоинства и недостатки?
6. Нарисуйте обобщенную схему процедуры приобретения знаний и объясните существо этой процедуры. Каковы стратегии автоматизации процедуры приобретения знаний?
7. Расскажите о методах приобретения знаний.
8. Какие средства автоматизации создания экспертных систем существуют в настоящее время?
9. Перечислите основные функции, которые должна выполнять интеллектуальная информационная технология.
25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 Наверх ↑