ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ЭКСПЕРТНЫЕ СИСТЕМЫ Учебное пособие для вузов Составитель А.Ю. Телков
Воронеж, 200...
17 downloads
258 Views
938KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ
ЭКСПЕРТНЫЕ СИСТЕМЫ Учебное пособие для вузов Составитель А.Ю. Телков
Воронеж, 2007
2
Утверждено Научно-методическим советом физического факультета « 1 » февраля 2007 г., протокол № 2 Рецензент: начальник кафедры теоретических и прикладных математических дисциплин Воронежского института МВД России доктор физико-математических наук Меньших В.В.
Учебное пособие подготовлено на кафедре электроники физического факультета Воронежского государственного университета В данном пособии рассматриваются подходы к построению интеллектуальных информационных систем, экспертных систем, изучаются этапы создания экспертных систем, приводятся основные сведения о способах представления знаний в экспертных системах. Анализируются особенности экспертных систем различных классов - самообучающихся, индуктивных, нейронных сетей, системах, основанных на прецедентах. Приводятся основные модели и методы решения задач, стратегии организации поиска решений. Рассматриваются формальные и неформальные модели представления знаний в экспертных системах. Отдельно изучаются вопросы построения систем «машинного зрения». В качестве примера подробно изучается экспертная система оценки качества изготовления систем «антенна-обтекатель». Рассматривается постановка задачи, алгоритмы преобразования информации. Обосновываются состав исходных и выходных документов экспертной системы, механизмы, реализующие логику работы. Приводятся вопросы для самостоятельного контроля. Рекомендовано для студентов 5-го курса дневного отделения. Для специальности: 010800 – Радиофизика
3
СОДЕРЖАНИЕ 1. Особенности и признаки интеллектуальных информационных систем………………………………………………………………... 2. Назначение экспертных систем………..…...................................... 3. Самообучающиеся системы.……...................................................... 4. Технология создания экспертных систем……………………….. 5. Методы работы со знаниями……………………………………….. 6. Модели и методы решения задач………………………………….. 7. Планирование задач………………………………………………… 8. Представление знаний в интеллектуальных системах ……........... 9. Системы машинного зрения……………………………………….. 10. Интеллектуальная база данных результатов оценки РТХ систем антенна-обтекатель…………………………………………………. 11. Тенденции развития систем искусственного интеллекта……………....................................................................................... 12. Список вопросов для самоконтроля……………………………….. Список литературных источников…………………………………
4 7 11 17 21 31 39 44 59 64 76 80 82
4
1. Особенности и признаки интеллектуальности информационных систем Любая информационная система (ИС) выполняет следующие функции: воспринимает вводимые пользователем информационные запросы и необходимые исходные данные, обрабатывает введенные и хранимые в системе данные в соответствии с известным алгоритмом и формирует требуемую выходную информацию. С точки зрения реализации перечисленных функций ИС можно рассматривать как структуру, производящую информацию, в которой заказом является информационный запрос, сырьем - исходные данные, продуктом требуемая информация, а инструментом (оборудованием) - знание, с помощью которого данные преобразуются в информацию. Знание имеет две составляющие: фактуальную и операционную. Фактуальное знание - это осмысленные и понятые данные. Данные сами по себе - это специально организованные знаки на каком-либо носителе. Операционное знание - это те общие зависимости между фактами, которые позволяют интерпретировать данные или извлекать из них информацию. Информация - это новое и полезное знание для решения каких-либо задач. Фактуальное знание называют также экстенсиональным (детализированным), а операционное знание - интенсиональным (обобщенным). Процесс извлечения информации из данных сводится к адекватному соединению операционного и фактуального знаний и в различных типах ИС выполняется по-разному. Самый простой путь их соединения заключается в рамках одной прикладной программы. Программа = Алгоритм (Правила преобразования данных + Управляющая структура) + Структура данных Таким образом, операционное знание (алгоритм) и фактуальное знание (структура данных) неотделимы друг от друга. Однако, если в ходе эксплуатации ИС выяснится потребность в модификации одного из двух компонентов программы, то возникнет необходимость ее переписывания. Это объясняется тем, что полным знанием проблемной области обладает только разработчик ИС, а программа служит исполнителем. Конечный же пользователь вследствие процедурности и машинной ориентированности представления знаний понимает лишь внешнюю сторону процесса обработки данных и никак не может на него влиять. Следствием перечисленных недостатков является плохая жизнеспособность ИС или ее адаптивность к постоянным изменениям информационных потребностей. Кроме того, в силу детерминированности алгоритмов решаемых задач ИС не способна к формированию у пользователя знаний о действиях в не полностью определенных ситуациях. В системах, основанных на обработке баз данных (СБД), происходит отделение фактуального и операционного знаний друг от друга. Первое
5
организуется в виде баз данных, второе - в виде программ. Причем, программа может автоматически генерироваться по запросу пользователя (например, реализация запросов). В качестве посредника между программой и базой данных выступает программный инструмент доступа к данным система управления базой данных (СУБД): СБД = Программа → " СУБД " → База данных Концепция независимости программ от данных позволяет повысить гибкость ИС по выполнению произвольных информационных запросов. Однако эта гибкость, в силу процедурности представления операционного знания, имеет четко определенные границы. Для формулирования информационного запроса пользователь должен ясно представить себе структуру базы данных и до определенной степени алгоритм решения задачи. Следовательно, пользователь должен достаточно хорошо разбираться в проблемной области, в логической структуре базы данных и алгоритме программы. Общие недостатки традиционных информационных систем, к которым относятся системы первых двух типов, заключаются в слабой адаптируемости к изменениям в предметной области и информационным потребностям пользователей, в невозможности решать плохо формализуемые задачи, с которыми управленческие работники постоянно имеют дело. Перечисленные недостатки устраняются в интеллектуальных информационных системах (ИИС). Анализ структуры программы показывает возможность выделения из программы операционного знания (правил преобразования данных) в так называемых базу знаний, которая в декларативной форме хранит общие для различных задач единицы знаний. При этом управляющая структура приобретает характер универсального механизма решения задач (механизма вывода), который связывает единицы знаний в исполняемые цепочки (генерируемые алгоритмы) в зависимости от конкретной постановки задачи (сформулированной в запросе цели и исходных условий). Такие ИС становятся системами, основанными на отработке баз знаний или просто знаний (СБЗ). СБЗ = База знаний + "Управляющая структура + (механизм вывода)" + База данных Системы, основанные на знаниях, являются интеллектуальными ИС (ИИС) в силу возможности генерации алгоритмов решения задач, для которых характерны следующие признаки: - развитые коммуникативные способности, - умение решать сложные плохо формализуемые задачи, - способность к развитию и самообладанию.
6
Коммуникативные способности ИИС характеризуют способ взаимодействия (интерфейса) конечного пользователя с системой, в частности, возможность формулирования произвольного запроса в диалоге с ИИС на языке, максимально приближенном к естественному. Сложные плохо формализуемые задачи - задачи, которые требуют построения оригинального алгоритма решения в зависимости от конкретной ситуации, для которой могут быть характерны неопределенность и динамичность исходных данных и знаний. Способность к самообучению - это возможность автоматического извлечения знаний для решения задач из накопленного опыта конкретных ситуаций. В различных ИИС перечисленные признаки интеллектуальности развиты в неодинаковой степени. Условно, каждому из признаков соответствует свой класс ИИС (рис. 1).
Рис. 1. Классификация интеллектуальных информационных систем Системы с интеллектуальным интерфейсом Интеллектуальные базы данных отличаются от обычных баз данных возможностью выборки по запросу необходимой информации, которая может явно не храниться, а выводиться из имеющейся в базе данных. Интеллектуальная система баз помощи пользователя по структуре базы данных сама строит путь доступа к файлам данных. Формирование запроса осуществляется в диалоге с пользователем, последовательных шагов кото-
7
рого выполняется в максимально удобной для пользователя форме. Запрос к базе данных может формулироваться и с помощью естественноязыкового интерфейса. Естественно-языковой интерфейс предполагает трансляцию естественно-языковых конструкций на внутримашинный уровень представления знаний. Для этого необходимо решать задачи морфологического, синтаксического и семантического анализа и синтеза высказываний на естественном языке. Естественно-языковой интерфейс используется для: - доступа к интеллектуальным базам данных, - контекстного поиска документальной текстовой информации, - голосового ввода команд в системе управления, - машинного перевода с иностранных языков. Гипертекстовые системы предназначены для реализации поиска по ключевым словам в базах текстовой информации; поиска мультимедийной информации, включающей помимо текстовой и цифровой информации графические, аудио и видео-образы. Системы контекстной помощи - частичный случай интеллектуальных гипертекстовых и естественно-языковых систем. В отличие от обычных систем помощи, пользователь описывает проблему, а система с помощью дополнительного диалога ее конкретизирует и сама выполняет поток относящихся к ситуации рекомендаций. Такие системы относятся к классу систем распространения знаний. Системы когнитивной графики позволяют осуществлять интерфейс пользователя с ИИС с помощью графических образов, которые генерируются в соответствии с происходящими событиями. Такие системы используются в мониторинге и управлении оперативными процессами. Например, состояние сложного управляемого объекта отображается в виде человеческого лица, на котором каждая черта отвечает за какой-либо параметр, а общее выражение лица дает интегрированную характеристику ситуации. Системы когнитивной графики широко используются также в обучающих и тренажерных системах на основе использования принципов виртуальной реальности, когда графические образы моделируют ситуации, в которых обучаемому необходимо принимать решения и выполнять определенные действия. 2. Назначение экспертных систем Назначение экспертных систем заключается в решении достаточно трудных для экспертов задач на основе накапливаемой базы знаний, отражающей опыт работы экспертов в рассматриваемой проблемной области. Достоинство применения экспертных систем заключается в возможности принятия решений в уникальных ситуациях, для которых алгоритм заранее не известен и формируется по исходным данным в виде цепочки рассуждений (правил принятия решений) из базы знаний. Причем решение задач предполагается осуществлять в условиях неполноты, недостоверности,
8
многозначности исходной информации и качественных оценок процессов. Экспертная система является инструментом, усиливающим интеллектуальные особенности эксперта, и может выполнять следующие роли: - консультанта для неопытных или непрофессиональных пользователей, - ассистента в связи с необходимостью анализа экспертом различных вариантов принятия решений, - партнера эксперта по вопросам, относящимся к источникам знаний из смежных областей деятельности. Архитектура ЭС (рис. 2): - база знаний (хранилище единиц знаний), - программный инструмент доступа и обработки знаний, состоящий из механизмов вывоза заключений, приобретения знаний, объяснения получаемых результатов и интеллектуального интерфейса. База знаний - это совокупность единиц знаний, которые представляют собой формализованное с помощью некоторого метода представления знаний описание объектов проблемной области и их взаимосвязей, действий над объектами и, возможно, неопределенностей, с которыми эти действия осуществляются. В качестве методов представления знаний чаще всего используются либо правила, либо объекты (фреймы), либо их комбинация.
Рис. 2. К пояснению структуры экспертной системы
9
Правила представляют собой конструкции: Если , то CF (фактор определенности) . Объекты представляют собой совокупность атрибутов, описывающих свойства и отношения с другими объектами. Интеллектуальный интерфейс. Обмен данными между конечным пользователем ИЭС выполняет программа интеллектуального интерфейса, которая воспринимает сообщения пользователя и преобразует их в форму представления базы знаний и, наоборот, перевозят внутреннее представление результата обработки в формат пользователя, и выдает сообщение на требуемый носитель. Механизм вывода. Этот программный инструмент получает от интеллектуального интерфейса преобразованный во внутреннее представление запрос, формирует из базы знаний конкретный алгоритм решения задачи, выполняет алгоритм, а полученный результат предоставляется интеллектуальному интерфейсу для выдачи ответа на запрос пользователя. Механизм объяснения. В процессе или по результатам решения задачи пользователь может запросить объяснение или обновление кода решения. С этой целью ЭС должна предоставить соответствующий механизм объяснения. Объяснительные способности ЭС определяются возможностью механизма вывода запоминать путь решения задачи. Механизм приобретения знаний. База знаний отражает знания экспертов в данной проблемной области о действиях в различных ситуациях или процессах решения характерных задач. Выявлением подобных знаний и последующим их представлением в базе знаний занимаются специалисты-инженеры знаний. Для ввода знаний в базу существует механизм приобретения знаний. В простейшем случае это интеллектуальный редактор, который позволяет вводить единицы знаний в базу и приводить их синтетический и семантический контроль. Классы экспертных систем подразделяют по способу формирования решения (аналитические – выбор решения из множества известных альтернатив и синтетические – генерация неизвестных решений), по способу учета временного признака (статические – решение задач при неизменных данных и динамические – допускается изменение данных), по виду использования данных и знаний (с детерминированными знаниями и с неопределенными знаниями), по числу используемых источников знаний (один и множество).
10
Экспертные системы, решающие задачи распознавания ситуаций, называются классифицирующими, поскольку определяют принадлежность анализируемой ситуации к некоторому классу. В качестве основного метода формирования решений используется метод логического дедуктивного вывода от общего к частному. Доопределяющие экспертные системы решают более сложные аналитические задачи на основе неопределенных исходных данных и знаний. Экспертная система доопределяет недостающие знания. Применение классифицирующих и доопределяющих ЭС: - интерпретация данных - выбор решения из множества альтернатив (направление, анализ финансового состояния предприятия), - диагностика - выявление причин, приведших к возникновению ситуаций. Требуется предварительная интерпретация ситуации с последующей проверкой дополнительных фактов, - коррекция - диагностика, дополненная возможностью оценки и рекомендации действий по исправлению отклонений от нормального состояния рассматриваемых ситуаций. Трансформирующие ЭС относятся к синтезирующим динамическим системам. В качестве методов решения задач используются: - генерация и тестирование, когда по исходным данным осуществляется генерация гипотез, а затем проверка сформулированных гипотез на подтверждение поступающими фактами, - метод предложений и умолчаний, когда по неполным данным подбираются знания об аналогичных классах объектов, которые в дальнейшем динамически адаптируются к конкретной ситуации в зависимости от ее развития, - использование общих закономерностей (метауправления в случае неизвестных ситуаций, позволяющих генерировать недостающее знание). Многоагентные системы. Для таких динамических систем характерна интеграция в базе знаний, обменивающихся между собой получаемыми результатами на динамической основе, например, через "доску объявлений". Особенности: - проведение альтернативных рассуждений на основе использования различных источников знаний с механизмом устранения противоречий, - распределенное решение проблем, которые разбиваются на параллельно решаемые подпроблемы, соответствующие самостоятельным источником знаний, и т.д. Применение: - проектирование (бюджета предприятия, портфеля инвестиций), - прогнозирование, - диспетчерование - распределение работ, составление расписаний, - планирование, - мониторинг, - управление.
11
Примеры широко известных и эффективно используемых (или использованных в свое время) экспертных систем: DENDRAL - ЭС для распознавания структуры сложных органических молекул по результатам их спектрального анализа (считается первой в мире экспертной системой); MOLGEN - ЭС для выработки гипотез о структуре ДНК на основе экспериментов с ферментами, XCON - ЭС для конфигурирования (проектирования) вычислительных комплексов VAX-11 в корпорации DEC в соответствии с заказом покупателя; MYCIN - ЭС диагностики кишечных заболеваний; PUFF - ЭС диагностики легочных заболеваний; MACSYMA - ЭС для символьных преобразований алгебраических выражений; YES/MVS - ЭС для управления многозадачной операционной системой MVS больших ЭВМ корпорации IBM; DART - ЭС для диагностики больших НМД корпорации IBM; PROSPECTOR - ЭС для консультаций при поиске залежей полезных ископаемых; POMME - ЭС для выдачи рекомендаций по уходу за яблоневым садом; набор экспертных систем для управления планированием, запуском и полетом космических аппаратов типа "челнок"; ЭСПЛАН - ЭС для планирования производства на Бакинском нефтеперерабатывающем заводе; МОДИС - ЭС диагностики различных форм гипертонии. Порядка 30% экспертных систем служат для диагностики, 15% - интерпретации, также 15% - рекомендаций, 12% - планирования, 9% - мониторинга, 8% - управления. Меньшую долю занимают задачи моделирования, выбора. 3. Самообучающиеся системы В основе самообучающихся систем лежат методы автоматической классификации примеров ситуаций реальной практики (обучения на примерах). Примеры реальных ситуаций накапливаются за некоторый исторический период и составляют обучающую выборку. Эти примеры описываются множеством признаков классификации. Причем обучающая выборка может быть: - "с учителем", когда для каждого примера задается в явном виде значение признака его принадлежности некоторому классу ситуаций (классообразующего признака);
12
- "без учителя", когда по степени близости значений признаков классификации система сама выделяет классы ситуаций. В результате обучения системы автоматически строятся обобщенные правила или функции, определяющие принадлежность ситуаций классам, которыми обученная система пользуется при интерпретации новых возникающих ситуаций. Таким образом, автоматически формируется база знаний, используемая при решении задач классификации и прогнозирования. Эта база знаний периодически автоматически корректируется по мере накопления опыта реальных ситуаций, что позволяет сократить затраты на ее создание и обновление. Общие недостатки, свойственные всем самообучающимся системам, заключаются в следующем: - возможна неполнота и/или зашумленность (избыточность) обучающей выборки и, как следствие, относительная адекватность базы знаний возникающим проблемам; - возникают проблемы, связанные с плохой смысловой ясностью зависимостей признаков и, как следствие, неспособность объяснения пользователям получаемых результатов; - ограничения в размерности признакового пространства вызывают неглубокое описание проблемной области и узкую направленность применения. Индуктивные системы Обобщение примеров по принципу от частного к общему сводится к выявлению подмножеств примеров, относящихся к одним и тем же подклассам, и определению для них значимых признаков. Процесс классификации примеров осуществляется следующим образом: 1. Выбирается признак классификации из множества заданных (либо последовательно, либо по какому-либо правилу, например, в соответствии с максимальным числом получаемых подмножеств примеров). 2. По значению выбранного признака множество примеров разбивается на подмножества. 3. Выполняется проверка, принадлежит ли каждое образовавшееся подмножество примеров одному подклассу. 4. Если какое-то подмножество примеров принадлежит одному подклассу, т.е. у всех примеров подмножества совпадает значение классообразующего признака, то процесс классификации заканчивается (при этом остальные признаки классификации не рассматриваются). 5. Для подмножеств примеров с несовпадающим значением классообразующего признака процесс классификации признаков продолжается последовательной классификацией, а в конечных узлах определяются значения признака принадлежности определенному классу. Пример построения дерева решений на основе фрагмента таблицы примеров (таблица № 1) показан на схеме 1. Анализ типовой ситуации сводится к выбору ветви дерева, которая полностью определяет эту ситуацию. Поиск решения осуществляется в ре-
13
зультате последовательной проверки признаков классификации. Каждая ветвь дерева соответствует одному правилу решения: Если Спрос="низкий" и Издержки="маленькие", то Цена="низкая". Примерами инструментальных средств, поддерживающих индуктивный вывод знаний, являются 1st Class (Programs in Motion), Rulcmaster (Radian Corp.), ИЛИС (ArgusSoft), KAD (ИПС Переяславль-Залесский). Таблица № 1. Таблица примеров решений Классообр. признак Цена низкая высокая высокая высокая высокая высокая
Признаки классификации Спрос низкий низкий высокий высокий высокий высокий
Конкуренция маленькая маленькая маленькая маленькая маленькая маленькая
Издержки маленькие большие большие маленькие маленькие большие
Количество низкое высокое низкое высокое низкое высокое
высокий Æ [цена высокая] низкий [издержки] большие Æ [цена высокая] Æ маленькие Æ [цена низкая] Схема 1. Фрагмент дерева решений
[спрос]
Æ
Нейронные сети. В результате обучения на примерах строятся математические решающие функции (передаточные функции или функции активации), которые определяют зависимости между входными ( x i ) и выходными ( y j ) признаками (сигналами) (рис. 3).
Рис. 3. Решающая функция - "нейрон" Каждая такая функция, называемая по аналогии с элементарной единицей человеческого мозга - нейроном, отображает зависимость значения выходного признака ( y j ) от взвешенной суммы (U) значений входных признаков ( x i ), в которой вес входного признака ( Wi ) показывает степень влияния входного признака на выходной.
14
Решающие функции используются в задачах классификации на основе сопоставления их значений при различных комбинациях значений входных признаков с некоторым пороговым значением. В случае превышения заданного порога считается, что нейрон сработал и таким образом распознал некоторый класс ситуаций. Нейроны используются и в задачах прогнозирования, когда по значениям входных признаков после их подстановки в выражение решающей функции получается прогнозное значение выходного признака. Функциональная зависимость может быть линейной, но, как правило, используется сигмоидальная форма, которая позволяет вычленять более сложные пространства значений выходных признаков. Такая функция называется логистической (рис. 4).
Рис. 4. Логистическая (сигмоидалъная) функция Нейроны могут быть связаны между собой, когда выход одного нейрона является входом другого. Таким образом, строится нейронная сеть (рис. 5), в которой нейроны, находящиеся на одном уровне, образуют слои.
Рис. 5. Нейронная сеть Обучение нейронной сети сводится к определению связей (синапсов) между нейронами и установлению силы этих связей (весовых коэффициентов). Алгоритмы обучения нейронной сети упрощенно сводятся к определению зависимости весового коэффициента связи двух нейронов от числа примеров, подтверждающих эту зависимость. Наиболее распространенным алгоритмом обучения нейронной сети является алгоритм обратного
15
распространения ошибки. Целевая функция по этому алгоритму должна обеспечить минимизацию квадрата ошибки в обучении по всем примерам: 2 min ∑ (Ti − y i ) , где Ti - заданное значение выходного признака по i - му i
примеру; y i - вычисленное значение выходного признака по i - му примеру. Сущность алгоритма, обратного распространения ошибки сводится к следующему: 1. Задать произвольно небольшие начальные значения весов связей нейронов. 2. Для всех обучающих пар "значения входных признаков – значение выходного признака" (примеров из обучающей выборки) вычислить выход сети (Y). 3. Выполнить рекурсивный алгоритм, начиная с выходных узлов по направлению к первому скрытому слою, пока не будет достигнут минимальный уровень ошибки. Вычислить веса на (t + 1) шаге по формуле: Wi , j (t + 1) = Wi , j (t ) + ηδ i X i , где - Wi , j - вес связи от скрытого i -го нейрона или от входа к j-му нейрону на шаге t; - X i - выходное значение i -го нейрона; - η - коэффициент скорости обучения; - δi - ошибка для j-го нейрона. Если j-й нейрон - выходной, то δi = y i (1 − y i ) (T i − y i ) Если j-и нейрон находится в скрытом внутреннем слое, то δ j = X j (1 − X j ) ∑ δ k Wj, k , где к - индекс всех нейронов в слое, расположенk
ном вслед за споем с j-м нейроном. Выполнить шаг 2. Достоинство нейронных сетей перед индуктивным выводом заключается в решении не только классифицирующих, но и прогнозных задач. Возможность нелинейного характера функциональной зависимости выходных и входных признаков позволяет строить более точные классификации. Сам процесс решения задач в силу проведения матричных преобразований проводится очень быстро. Фактически имитируется параллельный процесс прохода по нейронной сети в отличие от последовательного в индуктивных системах. Нейронные сети могут быть реализованы и аппаратно в виде нейрокомпьютеров с ассоциативной памятью. Последнее время нейронные сети получили стремительное развитие и очень активно используются в финансовой области. В качестве примеров внедрения нейронных сетей можно назвать: - "Система прогнозирования динамики биржевых курсов для Chemical Bank" (фирма Logica);
16
- "Система прогнозирования для Лондонской фондовой биржи" (фирма SearchSpacе); - "Управление инвестициями для Mellon Bank" (фирма NеuralWarе). В качестве инструментальных средств разработки нейронных сетей следует выделить инструментальные средства NеurOn-line (фирма GENSYM), NеuralWorks Professional II/Plus (фирма NeuralWare), отечественную разработку FOREX-94 (Уралвнешторгбанк) и др. Системы, основанные на прецедентах (Case-based reasoning). В этих системах база знаний содержит описания не обобщенных ситуаций, а собственно сами ситуации или прецеденты. Тогда поиск решения проблемы сводится к поиску по аналогии (абдуктивному выводу от частного к частному): 1. Получение подробной информации о текущей проблеме. 2. Сопоставление полученной информации со значениями признаков прецедентов из базы знаний. 3. Выбор прецедента из базы знаний, наиболее близкого к рассматриваемой проблеме. 4. В случае необходимости выполняется адаптация выбранного прецедента к текущей проблеме. 5. Проверка корректности каждого полученного решения. 6. Занесение детальной информации о полученном решении в базу знаний. Так же, как и для индуктивных систем, прецеденты описываются множеством признаков, по которым строятся индексы быстрого поиска. Но в отличие от индуктивных систем допускается нечеткий поиск с получением множества допустимых альтернатив, каждая из которых оценивается некоторым коэффициентом уверенности. Далее наиболее подходящие решения адаптируются по специальным алгоритмам к реальным ситуациям. Обучение системы сводится к запоминанию каждой новой обработанной ситуации с принятыми решениями в базе прецедентов. Системы, основанные на прецедентах, применяются как системы распространения знаний с расширенными возможностями или как в системах контекстной помощи. Пример диалога с CBR-системой Описание ситуации (проблемы) Не печатает принтер Вопросы Включено ли питание? Да Прошло ли тестирование? Да Замята ли бумага? Да Подключен ли драйвер? Не знаю Действия
17
Освободите бумагу уверенность 80 Загрузите драйвер уверенность 50 Вызовите тех. персонал уверенность 10 В качестве примера инструментального средства поддержки баз знаний прецедентов, распространяемого в России, можно назвать систему CBR-Exprеss (Inference, дистрибьютор фирма Метатехнология). Информационные хранилища (Data Warehouse). В отличие от интеллектуальной базы данных информационное хранилище представляет собой хранилище извлеченной значимой информации из оперативной базы данных, которое предназначено для оперативного анализа данных (реализации OLAP - технологии)- Извлечение знаний из баз данных осуществляется регулярно, например, ежедневно. Типичными задачами оперативного ситуационного анализа являются: - определение профиля потребителей конкретного товара; - предсказание изменений ситуации на рынке; - анализ зависимостей признаков ситуаций (корреляционный анализ) и др. Для извлечения значимой информации из баз данных используются специальные методы (Data Mining или Knowledge Discovery), основанные или на применении многомерных статистических таблиц, или индуктивных методов построения деревьев решений, или нейронных сетей. Формулирование запроса осуществляется в результате применения интеллектуального интерфейса, позволяющего в диалоге гибко определять значимые признаки анализа. Применение информационных хранилищ на практике все в большей степени демонстрирует необходимость интеграции интеллектуальных и традиционных информационных технологий, интегрированность различных методов представления и вывода знаний, усложнение архитектуры информационных систем. Разработкой и распространением информационных хранилищ в настоящее время занимаются такие компьютерные фирмы, как IBM (Intelligent Miner), Silicon Graphics (MineSet), Intersolv (DataDirect, SmartData), Oracle (Express), SAS Institute (SAS/Assist) и др. 4. Технология создания экспертных систем На начальных этапах идентификации и концептуализации, связанных с определением контуров будущей системы, инженер по знаниям выступает в роли ученика, а эксперт - в роли учителя, мастера. На заключительных этапах реализации и тестирования инженер по знаниям демонстрирует результаты разработки, адекватность которых проблемной области оценивает эксперт. На этапе тестирования это могут быть совершенно другие эксперты. На этапе тестирования созданные экспертные системы оцениваются с позиции двух основных групп критериев: точности и полезно-
18
сти. В общем виде выделяют следующие этапы создания экспертных систем: - идентификация проблемной области; - концептуализация проблемной области; - формализация базы знаний; - реализация базы данных; - тестирование базы знаний; - опытная эксплуатация. Этап идентификации проблемной области включает определение назначения и сферы применения экспертной системы, подбор экспертов и группы инженеров по знаниям, выделение ресурсов, постановку и параметризацию решаемых задач. Назначение экспертной системы связано с одной из следующих областей: - обучение и консультация неопытных пользователей, - распространение и использование уникального опыта экспертов, - автоматизация работы экспертов по принятию решений, - оптимизация решения проблем, выдвижение и проверка гипотез. Ограничивающими факторами на разработку экспертной системы выступают отводимые сроки, финансовые ресурсы и программнотехническая среда. От этих ограничений зависит количественный состав групп инженеров по знаниям и экспертов, глубина прорабатываемых вопросов, адекватность и эффективность решения проблем. Обычно различают три стратегии разработки экспертных систем: - широкий набор задач, каждая из которых ориентирована на узкую проблемную область, - концентрированный набор задач, определяющий основные направления повышения эффективности функционирования экономического объекта, - комплексный набор задач, определяющий организацию всей деятельности экономического объекта. К основным параметрам проблемной области относятся следующие: - класс решаемых задач (интерпретация, диагностика, коррекция, прогнозирование, планирование, проектирование, мониторинг, управление), - критерии эффективности результатов решения задач (минимизация использования ресурсов, повышение качества продукции и обслуживания, ускорение оборачиваемости капитала и т.д.), - критерии эффективности процесса решения задач (повышение точности принимаемых решений, учет большего числа альтернативных вариантов, адаптивность к изменениям проблемной области информационных потребностей пользователей, сокращение сроков принятия решений), - цели решаемых задач (выбор из альтернатив, например, распределение бюджета по статьям),
19
- подцели - разбиение задачи на подзадачи, для каждой из которых определяется своя цель), - исходные данные (совокупность используемых факторов), - особенности используемых знаний (детерминированность, неопределенность, статичность/динамичность, одноцелевая и многоцелевая направленность, единственность/множественность источников знаний). На этапе построения концептуальной модели создается целостное и системное описание используемых знаний, отражающих сущность функционирования проблемной области. Результат концептуализации проблемной области обычно фиксируется в виде наглядных графических схем на объектном, функциональном и поведенческом уровнях моделирования: - объектная модель описывает структуру предметной области как совокупности взаимосвязанных объектов, - функциональная модель отражает действия и преобразования над объектами, - поведенческая модель рассматривает взаимодействия объектов во временном аспекте. Первые две модели описывают статические аспекты функционирования проблемной области, а третья модель - динамику изменения ее состояний. Объектная модель отражает фактуальное знание о составе объектов, их свойств и связей. Элементарной единицей структурного знания является факт, описывающий одно свойство или одну связь объекта, который представляется в виде триплета: предикат (объект, значение). Под классом объектов понимается совокупность объектов с одинаковым набором предикатов (свойств и связей). Класс объектов часто описывается в виде n арного реляционного отношения. Если объекты обладают частично пересекающимся набором предикатов, то осуществляется более сложная классификация объектов: класс объектов по значениям какого-либо свойства (признака) разбивается на подклассы таким образом, что класс объектов содержит общие для подклассов свойства и связи, а каждый из подклассов отражает специфические свойства и связи. При этом подклассы объектов автоматически наследуют общие свойства и связи вышестоящих классов, а совокупность взаимосвязанных по отношению обобщения классов объектов образует иерархию наследования свойств. Обычно объектное знание представляется графически средствами ER-моделей (модель "Сущность - Связь"). Функциональная модель описывает преобразования фактов, зависимости между ними, показывающие как одни факты образуются от других. Функциональная модель строится путем последовательной композиции целей, а именно: для цели определяются подцели, для которых в свою очередь устанавливаются подцели и так дальше, пока в качестве подцелей не окажутся исходные факты (процесс композии "сверху" - "вниз"). Каждой цели (подцели) соответствует некоторая задача (подзадача), которая не
20
может быть решена, пока не будут достигнуты ее нижестоящие подцели (решены подзадачи). Таким образом, функциональная модель отражает в обобщенной форме процесс решения характерных для нее задач. Обычно функциональные зависимости фактов представляются графически в виде деревьев целей или графов. Поведенческая модель отражает изменение состояний объектов в результате возникновения некоторых событий, влекущих за собой выполнение определенных действий (процедур). Состояние объекта - это изменяющиеся во времени значения некоторого свойства. Набор действий, связанный с некоторым событием, составляет поведение объекта, которое выражается в виде правил или процедур. На этапе формализации базы знаний осуществляется выбор метода представления знаний. В рамках выбранного формализма осуществляется проектирование логической структуры базы знаний.
Рис. 6. Методы представления знаний в экспертных системах
21
5. Методы работы со знаниями Приобретением знаний называется выявление знаний из источников и преобразование их в нужную форму, а также перенос в базу знаний ИС. Источниками знаний могут быть книги, архивные документы, содержимое других баз знаний и т. п., т. е. некоторые объективизированные знания, переведенные в форму, которая делает их доступными для потребителя. Другим типом знаний являются экспертные знания, которые имеются у специалистов, но не зафиксированы во внешних по отношению к нему хранилищах. Экспертные знания являются субъективными. Еще одним видом субъективных знаний являются эмпирические знания. Такие знания могут добываться ИС путем наблюдения за окружающей средой (если у ИС есть средства наблюдения). Ввод в базу знаний объективизированных знаний не представляет особой проблемы, выявление и ввод субъективных и особенно экспертных знаний достаточно трудны. Чтобы разработать методологию приобретения субъективных знаний, получаемых от эксперта, надо четко различать две формы репрезентации знаний. Одна форма связана с тем, как и в каких моделях хранятся эти знания у человека-эксперта. При этом эксперт не всегда осознает полностью, как репрезентированы у него знания. Другая форма связана с тем, как инженер по знаниям, проектирующий ИС, собирается их описывать и представлять. От степени согласованности этих двух форм репрезентации между собой зависит эффективность работы инженера по знаниям. В когнитивной психологии изучаются формы репрезентации знаний (когнитивные структуры знаний) характерные для человека. Примерами могут служить: представление класса понятий через его элементы (например, понятие "птица" репрезентируется рядом чайка, воробей, скворец, ...) представление понятий класса с помощью базового прототипа, отражающего наиболее типичные свойства объектов класса (например, понятие "птица" репрезентируется прототипом нечто с крыльями, клювом, летает) представление с помощью признаков (для понятия "птица", например, наличие крыльев, клюва, двух лап, перьев). Кроме понятий репрезентируются и отношения между ними. Как правило, отношения между понятиями определяются процедурным способом, а отношения между составляющими понятий (определяющими структуру понятия) - декларативным способом. Наличие двух видов описаний заставляет в моделях представления знаний одновременно иметь оба компонента, например, семантическую сеть и продукционную систему, как это представлено в когнитивной модели. При приобретении знаний важную роль играет так называемое поле знаний, в котором содержатся основные понятия, используемые при описании предметной области, и свойства всех отношений, используемых для установления связей между понятиями. Поле знаний связано с концептуальной моделью проблемной области, в которой еще не учтены ограниче-
22
ния, которые неизбежно возникают при формальном представлении знаний в базе знаний. Переход от описания некоторой области в поле знаний к описанию в базе знаний аналогичен переходу от концептуальной модели базы данных к ее логической схеме, когда уже зафиксирована система управления базой данных. Важно отметить, что переход непосредственно к формальным представлениям в базе знаний без этапа концептуального описания в поле знаний приводит к многочисленным ошибкам, что замедляет процесс формирования базы знаний ИС. Возможны три режима взаимодействия инженера по знаниям с экспертом-специалистом: протокольный анализ, интервью и игровая имитация профессиональной деятельности. Протокольный анализ заключается в фиксации (например, путем записи на магнитную ленту) "мыслей вслух" эксперта во время решения проблемы и в последующем анализе полученной информации. В режиме интервью инженер по знаниям ведет с экспертом активный диалог, направляя его в нужную сторону. При игровой имитации эксперт помещается в ситуации, похожие на те, в которых протекает его профессиональная деятельность. Наблюдая за его действиями в различных ситуациях, инженер по знаниям, формирует свои соображения об экспертных знаниях, которые впоследствии могут быть уточнены с экспертом в режиме интервью. Принципы игровой имитации нашли применение в разнообразных деловых играх, специальных тренажерах. Каждый из упомянутых способов извлечения знаний имеет свои преимущества и недостатки. Так, при анализе протоколов инженеру по знаниям нелегко отделить понятия, важные для включения в словарь предметной области, от тех, которые при "мыслях вслух" появляются случайно. Кроме того, в протоколах обнаруживаются пробелы, когда рассуждение эксперта как бы прерывается и продолжается уже на основе пропущенных шагов вывода. Заполнение подобных пробелов возможно лишь в режиме интервью. Таким образом, во всех трех подходах к извлечению знаний из экспертов необходим этап интервью, что делает его одним из важнейших методов приобретения знаний. Существует не менее двух десятков стратегий интервьюирования. Наиболее известны три: разбиение на ступени, репертуарная решетка и подтверждение сходства, При разбиении на ступени эксперту предлагается назвать наиболее важные, по его мнению, понятия предметной области и указать между ними отношения структуризации, т. е. отношения типа "род-вид", "элементкласс", "целое-часть" и т. п. Эти понятия используются на следующем шаге опроса как базовые. Стратегия нацелена на создание иерархии понятий предметной области, выделение в понятиях тесно связанных между собой групп-гаксонов (кластеров). Стратегия репертуарной решетки направлена на выявление характеристических свойств понятий, позволяющих отделять одни понятия от других. Методика состоит в предъявлении эксперту троек понятий с предложением назвать признаки для каждых двух понятий, которые отделяли
23
бы их от третьего. Так как каждое понятие входит в несколько троек, то на основании такой процедуры происходит уточнение объемов понятий и формируются "симптокомплексы" понятий, с помощью которых эти понятия могут идентифицироваться в базе знаний. Стратегия подтверждения сходства состоит в том, что эксперту предлагается установить принадлежность каждой пары понятий из предметной области к некоторому отношению сходства (толерантности). Для этого эксперту задается последовательность достаточно простых вопросов, цель которых заключается в уточнении того понимания сходства, которое вкладывает эксперт в утверждение о сходстве двух понятий предметной области. Процесс взаимодействия инженера по знаниям (аналитика) с экспертом-специалистом включает три основных этапа. 1. Подготовительный этап. Для успеха общения оба участника должны тщательно подготовиться к диалогу или игре. Желательно, чтобы эксперт был не только компетентным специалистом, но и заинтересованным (морально или материально) лицом в достижении конечной целипостроении ИС. Он должен быть доброжелателен к аналитику и уметь объяснять свои знания (наилучший случай - когда эксперт имеет опыт преподавательской работы). Аналитику необходимо: глубоко познакомиться со специальной литературой по предметной области", чтобы не задавать очень "глупых" вопросов (просто "глупые" вопросы бывают чрезвычайно полезны), а также увеличить количество "пакетов ожиданий"; уметь слушать и грамотно задавать вопросы; настроиться на роль "ученика", а не "экзаменатора"; разбираться в моделях когнитивной психологии, а также в моделях представления знаний, чтобы из знаний эксперта выделять четкие структуры. В любой совместной деятельности большое значение имеют психологические качества исследователей, такие, как личность, манера поведения, стиль научного мышления. Существуют различные классификации научных работников. В качестве примера приведем следующую: инициатор - быстро реагирует на перспективные проблемы, т. е. один из первых ощущает необходимость решения проблемы с элементами неопределенности; диагност -способен к быстрой оценке сильных и слабых сторон решения задачи, эрудит - наделен исключительной памятью, отличается повышенным вниманием к деталям и стремлением к упорядоченности; ремесленник - способен воплощать в жизнь плохо оформленные идеи других; эстет - стремится исследовать проблемы, приводящие к изящным решениям, не склонен к кропотливому труду; методолог заинтересован методологическими аспектами исследований; независимый - стремится к индивидуальному решению проблем; фанатик - самоотверженно увлечен своей научной проблемой, того же требует и от окружающих. Принадлежность научного работника к тому или иному типу определяется с помощью косвенных методик (тестов личности, интеллекта, когнитивных стилей, проектных методик). Автоматизация опроса и полу-
24
чения психологического портрета испытуемого реализована, например, в системе АВТАНТЕСТ. Для роли эксперта наиболее предпочтительны инициатор эрудит, диагност и ремесленник (в паре с аналитиком-эрудитом), а для роли аналитика-диагност, методолог, эрудит, инициатор. При этом наилучшее сочетание дают сочетания разных типов. Благодаря различиям в подходах к решению задачи, в точках зрения, стиле мышления восприятия, памяти и т. п. участники в такой паре с разных сторон подходят к поставленной цели, в результате увеличивается общее количество гипотез, идей, альтернативных вариантов, а, следовательно, обогащается поле знаний. Однако не все сочетания даже из приемлемых типов улучшают взаимодействие, а некоторые типы (например, фанатик, эстет, независимый, ремесленник) часто слабо приспособлены для творческого взаимодействия, что приводит к возникновению скрытых и явных конфликтов, которые усложняют процесс продуктивного общения. Важное значение имеет также лидерство в паре. В ходе любого диалога одна сторона обычно занимает позицию ведущей, чаще эту роль берет интервьюер, т. е. аналитик. Роль лидера в диалоге позволяет аналитику направлять и систематизировать процесс создания поля знания, не давая эксперту "размыть" или излишне детализовать процесс. С другой стороны, догматизм и настойчивость могут привести к неадекватному полю. Имеет место также эффект "фасада", т. е. желание эксперта не ударить "в грязь лицом" перед аналитиком, и отсюда генерирование неподтвержденных гипотез. 2. Установление "общего кода". Для создания лингвистического альянса взаимодействия участники взаимодействия должны пытаться сократить "расстоянием между объектом (т. е. исследуемой предметной областью) и аналитиком. Необходимо определить главные понятия, т. е. выработать словарную основу базы знаний; уровень детализации; взаимосвязи между понятиями. 3. Гносеологический этап. На этом этапе происходит выяснение закономерностей, присущих предметной области, условий достоверности и истинности утверждений, структурирование за счет введения отношений и т. п. Этот этап является определяющим во взаимодействии аналитика и эксперта. В процессе анализа игры или диалога вербализуется и формализуется знание эксперта и зачастую для него самого порождается новое знание. Репрезентация внешнего мира в его памяти получает материальное воплощение в форме поля знаний. В процессе извлечения знаний сначала желательно получить от эксперта поверхностные знания (такие, например, как репрезентация признаков), постепенно переходя к глубинным структурам и более абстрактным понятиям (таким, например, как прототипы). При формировании поля знаний учитываются особенности эмпирического знания: модальность, противоречивость, неполнота и т. д.,
25
Аналитик должен за частным всегда видеть общее, т. е. строить цепочки 1 факт - обобщенный факт - эмпирический закон - теоретический закон". Центральное звено цепочки - формализация эмпирики. При этом иногда основным на этапе формализации становится не извлечение "слепых" непонятных связей, а понимание внутренней структурной связи понятий предметной области. Искусство аналитика состоит в стремлении к созданию ясной и понятной модели проблемной области. Следует также учитывать, что эксперты в проблемной области не всегда опираются на логические рассуждения. В их представлениях о проблемной области и методах решения задач, характерных для нее, широкое применение находят ассоциативные рассуждения и рассуждения правдоподобия. Опишем примерную методику работы с экспертом по формированию поля знаний. Подготовительный этап Четкое определение задач проектируемой системы (сужение поля знаний): определение, что на входе и выходе; определение режима работ, консультации, обучение и др. Выбор экспертов: определение количества экспертов; выбор уровня компетентности (не всегда хорошо выбирать самый высокий уровень сразу); определение способов и возможности заинтересовать экспертов в работе; тестирование экспертов. Знакомство аналитика со специальной литературой в предметной области. Знакомство аналитика и экспертов (в дальнейшем для простоты будем считать, что эксперт один). Знакомство эксперта с популярной литературой по искусственному интеллекту (желательно, но необязательно). Попытка аналитика создать поле знаний первого приближения априорным знаниям из литературы (прототип поля знаний). Основной этап "Накачка" поля знаний: а) в зависимости от предметной области выбор способа интервьюирования; б) протоколирование мыслей вслух или запись на магнитофон рассуждений эксперта (аналитик по возможности не должен пока вмешиваться в рассуждения). "Домашняя работа". Попытка аналитика выделить некоторые причинно-следственные связи в рассуждениях эксперта; построение словаря предметной области (возможно, на карточках) и подготовка вопросов к эксперту. "Подкачка" поля зрения. Обсуждение с экспертом прототипа поля знаний и домашней работы, а также ответы на вопросы аналитика. Формализация концептуальной модели. Построение поля знаний второго приближения.
26
Системы приобретения знаний от экспертов Проблемы, возникающие при извлечении экспертных знаний, некоторые психологи связывают с так называемой когнитивной защитой. Известна теория человеческого познания, основанная на понятии "персональных конструктов", которые человек создает и пытается приспособить к реалиям мира. Также известна теория персональных конструктов, которая использована для создания системы извлечения экспертных знаний и показала свою способность успешно преодолевать когнитивную защиту, т. е. нежелание экспертов достичь четкого и осознанного ими истолкования основных понятий, отношений между понятиями и приемов решения задач в интересующей инженера по знаниям проблемной области. Методы интервьюирования эксперта предметной области знаний с использованием нескольких различных стратегий применены при создании системы TEIRESIAS. На примере диагностической системы MORE можно описать технику интервьюирования, направленную на выяснение сущностей, гипотез, симптомов, условий, связей и путей. Гипотеза – событие, идентификация которого имеет своим результатом диагноз. Симптом-событие, являющееся следствием существования гипотезы, наблюдение которого приближает последующее принятие гипотезы. Условие - событие или некоторое множество событий, которое не является непосредственно симптоматическим для какой-либо гипотезы, но которое может иметь диагностическое значение для некоторых других событий. Связи-соединения сущностей (в том числе, других связей). Путь - выделенный тип связи, который соединяет гипотезы с симптомами. В соответствии с этим используются следующие стратегии интервью: дифференциация гипотез, различение симптомов, симптомная обусловленность, деление пути и др. Дифференциация гипотез направлена на поиск симптомов, которые обеспечивают более точное различение гипотез. Наиболее мощными в этом смысле являются те симптомы, которые происходят из одного диагностируемого события. Различение симптомов выявляет специфические характеристики симптома, которые, с одной стороны, идентифицируют его как следствие некоторой гипотезы, с другой - противопоставляют другим. Симптомная обусловленность направлена на выявление негативных симптомов, т. е. симптомов, отсутствие которых имеет больший диагностический вес, чем их присутствие. Деление пути обеспечивает нахождение симптоматических событий, которые лежат на пути к уже найденному симптому. Если такой симптом существует, то он имеет большое диагностическое значение, чем уже найденный. Аналогичные стратегии интервьюирования эксперта использованы при создании инструментальной диагностической системы ИДИС. В системе KRITON для приобретения знаний используются два источника: эксперт с его знаниями, полученными на практике (эти знания, как правило, неполны, отрывочны, плохо структурированы); книжные знания, документы, описания инструкции (эти знания хорошо структурирова-
27
ны и фиксированы традиционными средствами). Для извлечения знаний из первого источника в KRITON применена техника интервью, использующая стратегии репертуарной решетки и разбиения на ступени. При этом применяется прием переключения стратегий: если при предъявлении тройки семантически связанных понятий эксперт не в состоянии назвать признак, отличающий два из них от третьего, система запускает стратегию разбиения на ступени и предпринимает попытку выяснения таксономической структуры этих понятий с целью выявления признаков, их различающих. Для выявления процедурных знаний эксперта в KRITON применен метод протокольного анализа. Он осуществляется в пять шагов. На первом шаге протокол делится на сегменты на основании пауз, которые делает эксперт в процессе записи. Второй шаг - семантический анализ сегментов, формирование высказываний для каждого сегмента. На третьем шаге из текста выделяются операторы и аргументы. Далее делается попытка поиска по образцу в базе знаний для обнаружения переменных в высказываниях (переменная вставляется в высказывание, если соответствующая ссылка в тексте не обнаружена). На последнем шаге утверждения упорядочиваются в соответствии с их появлением в протоколе. Анализ текста используется в KRITON для выявления хорошо структурированных знаний из книг, документов, описаний, инструкций. Существует метод выявления модели предметной области. Первая фаза-формирование инженером знаний грубой модели предметной области путем определения предикатов и сортов их возможных аргументов и сообщения системе фактов об области, выразимых этими предикатами. Система выявляет свойства предикатов и устанавливает отношения между ними, структурируя таким образом предметную область. На второй фазе с помощью метазнаний (общих структур), отражающих особенности человеческого мышления, осуществляется проверка соответствия фактов предикатам, индуктивный вывод правил из фактов, вывод правил из других правил. В системах SIMER и ДИАПС основным методом приобретения знаний является автоматизированное интервьюирование эксперта, которое управляется знаниями, приобретенными системой. В системах SIMER и ДИАПС не выявляется предварительная модель области. Все объекты (события) и их атрибуты определяются в режиме прямого интервьюирования эксперта. Предполагается только, что на множестве объектов могут быть заданы ряд отношений из известного (конечного) множества: "элементмножество", "часть - целое", "пример - прототип", отношения структурного сходства объектов, структурной иерархии и некоторые другие. Все отношения попарно различаются формальными свойствами. Так, отношений структурного сходства не обладает транзитивностью, но симметрично. Отношение структурной иерархии, напротив, не обладает симметричностью, однако транзитивно. На выяснение этих и ряда других свойств отношений и объектов направлено интервью.
28
В частности, для установления структурного сходства на первой фазе интервью для каждого вновь вводимого понятия эксперту предлагается указать (с помощью меню) те понятия предметной области, с которыми может быть связано данное (без спецификации отношения). Затем в процессе интервью для каждой пары понятий (из выделенных на первой фазе) связь специфицируется, устанавливаются свойства и тип отношения, в число элементов которого включается исследуемая пара. Так, для включения некоторой пары понятий Х и Y, о которых эксперт сообщил, что Х влияет на Y(например, Х увеличивает возможность Y), в число элементов некоторого отношения Я, обладающего среди прочих свойств симметричностью, необходимо задать эксперту вопрос: "Увеличивает ли Y возможность X?". При положительном ответе на этот вопрос (и если прочие свойства уже установлены и удовлетворяют определению отношения Я) пара (X, Y) включается в R. Для установления структурного сходства и структурной иерархии понятий используются стратегии подтверждения сходства и разбиения на ступени. В модели имеются метапроцедуры и метаправила, которые проверяют корректность модели, используют формальные свойства отношений для пополнения модели и генерируют правила. Сформулируем основные этапы реализации системы приобретения знаний: 1. Интервью для определения актуальной области, в которой происходит процесс решения интересующей проблемы, и расчленение ее на автономные области. 2. Автоматизированное интервью для выявления и формирования декларативной модели предметной области. 3. Протокольный анализ к выявленным на предыдущем этапе понятиям и отношениям предметной области для пополнения модели процедурными знаниями (этапы 2 и 3 можно использовать попеременно до тех пор, пока модель не достигнет нужной полноты). 4. Протокольный анализ для пополнения декларативных знаний модели. 5. Проверка полноты модели. Обычно протокольный анализ выявляет пустоты в модели. Имеется в виду случай, когда понятия, использованные в "мыслях вслух", недостаточно описаны. В этом случае интервью и протокольный анализ повторяются. Формализация качественных знаний При формализации качественных знаний может быть использована теория нечетких множеств, особенно те ее аспекты, которые связаны с лингвистической неопределенностью, наиболее часто возникающей при работе с экспертами на естественном языке. Под лингвистической неопределенностью подразумевается не полиморфизм слов естественного языка, который может быть преодолен на уровне понимания смысла высказываний в рамках байесовской модели, а качественные оценки естественного
29
языка для длины, времени, интенсивности, для целей логического вывода, принятия решений, планирования. Лингвистическая неопределенность в системах представления знаний задается с помощью лингвистических моделей, основанных на теории лингвистических переменных и теории приближенных рассуждений. Эти теории опираются на понятие нечеткого множества, систему операций над нечеткими множествами и методы построения функций принадлежности. Одним из основных понятий, используемых в лингвистических моделях, является понятие лингвистической переменной. Значениями лингвистических переменных являются не числа, а слова или предложения некоторого искусственного либо естественного языка. Например, числовая переменная "возраст" принимает дискретные значения между нулем и сотней, а целое число является значением переменной. Лингвистическая переменная "возраст" может принимать значения: молодой, старый, довольно старый, очень молодой и т. д. Эти термы - лингвистические значения переменной. На это множество (как и на числа) также налагаются ограничения. Множество допустимых значений лингвистической переменной называется терм-множеством. При вводе в ЭВМ информации о лингвистических переменных и терм-множестве ее необходимо представить в форме, пригодной для работы на ЭВМ. Лингвистическая переменная задается набором из пяти компонентов: , где Л-имя лингвистической переменной; Т(Л)-ее терм-множество; U- область, на которой определены значения лингвистической переменной; А описывает операции по порождению производных значений лингвистической переменной на основе тех значений, которые входят в терм-множество. С помощью правил из О можно расширить число значений лингвистической переменной, т. е. расширить ее терм-множество. Каждому значению А лингвистической переменной Л соответствует нечеткое множество, являющееся подмножеством V. По аналогии с формальными системами, правила часто называют синтаксическими. Наконец, компонент М образует набор семантических правил. С их помощью происходит отображение значений лингвистической переменной А в нечеткие множества Ха и выполняются обратные преобразования. Именно эти правила обеспечивают формализацию качественных утверждений экспертов при формировании проблемной области в памяти ИС. Для перехода от качественных описаний к формализованным необходимо построить отображения, входящие в М, т. е. построить функции принадлежности. При получении от экспертов информации о виде функций принадлежности необходимо учитывать характер измерений (первичные и производные измерения) и тип шкалы, на которую проецируются измерения и на которой будут определяться функции принадлежности. На этой шкале задается вид допустимых операторов и операций, т. е. некоторая алгебра для функций принадлежности. Кроме того, следует различать характеристики, которые можно измерять непосредственно и характеристики, которые яв-
30
ляются качественными и требуют попарного сравнения объектов, обладающих этими характеристиками, чтобы определить их отношение к исследуемому понятию. Можно выделить две группы методов построения функций принадлежности: прямые и косвенные. В прямых методах эксперт непосредственно задает правила определения значений функции принадлежности. В косвенных методах значения функции принадлежности выбираются таким образом, чтобы удовлетворялись заранее сформулированные условия. Экспертная информация является только исходной для дальнейшей обработки. Дополнительные условия могут налагаться как на вид получаемой информации, так и на процедуру обработки. Примерами дополнительных условий могут служить следующие: функция принадлежности должна отражать близость к заранее выделенному эталону, объекты множества являются точками в параметрическом пространстве; результатом процедуры обработки должна быть функция принадлежности, удовлетворяющая условиям интервальной шкалы; при попарном сравнении объектов, если один объект оценивается в k раз сильнее, чем другой, то второй объект оценивается в 1/k раз сильнее, чем первый объект и т. д. Как правило, прямые методы используются для описания понятий, которые характеризуются измеримыми признаками (высотой, ростом, массой, объемом). В этом случае удобно непосредственное задание функции принадлежности. К прямым методам можно отнести методы, основанные на вероятностной трактовке функций принадлежности: а(и)==Р(а/и), т. е. вероятность того, что объект будет принадлежать к множеству. Так как люди часто искажают оценки, например, сдвигают их в направлении концов оценочной шкалы, то прямые измерения, основанные на непосредственном определении значений функции принадлежности, могут быть использованы только в том случае, когда такие искажения незначительны или маловероятны. Косвенные методы более трудоемки, чем прямые, но обладают стойкостью к искажениям в ответе. Результатом применения косвенных методов является интервальная шкала. Известны ограничения применения косвенных методов (условие безоговорочного экстремума): при определении степени принадлежности множество исследуемых объектов должно содержать, по крайней мере, два объекта, численные представления которых на интервале [0; 1] - 0 и 1 соответственно. Функции принадлежности могут отражать как мнение некоторой группы экспертов, так и мнение одного уникального эксперта. Комбинируя возможные два метода построения функций принадлежности с двумя типами экспертов (коллективным и уникальным), можно получить четыре типа экспертизы. При анализе ситуации эксперт рассуждает в семантическом пространстве (пространстве шкал), в котором ситуации соответствует оцененный образ. Семантическое пространство аналогично субъективному пространству ощущений, в котором формируется внутренний образ внешних
31
сигналов и возникают субъективные связи между свойствами (признаками, параметрами). В зависимости от индивидуального восприятия одно и то же значение признака может быть оценено по-разному. Однако для конкретного индивидуума оцененная ситуация является инвариантом относительно определенного класса ситуаций. Следовательно, при отождествлении реальных значений признаков с семантическим образом существенной является форма нечеткого отображения пространства признаков в семантическое пространство. Отображение любой ситуации на единичный интервал происходит таким образом, что точка интервала характеризует степень проявления некоторого свойства (0 соответствует отсутствию свойства, 1интересующему нас максимальному проявлению свойства). При построений функции принадлежности используется модель измерений, которая определяется двумя параметрами: типом шкалы принадлежности, на которую отображается информация от эксперта и типом измерения (прямой или косвенный). Процесс формализации знаний, полученных у эксперта, состоит из следующих шагов: выбор метода измерения нечеткости, получение исходных данных посредством опроса эксперта, реализация алгоритма построения функции принадлежности. В процессе реализации метода используются следующие характеристики: тип метода измерения (П - прямой, К - косвенный); интерпретация принадлежности (ВЧ - вероятность частотная, ВС - вероятность субъективная, В - возможность, Д - детерминированная); процедура получения исходных данных (ОФ - определение функции принадлежности в виде формул, 03-назначение значений принадлежности, ОДН - оценивание типа "да - нет"; ОПО - оценивание пар объектов; Р ранжирование, РП -ранжирование пар объектов, ПС - сравнение попарно); измерений (Ф - фундаментальное, П - производное); тип шкалы (Н - номинальная" П - порядковая, И - интервальная, О - отношений, А - абсолютная). 6. Модели и методы решения задач Классификация представления задач Логические модели Постановка и решение любой задачи всегда связаны с ее "погружением" в подходящую предметную область. Так, решая задачу составления расписания обработки деталей на металлорежущих станках, мы вовлекаем в предметную область такие объекты, как конкретные станки, детали, интервалы времени, и общие понятия "станок", "деталь", "тип станка" и т. п. Все предметы и события, которые составляют основу общего понимания необходимой для решения задачи информации, называются предметной областью. Мысленно предметная область представляется состоящей из реальных или абстрактных объектов, называемых сущностями.
32
Сущности предметной области находятся в определенных отношениях друг к другу (ассоциациях), которые также можно рассматривать как сущности и включать в предметную область. Между сущностями наблюдаются различные отношения подобия. Совокупность подобных сущностей составляет класс сущностей, являющийся новой сущностью предметной области. Отношения между сущностями выражаются с помощью суждений. Суждение-это мысленно возможная ситуация, которая может иметь место для предъявляемых сущностей или не иметь места. В языке (формальном или естественном) суждениям отвечают предложения. Суждения и предложения также можно рассматривать как сущности и включать в предметную область. Языки, предназначенные для описания предметных областей, называются языками представления знаний. Универсальным языком представления знаний является естественный язык. Однако использование естественного языка в системах машинного представления знаний наталкивается на большие трудности ввиду присущих ему нерегулярностей, двусмысленностей и т. п. Но главное препятствие заключается в отсутствии формальной семантики естественного языка, которая имела бы достаточно эффективную операционную поддержку. Для представления математического знания в математической логике давно пользуются логическими формализмами - главным образом исчислением предикатов, которое имеет ясную формальную семантику и операционную поддержку в том смысле, что для него разработаны механизмы вывода. Поэтому исчисление предикатов было первым логическим языком, который применили для формального описания предметных областей, связанных с решением прикладных задач. Описания предметных областей, выполненные в логических языках, называются (формальными) логическими моделями. Сетевые модели Введем ряд определений. Под сущностью будем понимать объект произвольной природы. Этот объект может существовать в реальном мире. В этом случае он будет называться П-сущностью. В базе знаний ему соответствует некоторое описание, полнота которого определяется той информацией, которую имеет о П-сущности ИС. Такое представление в базе знаний называется М-сущностью. Могут существовать М-сущности, для которых в окружающем ИС мире нет соответствующих П-сущностей. Такие М-сущности представляют собой абстрактные объекты, полученные в результате операций типа обобщения внутри базы знаний. Разделение на два типа сущностей позволяет использовать в сетевых моделях идеи, впервые сформулированные в теории семиотических моделей и основанном на них ситуационном управлении. Под семиотическими моделями проблемных областей будет пониматься комплекс процедур, позволяющих отображать в базе знаний П-сущности и их связи, фиксируе-
33
мые в проблемной области инженером по знаниям, в совокупность связанных между собой М-сущностей. Способ интерпретации взаимосвязанных П-сущностей будет называться денотативной семантикой, а способ интерпретации взаимосвязанных М-сущностей - коннотативной семантикой. П-сущность по отношению к соответствующей М-сущности называется денотатом или референтом этой М-сущности, а М-сущность по отношению к исходной П-сущности - ее десигнатом, именем, меткой, идентификатором и т. п. Десигнат-это простейший элемент в сетевой модели. Он входит в класс терминальных объектов сетевой модели. Терминальным объектом называется М-сущность, которая не может быть разложена на более простые сущности. Остальные М-сущности называются производными объектами или производными М-сущностями. Перечень терминальных объектов, которые могут образовывать классы или типы, задается при проектировании ИС. Ими могут быть целые вещественные числа, идентификаторы, строки, списки и т. п. Семантика терминальных объектов определяется набором допустимых процедур, оперирующих с ними, например: арифметические действия над числами, сравнение между собой строк или идентификаторов, операции вводавывода, включающие необходимые трансформации представлений, и т. д. Продукционные модели Продукции наряду с фреймами являются наиболее популярными средствами представления знаний в ИС. Продукции, с одной стороны, близки к логическим моделям, что позволяет организовывать на них эффективные процедуры вывода, а с другой стороны, более наглядно отражают знания, чем классические логические модели. В них отсутствуют жесткие ограничения, характерные для логических исчислений, что дает возможность изменять интерпретацию элементов продукции. В общем виде под продукцией понимается выражение следующего вида: (i); Q; Р; А=>В; N. Здесь i-имя продукции, с помощью которого данная продукция выделяется из всего множества продукций. В качестве имени может выступать некоторая лексема, отражающая суть данной продукции (например, "покупка книги" или "набор кода замка"), или порядковый номер продукции в их множестве, хранящемся в памяти системы. Элемент Q характеризует сферу применения продукции. Такие сферы легко выделяются в когнитивных структурах человека. Наши знания как бы "разложены по полочкам". На одной "полочке" хранятся знания о том, как надо готовить пищу, на другой - как добраться до работы и т. п. Разделение знаний на отдельные сферы позволяет экономить время на поиск нужных знаний. Такое же разделение на сферы в базе знаний ИС целесообразно и при использовании для представления знаний продукционных моделей.
34
Основным элементом продукции является ее ядро: А=>В. Интерпретация ядра продукции может быть различной и зависит от того, что стоит слева и справа от знака секвенции =>. Обычное прочтение ядра продукции выглядит так: ЕСЛИ A, ТО B, более сложные конструкции ядра допускают в правой части альтернативный выбор, например, ЕСЛИ А, ТО B1, ИНАЧЕ B2. Секвенция может истолковываться в обычном логическом смысле как знак логического следования В из истинного А (если А не является истинным выражением, то о В ничего сказать нельзя). Возможны и другие интерпретации ядра продукции, например, A описывает некоторое условие, необходимое для того, чтобы можно было совершить действие В. Элемент Р есть условие применимости ядра продукции. Обычно Р представляет собой логическое выражение (как правило, предикат). Когда Р принимает значение "истина", ядро продукции активизируется. Если Р ложно, то ядро продукции не может быть использовано. Например, если в продукции "НАЛИЧИЕ ДЕНЕГ; ЕСЛИ ХОЧЕШЬ КУПИТЬ ВЕЩЬ X, ТО ЗАПЛАТИ В КАССУ ЕЕ СТОИМОСТЬ И ОТДАЙ ЧЕК ПРОДАВЦУ" условие применимости ядра продукции ложно, т. е. денег нет, то применить ядро продукции невозможно. Элемент N описывает постусловия продукции. Они актуализируются только в том случае, если ядро продукции реализовалось. Постусловия продукции описывают действия и процедуры, которые необходимо выполнить после реализации В. Например, после покупки некоторой вещи в магазине необходимо в описи товаров, имеющихся в этом магазине, уменьшить количество вещей такого типа на единицу. Выполнение N может происходить не сразу после реализации ядра продукции. Если в памяти системы хранится некоторый набор продукций, то они образуют систему продукций. В системе продукций должны быть заданы специальные процедуры управления продукциями, с помощью которых происходит актуализация продукций и выбор для выполнения той или иной продукции из числа актуализированных. В ряде ИС используются комбинации сетевых и продукционных моделей представления знаний. В таких моделях декларативные знания описываются в сетевом компоненте модели, а процедурные знания - в продукционном. В этом случае говорят о работе продукционной системы над семантической сетью. Сценарии Особую роль в системах представления знаний играют стереотипные знания, описывающие известные стандартные ситуации реального мира. Такие знания позволяют восстанавливать информацию, пропущенную в описании ситуации, предсказывать появление новых фактов, которых можно ожидать в данной ситуации, устанавливать смысл происхождения ситуации с точки зрения более общего ситуативного контекста. Для описания стереотипного знания используются различные модели. Среди них наиболее распространенными являются сценарии. Сценари-
35
ем называется формализованное описание стандартной последовательности взаимосвязанных фактов, определяющих типичную ситуацию предметной области. Это могут быть последовательности действий или процедур, описывающие способы достижения целей действующих лиц сценария (например, обед в ресторане, командировка, полет самолета, поступление в вуз). В ИС сценарии используются в процедурах понимания естественноязыковых текстов, планирования поведения, обучения, принятия решений, управления изменениями среды и др. Интеллектуальный интерфейс Предположим, что на вход ИС поступает текст. Будем говорить, то ИС понимает текст, если она дает ответы, правильные с точки зрения человека, на любые вопросы, относящиеся к тому, о чем говорится в тексте. Под "человеком" понимается конкретный человек-эксперт, которому поручено оценить способности системы к пониманию. Это вносит долю субъективизма, ибо разные люди могут по-разному понимать одни и те же тексты. Классификация уровней понимания В существующих ИС можно выделить пять основных уровней понимания и два уровня метапонимания. Первый уровень характеризуется схемой, показывающей, что любые ответы на вопросы система формирует только на основе прямого содержания, введенного из текста. Если, например, в систему введен текст: "В восемь утра, после завтрака, Петя ушел в школу. В два часа он вернулся домой. После обеда он ушел гулять", то на первом уровне понимания система обязана уметь отвечать правильно на вопросы типа: "Когда Петя ушел в школу?" или "Что сделал Петя после обеда?". В лингвистическом процессоре происходит морфологический, синтаксический и семантический анализ текста и вопросов, относящихся к нему. На выходе лингвистического процессора получается внутреннее представление текста и вопросов, с которыми может работать блок вывода. Используя специальные процедуры, этот блок формирует ответы. Другими словами, уже понимание на первом уровне требует от ИС определенных средств представления данных и вывода на этих данных. На втором уровне добавляются средства логического вывода, основанные на информации, содержащейся в тексте. Это разнообразные логики текста (временная, пространственная, каузальная и т. п.), которые способны породить информацию, явно отсутствующую в тексте. Для нашего примера на втором уровне возможно формирование правильных ответов на вопросы типа: "Что было раньше: уход Пети в школу или его обед?" или "Гулял Петя после возвращения из школы?" Только построив временную структуру текста, ИС сможет ответить на подобные вопросы. Схема ИС, с помощью которой может быть реализован второй уровень понимания, имеет еще одну базу знаний. В ней хранятся закономер-
36
ности, относящиеся к временной структуре событий, возможной их пространственной организации, каузальной зависимости и т. п., а логический блок обладает всеми необходимыми средствами для работы с псевдофизическими логиками. Третий уровень. К средствам второго уровня добавляются правила пополнения текста знаниями системы о среде. Эти знания в ИС, как правило, носят логический характер и фиксируются в виде сценариев или процедур иного типа. На третьем уровне понимания ИС должна дать правильные ответы на вопросы типа: "Где был Петя в десять утра?" или "Откуда Петя вернулся в два часа дня?" Для этого надо знать, что означает процесс "пребывание в школе" и, в частности, что этот процесс является непрерывным и что субъект, участвующий в нем, все время находится "в школе". Схема ИС, в которой реализуется понимание третьего уровня, внешне не отличается от схемы второго уровня. Однако в логическом блоке должны быть предусмотрены средства не только для чисто дедуктивного вывода, но и для вывода по сценариям. Три перечисленных уровня понимания реализованы во всех практически работающих ИС. Первый уровень и частично второй входят в разнообразные системы общения на естественном языке. Следующие два уровня понимания реализованы в существующих ИС лишь частично. Четвертый уровень. Вместо текста в ней используется расширенный текст, который порождается лишь при наличии двух каналов получения информации. По одному в систему передается текст, по другому - дополнительная информация, отсутствующая в тексте. При человеческой коммуникации роль второго канала, как правило, играет зрение. Более одного канала коммуникации имеют интеллектуальные роботы, обладающие зрением. Зрительный канал коммуникации позволяет фиксировать состояние среды "здесь и сейчас" и вводить в текст наблюдаемую информацию. Система становится способной к пониманию текстов, в которые введены слова, прямо связанные с той ситуацией, в которой порождается текст. На более низких уровнях понимания нельзя понять, например, текст: "Посмотрите, что сделал Петя! Он не должен был брать это!" При наличии зрительного канала процесс понимания становится возможным. При наличии четвертого уровня понимания ИС способна отвечать на вопросы типа: "Почему Петя не должен был брать это?" или "Что сделал Петя?" Если вопрос, поступивший в систему, соответствует третьему уровню, то система выдает нужный ответ. Если для ответа необходимо привлечь дополнительную ("экзегетическую") информацию, то внутреннее представление текста и вопроса передается в блок, который осуществляет соотнесение текста с той реальной ситуацией его порождения, которая доступна ИС по зрительному или какому-нибудь иному каналу фиксации ситуации внешнего мира.
37
Пятый уровень. Для ответа на этом уровне ИС кроме текста использует информацию о конкретном субъекте, являющемся источником текста, и хранящуюся в памяти системы общую информацию, относящуюся к коммуникации (знания об организации общения, о целях участников общения, о нормах участия в общении). Теория, соответствующая пятому уровню, - это так называемая теория речевых актов. Было обращено внимание на то, что любая фраза не только обозначает некое явление действительности, но и объединяет в себе три действия: локуцию, иллокуцию и перлокуцию. Локуция-это говорение как таковое, т. е. те действия, которые говорящий произвел, чтобы высказать свою мысль. Иллокуция - это действие при помощи говорения: вопрос, побуждение (приказ или просьба) и утверждение. Перлокуция - это действие, которым говорящий пытается осуществить некоторое воздействие на слушающего: "льстить", "удивлять", "уговаривать" и т. д. Речевой акт можно определить как минимальную осмысленную (или целесообразную) единицу речевого поведения. Каждый речевой акт состоит из локутивного, иллокутивного и перлокутивного акта. Для четвертого и пятого уровней понимания интересны результаты по невербальным (несловесным) компонентам общения и психологическим принципам, лежащим в основе общения. Кроме того, в правила пополнения текста входят правила вывода, опирающиеся на знания о данном конкретном субъекте общения, если такие знания у системы есть. Например, система может доверять данному субъекту, считая, что порождаемый им текст истинен. Но может не доверять ему и понимать текст, корректируя его в соответствии со своими знаниями о субъекте, породившем текст. Знания такого типа должны опираться на психологические теории общения, которые пока развиты недостаточно. Например, на вход системы поступает текст: "Нина обещала скоро прийти". Если о Нине у системы нет никакой информации, она может обратиться к базе знаний и использовать для оценки временного указателя "скоро некоторую нормативную информацию. Из этой информации можно узнать, что с большой долей уверенности "скоро" не превышает полчаса. Но у системы может иметься специальная информация о той Нине, о которой идет речь во входном тексте. В этом случае система, получив нужную информацию из базы знаний, может приготовиться, например, к тому, что Нина, скорее всего, придет не ранее чем через час. Первый метауровень. На этом уровне происходит изменение содержимого базы знаний. Она пополняется фактами, известными системе и содержащимися в тех текстах, которые в систему введены. Разные ИС отличаются друг от друга характером правил порождения фактов из знаний. Например, в системах, предназначенных для экспертизы в области фармакологии, эти правила опираются на методы индуктивного вывода и распознавания образов. Правила могут быть основаны на принципах вероятностей, размытых выводов и т. п. Но во всех случаях база знаний оказывается априорно неполной и в таких ИС возникают трудности с поиском ответов
38
на запросы. В частности, в базах знаний становится необходимым немонотонный вывод. Второй метауровень. На этом уровне происходит порождение метафорического знания. Правила порождения знаний метафорического уровня, используемые для этих целей, представляют собой специальные процедуры, опирающиеся на вывод по аналогии и ассоциации. Известные в настоящее время схемы вывода по аналогии используют, как правило, диаграмму Лейбница, которая отражает лишь частный случай рассуждений по аналогии. Еще более бедны схемы ассоциативных рассуждений. Если рассматривать уровни и метауровни понимания с точки зрения архитектуры ИС, то можно наблюдать последовательное наращивание новых блоков и усложнение реализуемых ими процедур. На первом уровне достаточно лингвистического процессора с базой знаний, относящихся только к самому тексту. На втором уровне в этом процессоре возникает процедура логического вывода. На третьем уровне необходима база знаний. Появление нового канала информации, который работает независимо от исходного, характеризует четвертый уровень. Кроме процедур, связанных с работой этого канала, появляются процедуры, увязывающие между собой результаты работы двух каналов, интегрирующие информацию, получаемую по каждому из них. На пятом уровне развитие получают разнообразные способы вывода на знаниях и данных. На этом уровне становятся важными модели индивидуального и группового поведения. На метауровнях возникают новые процедуры для манипулирования знаниями, которых не было на более низких уровнях понимания. И этот процесс носит открытый характер. Понимание в полном объеме - некоторая, по-видимому, недостижимая мечта. Но понимание на уровне "бытового понимания" людей в ИС вполне достижимо. Существуют и другие интерпретации феномена понимания. Можно, например, оценивать уровень понимания по способности системы к объяснению полученного результата. Здесь возможен не только уровень объяснения, когда система объясняет, что она сделала, например, на основе введенного в нее текста, но и уровень обоснования (аргументации), когда система обосновывает свой результат, показывая, что он не противоречит той системе знаний и данных, которыми она располагает. В отличие от объяснения обоснование всегда связано с суммой фактов и знаний, которые определяются текущим моментом существования системы. И вводимый для понимания текст в одних состояниях может быть воспринят системой как истинный, а в других - как ложный. Кроме объяснения и обоснования возможна еще одна функция, связанная с пониманием текстов,- оправдание. Оправдать нечто означает, что выводимые утверждения не противоречат той системе норм и ценностей, которые заложены в ИС. Существующие ИС типа экспертных систем, как правило, способны давать объяснения и лишь частично обоснования. В полном объеме процедуры обоснования и оправдания еще не реализованы.
39
7. Планирование задач Основные определения Функционирование многих ИС носит целенаправленный характер. Типичным актом такого функционирования является решение задачи планирования пути достижения нужной цели из некоторой фиксированной начальной ситуации. Результатом решения задачи должен быть план действий - частично-упорядоченная совокупность действий. Такой план напоминает сценарий, в котором в качестве отношения между вершинами выступают отношения типа: "цель-подцель" "цель-действие", "действиерезультат" и т. п. Любой путь в этом сценарии, ведущий от вершины, соответствующей текущей ситуации, в любую из целевых вершин, определяет план действий. Поиск плана действий возникает в ИС лишь тогда, когда она сталкивается с нестандартной ситуацией, для которой нет заранее известного набора действий, приводящих к нужной цели. Все задачи построения плана действий можно разбить на два типа, которым соответствуют различные модели: планирование в пространстве состояний (SS-проблема) и планирование в пространства задач (PR-проблема). В первом случае считается заданным некоторое пространство ситуаций. Описание ситуаций включает состояние внешнего мира и состояние ИС, характеризуемые рядом параметров. Ситуации образуют некоторые обобщенные состояния, а действия ИС или изменения во внешней среде приводят к изменению актуализированных в данный момент состояний. Среди обобщенных состояний выделены начальные состояния (обычно одно) и конечные (целевые) состояния. SS-проблема состоит в поиске пути, ведущего из начального состояния в одно из конечных. Если, например, ИС предназначена для игры в шахматы, то обобщенными состояниями будут позиции, складывающиеся на шахматной доске. В качестве начального состояния может рассматриваться позиция, которая зафиксирована в данный момент игры, а в качестве целевых позиций - множество ничейных позиций. Отметим, что в случае шахмат прямое перечисление целевых позиций невозможно. Матовые и ничейные позиции описаны на языке, отличном от языка описания состояний, характеризуемых расположением фигур на полях доски. Именно это затрудняет поиск плана действий в шахматной игре. При планировании в пространстве задач ситуация несколько иная. Пространство образуется в результате введения на множестве задач отношения типа: "часть - целое", "задача - подзадача", "общий случай - частный случай" и т. п. Другими словами, пространство задач отражает декомпозицию задач на подзадачи (цели на подцели). PR-проблема состоит в поиске декомпозиции исходной задачи на подзадачи, приводящей к задачам, решение которых системе известно. Например, ИС известно, как вычисляются значения sin x и cos x для любого значения аргумента и как производится операция деления. Если ИС необходимо вычислить tg x, то решением
40
PR-проблемы будет представление этой задачи в виде декомпозиции tgx=a =sinx/cosx (кроме π := π /2+k π ). Дадим классификацию методов, используемых при решении SS- и PR-проблем. 1. Планирование по состояниям. Представление задач в пространстве состояний предполагает задание ряда описаний: состояний, множества операторов и их воздействий на переходы между состояниями, целевых состояний. Описания состояний могут представлять собой строки символов, векторы, двухмерные массивы, деревья, списки и т. п. Операторы переводят одно состояние в другое. Иногда они представляются в виде продукций А=>В, означающих, что состояние А преобразуется в состояние В. Пространство состояний можно представить как граф, вершины которого помечены состояниями, а дуги - операторами. Если некоторая дуга направлена от вершины ni, к вершине nj, то ni, называется дочерней, а nj;родительской вершинами. Последовательность вершин ni1, ni2, ... ,nik , в которой каждая niдочерняя вершина для вершины ni-1 , i=2,..., k, называется путем длиной k от вершины ni1, к вершине nik . Таким образом, проблема поиска решения задачи при планировании по состояниям представляется как проблема поиска на графе пути из A в B. Обычно графы не задаются, а генерируются по мере надобности. Различаются слепые и направленные методы поиска пути. Слепой метод имеет два вида: поиск вглубь и поиск вширь. При поиске вглубь каждая альтернатива исследуется до конца, без учета остальных альтернатив. Метод плох для "высоких" деревьев, так как легко можно проскользнуть мимо нужной ветви и затратить много усилий на исследование "пустых" альтернатив. При поиске вширь на фиксированном уровне исследуются все альтернативы и только после этого осуществляется переход на следующий уровень. Метод может оказаться хуже метода поиска влубь, если в графе все пути, ведущие к целевой вершине, расположены примерно на одной и той же глубине. Оба слепых метода требуют большой затраты времени и поэтому необходимы направленные методы поиска. Метод ветвей и границ. Из формирующихся в процессе поиска неоконченных путей выбирается самый короткий и продлевается на один шаг. Полученные новые неоконченные пути (их столько, сколько ветвей в данной вершине) рассматриваются наряду со старыми, и вновь продлевается на один шаг кратчайший из них. Процесс повторяется до первого достижения целевой вершины, решение запоминается. Затем из оставшихся неоконченных путей исключаются более длинные, чем законченный путь, или равные ему, а оставшиеся продлеваются по такому же алгоритму до тех пор, пока их длина меньше законченного пути. В итоге либо все неоконченные пути исключаются, либо среди них формируется законченный путь, более короткий, чем ранее полученный. Последний путь начинает играть роль эталона и т. д.
41
Алгоритм кратчайших путей Мура. Исходная вершина x0 помечается числом 0. Пусть в ходе работы алгоритма на текущем шаге получено множество дочерних вершин Г(xi) вершины xi . Тогда из него вычеркиваются все ранее полученные вершины, оставшиеся помечаются меткой, увеличенной на единицу по сравнению с меткой вершины xi, и от них проводятся указатели к xi. Далее, на множестве помеченных вершин, еще не фигурирующих в качестве адресов указателей, выбирается вершина с наименьшей меткой и для нее строятся дочерние вершины. Разметка вершин повторяется до тех пор, пока не будет получена целевая вершина. Алгоритм Дейкстры определения путей с минимальной стоимостью является обобщением алгоритма Мура за счет введения дуг переменной длины. Алгоритм Дорана и Мичи поиска с низкой стоимостью. Используется, когда стоимость поиска велика по сравнению со стоимостью оптимального решения. В этом случае вместо выбора вершин, наименее удаленных от начала, как в алгоритмах Мура и Дейкстры, выбирается вершина, для которой эвристическая оценка расстояния до цели наименьшая. При хорошей оценке можно быстро получить решение, но нет гарантии, что путь будем минимальным. Алгоритм Харта, Нильсона и Рафаэля. В алгоритме объединены оба критерия: стоимость пути до вершины g(x) и стоимость пути от вершины h(x) - в аддитивной оценочной функции f (x) = g (x) + h (x). При условии h(x)В, где Р, А и В-множества ППФ исчисления предикатов первого порядка, Р выражает условия применения ядра продукции А=>В, где В содержит список добавляемых ППФ и список исключаемых ППФ, т. е. постусловия. Метод повторяет метод ОРЗ с тем отличием, что стандартные задачи определения различий и применения подходящих операторов решаются на основе принципа резолюций. Подходящий оператор выбирается так же, как в ОРЗ, на основе принципа "анализ
44
средств и целей". Наличие комбинированного метода планирования позволило ограничить процесс логического вывода описанием состояния мира, а процесс порождения новых таких описаний оставить за эвристикой "от цели к средству ее достижения". Метод продукций, использующий макрооператоры. Макрооператоры-это обобщенные решения задач, получаемые методом STRIPS. Применение макрооператоров позволяет сократить поиск решения, однако при этом возникает проблема упрощения применяемого макрооператора, суть которой заключается в выделении по заданному различию его требуемой части и исключении из последней ненужных операторов. Метод иерархической системы продукций решателя ABSTRIPS . В этом методе разбиение пространства поиска на уровни иерархии осуществляется с помощью детализации продукций, используемых в методе STRIPS. Для этого каждой литере ППФ, входящей в множество Р условий применения продукции, присваивается вес j, j=0, k, и на i-м уровне планирования, осуществляемом методом системы STRIPS, учитываются лишь литеры веса j. Таким образом, на k-ом уровне продукции описываются наименее детально, на нулевом-наиболее детально как в методе системы STRIPS. Подобное разбиение позволяет для планирования на j-м уровне использовать решение (j+1)-го уровня как скелет решения j-го уровня, что повышает эффективность поиска в целом. Усовершенствованный метод планирования Ньюэлла и Саймона. В основу метода положена следующая идея дальнейшего совершенствования метода ОРЗ: задача решается сначала в упрощенной (за счет ранжировки различий) области планирования, а затем делается попытка уточнить решение применительно к более детальной, исходной проблемной области. 8. Представление знаний в интеллектуальных системах В настоящее время в исследованиях по искусственному интеллекту (ИИ) выделились шесть направлений. Представление знаний. Манипулирование знаниями. Общение. Восприятие. Обучение. Поведение. В рамках направления "Представление знаний" решаются задачи, связанные с формализацией и представлением знаний в памяти интеллектуальной системы (ИС). Для этого разрабатываются специальные модели представления знаний и языки для описания знаний, выделяются различные типы знаний. Изучаются источники, из которых ИС может черпать знания, и создаются процедуры и приемы, с помощью которых возможно приобретение знаний для ИС. Проблема представления знаний для ИС
45
чрезвычайно актуальна, т.к. ИС - это система, функционирование которой опирается на знания о проблемной области, которые хранятся в ее памяти. Данные и знания. Основные определения Информация, с которой имеют дело ЭВМ, разделяется на процедурную и декларативную. Процедурная информация овеществлена в программах, которые выполняются в процессе решения задач, декларативная информация - в данных, с которыми эти программы работают. Стандартной формой представления информации в ЭВМ является машинное слово, состоящее из определенного для данного типа ЭВМ числа двоичных разрядов - битов. Машинное слово для представления данных и машинное слово для представления команд, образующих программу, могут иметь одинаковое или разное число разрядов. В последнее время для представления данных и команд используются одинаковые по числу разрядов машинные слова. Однако в ряде случаев машинные слова разбиваются на группы по восемь двоичных разрядов, которые называются байтами. Одинаковое число разрядов в машинных словах для команд и данных позволяет рассматривать их в ЭВМ в качестве одинаковых информационных единиц и выполнять операции над командами, как над данными. Содержимое памяти образует информационную базу. В большинстве существующих ЭВМ возможно извлечение информации из любого подмножества разрядов машинного слова вплоть до одного бита. Во многих ЭВМ можно соединять два или более машинного слова в слово с большей длиной. Однако машинное слово является основной характеристикой информационной базы, т.к. его длина такова, что каждое машинное слово хранится в одной стандартной ячейке памяти, снабженной индивидуальным именем - адресом ячейки. По этому имени происходит извлечение информационных единиц из памяти ЭВМ и записи их в нее. Параллельно с развитием структуры ЭВМ происходило развитие информационных структур для представления данных. Появились способы описания данных в виде векторов и матриц, возникли списочные структуры, иерархические структуры. В настоящее время в языках программирования высокого уровня используются абстрактные типы данных, структура которых задается программистом. Появление баз данных (БД) знаменовало собой еще один шаг на пути организации работы с декларативной информацией. В базах данных могут одновременно храниться большие объемы информации, а специальные средства, образующие систему управления базами данных (СУБД), позволяют эффективно манипулировать с данными, при необходимости извлекать их из базы данных и записывать их в нужном порядке в базу. По мере развития исследований в области ИС возникла концепция знаний, которые объединили в себе многие черты процедурной и декларативной информации.
46
В ЭВМ знания так же, как и данные, отображаются в знаковой форме - в виде формул, текста, файлов, информационных массивов и т.п. Поэтому можно сказать, что знания - это особым образом организованные данные. Но это было бы слишком узкое понимание. А между тем, в системах ИИ знания являются основным объектом формирования, обработки и исследования. База знаний, наравне с базой данных, - необходимая составляющая программного комплекса ИИ. Машины, реализующие алгоритмы ИИ, называются машинами, основанными на знаниях, а подраздел теории ИИ, связанный с построением экспертных систем, - инженерией знаний. Особенности знаний. Переход от Базы Данных к Базе Знаний Особенности знаний. Внутренняя интерпретируемость. Каждая информационная единица должна иметь уникальное имя, по которому ИС находит ее, а также отвечает на запросы, в которых это имя упомянуто. Когда данные, хранящиеся в памяти, были лишены имен, то отсутствовала возможность их идентификации системой. Данные могла идентифицировать лишь программа, извлекающая их из памяти по указанию программиста, написавшего программу. Что скрывается за тем или иным двоичным кодом машинного слова, системе было неизвестно. Фамилия Попов Сидоров Иванов Петров
Год рождения 1965 1946 1925 1937
Таблица № 2. Сведения о сотрудниках Специальность Стаж, число лет Слесарь 5 Токарь 20 Токарь 30 Сантехник 25
Если, например, в память ЭВМ нужно было записать сведения о сотрудниках учреждения, представленные в табл. № 2, то без внутренней интерпретации в память ЭВМ была бы занесена совокупность из четырех машинных слов, соответствующих строкам этой таблицы. При этом информация о том, какими группами двоичных разрядов в этих машинных словах закодированы сведения о специалистах, у системы отсутствуют. Они известны лишь программисту, который использует данные табл. 2 для решения возникающих у него задач. Система не в состоянии ответить на вопросы типа "Что тебе известно о Петрове?" или "Есть ли среди специалистов сантехник?". При переходе к знаниям в память ЭВМ вводится информация о некоторой протоструктуре информационных единиц. В рассматриваемом примере она представляет собой специальное машинное слово, в котором указано, в каких разрядах хранятся сведения о фамилиях, годах рождения, специальностях и стажах. При этом должны быть заданы специальные словари, в которых перечислены имеющиеся в памяти системы фамилии,
47
года рождения, специальности и продолжительности стажа. Все эти атрибуты могут играть роль имен для тех машинных слов, которые соответствуют строкам таблицы. По ним можно осуществлять поиск нужной информации. Каждая строка таблицы будет экземпляром протоструктуры. В настоящее время СУБД обеспечивают реализацию внутренней интерпретируемости всех информационных единиц, хранящихся в базе данных. Структурированность. Информационные единицы должны обладать гибкой структурой. Для них должен выполняться "принцип матрешки", т.е. рекурсивная вложенность одних информационных единиц в другие. Каждая информационная единица может быть включена в состав любой другой, и из каждой информационной единицы можно выделить некоторые составляющие ее информационные единицы. Другими словами, должна существовать возможность произвольного установления между отдельными информационными единицами отношений типа "часть - целое", "род вид" или "элемент - класс". Связность. В информационной базе между информационными единицами должна быть предусмотрена возможность установления связей различного типа. Прежде всего эти связи могут характеризовать отношения между информационными единицами. Семантика отношений может носить декларативный или процедурный характер. Например, две или более информационные единицы могут быть связаны отношением "одновременно", две информационные единицы - отношением "причина - следствие" или отношением "быть рядом". Приведенные отношения характеризуют декларативные знания. Если между двумя информационными единицами установлено отношение "аргумент - функция", то оно характеризует процедурное знание, связанное с вычислением определенных функций. Далее будем различать отношения структуризации, функциональные отношения, каузальные отношения и семантические отношения. С помощью первых задаются иерархии информационных единиц, вторые несут процедурную информацию, позволяющую находить (вычислять) одни информационные единицы через другие, третьи задают причинно - следственные связи, четвертые соответствуют всем остальным отношениям. Между информационными единицами могут устанавливаться и иные связи, например, определяющие порядок выбора информационных единиц из памяти или указывающие на то, что две информационные единицы несовместимы друг с другом в одном описании. Перечисленные три особенности знаний позволяют ввести общую модель представления знаний, которую можно назвать семантической сетью, представляющей собой иерархическую сеть, в вершинах которой находятся информационные единицы. Эти единицы снабжены индивидуальными именами. Дуги семантической сети соответствуют различным связям между информационными единицами. При этом иерархические связи определяются отношениями структуризации, а неиерархические связи - отношениями иных типов.
48
Семантическая метрика. На множестве информационных единиц в некоторых случаях полезно задавать отношение, характеризующее ситуационную близость информационных единиц, т.е. силу ассоциативной связи между информационными единицами. Его можно было бы назвать отношением релевантности для информационных единиц. Такое отношение дает возможность выделять в информационной базе некоторые типовые ситуации (например, "покупка", "регулирование движения на перекрестке"). Отношение релевантности при работе с информационными единицами позволяет находить знания, близкие к уже найденным. Активность. С момента появления ЭВМ и разделения используемых в ней информационных единиц на данные и команды создалась ситуация, при которой данные пассивны, а команды активны. Все процессы, протекающие в ЭВМ, инициируются командами, а данные используются этими командами лишь в случае необходимости. Для ИС эта ситуация не приемлема. Как и у человека, в ИС актуализации тех или иных действий способствуют знания, имеющиеся в системе. Таким образом, выполнение программ в ИС должно инициироваться текущим состоянием информационной базы. Появление в базе фактов или описаний событий, установление связей может стать источником активности системы. Перечисленные пять особенностей информационных единиц определяют ту грань, за которой данные превращаются в знания, а базы данных перерастают в базы знаний (БЗ). Совокупность средств, обеспечивающих работу со знаниями, образует систему управления базой знаний (СУБЗ). В настоящее время не существует баз знаний, в которых в полной мере были бы реализованы внутренняя интерпретируемость, структуризация, связность, введена семантическая мера и обеспечена активность знаний. Неформальные (семантические) модели Существуют два типа методов представления знаний (ПЗ): формальные модели ПЗ; неформальные (семантические, реляционные) модели ПЗ. Очевидно, все методы представления знаний, которые рассмотрены выше, включая продукции (это система правил, на которых основана продукционная модель представления знаний), относятся к неформальным моделям. В отличие от формальных моделей, в основе которых лежит строгая математическая теория, неформальные модели такой теории не придерживаются. Каждая неформальная модель годится только для конкретной предметной области и поэтому не обладает универсальностью, которая присуща моделям формальным. Логический вывод - основная операция в СИИ - в формальных системах строг и корректен, поскольку подчинен жестким аксиоматическим правилам. Вывод в неформальных системах во многом определяется самим исследователем, который и отвечает за его корректность. Каждому из методов ПЗ соответствует свой способ описания знаний.
49
1. Логические модели. В основе моделей такого типа лежит формальная система, задаваемая четверкой вида: M = . Множество T есть множество базовых элементов различной природы, например, слов из некоторого ограниченного словаря, деталей детского конструктора, входящих в состав некоторого набора и т.п. Важно, что для множества T существует некоторый способ определения принадлежности или непринадлежности произвольного элемента к этому множеству. Процедура такой проверки может быть любой, но за конечное число шагов она должна давать положительный или отрицательный ответ на вопрос, является ли x элементом множества T. Обозначим эту процедуру П(T). Множество P есть множество синтаксических правил. С их помощью из элементов T образуют синтаксически правильные совокупности. Например, из слов ограниченного словаря строятся синтаксически правильные фразы, из деталей детского конструктора с помощью гаек и болтов собираются новые конструкции. Декларируется существование процедуры П(P), с помощью которой за конечное число шагов можно получить ответ на вопрос, является ли совокупность X синтаксически правильной. В множестве синтаксически правильных совокупностей выделяется некоторое подмножество A. Элементы A называются аксиомами. Как и для других составляющих формальной системы, должна существовать процедура П(A), с помощью которой для любой синтаксически правильной совокупности можно получить ответ на вопрос о принадлежности ее к множеству A. Множество B есть множество правил вывода. Применяя их к элементам A, можно получать новые синтаксически правильные совокупности, к которым снова можно применять правила из B. Так формируется множество выводимых в данной формальной системе совокупностей. Если имеется процедура П(B), с помощью которой можно определить для любой синтаксически правильной совокупности, является ли она выводимой, то соответствующая формальная система называется разрешимой. Это показывает, что именно правило вывода является наиболее сложной составляющей формальной системы. Для знаний, входящих в базу знаний, можно считать, что множество A образуют все информационные единицы, которые введены в базу знаний извне, а с помощью правил вывода из них выводятся новые производные знания. Другими словами формальная система представляет собой генератор порождения новых знаний, образующих множество выводимых в данной системе знаний. Это свойство логических моделей делает их притягательными для использования в базах знаний. Оно позволяет хранить в базе лишь те знания, которые образуют множество A, а все остальные знания получать из них по правилам вывода. 2. Сетевые модели. В основе моделей этого типа лежит конструкция, названная ранее семантической сетью. Сетевые модели формально можно задать в виде H = . Здесь I есть множество информационных единиц; C1, C2, ..., Cn - множество типов связей между информаци-
50
онными единицами. Отображение Г задает между информационными единицами, входящими в I, связи из заданного набора типов связей. В зависимости от типов связей, используемых в модели, различают классифицирующие сети, функциональные сети и сценарии. В классифицирующих сетях используются отношения структуризации. Такие сети позволяют в базах знаний вводить разные иерархические отношения между информационными единицами. Функциональные сети характеризуются наличием функциональных отношений. Их часто называют вычислительными моделями, т.к. они позволяют описывать процедуры "вычислений" одних информационных единиц через другие. В сценариях используются каузальные отношения, а также отношения типов "средство - результат", "орудие - действие" и т.п. Если в сетевой модели допускаются связи различного типа, то ее обычно называют семантической сетью. 3. Продукционные модели. В моделях этого типа используются некоторые элементы логических и сетевых моделей. Из логических моделей заимствована идея правил вывода, которые здесь называются продукциями, а из сетевых моделей - описание знаний в виде семантической сети. В результате применения правил вывода к фрагментам сетевого описания происходит трансформация семантической сети за счет смены ее фрагментов, наращивания сети и исключения из нее ненужных фрагментов. Таким образом, в продукционных моделях процедурная информация явно выделена и описывается иными средствами, чем декларативная информация. Вместо логического вывода, характерного для логических моделей, в продукционных моделях появляется вывод на знаниях. 4. Фреймовые модели. В отличие от моделей других типов во фреймовых моделях фиксируется жесткая структура информационных единиц, которая называется протофреймом. В общем виде она выглядит следующим образом: (Имя фрейма: Имя слота 1(значение слота 1) Имя слота 2(значение слота 2) ...................... Имя слота К (значение слота К)). Значением слота может быть практически что угодно (числа или математические соотношения, тексты на естественном языке или программы, правила вывода или ссылки на другие слоты данного фрейма или других фреймов). В качестве значения слота может выступать набор слотов более низкого уровня, что позволяет во фреймовых представлениях реализовать "принцип матрешки". При конкретизации фрейма ему и слотам присваиваются конкретные имена и происходит заполнение слотов. Таким образом, из протофреймов получаются фреймы - экземпляры. Переход от исходного протофрейма к
51
фрейму - экземпляру может быть многошаговым, за счет постепенного уточнения значений слотов. Например, структура табл. № 2, записанная в виде протофрейма, имеет вид (Список работников: Фамилия (значение слота 1); Год рождения (значение слота 2); Специальность (значение слота 3); Стаж (значение слота 4)). Если в качестве значений слотов использовать данные табл. № 2, то получится фрейм – экземпляр (Список работников: Фамилия (Попов - Сидоров - Иванов - Петров); Год рождения (1965 - 1946 - 1925 - 1937); Специальность (слесарь - токарь - токарь - сантехник); Стаж (5 - 20 - 30 - 25)). Связи между фреймами задаются значениями специального слота с именем "Связь". Часть специалистов по ИС считает, что нет необходимости специально выделять фреймовые модели в представлении знаний, т.к. в них объединены все основные особенности моделей остальных типов. Формальные модели представления знаний Система ИИ в определенном смысле моделирует интеллектуальную деятельность человека и, в частности, - логику его рассуждений. В грубо упрощенной форме наши логические построения при этом сводятся к следующей схеме: из одной или нескольких посылок (которые считаются истинными) следует сделать "логически верное" заключение (вывод, следствие). Очевидно, для этого необходимо, чтобы и посылки, и заключение были представлены на понятном языке, адекватно отражающем предметную область, в которой проводится вывод. В обычной жизни это наш естественный язык общения, в математике, например, это язык определенных формул и т.п. Наличие же языка предполагает, во - первых, наличие алфавита (словаря), отображающего в символьной форме весь набор базовых понятий (элементов), с которыми придется иметь дело и, во - вторых, набор синтаксических правил, на основе которых, пользуясь алфавитом, можно построить определенные выражения. Логические выражения, построенные в данном языке, могут быть истинными или ложными. Некоторые из этих выражений, являющиеся всегда истинными. Объявляются аксиомами (или постулатами). Они составляют ту базовую систему посылок, исходя из которой и пользуясь определенными правилами вывода, можно получить заключения в виде новых выражений, также являющихся истинными.
52
Если перечисленные условия выполняются, то говорят, что система удовлетворяет требованиям формальной теории. Ее так и называют формальной системой (ФС). Система, построенная на основе формальной теории, называется также аксиоматической системой. Формальная теория должна, таким образом, удовлетворять следующему определению: всякая формальная теория F = (A, V, W, R), определяющая некоторую аксиоматическую систему, характеризуется: наличием алфавита (словаря), A, множеством синтаксических правил, V, множеством аксиом, лежащих в основе теории, W, множеством правил вывода, R. Исчисление высказываний (ИВ) и исчисление предикатов (ИП) являются классическими примерами аксиоматических систем. Эти ФС хорошо исследованы и имеют прекрасно разработанные модели логического вывода - главной метапроцедуры в интеллектуальных системах. Поэтому все, что может и гарантирует каждая из этих систем, гарантируется и для прикладных ФС как моделей конкретных предметных областей. В частности, это гарантии непротиворечивости вывода, алгоритмической разрешимости (для исчисления высказываний) и полуразрешимости (для исчислений предикатов первого порядка). ФС имеют и недостатки, которые заставляют искать иные формы представления. Главный недостаток - это "закрытость" ФС, их негибкость. Модификация и расширение здесь всегда связаны с перестройкой всей ФС, что для практических систем сложно и трудоемко. В них очень сложно учитывать происходящие изменения. Поэтому ФС как модели представления знаний используются в тех предметных областях, которые хорошо локализуются и мало зависят от внешних факторов. Продукционные системы Продукции наряду с фреймами являются наиболее популярными средствами представления знаний в ИИ. Продукции, с одной стороны, близки к логическим моделям, что позволяет организовывать на них эффективные процедуры вывода, а с другой стороны, более наглядно отражают знания, чем классические логические модели. В них отсутствуют жесткие ограничения, характерные для логических исчислений, что дает возможность изменять интерпретацию элементов продукции. Компоненты продукционных систем В общем виде под продукцией понимается выражение следующего вида: (i); Q;P;A ⇒ B;N. Здесь i - имя продукции, с помощью которого данная продукция выделяется из всего множества продукций. В качестве имени может выступать некоторая лексема, отражающая суть данной продукции (например, "покупка книги " ), или порядковый номер продукций в их множестве, хранящимся в памяти системы.
53
Элемент Q характеризует сферу применения продукции. Такие сферы легко выделяются в когнитивных структурах человека. Наши знания как бы "разложены по полочкам". На одной полочке хранятся знания о том, как надо готовить пищу, на другой как добраться до работы, и т.п. Разделение знаний на отдельные сферы позволяет экономить время на поиск нужных знаний. Такое же разделение на сферы в базе знаний ИИ целесообразно и при использовании для представления знаний продукционных моделей. Основным элементом продукции является ее ядро: A ⇒ B. Интерпретация ядра продукции может быть различной и зависит от того, что стоит слева и справа от знака секвенции Ю. Обычное прочтение ядра продукции выглядит так: ЕСЛИ А, ТО В, более сложные конструкции ядра допускают в правой части альтернативный выбор, например, ЕСЛИ А, ТО В1, ИНАЧЕ В2. Секвенция может истолковываться в обычном логическом смысле как знак логического следования В из истинного А (если А не является истинным выражением, то о В ничего сказать нельзя). Возможны и другие интерпретации ядра продукции, например, А описывает некоторое условие, необходимое для того, чтобы можно было совершить действие В. Элемент Р есть условие применимости ядра продукции. Обычно Р представляет собой логическое выражение (как правило предикат). Когда Р принимает значение "истина", ядро продукции активизируется. Если Р "ложно", то ядро продукции не может быть использовано. Элемент N описывает постусловия продукции. Они актуализируются только в том случае, если ядро продукции реализовалось. Постусловия продкции описывают действия и процедуры, которые необходимо выполнить после реализации В. Выполнение N может проиходить сразу после реализации ядра продукции. Если в памяти системы хранится некоторый набор продукций, то они образуют систему продукций. В системе продукций должны быть заданы специальные процедуры управления продукциями, с помощью которых происходит актуализация продукций и выбор для выполнения той или иной продукции из числа актуализированных. В ряде систем ИИ используют комбинации сетевых и продукционных моделей представления знаний. В таких моделях декларативные знания описываются в сетевом компоненте модели, а процедурные знания - в продукционном. В этом случае говорят о работе продукционной системы над семантической сетью.
54
Классификация ядер продукции. Ядра продукции можно классифицировать по различным основаниям. Прежде всего, все ядра делятся на два больших типа: детерминированные и недетерминированные. В детерминированных ядрах при актуализации ядра и при выполнимости А правая часть ядра выполняется обязательно; в недетерминированных ядрах В может выполняться и не выполняться. Таким образом, секвенция ⇒ в детерминированных ядрах реализуется с необходимостью, а в недетерминированных - с возможностью. Интерпретация ядра в этом случае может, например, выглядеть так: ЕСЛИ А, ТО ВОЗМОЖНО В. Возможность может определяться некоторыми оценками реализации ядра. Например, если задана вероятность выполнения В при актуализации А, то продукция может быть такой: ЕСЛИ А, ТО С ВЕРОЯТНОСТЬЮ р РЕАЛИЗОВАТЬ В. Оценка реализации ядра может быть лингвистической, связанной с понятием терм-множества лингвистической переменной, например: ЕСЛИ А, ТО С БОЛЬШЕЙ ДОЛЕЙ УВЕРЕННОСТИ В. Возможны иные способы реализации ядра. Детерминированные продукции могут быть однозначными и альтернативными. Во втором случае в правой части ядра указываются альтернативные возможности выбора, которые оцениваются специальными весами выбора. В качестве таких весов могут использоваться вероятностные оценки, лингвистические оценки, экспертные оценки и т.п. Особым типом являются прогнозирующие продукции, в которых описываются последствия, ожидаемые при актуализации А, например: ЕСЛИ А, ТО С ВЕРОЯТНОСТЬЮ р МОЖНО ОЖИДАТЬ В. Дальнейшую классификацию ядер продукции можно провести, опираясь на типовую схему СИИ (рис. 7.) Если x и y обозначают любой из блоков рисунка (О,Д,З,Л), то ядро Аx ⇒ By означает, что информация об А берется из блока x, а результат срабатывания продукции В посылает в блок y. Комбинации x и y, осмысленные с точки зрения СИИ, отмечены в табл. № 3 знаком "+" Таблица № 3.
55
Рис. 7. Типовая схема СИИ Рассмотрим часто встречающийся тип продукции А3 ⇒ В3. В этом случае А3 и В3 представляют собой некоторые фрагменты информации, хранящейся в базе знаний. При сетевом представлении это могу быть фрагменты семантической сети, при логических моделях - формулы того или иного исчисления. Тогда смысл продукции А3 ⇒ В3 состоит в замене одного фрагмента базы знаний другим. Для актуализации этой продукции необходимо, чтобы в базе знаний существовал фрагмент, совпадающий с А. При поиске в базе знаний А играет роль образца, а процедура такого писка называется поиском по образцу. Стратегии решений организации поиска Для иллюстрации поиска предположим, что в базе знаний для представления знаний используется семантическая сеть (рис. 8, а) и продукция (рис. 8, б). Поиск А в базе знаний организуется различными способами. Можно, например, сначала искать вершину а. Если в базе знаний такой вершины нет, то поиск заканчивается неудачей. Если вершина а найдена, то ищутся все выходящие из нее дуги, помеченные отношением R3, так как в образце справа от этой дуги стоит вершина x, на месте которой в базе знаний может находиться любая вершина. Если из а не выходит ни одной дуги, помеченной отношением R3, то поиск заканчивается неудачей. Но если такие дуги есть, то происходит переход во все вершины, с которыми вершину а связывает отношение R3, т.е. возникает параллельный процесс поиска. В примере произойдет переход от вершины а к вершинам b и f, из которых начинается поиск выходящих из них дуг, помеченные отношением R1, ведущих в любую вершину, так как в образце далее стоит вершина, которой соответствует свободная переменная y. Далее процесс продолжается аналогичным образом. В примере поиск оказывается успешным. После нахождения А в семантической сети происходит замена, которая определяется правой частью образца. В результате возникает трансформированная сеть (рис. 8, в).
56
Продукция Ад ⇒ Вз может соответствовать процедуре нахождения закономерностей по эмпирическим данным. Логический блок на основании просмотра и анализа данных выдвигает гипотезы и наличии закономерностей и, убедившись в их приемлемости и достаточной обоснованности, записывает их в базу знаний. Аналогично можно интерпретировать и иные типы продукций из таблицы № 4.
Рис. 8. К пояснению реализации продукций. Представление простых фактов Представление - это действие, делающее некоторое понятие воспринимаемым посредством фигуры, записи, языка или формализма. Теория знаний изучает связи между субъектом (изучающим) и объектом. Знание (в объективном смысле) - то, что известно (то, что знаем после изучения). Представление знаний - формализация истинных убеждений посредством фигур, записей или языков. Нас особенно интересуют формализа-
57
ции, воспринимаемые (распознаваемые) ЭВМ. Возникает вопрос о представлении знаний в памяти ЭВМ, т.е. о создании языков и формализмов представления знаний. Они преобразуют наглядное представление (созданное посредством речи, изображением, естественным языком, вроде английского или немецкого, формальным языком, вроде алгебры или логики, рассуждениями и т.д.) в пригодное для ввода и обработки в ЭВМ. Результат формализации должен быть множеством инструкций, составляющих часть языка программирования. Представлению знаний присущ пассивный аспект: книга, таблица, заполненная информацией память. В ИИ подчеркивается активный аспект представления: знать должно стать активной операцией, позволяющей не только запоминать, но и извлекать воспринятые (приобретенные, усвоенные) знания для рассуждений на их основе. Следовательно, истоки представления знаний - в науке о познании, а его конечная цель - программные средства информатики. Во многих случаях подлежащие представлению знания относятся к довольно ограниченной области, например: - описание состояния человека - описание ситуации в игре (например, расположение фигур в шахматах) - описание размещения персонала предприятия - описание пейзажа Для характеристики некой области говорят об "области рассуждений" или "области экспертизы". Численная формализация таких описаний в общем мало эффективна. Напротив, использование символического языка, такого, как язык математической логики, позволяет формулировать описания в форме, одновременно близкой и к обычному языку, и к языку программирования. Впрочем, математическая логика позволяет рассуждать, базируясь на приобретенных знаниях: логические выводы действительно являются активными операциями получения новых знаний из усвоенных. В силу всех этих причин математическая логика лежит в основе различных представлений в ИИ. Данный раздел посвящен представлению простых фактов с помощью логики предикатов. Логическое представление служит также отправной точкой для других представлений (таких как "сетевые" и "объективные"), используемых в ИИ. Синтаксис логики предикатов Язык логики предикатов задается синтаксисом. Для представления знаний базисные синтаксические категории языка изображаются такими символами, которые несут достаточно четкую информацию и дают довольно ясную картину об области рассуждений (экспертизы). Логика предикатов, называемая также логикой первого порядка, допускает четыре типа выражений. Константы. Они служат именами индивидуумов (в отличие от имен совокупностей): объектов, людей или событий. Константы представляются
58
символами вроде Жак_2 (добавление 2 к слову Жак указывает на вполне определенного человека среди людей с таким именем), Книга_22, Посылка_8. Переменные. Обозначают имена совокупностей, таких, как человек, книга, посылка, событие. Символ Книга_22 представляет вполне определенный экземпляр, а символ книга указывает либо множество "всех книг", либо "понятие книги". Символами x,y,z представлены имена совокупностей (определенных множеств или понятий). Предикатные имена. Они задают правила соединения констант и переменных, например, правила грамматики, процедуры, математические операции. Для предикативных имен используются символы наподобие следующих: Фраза, Посылать, Писать, Плюс, Разделить. Предикатное имя иначе называется предикатной константой. Функциональные имена представляют такие же правила, как и предикаты. Чтобы не спутать с предикатными именами, функциональные имена пишут одними строчными буквами: фраза, посылать, писать, плюс, разделить. Их называют так же функциональными константами. Символы, которые применяются для представления констант, переменных, предикатов и функций, не являются "словами русского языка". Они суть символы некоторого представления - слова "объектного языка" (в нашем случае языка предикатов). Представление должно исключать всякую двусмысленность языка. Поэтому имена индивидуумов содержат цифры, приписываемые к именам совокупностей. Жак_1 и Жак_2 представляют двух людей с одинаковыми именами. Эти представления суть конкретизации имени совокупности "Жак". Предикат - это предикатное имя вместе с подходящим числом термов. Предикат называют так же предикатной формой. Примеры применения логики для представления знаний Проиллюстрируем синтаксис логики предикатов, сопоставляя нескольким русским фразам их перевод на язык логического формализма. - По-русски: Жак посылает книгу Мари, Логически: Посылка (Жак_2, Мари_4, Книга_22). - По-русски: Каждый человек прогуливается, Логически: ∀ x ( Человек(x) ⊃ Прогуливается(x)). - По-русски: Некоторые люди прогуливаются, Логически: ∃ x (Человек(x) I Прогуливается(x)). Сравнивая два последних примера, видим, что замена прилагательного "каждый" на "некоторые" влечет при переводе не только замену квантора ∀ на ∃, но и замену связки ⊃ на I . Это иллюстрирует тот факт, что перевод фразы естественного языка на логический, вообще говоря, не является трафаретной операцией.
59
9. Системы машинного зрения Процесс ввода текста с использованием сканера со стороны выглядит достаточно просто: на отсканированном изображении система находит фрагменты, в которых "узнает" буквы, а затем заменяет эти изображения настоящими буквами, или, по-другому, их машинными кодами. Так осуществляется переход от изображения текста к "настоящему" тексту, с которым можно работать в текстовом редакторе. Каким образом этого добиться? Компанией "Бит" была разработана специальная технология распознавания символов, которая получила название "Фонтанного преобразования", а на ее основе - коммерческий продукт, получивший высокую оценку. Это система оптического распознавания Fine Reader. В основе фонтанного преобразования лежит принцип целостности. В соответствии с ним любой воспринимаемый объект рассматривается как целое, состоящее из частей, связанных между собой определенными отношениями. Так, например, печатная страница состоит из статей, статья - из заголовка и колонок, колонка - из абзацев, абзацы - из строк, строки - из слов, слова - из букв. При этом все перечисленные элементы текста связаны между собой определенными пространствами и языковыми отношениями. Для выделения целого требуется определить его части. Части же, в свою очередь, можно рассматривать только в составе целого. Поэтому целостный процесс восприятия может происходить только в рамках гипотезы о воспринимаемом объекте - целом. После того как выдвинуто предположение о воспринимаемом объекте, выделяются и интерпретируются его части. Затем предпринимается попытка "собрать" из них целое, чтобы проверить правильность исходной гипотезы. Разумеется, воспринимаемый объект может интерпретироваться в рамках более крупного целого. Так, читая предложение, человек узнает буквы, воспринимает слова, связывает их в синтаксические конструкции и понимает смысл. В технических системах любое решение при распознавании текста принимается неоднозначно, а путем последовательного выдвижения и проверки гипотез и привлечения как знаний о самом исследуемом объекте, так и общего контекста. Целостное описание класса объектов восприятия отвечает двум условиям: во - первых, все объекты данного класса удовлетворяют этому описанию, а во- вторых, ни один объект другого класса не удовлетворяют ему. Например, класс изображений буквы "К" должен быть описан так, чтобы любое изображение буквы "К" в него попадало, а изображение всех других букв - нет. Такое описание обладает свойством отображаемости, то есть обеспечивает воспроизведение описываемых объектов: эталон буквы для системы OCR позволяет визуально воспроизвести букву, эталон слова для распознавания речи позволяет произнести слово, а описание структуры предложения в синтаксическом анализаторе позволяет синтезировать правильное предложение. С практической точки зрения
60
отображаемость играет огромную роль, поскольку позволяет эффективно контролировать качество описаний. Существует два вида целостного описания: шаблонное и структурное. В первом случае описание представляет собой изображение в растровом или векторном представлении, и задан класс преобразований (например, повтор, масштабирование и пр.). Во втором случае описание представляется в виде графа, узлами которого являются составляющие элементы входного объекта, а дугами пространственные отношения между ними. В свою очередь элементы могут оказаться сложными (то есть иметь свое описание). Шаблонное описание проще в реализации, чем структурное. Однако оно не может использоваться для описания объектов с высокой степенью изменчивости. Шаблонное описание, к примеру, может приниматься для распознавания только печатных символов, а структурное - еще и для рукописных. Целостность восприятия предлагает два важных архитектурных решения. Во-первых, все источники знания должны работать по возможности одновременно. Нельзя, например, сначала распознать страницу, а затем подвергнуть ее словарной и контекстной обработке, поскольку в этом случае невозможно будет осуществить обратную связь от контекстной обработки к распознаванию. Во-вторых, исследуемый объект должен представляться и обрабатываться по возможности целиком. Первый шаг восприятия - это формирование гипотезы о воспринимаемом объекте. Гипотеза может формироваться как на основе априорной модели объекта, контекста и результатов проверки предыдущих гипотез (процесс "сверху - вниз"), так и на основе предварительного анализа объекта ("снизу - вверх"). Второй шаг - уточнение восприятия (проверка гипотезы), при котором производится дополнительный анализ объекта в рамках выдвинутой гипотезы и в полную силу привлекается контекст. Для удобства восприятия необходимо провести предварительную обработку объекта, не потеряв при этом существенной информации о нем. Обычно предварительная обработка сводится к преобразованию входного объекта в представление, удобное для дальнейшей работы (например, векторизация изображения), или получение всевозможных вариантов сегментации входного объекта, из которого путем выдвижения и проверки гипотез выбирается правильный вариант. Процесс выдвижения и проверки гипотез должен быть явно отражен в архитектуре программы. Каждая гипотеза должна быть объектом, который можно было бы оценить или сравнить с другими. Поэтому обычно гипотезы выдвигаются последовательно, а затем объединяются в список и сортируются на основе предварительной оценке. Для окончательного же выбора гипотезы активно используется контекст и другие дополнительные источники знаний. Ныне одним из лидеров в области генетического программирования является группа исследователей из Стэндфордского университета (Stanford
61
University), работающая под руководством профессора Джона Коза. Генетическое программирование вдохнуло новую жизнь в язык LISP (List Processing), который создавался группой Джона Маккарти (автора термина "искусственный интеллект") для обработки списков и функционального программирования. Именно этот язык в США был и остается одним из наиболее распространенных языков программирования для задач искусственного интеллекта. Распознавание символов К настоящему времени известно три подхода к распознаванию символов - шаблонный, структурный и признаковый. Принципу целостности отвечает лишь первые два. Шаблонное описание проще в реализации, однако в отличие от структурного, оно не позволяет описывать сложные объекты с большим разнообразием форм. Именно поэтому шаблонное описание применяется для распознавания лишь печатных символов, в то время как структурное для рукописных, имеющих, естественно, гораздо больше вариантов начертания. Шаблонные системы Такие системы преобразуют изображение отдельного символа в растровое, сравнивают его со всеми шаблонами, имеющимися в базе и выбирают шаблон с наименьшим количеством точек, отличных от входного изображения. Шаблонные системы довольно устойчивы к дефектам изображения и имеют высокую скорость обработки входных донных, но надежно распознают только те шрифты, шаблоны которых им "известны". И если распознаваемый шрифт хоть немного отличается от эталонного, шаблонные системы могут делать ошибки даже при обработке качественных изображений. Структурные системы В таких системах объект описывается как граф, узлами которого являются элементы входного объекта, а дугами - пространственные отношения между ними. Системы, реализующие подобный подход, обычно работают с векторными изображениями. Структурными элементами являются составляющие символ линии. Так, для буквы "р" - это вертикальный отрезок и дуга. К недостаткам структурных систем следует отнести их высокую чувствительность к дефектам изображения, нарушающим составляющие элементы. Также векторизация может добавить дополнительные дефекты. Кроме того, для этих систем, в отличие от шаблонных и признаковых, до сих пор не созданы эффективные автоматизированные процедуры обучения. Поэтому для Fine Reader структурные описания создавались.
62
Признаковые системы В таких системах усредненное изображение каждого символа представляется как объект в n-мерном пространстве признаков. Здесь выбирается алфавит признаков, значения которых вычисляются при распознавании входного изображения. Полученный n-мерный вектор сравнивается с эталонными, и изображение относится к наиболее подходящему из них. Признаковые системы не отвечают принципу целостности. Необходимое, но недостаточное условие целостности описания класса объектов (в нашем случае это класс изображений, представляющих один символ) состоит в том, что описанию должны удовлетворять все объекты данного класса и ни один из объектов других классов. Но поскольку при вычислении признаков теряется существенная часть информации, трудно гарантировать, что к данному классу удастся отнести только “родные” объекты. Структурно-пятенный эталон Фонтанное преобразование совмещает в себе достоинства шаблонной и структурной систем и, по мнению некоторых исследователей, позволяет исключить недостатки, присущие каждой из них по отдельности. В основе этой технологии лежит использование структурно-пятенного эталона. Он позволяет представить изображения в виде набора пятен, связанных между собой n-арными отношениями, задающими структуру символа. Эти отношения (то есть расположение пятен друг относительно друга) образуют структурные элементы, составляющие символ. Так, например, отрезок - это один тип n-арных отношений между пятнами, эллипс -другой, дуга - третий. Другие отношения задают пространственное расположение образующих символ элементов. В эталоне задаются: - имя; - обязательные, запрещающие и необязательные структурные элементы; - отношения между структурными элементами; - отношения, связывающие структурные элементы с описывающим прямоугольником символа; - атрибуты, используемые для выделения структурных элементов; - атрибуты, используемые для проверки отношений между элементами; - атрибуты, используемые для оценки качества элементов и отношений; - позиция, с которой начинается выделение элемента (отношения локализации элементов). Структурные элементы, выделяемые для класса изображений, могут быть исходными и составными. Исходные структурные элементы - это пятна, составные - отрезок, дуга, кольцо, точка. В качестве составных структурных элементов, в принципе, могут быть взяты любые объекты,
63
описанные в эталоне. Кроме того, они могут быть описаны как через исходные, так и через другие составные структурные элементы. Например, для распознавания корейских иероглифов (слоговое письмо) составными элементами для описания слога являются описания отдельных букв (но не отдельные элементы букв). В итоге, использование составных структурных элементов позволяет строить иерархические описания классов распознаваемых объектов. В качестве отношений используются связи между структурными элементами, которые определяются либо метрическими характеристиками этих элементов (например, “длина больше”), либо их взаимным расположением на изображении (например, “правее”, “соприкасается”). При задании структурных элементов и отношений используются конкретизирующие параметры, позволяющие доопределить структурный элемент или отношение при использовании этого элемента в эталоне конкретного класса. Для структурных элементов конкретизирующими могут являться, например, параметры, задающие диапазон допустимой ориентации отрезка, а для отношений -параметры, задающие предельное допустимое расстояние между характерными точками структурных элементов в отношении “соприкасается”. Конкретизирующие параметры используются также для вычисления качества конкретного структурного элемента изображения и качества выполнения данного отношения. Построение и тестирование структурно-пятенных эталонов для классов распознаваемых объектов - процесс сложный и трудоемкий. База изображений, которая используется для отладки описаний, должна содержать примеры хороших и плохих (предельно допустимых) изображений для каждой графемы, а изображения базы разделяются на обучающее и контрольное множества. Разработчик описания предварительно задает набор структурных элементов (разбиение на пятна) и отношения между ними. Система обучения по базе изображений автоматически вычисляет параметры элементов и отношений. Полученный эталон проверяется и корректируется по контрольной выборке изображений данной графемы. По контрольной же выборке проверяется результат распознавания, то есть оценивается качество подтверждения гипотез. Распознавание с использованием структурно-пятенного эталона происходит следующим образом. Эталон накладывается на изображение, и отношения между выделенными на изображении пятнами сравниваются с отношениями пятен в эталоне. Если выделенные на изображении пятна и отношения между ними удовлетворяют эталону некоторого символа, то данный символ добавляется в список гипотез о результате распознавания входного изображения.
64
Распознавание рукописных текстов Очевидно, проблема распознавания рукописного текста значительно сложнее, чем в случае с текстом печатным. Если в последнем случае мы имеем дело с ограниченным числом вариаций изображений шрифтов (шаблонов), то в случае рукописного текста число шаблонов неизмеримо больше. Таким образом, динамичное развитие новых компьютерных технологий (сетевые технологии, технологии “клиент-сервер”, и т. д.) нашли свое отражение и в состоянии сектора электронного документооборота. Если раньше в продвижении технологий ввода информации без клавиатуры делался упор на преимущества их персонального использования, то сегодня на первый план выходят преимущества коллективного и рационального использования технологий ввода и обработки документов. Иметь одну, обособленную систему распознавания сегодня уже явно недостаточно. С распознанными текстовыми файлами (как бы хорошо они распознаны ни были) чаще всего нужно делать ряд операций: хранить в базе данных, осуществлять их поиск, передавать по локальной сети, и т. д. То есть, требуется взаимодействие с архивной или иной системой работы с документами. Таким образом, система распознавания превращается в утилиту для архивных и иных систем работы с документами. 10. Интеллектуальная информационная система для оценки радиофизических характеристик систем антенна-обтекатель Постановка задачи В качестве примера интеллектуальной информационной системы (ИИС) в области радиофизики рассмотрим систему оценки радиофизических характеристик систем “антенна-обтекатель”. Часто при эксплуатации антенн бортовых радиолокационных станций (БРЛС) объектов возникает необходимость защиты их специализированными укрытиями. Обычно такие укрытия (обтекатели) должны обеспечивать, с одной стороны, минимальное влияние на характеристики антенны, и, с другой стороны, защиту от атмосферных осадков, ветра, встречного потока воздуха – при установке на летательных аппаратах и т.п. В условиях жестких ограничений на качество работы систем “антенна-обтекатель” до начала эксплуатации требуется оценить степень негативного влияния обтекателя, определяющейся технологией его изготовления, на рабочие характеристики антенны. Такое влияние проявляется обычно в снижении уровня излучения системы “антенна-обтекатель” по отношению к системе “антенна” в направлении основного лепестка суммарной диаграммы направленности (СДН), повышении уровня боковых лепестков СДН, появлении так называемой ошибки пеленга (ОП) – разности между минимумами разностных диаграмм направленности (РДН), формируемыми системами “антенна” и “антенна-обтекатель”.
65
Цели исследований систем “антенна-обтекатель” приводят к необходимости регистрации и совместного анализа диаграмм, формируемых системами “антенна” и “антенна-обтекатель” при некоторых наборах параметров работы. К таким параметрам относятся рабочая частота, плоскость измерения, поляризация электромагнитной волны (ЭМВ), длина ЭМВ, угол фазирования или поворота антенны, состав антенны, состав обтекателя и т.п. Проблемой оценки радиотехнических характеристик радиопрозрачных обтекателей является значительное время обработки и совместного анализа больших объемов измерительной информации. Кроме этого при больших объемах промышленных испытаний остро стоит самостоятельный вопрос эффективного хранения результатов измерений и условий их проведения. Маршруты движения информации К настоящему времени созданы методики проведения экспериментальных исследований радиотехнических характеристик систем «антеннаобтекатель». Здесь будет описана ИИС, обеспечивающая получение уточненных радиотехнических характеристик изучаемых объектов и, кроме того, обеспечивающая решение самостоятельного вопроса эффективного хранения измерительной информации с возможностью ее извлечения по набору условий поиска. Решение первой задачи основано на применении алгоритмов апостериорной обработки, в частности, метода наименьших квадратов, с целью минимизации влияния шумов различной природы на форму участков диаграмм, непосредственно использующихся для расчета оценок РФХ. Решение второй задачи основано на реляционном подходе к хранению измерительной информации - все данные о параметрах проведения измерений хранятся в виде связанных таблиц. Измеренные диаграммы хранятся в виде файлов. Это позволяет использовать структурированный язык SQL для построения запросов к информационной базе. Удобство работы с системой достигается представлением исходной и выходной информации в виде электронных документов, бумажные формы которых могут отразить весь документооборот лаборатории, занимающейся проведением испытаний. Для пояснения принципов работы экспертной системы обратимся к рисунку 9. Логика работы с системой заключается в следующем. На первом этапе разрабатывается программа испытаний и оформляется в виде электронного документа – «Протокол измерений». В документе отражается весь набор параметров, необходимый для работы с данными, которые будут получены согласно этому документу по результатам испытаний (рабочая частота, состав антенной системы, состав обтекателя, поляризация радиосигнала, плоскость антенны, список имен файлов в соответ-
66
ствии с углами фазирования и т.п.). Задача создания документа решается за счет использования конструктора программ испытаний. Документ «Протокол измерений» передается группе инженеров для проведения испытаний на радиолокационном измерительном комплексе (РИК). Предполагается, что на РИК имеется программа измерений, которая обеспечивает управление и регистрацию измерительной информации в автоматизированном режиме. Результатом измерений согласно «Протоколу измерений» является набор файлов, который формируется при параметрах измерений, указанных в исходном документе. Для каждого угла фазирования (поворота) антенны получается два файла – один файл содержит в цифровом виде диаграмму излучения (приема) системы «антенна», а второй – диаграмму излучения (приема) системы «антенна-обтекатель».
Рис. 9. Схема движения информации Набор файлов результатов измерений передается в экспертную систему, и при необходимости, подвергается цифровой обработке. Весь набор файлов логически связывается с родительским документом «Протокол измерений». Совокупность протоколов измерений, логически связанных с соответствующими наборами файлов, образуют так базу протоколов измерений. База протоколов измерений выступает в роли тех исходных данных, на основе которых получаются требуемые оценки РТХ. Ядром экспертной системы являются алгоритмы анализа и обработки данных, которые по исходному набору данных получают требуемые оценки РТХ. По-существу, указанные алгоритмы обеспечивают получение некоторого выходного документа, который можно назвать «Результат экспертной оценки», по исходному документу «Протокол измерений». При
67
этом в документе «Результат экспертной оценки» должны быть отражены: ссылка на родительский документ «Протокол измерений», наименование оцениваемой характеристики, алгоритм оценки характеристики, набор параметров, при которых использован алгоритм оценки РТХ и т.п. На основании одного документа «Протокол» измерений может быть получено несколько документов «Результат экспертной оценки». Непосредственно процесс измерений можно пояснить с помощью схемы, иллюстрирующей принцип работы типового коллиматорного измерительного комплекса (рис. 10.). Генератор создает монохроматическую электромагнитную волну, которая через облучатель, расположенный в фокусе коллиматора, излучается в свободное пространство. После отражения от зеркала коллиматора фронт волны становиться квазиплоским, и сформировавшийся пучок распространяется по направлению к объекту измерений. Электромагнитное излучение попадает на раскрыв антенны, после которого по системе волноводов подается на вход приемника. В приведенной схеме используется относительный метод измерения, когда принимаемый сигнал сравнивается с исходным сигналом, и на основании этого делается вывод о значениях его амплитуды и фазы. Регистрация значений осуществляется в наборе дискретных точек с помощью ЭВМ.
Рис. 10. К пояснению принципов функционирования радиолокационного измерительного комплекса При принятии решения о качестве изготовления обтекателей необходимо иметь базу требований, которые представляют собой ограничения на границы изменения оцениваемых РТХ. Задача создания требования решается за счет использования конструктора требований. Кроме этого, для объяснения принятых системой решений о значениях исследуемых РТХ должен присутствовать механизм объяснения, который должен предоставлять конечному пользователю системы некоторый
68
материал, при восприятии которого пользователю было понятно, почему системой принято такое решение. Совокупность документов «Протокол экспертной оценки» представляет базу данных результатов экспертизы. Реализация ИИС Объекты доступа к данным объединены в группы. Группа 1. Таблицы документа «Протокол измерений»: MainDsTable – родительская таблица (номер документа, дата документа, частота радиосигнала, поляризация радиосигнала и т.п.); AntRflFlsTable – таблица со списком пар файлов измерений соответствующих системе «антенна» и «антенна-обтекатель» и назначенных углах фазирования (поворота) антенны; DevicesTable – список приборов комплекса, использующихся при проведении цикла испытаний; AntBlkTable – список узлов, входящих в состав антенной системы; RflBlkTable – список узлов, входящих в состав обтекателя; SmenaTable – состав смены, проводящей испытания. Группа 2. Таблицы документа «Результат экспертной оценки»: ExpDsTable – родительская таблица (номер документа, дата документа, ссылка на родительский документ, ссылка на экземпляр алгоритма со своими параметрами и т.п.); ExpARFlsTable – таблица со списком пар файлов измерений соответствующих системе «антенна» и «антеннаобтекатель» и назначенных углах фазирования (поворота) антенны – загружается из документа «Протокол измерений»; ORflDtaTable – фрагмент исходной диаграммы излучения (приема) системы «антенна-обтекатель»; OAntDtaTable – фрагмент исходной диаграммы излучения (приема) системы «антенна»; OIRflDtaTable – фрагмент интерполированной диаграммы излучения (приема) системы «антенна-обтекатель» вблизи локального экстремума; OIAntDtaTable – фрагмент интерполированной диаграммы излучения (приема) системы «антенна» вблизи локального экстремума. Последние 4 указанные таблицы используются в механизме объяснения. Группы 3, 4. Справочники системы: SprFreqs - частоты; ScWorks – научно-исследовательские работы, SprPolars – виды поляризации, SprSotrs – список сотрудников, SprRefls – перечень блоков обтекателей, SprAnts – перечень блоков антенных систем, SprOrgs – организации, SprDgrTps – типы измеряемых диаграмм, SprAntPlans – перечень рабочих плоскостей антенны, SprDevices – перечень приборов РИК, MChTypsTable – перечень оцениваемых характеристик, DProgParsTable – параметры программы, AlgsTable – список алгоритмов, AlgParsTable – детализация параметров алгоритмов, ReqsTable – требования к РТХ, ReqDetsTable – детализация требований к РТХ. Группа 5. Таблицы, использующиеся для формирования и исполнения запросов к информационной базе. QuryItemsTable – список полей, по которым могут быть организованы запросы к информационной базе (дата документа, номер документа, частота радиосигнала, тип оцениваемой характеристики и т.п.), QueryRecsTable – список записей, содержащих поля, которые используются в текущем запросе, QueryAntBlkTable – список бло-
69
ков антенной системы, документы с которыми должны быть отобраны, QueryRflBlkTable – список блоков обтекателей, документы с которыми должны быть отобраны. Группа 6. Таблицы для решения задач администрирования базы данных экспертной системы (сохранения, восстановления, архивации, открытия и закрытия таблиц): dbAdmTasksTable – перечень задач, выполняемых в рамках текущего сценария обработки базы данных экспертной системы. Группа 7. Таблицы шаблонов для ускорения процесса создания документа «Протокол измерений». В программе, созданной для операционной системы Windows и являющейся реализацией экспертной системы, предусмотрено получение РТХ двух типов - зависимости коэффициента прохождения обтекателя от угла фазирования (поворота) антенны и зависимости ошибки пеленга от угла фазирования (поворота) антенны. В обоих случаях остальные параметры проведения измерений (длина волны, поляризация, плоскость измерения, тип диаграммы и т.п.) в рамках одного документа «Протокол измерений» фиксированы. После запуска программы на экран выдается родительское окно, содержащее семейство дочерних окон (рис. 11).
Рис. 11. Вид программного интерфейса в режиме просмотра документов “Протокол измерений”
70
Основную часть при отображении информации занимает окно документа «Протокол измерений», в котором отражаются: номер документа, название НИР, в рамках которой проводятся испытания, список персонала, даты начала и окончания испытаний (могут заполняться после получения результатов испытаний). Здесь также учитываются: время начала и окончания испытаний, тип диаграммы, частота радиосигнала, плоскость антенны, список оборудования РИК, использующегося при проведении измерений, список блоков антенны, список блоков обтекателя, ссылка на каталог размещения файлов с измерительной информацией, список файлов измерений объектов «антенна» и «антенна-обтекатель». Отображаются, кроме того, окна «Журнал: Протоколы измерений», «Журнал: Протоколы эксп. оценки», «Диаграммы (исходные)». Вид программного интерфейса в режиме просмотра документов «Результат экспертной оценки» показан на рисунке 12.
Рис. 12. Вид программного интерфейса в режиме просмотра документов “Результат экспертной оценки” Конечным результатом оценки требуемых РТХ является кривая, показанная в окне «Оцениваемая характеристика», рис. 12. На рисунке приведена зависимость ошибки пеленга от угла фазирования антенны. Ограничения на значения этой функции, соответствующие требованиям к испытуемому обтекателю, приведены на этом же рисунке жирными линиями – они образуют «коридор» допустимых значений. Для интерполяции
71
участков диаграмм вблизи локальных минимумов использован алгоритм, основанный на методе наименьших квадратов, взят 21 отсчет измеренных значений каждой из диаграмм. Результат интерполяции показан жирными кривыми в окне «Диаграммы (окр. экстремума)», рис. 12. Эти данные являются промежуточными, они записываются в базу данных для каждой пары диаграмм систем «антенна» и «антенна-обтекатель» и предназначены для объяснения пользователю конечного результата. В системе предусмотрена возможность создания запросов к базе документов «Протокол измерений» с использованием элементов естественного языка. Создан специальный алгоритм, формирующий тексты SQL запросов на основании подготовленных данных. Описание алгоритма громоздко и в этой связи здесь не приводится. Для обеспечения возможности вывода информации на бумажные носители предусмотрено пять видов отчетов. Поддерживается независимая возможность переноса всех графических объектов в приложения Windows через буфер обмена. Направлениями дальнейшего развития рассмотренной информационной системы являются: расширение числа оцениваемых радиотехнических характеристик, расширение класса функций для интерполяции измеряемых диаграмм, применение технологии COM+ и сервера Microsoft Word в модулях генерации отчетов. Таким образом, рассмотрена ИИС, обеспечивающая получение уточненных оценок РФХ обтекателей антенн по данным стендовых измерений. Обоснована структура исходных и выходных документов ИИС. Система может быть использована для автоматизации деятельности лабораторий, занимающихся испытаниями систем «антенна-обтекатель». Алгоритмы обработки сигналов в ИИС В рассмотренной ИИС алгоритмы обработки сигналов представляют операциональную составляющую базы знаний. Количественное снижение уровня основного лепестка СДН характеризуется коэффициентом пропускания (КП), который определяется по формуле: σ (ϕ ) КП = А + О max , (10.1) σ А (ϕ max ) σ А +О (ϕ max ) - максимальное значение амплитуды функции СДН системы “антенна-обтекатель” в максимуме основного лепестка, σ А (ϕ max ) - значение максимума функции СДН системы “антенна” в максимуме основного лепестка. Ошибка пеленга вычисляется следующим образом: ОП = ϕА ,min − ϕА+O ,min , (10.2)
72
ϕА ,min - значение угла минимума функции РДН системы “антенна” ϕА+О,min - значение функции минимума функции РДН системы “антеннаобтекатель”. На практике для определения КП и ОП согласно (10.1) и (10.2) сначала измеряют угловые зависимости σ А+О (ϕ) , σ А (ϕ) - диаграммы излучения (приема) систем “антенна” и “антенна+обтекатель” в режиме формирования суммарной диаграммы (рис. 13) или разностной диаграммы (рис. 14): σ, дБ
0
σ, дБ
0
-10
-10
-20
-20
-30
-30
-40
-40
-50
-50
-60 100 110 120 130 140 150 160
-60 110 115 120 125 130 135
ϕ , град.
антенна
антенна+обтекатель
Рис. 13.
ϕ , град.
антенна
антенна+обтекатель
Рис. 14.
Погрешности оценки КП и ОП согласно формулам (10.1) и (10.2) связаны со следующими причинами: - неточное измерение угла позиционирования систем “антенна” и “антенна+обтекатель”; - шумы регистрирующей аппаратуры; - шумы квантования при записи информации о параметрах электромагнитного поля в цифровом виде. Традиционный путь снижения погрешностей измерений каких-либо физических параметров заключается в проведении многократных измерений и усреднении их результатов. Такой подход обеспечивает минимизацию влияния шумов различной природы при оценке характеристик измеряемых сигналов. В случае измерений диаграмм антенных систем, описанный выше, подход напрямую применить не представляется возможным. Это связано, во-первых, с неприемлемым ростом временных затрат. Так, при проведении вместо одного цикла измерений диаграммы излучения (приема) цикла в N измерений время измерений возрастает в N раз. При этом время регистрации одной диаграммы излучения (приема) составляет единицы минут. Во-вторых, основной сдерживающий фактор – невысокая стабильность ра-
73
боты аппаратуры СВЧ в течение длительного периода. Практически трудно обеспечить высокую (~ 0.1 дБ) стабильность работы за время, большее нескольких минут. Использование интерполирующей функции в рассматриваемой задаче представляет собой, по-существу, способ уточнения значений диаграмм излучения (приема) в окрестностях их локальных экстремумов без использования операции усреднения результатов многократных измерений. При этом уточнение значений функции конкретной диаграммы в точках окрестности локального экстремума происходит не за счет усреднения результатов многократных измерений в этих же точках, а за счет использования измерительной информации, содержащейся в соседних отсчетах однократно измеренной диаграммы. В качестве интерполирующей функции в рамках алгоритма обработки использован квадратичный полином f (ϕ) = a 0 ⋅ ϕ2 + a 1 ⋅ ϕ1 + a 2 . Пусть ϕ−n , ϕ−n +1 , ... , ϕ−1 , ϕ0 , ϕ1 , ... , ϕn −1 , ϕn - углы диаграммы излучения (приема) в окрестности локального экстремума, на которых измерены значения функции диаграммы A −n , A −n +1 , ... , A −1 , A 0 , A1 , ... , A n −1 , A n . С целью оценки параметров a 0 , a 1 , a 2 для значений ϕi , i = −n, ... , n и A i , i = −n, ... , n следует написать систему линейных алгебраических уравнений
⎧a 0 ⋅ ϕ−2 n + a 1 ⋅ ϕ1−n + a 2 = A −n ⎪ ... ... ... ... ... ⎪ 2 1 ⎪ a 0 ⋅ ϕ−1 + a 1 ⋅ ϕ−1 + a 2 = A −1 ⎪ 2 1 ⎨ a 0 ⋅ ϕ0 + a 1 ⋅ ϕ 0 + a 2 = A 0 , ⎪ a ⋅ ϕ2 + a ⋅ ϕ1 + a = A 1 1 2 1 ⎪ 0 1 ... ... ... ... ... ⎪ ⎪ a ⋅ ϕ2 + a ⋅ ϕ1 + a = A 1 n 2 n ⎩ 0 n
(10.3)
В этой системе N = 2n + 1 , N > 3 уравнений с тремя неизвестными. В матричном виде систему (10.3) можно представить в виде
B Φ = A,
⎡ϕ2−n ⎢ ... ⎢ 2 ⎢ ϕ−1 2 B = [a 0 , a1 , a 2 ], Φ = ⎢ ϕ0 ⎢ 2 ⎢ ϕ1 ⎢ ... ⎢ 2 ⎣ ϕn
ϕ1−n 1⎤ ⎡A −n ⎤ ⎥ ⎢ ... ⎥ ... ... ⎥ ⎢ ⎥ ϕ1−1 1 ⎥ A −1 ⎥ ⎢ ϕ10 1 ⎥ , A = ⎢ A ⎥ ⎥ ⎢ A0 ⎥ 1 ϕ1 1 ⎥ ⎢ 1⎥ ⎢ ... ⎥ ... ... ⎥ ⎥ 1 ⎢⎣ A n ⎥⎦ ϕn 1 ⎦
(10.4)
74
Система уравнений, в которой число уравнений превышает число переменных, называется переопределенной. Правая часть системы представляет собой результаты измерений и известна с погрешностью. Оценка решения, имеющая наименьшее среднеквадратичное отклонение от истинного решения (если оно существует) может быть получена в виде:
B* = Φ − A ,
Φ − = ( Φ T Φ + αI
)
−1
Φ T - обобщенная обратная матрица,
(10.5)
T – знак транспонирования, I – единичная матрица размерности N × N , α параметр регуляризации. Расчеты по экспериментальным данным показали, что использование (10.5) напрямую во многих случаях не позволяет получить устойчивого решения ни при каких значениях параметра регуляризации. Такой результат можно объяснить тем, что массив ϕ−n , ϕ−n +1 , ... , ϕ−1 , ϕ0 , ϕ1 , ... , ϕn −1 , ϕn угловых отсчетов сосредоточен в малом диапазоне, а массив A −n , A −n +1 , ... , A −1 , A 0 , A1 , ... , A n −1 , A n в диапазоне значений, большем углового диапазона в 100 … 1000 раз. Поэтому для повышения устойчивости решения была разработана и использована процедура уравнивания порядков коэффициентов в правых и левых частях уравнения (10.5). Этапы алгоритма, который позволяет строить интерполирующую функцию, с учетом процедуры повышения устойчивости решения, можно представить в виде: Находится угол ϕ0 локального экстремума функции A(ϕ j ),
j = 0 .. M − 1, M - общее число точек измерения диаграммы. Задается n - параметр, определяющий количество точек N , по которым будет строиться интерполирующая функция. Формируется массив значений ψ = [ϕ−n , ϕ−n +1 , ... , ϕ−1 , ϕ0 , ϕ1 , ... , ϕn −1 , ϕn ] , в котором ϕ−n - нижняя граница углового диапазона, ϕ+ n - верхняя граница углового диапазона. Производится нормализация массива углов, целью которой является получение вектора T
⎡ ϕ − ϕ0 ϕ−n +1 − ϕ0 ϕ − ϕ0 ϕ − ϕ0 ϕ − ϕ0 ϕ n − ϕ0 ⎤ , , , ... , −1 , 0, 1 , ... , n −1 , ψ = ⎢ −n ϕ + n − ϕ −n ϕ + n − ϕ −n ϕ+n − ϕ−n ϕ+n − ϕ−n ⎥⎦ ⎣ ϕ + n − ϕ −n ϕ + n − ϕ −n элементы которого находятся в интервале [− 1 ... 1 ]. 4. Формируется массив значений A = [ A −n , A −n +1 , ... , A −1 , A 0 , A1 , ... , A n −1 , A n ] . Производится его нормализация, целью которой является получение вектора ⎡ A − A min A −n +1 − A min A 0 − A min A − A min A n − A min ⎤ A * = ⎢ −n , , ... , , ... , n −1 , ⎥, − − − − − A A A A A A A A A A min max min max min max min max min ⎦ ⎣ max *
75
элементы которого находятся в интервале [− 1 ... 1 ]. В приведенном выражении A min - значение минимального элемента измеренного массива амплитуд в интервале углов интерполяции, A max - значение максимального элемента. 5. Согласно (10.5) производится получение оценки B* . На рис. 16, 17 приведены результаты обработки экспериментальных диаграмм, сформированных в “суммарном” (рис. 15) и “разностном” (рис. 16) режимах работы ФАР. Графики построены по тем же данным, что и кривые на рис. 14, 15 – на рис. 16, 17 рассмотрены только диапазоны углов локальных экстремумов. При работе в “суммарном” режиме интервал между отсчетами при регистрации диаграмм составлял 0.05 градуса, в “разностном” режиме - 0.01 градуса. Интервал дискретизации при регистрации амплитуды поля в обоих случаях равнялся 0.1 дБ. Параметр регуляризации α = 0 .
σ, дБ
-26 σ, дБ
-2 -28
-2.5 -30
-3
-32
-3.5 -4 127.8 128.2 128.6 антенна
129
129.4
ϕ , град.
антенна+обтекатель
Рис. 15.
-34 121.9 антенна
122
122.1
ϕ , град.
антенна+обтекатель
Рис. 16.
Результаты обработки экспериментальных данных при оценке РФХ антенных обтекателей по предложенным алгоритмам позволяют говорить о повышении точности оценки КП и ОП с их помощью на 5..10 %. Квазиестественный языковой интеллектуальный интерфейс Для реализации возможности выборочного доступа к данным в ИИС создан квазиестественный языковой интерфейс, который позволяет сформировать запрос в виде набора условий. На основании набора условий специальный встроенный алгоритм генерирует текст соответствующего SQL запроса. Генератор произвольных SQL–запросов к базе данных реализован в виде отдельного модуля.
76
Существует возможность упорядочивания получающегося после запроса перечня документов либо по одному из атрибутов поиска, либо по названиям блоков антенной системы, либо по наименованию обтекателя. Список документов, отобранных по результатам выполнения запроса, может быть выведен на печать. 12. Тенденции развития систем искусственного интеллекта
Искусственный интеллект вообще и экспертные системы в частности, прошли долгий путь: первые увлечения (1960 год), лженаука (196065), успехи при решении головоломок и игр (1965-1975), разочарование при решении практических задач (1970-1985), первые успехи при решении ряда практических задач (1962-1992), массовое коммерческое использование при решении практических задач (1993-1995). Но основу коммерческого успеха по праву составляют экспертные системы и, в первую очередь, экспертные системы реального времени. Именно они позволили искусственному интеллекту перейти от игр и головоломок к массовому использованию при решении практически значимых задач. Программные средства, базирующиеся на технологии и методах искусственного интеллекта, получили значительное распространение в мире. Их важность, и, в первую очередь, экспертных систем и нейронных сетей, состоит в том, что данные технологии существенно расширяют круг практически значимых задач, которые можно решать на компьютерах, и их решение приносит значительный экономический эффект. В то же время, технология экспертных систем является важнейшим средством в решении глобальных проблем традиционного программирования: длительность и, следовательно, высокая стоимость разработки приложений; высокая стоимость сопровождения сложных систем; повторная используемость программ и т.п. Кроме того, объединение технологий экспертных систем и нейронных сетей с технологией традиционного программирования добавляет новые качества к коммерческим продуктам за счет обеспечения динамической модификации приложений пользователем, а не программистом, большей "прозрачности" приложения (например, знания хранятся на ограниченном естественном языке, что не требует комментариев к ним, упрощает обучение и сопровождение), лучших графических средств, пользовательского интерфейса и взаимодействия. По мнению специалистов, в недалекой перспективе экспертные системы будут играть ведущую роль во всех фазах проектирования, разработки, производства, распределения, продажи, поддержки и оказания услуг. Их технология, получив коммерческое распространение, обеспечит революционный прорыв в интеграции приложений из готовых интеллектуально-взаимодействующих модулей.
77
Коммерческий рынок продуктов искусственного интеллекта в мире в 1993 году оценивался примерно в 0,9 млрд. долларов; из них 600 млн. приходится на долю США. Выделяют несколько основных направлений этого рынка: 1) экспертные системы; теперь их часто обозначают еще одним термином - "системы, основанные на знаниях"; 2) нейронные сети и "размытые" (fuzzy) логики; 3) естественно-языковые системы. В США в 1993 году рынок между этими направлениями распределился так: экспертные системы - 62%, нейронные сети - 26%, естественноязыковые системы - 12%. Рынок этот можно разделить и иначе: на системы искусственного интеллекта (приложения) и инструментальные средства, предназначенные для автоматизации всех этапов существования приложения. В 1993 году в общем объеме рынка США доля приложений составила примерно две, а доля инструментария - примерно одну треть. Одно из наиболее популярных направлений последних пяти лет связано с понятием автономных агентов. Их нельзя рассматривать как "подпрограммы", - это скорее прислуга, даже компаньон, поскольку одной из важнейших их отличительных черт является автономность, независимость от пользователя. Идея агентов опирается на понятие делегирования своих функций. Другими словами, пользователь должен довериться агенту в выполнении определенной задачи или класса задач. Всегда существует риск, что агент может что-то перепутать, сделать что-то не так. Следовательно, доверие и риск должны быть сбалансированными. Автономные агенты позволяют существенно повысить производительность работы при решении тех задач, в которых на человека возлагается основная нагрузка по координации различных действий. В том, что касается автономных (интеллектуальных) агентов, следует отметить проект, который выполнялся под руководством профессора Генри Либермана в Media-лаборатории MIT (MIT Media Lab). Речь идет об агентах, отвечающих за автоматическое генерирование технической документации. Решением этой задачи занимался академик Андрей Петрович Ершов, сформулировавший понятие деловой прозы как четко определенного подмножества естественного языка, которое может быть использовано, в частности, для синтеза технической документации (это одно из самых узких мест в любом производстве). Группа под руководством профессора Либермана исследовала возможности нового подхода к решению этой проблемы, на основе автономных агентов. Успехи систем искусственного интеллекта и их причины Использование экспертных систем и нейронных сетей приносит значительный экономический эффект. Так, например: - American Express сократила свои потери на 27 млн. долларов в год благодаря экспертной системе, определяющей целесообразность выдачи или отказа в кредите той или иной фирме;
78
- DEC ежегодно экономит 70 млн. долларов в год благодаря системе XCON/XSEL, которая по заказу покупателя составляет конфигурацию вычислительной системы VAX. Ее использование сократило число ошибок от 30% до 1%; - Sira сократила затраты на строительство трубопровода в Австралии на 40 млн. долларов за счет управляющей трубопроводом экспертной системы, реализованной на базе описываемой ниже системы G2. Коммерческие успехи к экспертным системам и нейронным сетям пришли не сразу. На протяжении ряда лет (с 1960-х годов) успехи касались в основном исследовательских разработок, демонстрировавших пригодность систем искусственного интеллекта для практического использования. Начиная примерно с 1985 (а в массовом масштабе, вероятно, с 19881990 годов), в первую очередь, экспертные системы, а в последние два года и нейронные сети стали активно использоваться в реальных приложениях. Причины, приведшие системы искусственного интеллекта к коммерческому успеху, следующие: 1. Специализация. Переход от разработки инструментальных средств общего назначения к проблемно/предметно специализированным средствам, что обеспечивает сокращение сроков разработки приложений, увеличивает эффективность использования инструментария, упрощает и ускоряет работу эксперта, позволяет повторно использовать информационное и программное обеспечение (объекты, классы, правила, процедуры). 2. Использование языков традиционного программирования и рабочих станций. Переход от систем, основанных на языках искусственного интеллекта (Lisp, Prolog и т.п.), к языкам традиционного программирования (С, С++ и т.п.) упростил "интегрированность" и снизил требования приложений к быстродействию и емкости памяти. Использование рабочих станций вместо ПК резко увеличило круг возможных приложений методов искусственного интеллекта. 3. Интегрированность. Разработаны инструментальные средства искусственного интеллекта, легко интегрирующиеся с другими информационными технологиями и средствами (с CASE, СУБД, контроллерами, концентраторами данных и т.п.). 4. Открытость и переносимость. Разработки ведутся с соблюдением стандартов, обеспечивающих данные характеристики. 5. Архитектура клиент/сервер. Разработка распределенной информационной системы в данной архитектуре позволяет снизить стоимость оборудования, используемого в приложении, децентрализовать приложения, повысить надежность и общую производительность, поскольку сокращается объем информации, пересылаемой между ЭВМ, и каждый модуль приложения выполняется на адекватном оборудовании. Перечисленные причины могут рассматриваться как общие требования к инструментальным средствам создания систем искусственного интеллекта.
79
Экспертные системы реального времени - основное направление искусственного интеллекта. Среди специализированных систем, основанных на знаниях, наиболее значимы экспертные системы реального времени, или динамические экспертные системы. На их долю приходится 70 процентов этого рынка. Значимость инструментальных средств реального времени определяется не столько их бурным коммерческим успехом (хотя и это достойно тщательного анализа), но, в первую очередь, тем, что только с помощью подобных средств создаются стратегически значимые приложения в таких областях, как управление непрерывными производственными процессами в химии, фармакологии, производстве цемента, продуктов питания и т.п., аэрокосмические исследования, транспортировка и переработка нефти и газа, управление атомными и тепловыми электростанциями, финансовые операции, связь и многие другие. Классы задач, решаемых экспертными системами реального времени, таковы: мониторинг в реальном масштабе времени, системы управления верхнего уровня, системы обнаружения неисправностей, диагностика, составление расписаний, планирование, оптимизация, системы-советчики оператора, системы проектирования. Статические экспертные системы не способны решать подобные задачи, так как они не выполняют требования, предъявляемые к системам, работающим в реальном времени: 1. Представлять изменяющиеся во времени данные, поступающие от внешних источников, обеспечивать хранение и анализ изменяющихся данных. 2. Выполнять временные рассуждения о нескольких различных асинхронных процессах одновременно (т.е. планировать в соответствии с приоритетами обработку поступивших в систему процессов). 3. Обеспечивать механизм рассуждения при ограниченных ресурсах (время, память). Реализация этого механизма предъявляет требования к высокой скорости работы системы, способности одновременно решать несколько задач (т.е. операционные системы UNIX, VMS, Windows NT, но не MS-DOS). 4. Обеспечивать "предсказуемость" поведения системы, т.е. гарантию того, что каждая задача будет запущена и завершена в строгом соответствии с временными ограничениями. Например, данное требование не допускает использования в экспертной системе реального времени механизма "сборки мусора", свойственного языку Lisp. 5. Моделировать "окружающий мир", рассматриваемый в данном приложении, обеспечивать создание различных его состояний. 6. Протоколировать свои действия и действия персонала, обеспечивать восстановление после сбоя. 7. Обеспечивать наполнение базы знаний для приложений реальной степени сложности с минимальными затратами времени и труда (необхо-
80
димо использование объектно-ориентированной технологии, общих правил, модульности и т.п.). 8. Обеспечивать настройку системы на решаемые задачи (проблемная/предметная ориентированность). 9. Обеспечивать создание и поддержку пользовательских интерфейсов для различных категорий пользователей. 10. Обеспечивать уровень защиты информации (по категориям пользователей) и предотвращать несанкционированный доступ. Подчеркнем, что кроме этих десяти требований средства создания экспертных систем реального времени должны удовлетворять и перечисленным выше общим требованиям. Основные производители Инструментарий для создания экспертных систем реального времени впервые выпустила фирма Lisp Machine Inc в 1985 году. Этот продукт предназначался для символьных ЭВМ Symbolics и носил название Picon. Его успех привел к тому, что группа ведущих его разработчиков образовала фирму Gensym, которая, значительно развив идеи, заложенные в Picon, выпустила в 1988 году инструментальное средство под названием G2. В настоящий момент работает его третья версия и подготовлена четвертая. С отставанием от Gensym на два-три года ряд других фирм начал создавать (или пытаться создавать) свои инструментальные средства. Назовем ряд из них: RT Works (фирма Talarian, США), COMDALE/C (Comdale Techn., Канада), COGSYS (SC, США), ILOG Rules (ILOG, Франция). Сравнение двух наиболее продвинутых систем, G2 и RT Works, которое проводилось путем разработки одного и того же приложения двумя организациями, NASA (США) и Storm Integration (США), показало значительное превосходство первой. СПИСОК ВОПРОСОВ ДЛЯ САМОКОНТРОЛЯ
1. 2. 3. 4. 5. 6. 7. 8. 9.
Чем отличаются экспертные системы от прикладных компьютерных программ? Что понимается под фактуальной и операционной составляющими знания? На решение какого рода задач нацелены экспертные системы? Какие существуют классы экспертных систем? Какова структура экспертной системы? В чем отличия самообучающихся систем «с учителем» и «без учителя»? Перечислите признаки индуктивных систем. Что такое логистическая функция? В чем заключается принцип работы нейрона?
81
10. Приведите структуру алгоритма обратного распространения ошибки (для нейронной сети). 11. Что такое прецедент? Как работают системы, основанные на прецедентах? 12. Назовите основные этапы создания экспертных систем. 13. Какие Вы знаете методы работы со знаниями? 14. Какая задача решается на этапе формализации качественных знаний? 15. Каковы основные этапы построения системы приобретения знаний? 16. Перечислите логические модели решения задач и дайте их краткую характеристику. 17. Продукционные модели. 18. Уровни понимания в современных интеллектуальных системах. 19. Планирование в пространстве состояний (SS-проблема) и планирование в пространства задач (PR-проблема) – идеи двух подходов. 20. Алгоритмы поиска решений (Мура, Дейкстры, Дорана и Мичи, Харта, Нильсона и Рафаэля, Ченга и Слейгла, метод ключевых операторов). 21. Компоненты фреймовой модели представления знаний. 22. Назовите классификацию ядер продукции. 23. Стратегии решений организации поиска (прямой вывод, обратный вывод). 24. Назовите элементы синтаксиса логики предикатов и поясните их назначение. 25. Перечислите подходы к распознаванию символов. 26. Проблема испытаний радиофизических характеристик систем «Антенна-обтекатель». 27. Алгоритмы обработки данных в интеллектуальной информационной системе оценки радиофизических характеристик систем «Антеннаобтекатель». 28. Структура базы данных интеллектуальной информационной системы оценки радиофизических характеристик систем «Антеннаобтекатель». 29. Квазиестественный языковой интерфейс подсистемы формирования запросов к базе данных. 30. Перечислите основные направления развития систем искусственного интеллекта.
82
СПИСОК ЛИТЕРАТУРНЫХ ИСТОЧНИКОВ
1. Уинстон П. Искусственный интеллект / П. Уинстон. – М.: Мир, 1980. – 519 с. 2. Хант Э. Искусственный интеллект / Э. Хант. – М.: Мир, 1978. – 558 с. 3. Логический подход к искусственному интеллекту / под ред. Г.П. Гаврилова – М.: Мир, 1998. – 493 с. 4. Эндрю А. Искусственный интеллект / Под ред. Поспелова Д.А. – М.: Мир, 1985. – 265 с. 5. Курс лекций по дисциплине «Системы искусственного интеллекта». Адрес в сети Интернет: http://www.mari-el.ru/mmlab/home/AI/12/index.html 6. Курс лекций по дисциплине «Системы искусственного интеллекта» / под ред. М.Н. Морозова. Адрес в сети Интернет: http://khpi-iip.mipk.kharkiv.edu/library/ai/conspai/index.html 7. Курс лекций по дисциплине «Информатика», раздел «Экспертные системы». Адрес в сети Интернет: http://synopsis.kubsu.ru/informatic/ 8. Курс лекций по курсу «Экспертные системы». Адрес в сети Интернет: http://www.univer.omsk.su/lection/ 9. Курс лекций по курсу «Экспертные системы» / под ред. Л.Н. Туктаровой. Адрес в сети Интернет: http://www.ugkr.ru/Lektiis.html 10. Антиликаторов А.Б. Интеллектуальная информационная система оценки радиотехнических характеристик радиопрозрачных обтекателей антенн. /А.Б. Антиликаторов, А.Ю. Телков // Системные проблемы надежности, качества, информационных и электронных технологий в инновационных проектах: материалы Международ. конф. и Рос. науч. школы. – М., 2006. – Т. 1, ч. 4. – С. 125 – 130.
83 Учебное издание
ЭКСПЕРТНЫЕ СИСТЕМЫ Учебное пособие для вузов
Составитель ТЕЛКОВ Александр Юрьевич Редактор Воронина А.П.
________________________________________________________________________ Подписано в печать 14.2.2007. Формат 60х84/16. Усл. п.л. 5,25. Тираж 50. Заказ 35. Издательско-полиграфический центр Воронежского государственного университета. 394006, г. Воронеж, Университетская площадь, 1, ком.43, тел.208-853. Отпечатано в лаборатории оперативной печати ИПЦ ВГУ.