Логические модели представления знаний



 

В основе логических моделей лежит понятие формальной теории, задаваемой четверкой:

S= <В, F, A, R>,

где   В – счетное множество базовых символов (алфавит) теории S;

F – подмножество выражений теории S, называемых формулами теории (под выражениями понимаются конечные последовательности базо­вых символов теории S); А – выделенное множество формул, называемых аксиомами теории S, т.е. множество априорно истинных формул; R – конечное множество отношений {r1,..., rn} между формулами, назы­ваемыми правилами вывода.

Обычно существует эффективная процедура (множество синтаксических правил), позволяющая строить из В син­таксически правильные выражения – формулы;

Для каждого ri существует целое положительное число j, при котором для каждого множества, состоящего из j формул, и для каждой формулы f эффективно решается вопрос о том, находятся ли данные j формул в отношении ri с формулой f. Если отношение riвыполняет­ся, то f называется непосредственнымследствием данных j формул по правилу ri. Следствием (выводом) формулы fn в формальной теории S называется всякая последовательность f1,...,fnформул, при которой для любого i формула fi есть либо аксиома теории S, либо непосредственное след­ствие каких-либо предыдущих формул по одному из правил вывода. Правила вывода позволяют расширять множество формул, которые считаются истинными в рамках данной теории.

Из символов алфавита можно строить различные выражения. Выделяют термы, элементарные формулы (атомы) и правильно по­строенные формулы (или просто формулы). Всякий символ переменной или константной буквы есть терм. Если t1,... ,tn (n і 1) – термы, то и fkn (t1,... ,tn) является термом.

Если pkn – предикатная буква, а t1,...,tn – термы, то pkn(t1,...,tn) – элементарная формула (атом). Атом – простейший неделимый элемент. Атом – правильно построенная формула. Если А и В – правильно построенные формулы, то щА, AЪВ, АЩВ, АЙВ есть правильно построенные формулы. Если А – правильно построенная формула и х – переменная в А, то конструкции (х) А и ($х) А – пра­вильно построенные формулы. Выражение является правильно по­строенной формулой, в том случае, если оно получено с соблюдением при­веденных выше правил.

Для того чтобы придать формуле содержание, ее интерпретируют как утверждение, касающееся рассматриваемой предметной области. Под интерпретацией понимают всякую систему, состоящую из непус­того множества D, называемого областью интерпретации, и какого-либо соответствия, относящего каждой предикатной букве pkn неко­торое n – местное отношение в D; каждой функциональной букве fkn – некоторую n – местную функцию, отображающую Dn®D, и каждой константной букве fk0 – некоторый элемент из D. При заданной ин­терпретации переменные мыслятся “пробегающими” все значения из области D этой интерпретации, а всякой элементарной формуле при­писывается значение “истинно” (И) или “ложно” (Л). Приписывание значения элементарной формуле pkn(t1,...,tn) осуществляется по сле­дующему правилу: если термы предикатной буквы соответствуют элементам из D, удовлетворяющим отношению, определяемому дан­ной интерпретацией, то значением элементарной формулы будет ис­тина, в противном случае – ложь. Значение неэлементарной формулы вычисляется рекуррентно, исходя из значений составляющих ее фор­мул. Очевидно, что значения формул могут быть истинными или лож­ными в зависимости от выбранной интерпретации.

Основной задачей, решаемой в рамках исчисления предикатов, яв­ляется выяснение истинности или ложности заданной формулы на некоторой области интерпретации. При этом особая роль отводится общезначимым формулам, т.е. формулам, истинным при любой интер­претации, и невыполнимым формулам, т.е. формулам, ложным при лю­бой интерпретации. Справедлива следующая основополагающая теорема дедукции: пусть даны формулы B1,...,Bn и формула А. Формула Алогическое следствие B1,...,Bn тогда и только тогда, когда формула B1Щ…ЩBnЙА общезначима, т.е. |=(В1Щ...ЩВnА. Напомним, что формула А логически следует из формул B1,...,Вn тогда и только тогда, когда всякая интерпретация I, удовлетворяю­щая В1Щ...ЩВn, удовлетворяет также и А. Формулы B1,...,Вn называют посылками, а А – заключением логического следования и обозначают B1,...,Вn |=А.

Задачей доказательства теоремы называют выяснение вопроса логического следования некоторой формулы А из заданного мно­жества формул B1,...,Вn, что равносильно доказательству общезначи­мости формулы В1Щ...ЩВnЙА или невыполнимости формулы B1Щ…ЩBnЩ|А.

Известно, что для исчисления предикатов первого порядка не существует общего метода установления общезначимости любых формул, т.е. исчисление предикатов первого порядка является не­разрешимым. Однако, если некоторая формула исчисления предикатов общезначима, то существует процедура для проверки ее общезначи­мости, т.е. исчисление предикатов можно назвать полуразрешимым.

Приведем пример записи некоторого факта в виде формулы ис­числения предикатов:

 

ДАТЬ (МИХАИЛ, ВЛАДИМИРУ, КНИГУ);

($х) (ЭЛЕМЕНТ (х, СОБЫТИЕ-ДАТЬ) Щ ИСТОЧНИК (х, МИХАИЛ) Щ

АДРЕСАТ (х, ВЛАДИМИР) Щ ОБЪЕКТ (х, КНИГА).

 

Здесь описаны два способа записи одного факта: “Михаил дал книгу Владимиру”.

Основное достоинством использования исчисления предикатов в качестве модели представления знаний – это наличие единооб­разной формальной процедуры доказательства теорем. Однако вы­сокая степень единообразия влечет за собой и основной недостаток данного подхода – сложность использования при доказательстве эв­ристик, отражающих специфику конкретной проблемной среды. Указанный недостаток особенно важен при построении экспертных систем, вычислительная мощность которых в основном определяется знаниями, характеризующими специфику проблемной среды. К дру­гим недостаткам формальных систем следует отнести их монотон­ность, отсутствие средств для структурирования ис­пользуемых элементов и недопустимость противоречий.

Стремление устранить недостатки формальных систем при их ис­пользовании в качестве моделей представления привело к появлению семиотических систем. Семиотическая система формально задается восьмеркой:

S = < В, F, A, R, Q(B), Q(F), Q(A), Q(R) >.

Здесь первые четыре компонента те же, что и в определении фор­мальной системы, а остальные компоненты – правила из­менения первых четырех компонентов под влиянием накапливаемого в базе знаний интеллектуальной системы опыта о строении и функ­ционировании сущностей в данной проблемной среде. Теория таких систем находится на начальной стадии развития.

Семантические сети

 

Сетевые модели – структуры, состоящие из наборов – поименованных взаимосвязанных двухуровневых деревьев.

В основе этих моделей лежит понятие сети, образованной поме­ченными вершинами и дугами. Вершины сети представляют неко­торые сущности (объекты, события, процессы, явления), а дуги – от­ношения между сущностями, которые они связывают.

Ограничив описания вершин и дуг, можно полу­чить сети различного вида. Если вершины не имеют собственной внутренней структуры, то соответствующие сети называют простыми сетями. Если вершины обладают некоторой структурой, то такие се­ти называют иерархическими сетями. В настоящее время в боль­шинстве приложений, использующих семантические сети, они яв­ляются иерархическими.

На рис. 2.1 изображен фрагмент простой семантической сети, выражающий примерно следующую информа­цию: “Михаилу в течение интервала времени [t1,t2] принадлежат ЖИГУЛИ № 25-15”. Михаил есть агент (собственник) в событии В1. Михаил является элементом (э) множества ЧЕЛОВЕК. ЖИГУЛИ № 25-15 – элемент множества МАШИНЫ. Событие В1 – элемент множества всех событий ВЛАДЕТЬ, которое яв­ляется подмножеством (п) множества СИТУАЦИИ и т.д. Использо­ванные на рис. 2.1 дуги “э” (элемент) и “п” (подмножество) служат для выражения таксономии понятий, представленных вершинами. Важ­ность таксономии заключается в том, что множества обычно имеют свойства, присущие всем элементам данного множества. Эти свойства связываются в сети не с конкретными элементами, а с вершинами, сопоставляемыми всему множеству. Так, дуга “п” указывает отношение быть “подмножеством”. В связи с тем, что большинство подмножеств являются различными, т.е. непересекающимися, для их представления удобно ввести дугу специального вида – “пр” (подмножество различное).  Дуга “пр”, идущая из вершины х (например, люди) в вершину z (например, официальные лица), указы­вает, что множество, представленное вершиной х (люди), есть подмножество множества, представленного вершиной  z (официальные лица), и что х (люди) не пересекается ни с каким дру­гим подмножеством, представляемым вершиной r (например, пред­приятия) и имеющим дугу “пр” из r (предприятия) в z (официальные лица). По аналогии можно ввести и отношение “эр”.

 

Рис. 2.1. Фрагмент семантической сети

 

Одно из основных отличий иерархических семантических сетей от простых состоит в возможности разделить сеть на подсети (пространства) и устанавливать отношения не толь­ко между вершинами, но и между пространствами. Все вершины и дуги являются элементами по крайней мере одного пространства. Отметим, что понятие пространства аналогично понятию скобок в математической нотации.

Различные пространства, существующие в сети, могут быть упорядочены в виде дерева пространств, вершинам которого соответствуют пространства, а дугам – отношения видимос­ти.

На рис. 2.2 приведен пример дерева пространств, в соответствии с которым, из пространства Р6 (пространство-потомок) ви­димы все вершины и дуги, лежащие в пространствах-предках Р4, Р2, Р0, а остальные пространства невидимы. Отношение видимости по­зволяет сгруппировать пространства в упорядоченные множества –перспективы. Перспектива обычно используется для ограничения сетевых сущностей, видимых некоторой процедурой, работающей с сетью. Обычно в перспективу включают не любые, а иерархически сгруппированные пространства.

 

 

Рис. 2.2. Пример разбиения сети на пространства

 

При графическом изображении иерархических сетей обычно используют следующие соглашения:

1) вершины и дуги, лежащие в одном пространстве, ограничи­ваются на рисунках многоугольником (обычно прямоугольником);

2) дуга принадлежит тому пространству, в котором находится имя дуги;

3) пространство Pi (точнее, ограничивающий его многоугольник), изображаемое внутри пространства Pj, считается потомком (внутренним уровнем), т.е. из Pi видимо Pj). Отметим, что простран­ство Рi может рассматриваться как супервершина, которая лежит в Pj. Свойство невидимости позволяет повысить эффективность опера­ции поиска в сети. Например, при поиске конкретных фактов ин­формация из кванторных утверждений и правил невидима, так как она заключена в пространствах, ограничивающих эти утверждения и правила.

При необходимости в иерархических сетях можно представить любые логические связки и кванторы. На рис. 2.3 и 2.4 приведены представление выражений, содержащих импликацию и квантор всеобщности (выраженный через импликацию) соответственно. Кроме представления логических связок и кванторов сеть может быть ис­пользована также для кодирования других структур высших по­рядков.

 

 

Рис. 2.3. Сетевое представление импликации

 

 

Рис. 2.4. Изображение в сети квантора всеобщности с использованием импликации

 

При решении многих конкретных задач представление знаний только в виде семантических сетей оказывается неудобным или неэф­фективным. По этой причине в семантических сетях вводят механизм процедурных присоединений.

 

Фреймы

 

Стремление разработать представление, соединяющее в себе до­стоинства различных моделей, привело к возникновению так назы­ваемого, фрейм-представления. С каждым фреймом ассоциируется разнообразная информация (в том числе и процедуры), например информация о том, как пользоваться данным фреймом, ка­ковы ожидаемые результаты выполнения фрейма, что делать, если ожидания не оправдались, и т.п. Фрейм можно представить в виде сети, состоящей из вершин и отношений (дуг). Верхние уровни фрей­ма фиксированы и представляют сущности, всегда истинные в ситуа­ции, описываемой данным фреймом. Нижние уровни заканчиваются слотами, которые заполняются конкретной информацией при вызове фрейма. Можно провести аналогию между фреймами и описанием процедур в языках программирования.

Фрейм соответствует описанию процедуры, а означенный фрейм (фрейм-пример) соответствует вызову процедуры. Отличие фреймов от описаний процедур состоит в том, что фреймы могут вы­зываться не по имени, а по соответствию текущей ситуации – той си­туации, которую описывает данный фрейм. Кроме того, фрейм, сло­ты и механизм их означивания описывают ситуацию в семантических (а не синтаксических) терминах и в метатерминах. С каждым слотом фрейма связаны описания условий, которые должны быть соблюде­ны, чтобы могло произойти означивание слота. В простейших случаях эти условия могут сводиться к указанию семантических категорий, которым должно удовлетворять значение слота. В более сложных случаях условия могут касаться отношений между значениями, выби­раемыми для нескольких слотов.

Итак, фрейм-пример может быть представлен в виде следующей конструкции:

                           f=[<r1,v1>,<r2,v2>,…,<rn,vn>],

где f – имя фрейма, ri – имя слота, a vi – значение слота. В качестве значений слотов могут выступать имена других фреймов, что обеспечивает связь меж­ду фреймами.

Родственные фреймы связываются в систему фреймов. Система содержит описание зависимостей (причинных, временных и т.п.) меж­ду входящими в нее фреймами. Для выражения указанных зависимо­стей фреймы, входящие в некоторую систему, имеют общее множе­ство слотов. Представление зависимостей в явном виде позволяет предсказать переход от одного состояния А (выражаемого фреймом А’) к другому зависимому от него состоянию В (выражаемому фрей­мом В’) и осуществить этот переход эффективно, т.е. не вычисляя за­ново значений всех параметров, характеризующих состояние В, а пе­речислив только изменившиеся (или новые) параметры.

Рассмотрим пример фрейма в системе моделирования процесса выдачи банковского кредита под за­лог (рис. 2.5). Эта система содержит фрейм “Клиент”, кото­рый представляет собой класс заемщиков кредита. Он содержит такую информацию, относящуюся к человеку-клиенту, как обеспечение клиента, его ответ­ственность, имущество и т.д.

Фрейм имеет сложную структуру данных, в которой атрибуты фрейма сами являются фреймами. Например, слот “Прилагается к закладной “ сам является фреймом “Кредит под залог” с присущими ему атрибутами.

Значение в слоте “Месячная плата” может быть результатом вычисления по формуле, в которой используются слоты “Количество”, “Ставка” и “Продолжитель­ность”.

Феноменологическая сила фрейм-представления во многом осно­вывается на включении в него предположений и ожиданий. Слотам фрейма могут быть заранее приписаны по умолчанию некоторые стандартные значения. Это позволяет анализировать с помощью фреймов ситуации, в которых отсутствует упоминание о ряде дета­лей. Стандартные значения, присвоенные по умолчанию, не жестко связаны со своими слотами и могут быть заменены более подходя­щими значениями, если они найдены в обрабатываемой ситуации. Использование концепции “умолчания” часто позволяет исключить необходимость в кванторных утверждениях.

 

 

Рис 2.5. Пример фрейма

Системы фреймов в свою очередь обычно организуют в инфор­мационно-поисковую сеть. Эта сеть используется в случаях, когда предложенный фрейм не удается привести в соответствие с данной ситуацией, т.е. когда слотам не могут быть присвоены значения, удо­влетворяющие условиям, связанным с этими слотами. В подобных ситуациях сеть используется для того, чтобы предложить какой-либо другой фрейм.

Необходимо отметить, что фрейм-представление (так же, как де­кларативное и процедурное представление) является не конкретным языком для представления знаний, а некой концепцией, реализуемой по-разному в таких конкретных языках, как KRL, FRL, K-NET и т.п. В частности, фреймы могут быть представлены с помощью иерархи­ческих семантических сетей, как это сделано в K-NET, где некоторое пространство в сети рассматривается как фрейм, а дуги, связы­вающие это пространство с остальной сетью, рассматриваются как слоты.

 


Дата добавления: 2019-07-15; просмотров: 196; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!