Использование управляемых образцами модулей



Механизм использования управляемых образцами модулей про­иллюстрируем на примере инструментальной системы HEARSAY-III, предназначенной для проектирования ЭС и являющейся моди­фикацией системы понимания речи HEARSAY-II.

Все рассмотренные ранее способы представления знаний исполь­зовали частный случай УОМ. Действи­тельно, каждый модуль представлялся в виде продукционного пра­вила. Сложность правил была весьма ограничена, что позволяло выразить их в виде, понятном эксперту. Если же преобразования, выполняемые модулем, очень сложны, то для их представления при­ходится прибегать к процедурной форме. Стремление сохранить не­зависимость модулей друг от друга привело к созданию в HEARSAY-III схемы, обеспечивающей взаимодействие модулей не непосредственно, а через рабочую память, называемую “классная доска”. Модули в HEARSAY-III называются источниками знаний (ИЗ). Каждый ИЗ состоит из программы-условия, определяющей, применение ИЗ к текущему состоянию классной доски, и программы-действия, производящей результаты.

Классная доска разделена на несколько уровней, на каждом из которых обрабатываются данные определенного вида. В системе HEARSAY-II выделены следующие уровни: предложение, словосоче­тание, слово, слог, фонема и т.д. Поиск решения рассматривается системой как итеративный процесс, состоящий из выдвижения ги­потез и проверки их правдоподобности. Текущее состояние решения представляется в виде гипотез на классной доске. Гипотеза пред­ставляет собой интерпретацию некоторой части устного высказыва­ния на определенном уровне. Гипотезы различных уровней объ­единены в направленный граф (сеть), что позволяет описывать гипо­тезы одного уровня через гипотезы более низкого уровня.

Таким образом, в HEARSAY-III рабочая память представляется в виде се­ти, а знания о проблемной среде – в виде модулей, вызываемых по образцу. Использование программ, вызываемых по образцу, яв­ляется шагом в направлении к процедурному представлению с по­пыткой сохранить независимость источников знания. Подобный под­ход (в отличие от использования продукций и сетей) позволяет решать значительно более сложные задачи, но уменьшает возможности по объяснению и приобретению новых знаний. Использование про­грамм, вызываемых по образцу, требует разработки для каждой предметной области своего специфического решателя, осуществляю­щего планирование процесса решения и использование знаний.

Применение правил в виде продукций, фреймов, сетей позволяет создавать системы, ориентированные на определенный класс задач, сохранив способности к объяснению и приобретению знаний. Одна­ко малая мощность подобных правил приводит к резкому снижению эффективности при решении сложных задач. Например, экспе­риментальная попытка представить часть HEARSAY-II в виде про­дукционных правил привела к замедлению работы примерно в 1000 раз. Общим для всех рассмотренных подходов является использование образцов при вызове модуля или правила.

Смешанные представления (объекты и правила)

Как правило, в ЭС используется не одно, а несколько представлений. Исполняемые утверждения представляются либо в виде продукционных правил, либо в виде модулей (процедур), вызываемых по образцу. Для представления модели предметной об­ласти используются объектный подход или сетевые модели (семантические сети и фреймы).

Главное преимущество использования объектно-ориентиро­ванного программирования при разработке систем обработки дан­ных заключается в поддержке методов, облегчающих повторное ис­пользование кода. Однако, как отмечают многие исследователи, эф­фект от внедрения объектно-ориентированной технологии програм­мирования начинает проявляться лишь через 5–8 лет. Это обусловле­но необходимостью накопления опыта разработок и формирования устойчивой и достаточно гибкой иерархии классов. Очевидно, что по­добные издержки неприемлемы для инструментальных средств инже­нерии знаний, где одним из определяющих требований является необ­ходимость создания “быстрого прототипа”. Поэтому объектно-ориен­тированный инструментарий для создания систем, основанных на зна­ниях, должен включать библиотеку стандартных, но достаточно лег­ко модифицируемых объектов.

Применение объектно-ориентированного подхода в системах ин­женерии знаний выводит на первый план другую его особенность, а именно: возможность естественной декомпозиции задачи на совокуп­ность подзадач, представляемых достаточно автономными агентами, работающими со знаниями. На сегодняшний день это единственная практическая возможность работы в условиях экспоненциального ро­ста сложности (количества взаимосвязей), характерного для систем, использующих знания. Так, практически все инструментальные сред­ства для создания динамических ЭС поддерживают объектно-ориентированный подход к проектированию систем, объединенный с правилами.

Сценарии

Рассмотрим, как моделируются рассуж­дения человека в ИИ. При построении модели некоторого процесса (явления) мы выделяем:

1) сущности, имеющие отношение к данному процессу;

2) отношения между сущностями.

Сущности – это предметы, факты, явления, операции, процессы и т.д. Сущность – любой различимый объект, информацию о котором необходимо хранить в базе данных. Сущность имеет ряд характерных для нее свойств. Так, к свойствам материала относятся его вес, сорт, габариты, цена и т.д. Однако не всякое свойство, взятое в отдельности, является сущностью. Для ее характеристики необходима совокупность свойств. Каждое из свойств сущно­сти – это некото­рая элементарная единица информации, которую называют реквизитом. Данный реквизит может фигурировать в разнооб­разных информационных совокупностях, относящихся к раз­личным сущностям. Реквизиты можно классифицировать на основания и признаки. Основания характеризуют количествен­ные свойства сущности, полученные в результате вычислений, взвешиваний, измерений и т.п. Признаки выражают, как пра­вило, качественные свойства сущности и характеризуют об­стоятельства, при которых протекал изученный процесс и бы­ли получены те или иные реквизиты-основания.

Характерная особенность оснований состоит в том, что каждое из них вместе с относящимися к нему признаками, об­разует показатель – информационную совокупность с мини­мальным составом, достаточным для образования информаци­онного документа.

Отношения могут быть как наблюдаемые непосредст­венно с помощью наших органов чувств (например, отноше­ние типа “субъект-действие” или отношения следования “быть раньше”, “быть позже”), так и получаемые с помощью логических выводов (например, отношения типа “причина-следствие” или “цель-средство”)

Важнейшую роль в познании окружающего нас мира играют причинно-следственные отношения. Один из методов установления таких отношений предложил английский логик середины XIX века Д.С. Милль. Суть его метода состояла в нахождении связей между фактами и явлениями на основе анализа их совместного появления или непоявления в последо­вательности экспериментов. Устанавливать отношения причи­ны и следствия путем выделения сходства и различия в наблю­даемых ситуациях внешнего мира – фундаментальная способ­ность, присущая, по-видимому, всем живым существам. Опи­раясь на эту способность, присущую человеческим наблюдениям, Д.С.Милль сформулировал свои знаменитые принципы индукции.

Принцип существенного различия можно сформули­ровать так. Если после введения какого-либо фактора появля­ется, или после удаления его исчезает известное явление, при­чем мы не вводим и не удаляем никакого другого обстоятель­ства, которое могло бы иметь в данном случае влияние, и не производим никакого изменения среди первоначальных усло­вий явления, то указанный фактор и составляет причину явле­ния. Этот принцип можно изобразить в виде следующей схе­мы:

Здесь знак => означает появление следования d при на­личии а,b,с, а знак ? > означает, что d не появляется. Повторе­ние ситуации n раз свидетельствует о ее устойчивости в целом и необходимо для исключения единственного случая появле­ния d, не связанного с а. Если n достаточно для уверенного вывода, что в соответствии с первым принципом а является причиной, а d следствием, то между а и d имеется причинно-следственное отношение.

Принцип единственного сходства. Если все обстоя­тельства явления, кроме одного, могут отсутствовать, не унич­тожая этим явление, то это одно обстоятельство находится в отношении причинной связи с явлением, при условии, что приняты были все меры к тому, чтобы никаких других обстоя­тельств, кроме принятых во внимание, налицо не оказалось. Схематически этот принцип можно описать следующим обра­зом:

В соответствии с этим принципом получаем, что а причина, а d – следствие.

Принцип единственного остатка. Если вычесть из ка­кого-либо явления ту часть, которая согласно прежним исследованиям, оказывается следствием известных причин, то остаток явления есть следствие остальных причин.

Схематически этот принцип можно проиллюстрировать следующим образом:

 

Следовательно, а и d связаны причинно-следственными отношениями; а, b и с являются возможными причинами е. Для дальнейшего уточнения зависимости надо посмотреть, приводит ли исключение b к появлению е. Если приводит, то с есть причина следствия е, в противном случае b – причина следствия е.

Особенность схем Милля то, что они справед­ливы лишь при условии, когда в описании ситуации имеется пол­ное множество наблюдаемых фактов или явлений. Например, в последней схеме может оказаться, что одновременное исключе­ние b и с не влияет на появление е. Тогда можно предположить, что для появления е необходимо либо одновременное наличие b и с, либо е должно быть следствием чего-то другого, не вошедшего в описание ситуации. Возможно, следствие определяется не отдельными фактами, как это мы видели в продукционных правилах.

При использовании метода индуктивных рассуждений Милля важную роль играет способ выделения признаков или факторов, с помощью которых описываются ситуации. Про­цесс обнаружения закономерностей на множестве примеров и контрпримеров можно реализовать в интеллектуальной систе­ме. Рассмотрим ДСМ (Джон-Стюарт-Милль)-метод, положен­ный в основу такой интеллектуальной системы.

ДСМ–метод выделения признаков для описания си­туации. Введем три множества:

причины A={а1,а2,...,аp},

следствия В={b1 ,b2,...,bm},

оценки Q={q1,q2,…,ql}.

Выражение вида аi=>bj:qk будем называть гипотезой с утверждением: “аi является причиной bj с оценкой достоверно­сти qk”. Выражение вида аi>bj:qk будем называть отрица­тельной гипотезой с утверждением: “аi не является причиной bj с оценкой достоверности qk”. Для сокращения записи поло­жительные гипотезы будем обозначать – n+ijk, а отрицатель­ные – n-ijk. Среди значений qk выделим два специальных:

0 – гипотеза является ложной;

1 – гипотеза является тождественно истинной.

Таким образом, гипотезы с оценками 0 и 1 можно рас­сматривать как высказывания, ложность и истинность которых твердо установлены. Предположим, что оценки 0<qk<1 являют­ся рациональными числами вида s/n, где s=1…n, и, чем боль­ше n, тем с большей точностью оценивается достоверность гипотез.

Рассмотрим пример из экономики. Замечено, что каж­дый раз при увеличении уровня минимальной заработной пла­ты (хотя и не в такой мере) увеличиваются цены на потреби­тельские товары. Оценка достоверности этой гипотезы при небольшом количестве наблюдений будет невелика. И каждый раз, если увеличение минимальной зарплаты влечет за собой увеличение цен на товары, то означает ли это, что выдвинутая гипотеза получила оценку достоверности, равную 1? В подоб­ных случаях обычно рассматривают два типа оценки истинно­сти: эмпирическую и теоретическую. В нашем примере об увеличении минимальной зарплаты для оценки истинности гипотезы мы используем эмпирическую истину. Однако могут иметь место случаи, когда увеличение минимальной зарплаты не влечет за собой увеличение цен на продовольственные то­вары. Совсем иное дело, когда эта зависимость носит характер экономического закона (или достоверности) в переходный пе­риод к рыночной экономике. В данном случае в качестве оценки достоверности упомянутой гипотезы будем использо­вать теоретическую истину.

На этом примере видна разница между дедуктивным и индуктивным умозаключением. Дедуктивное умозаключение предполагает применение некоторой общей закономерности, например, экономических законов, касающихся функциониро­вания экономики. В данном случае мы не приобретаем новых знаний. Информация, полученная с помощью наблюдений, позволяет формировать новое знание. Таким образом, индуктивное умозаключение, опирающееся на эмпирические наблюдения, спо­собно порождать новые знания. В этом смысле индуктивное умозаключение является более “интеллектуальным”, чем де­дуктивное.

В нашем примере предполагаемая причина гипотезы уже выделена из множества возможных причин. В ДСМ-методе формализован не только этап оценки достоверности гипотезы, но и предшествующий ему этап нахождения канди­дата в причины, который вызывает интересующее нас следст­вие.

Причины могут быть различными по типу. Наиболее редкие – необходимые и достаточные причины. Если аi необходимая причина, то bj происходит всегда. Если bj произошло, то аi является достаточной причиной. Следствие bj может быть вызвано и другими достаточными причинами. Для появления bj иногда нужен вполне определенный набор обяза­тельных причин, кроме дополнительных, факультативных.

Наряду с причинами аi могут использоваться так назы­ваемые тормоза, которые приводят к непоявлению bj. Так, принятие смертельной дозы яда не приводит к ожидаемому исходу, если до этого было принято противоядие.

Вернемся к нахождению причин-кандидатов для формируемых гипотез при наличии положительных и от­рицательных примеров. Вначале рассмотрим группу положи­тельных примеров, подтверждающих истинность гипотезы, и выделим кандидатов в причины. Образуем матрицу М+, в ко­торой строки соответствуют выделенным кандидатам аi, а столбцы – интересующим нас следствиям bj. На пересечении строк и столбцов матрицы будем записывать оценки достовер­ности qk гипотез n+ijk. Для множества отрицательных примеров строится аналогичным образом другая матрица М, в которой содержатся оценки достоверности отрицательных гипотез n-ijk.

Кандидаты в причины в матрицах М+ и М- могут частично совпадать, так как положительные и отрицательные примеры не образуют полной выборки из всего их множества возможных.

На каждом шаге работы ДСМ-метода используются по­ложительные и отрицательные примеры либо подтверждаю­щие гипотезы, либо противоречащие им. В первом случае уве­личиваются оценки достоверности qk, а во втором случае – уменьшаются. Механизм изменения оценок qk может быть раз­личным. В ДСМ-методе применяется следующий способ. Зна­чение n равно числу имеющихся в данный момент положи­тельных или отрицательных примеров. Таким образом, для матриц M+ и М- значение n в общем случае может быть раз­личным. С увеличением значения n растет “дробность” оценок достоверности. Так, оценка 1/n соответствует полному незна­нию о достоверности гипотезы. Поэтому в начальный момент матрицы M+ и М- заполнены лишь нулями, единицами и оцен­ками 1/n. Если некоторая положительная или отрицательная гипотеза n-ijk имела оценку k/n, то при появлении нового при­мера (n заменяется на n+1) проверяется, подтверждает он или нет эту гипотезу. При подтверждении оценка k/n заменяется на (k+1)(n+1), а при неподтверждении – с k/n на k/(n+1). Таким образом, в процессе появления новых примеров оценки гипотез либо приближаются к 0 или 1, либо колеблются между этими значениями. В первом случае гипотеза может на некотором шаге (в случае преодоления ап­риорно заданного нижнего порога достоверности) исчезнуть из М+ или M-. Во втором случае при достижении некоторого верхнего порога достоверности гипотеза может получить оценку, отражающую эмпирическую истину, и запомниться как некий установленный факт в системе. В третьем случае, когда колебания оценок достаточно сильны, может также про­изойти исключение сформированной ранее гипотезы из M+ и М-. Новые гипотезы формируются не только на основании вы­деления определенного сходства. Они могут использовать и метод различия, сформулированный Миллем. Различия в описаниях формируются из примеров, относящих к различ­ным группам, и включаются в М+ и M-.

Кроме выявления кандидатов в причины аi для гипотез ищутся тормоза, наличие которых снимает действие аi на появление bj. В качестве кандидатов в причины могут вы­ступать весьма сложные утверждения – логические выражения из отдельных частей описания.

В ДСМ-методе, кроме прямой реализации идей Милля, используется некоторые выводы по аналогии. Для этого на множестве описаний вводится понятие сходства. В случае ус­тановления сходства происходит следующий вывод по аналогии. Если гипотеза nijk такова, что ее причина сход­на с причиной в гипотезе nijk, имеющейся в той же матрице М и оцениваемой с точки зрения достоверности значением 1/n, то на эту гипотезу nijk переносится оценка гипотезы nijk и она получает оценку достоверности k/n. Эту процедуру называют правилом положительной аналогии. Существует в этом методе и правило отрицательной аналогии, а также градация тех и других правил по силе учитываемого в них сходства.


Дата добавления: 2019-07-15; просмотров: 131; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!