Использование управляемых образцами модулей
Механизм использования управляемых образцами модулей проиллюстрируем на примере инструментальной системы HEARSAY-III, предназначенной для проектирования ЭС и являющейся модификацией системы понимания речи HEARSAY-II.
Все рассмотренные ранее способы представления знаний использовали частный случай УОМ. Действительно, каждый модуль представлялся в виде продукционного правила. Сложность правил была весьма ограничена, что позволяло выразить их в виде, понятном эксперту. Если же преобразования, выполняемые модулем, очень сложны, то для их представления приходится прибегать к процедурной форме. Стремление сохранить независимость модулей друг от друга привело к созданию в HEARSAY-III схемы, обеспечивающей взаимодействие модулей не непосредственно, а через рабочую память, называемую “классная доска”. Модули в HEARSAY-III называются источниками знаний (ИЗ). Каждый ИЗ состоит из программы-условия, определяющей, применение ИЗ к текущему состоянию классной доски, и программы-действия, производящей результаты.
Классная доска разделена на несколько уровней, на каждом из которых обрабатываются данные определенного вида. В системе HEARSAY-II выделены следующие уровни: предложение, словосочетание, слово, слог, фонема и т.д. Поиск решения рассматривается системой как итеративный процесс, состоящий из выдвижения гипотез и проверки их правдоподобности. Текущее состояние решения представляется в виде гипотез на классной доске. Гипотеза представляет собой интерпретацию некоторой части устного высказывания на определенном уровне. Гипотезы различных уровней объединены в направленный граф (сеть), что позволяет описывать гипотезы одного уровня через гипотезы более низкого уровня.
|
|
Таким образом, в HEARSAY-III рабочая память представляется в виде сети, а знания о проблемной среде – в виде модулей, вызываемых по образцу. Использование программ, вызываемых по образцу, является шагом в направлении к процедурному представлению с попыткой сохранить независимость источников знания. Подобный подход (в отличие от использования продукций и сетей) позволяет решать значительно более сложные задачи, но уменьшает возможности по объяснению и приобретению новых знаний. Использование программ, вызываемых по образцу, требует разработки для каждой предметной области своего специфического решателя, осуществляющего планирование процесса решения и использование знаний.
Применение правил в виде продукций, фреймов, сетей позволяет создавать системы, ориентированные на определенный класс задач, сохранив способности к объяснению и приобретению знаний. Однако малая мощность подобных правил приводит к резкому снижению эффективности при решении сложных задач. Например, экспериментальная попытка представить часть HEARSAY-II в виде продукционных правил привела к замедлению работы примерно в 1000 раз. Общим для всех рассмотренных подходов является использование образцов при вызове модуля или правила.
|
|
Смешанные представления (объекты и правила)
Как правило, в ЭС используется не одно, а несколько представлений. Исполняемые утверждения представляются либо в виде продукционных правил, либо в виде модулей (процедур), вызываемых по образцу. Для представления модели предметной области используются объектный подход или сетевые модели (семантические сети и фреймы).
Главное преимущество использования объектно-ориентированного программирования при разработке систем обработки данных заключается в поддержке методов, облегчающих повторное использование кода. Однако, как отмечают многие исследователи, эффект от внедрения объектно-ориентированной технологии программирования начинает проявляться лишь через 5–8 лет. Это обусловлено необходимостью накопления опыта разработок и формирования устойчивой и достаточно гибкой иерархии классов. Очевидно, что подобные издержки неприемлемы для инструментальных средств инженерии знаний, где одним из определяющих требований является необходимость создания “быстрого прототипа”. Поэтому объектно-ориентированный инструментарий для создания систем, основанных на знаниях, должен включать библиотеку стандартных, но достаточно легко модифицируемых объектов.
|
|
Применение объектно-ориентированного подхода в системах инженерии знаний выводит на первый план другую его особенность, а именно: возможность естественной декомпозиции задачи на совокупность подзадач, представляемых достаточно автономными агентами, работающими со знаниями. На сегодняшний день это единственная практическая возможность работы в условиях экспоненциального роста сложности (количества взаимосвязей), характерного для систем, использующих знания. Так, практически все инструментальные средства для создания динамических ЭС поддерживают объектно-ориентированный подход к проектированию систем, объединенный с правилами.
Сценарии
Рассмотрим, как моделируются рассуждения человека в ИИ. При построении модели некоторого процесса (явления) мы выделяем:
|
|
1) сущности, имеющие отношение к данному процессу;
2) отношения между сущностями.
Сущности – это предметы, факты, явления, операции, процессы и т.д. Сущность – любой различимый объект, информацию о котором необходимо хранить в базе данных. Сущность имеет ряд характерных для нее свойств. Так, к свойствам материала относятся его вес, сорт, габариты, цена и т.д. Однако не всякое свойство, взятое в отдельности, является сущностью. Для ее характеристики необходима совокупность свойств. Каждое из свойств сущности – это некоторая элементарная единица информации, которую называют реквизитом. Данный реквизит может фигурировать в разнообразных информационных совокупностях, относящихся к различным сущностям. Реквизиты можно классифицировать на основания и признаки. Основания характеризуют количественные свойства сущности, полученные в результате вычислений, взвешиваний, измерений и т.п. Признаки выражают, как правило, качественные свойства сущности и характеризуют обстоятельства, при которых протекал изученный процесс и были получены те или иные реквизиты-основания.
Характерная особенность оснований состоит в том, что каждое из них вместе с относящимися к нему признаками, образует показатель – информационную совокупность с минимальным составом, достаточным для образования информационного документа.
Отношения могут быть как наблюдаемые непосредственно с помощью наших органов чувств (например, отношение типа “субъект-действие” или отношения следования “быть раньше”, “быть позже”), так и получаемые с помощью логических выводов (например, отношения типа “причина-следствие” или “цель-средство”)
Важнейшую роль в познании окружающего нас мира играют причинно-следственные отношения. Один из методов установления таких отношений предложил английский логик середины XIX века Д.С. Милль. Суть его метода состояла в нахождении связей между фактами и явлениями на основе анализа их совместного появления или непоявления в последовательности экспериментов. Устанавливать отношения причины и следствия путем выделения сходства и различия в наблюдаемых ситуациях внешнего мира – фундаментальная способность, присущая, по-видимому, всем живым существам. Опираясь на эту способность, присущую человеческим наблюдениям, Д.С.Милль сформулировал свои знаменитые принципы индукции.
Принцип существенного различия можно сформулировать так. Если после введения какого-либо фактора появляется, или после удаления его исчезает известное явление, причем мы не вводим и не удаляем никакого другого обстоятельства, которое могло бы иметь в данном случае влияние, и не производим никакого изменения среди первоначальных условий явления, то указанный фактор и составляет причину явления. Этот принцип можно изобразить в виде следующей схемы:
Здесь знак => означает появление следования d при наличии а,b,с, а знак ? > означает, что d не появляется. Повторение ситуации n раз свидетельствует о ее устойчивости в целом и необходимо для исключения единственного случая появления d, не связанного с а. Если n достаточно для уверенного вывода, что в соответствии с первым принципом а является причиной, а d следствием, то между а и d имеется причинно-следственное отношение.
Принцип единственного сходства. Если все обстоятельства явления, кроме одного, могут отсутствовать, не уничтожая этим явление, то это одно обстоятельство находится в отношении причинной связи с явлением, при условии, что приняты были все меры к тому, чтобы никаких других обстоятельств, кроме принятых во внимание, налицо не оказалось. Схематически этот принцип можно описать следующим образом:
В соответствии с этим принципом получаем, что а причина, а d – следствие.
Принцип единственного остатка. Если вычесть из какого-либо явления ту часть, которая согласно прежним исследованиям, оказывается следствием известных причин, то остаток явления есть следствие остальных причин.
Схематически этот принцип можно проиллюстрировать следующим образом:
Следовательно, а и d связаны причинно-следственными отношениями; а, b и с являются возможными причинами е. Для дальнейшего уточнения зависимости надо посмотреть, приводит ли исключение b к появлению е. Если приводит, то с есть причина следствия е, в противном случае b – причина следствия е.
Особенность схем Милля то, что они справедливы лишь при условии, когда в описании ситуации имеется полное множество наблюдаемых фактов или явлений. Например, в последней схеме может оказаться, что одновременное исключение b и с не влияет на появление е. Тогда можно предположить, что для появления е необходимо либо одновременное наличие b и с, либо е должно быть следствием чего-то другого, не вошедшего в описание ситуации. Возможно, следствие определяется не отдельными фактами, как это мы видели в продукционных правилах.
При использовании метода индуктивных рассуждений Милля важную роль играет способ выделения признаков или факторов, с помощью которых описываются ситуации. Процесс обнаружения закономерностей на множестве примеров и контрпримеров можно реализовать в интеллектуальной системе. Рассмотрим ДСМ (Джон-Стюарт-Милль)-метод, положенный в основу такой интеллектуальной системы.
ДСМ–метод выделения признаков для описания ситуации. Введем три множества:
причины A={а1,а2,...,аp},
следствия В={b1 ,b2,...,bm},
оценки Q={q1,q2,…,ql}.
Выражение вида аi=>bj:qk будем называть гипотезой с утверждением: “аi является причиной bj с оценкой достоверности qk”. Выражение вида аi>bj:qk будем называть отрицательной гипотезой с утверждением: “аi не является причиной bj с оценкой достоверности qk”. Для сокращения записи положительные гипотезы будем обозначать – n+ijk, а отрицательные – n-ijk. Среди значений qk выделим два специальных:
0 – гипотеза является ложной;
1 – гипотеза является тождественно истинной.
Таким образом, гипотезы с оценками 0 и 1 можно рассматривать как высказывания, ложность и истинность которых твердо установлены. Предположим, что оценки 0<qk<1 являются рациональными числами вида s/n, где s=1…n, и, чем больше n, тем с большей точностью оценивается достоверность гипотез.
Рассмотрим пример из экономики. Замечено, что каждый раз при увеличении уровня минимальной заработной платы (хотя и не в такой мере) увеличиваются цены на потребительские товары. Оценка достоверности этой гипотезы при небольшом количестве наблюдений будет невелика. И каждый раз, если увеличение минимальной зарплаты влечет за собой увеличение цен на товары, то означает ли это, что выдвинутая гипотеза получила оценку достоверности, равную 1? В подобных случаях обычно рассматривают два типа оценки истинности: эмпирическую и теоретическую. В нашем примере об увеличении минимальной зарплаты для оценки истинности гипотезы мы используем эмпирическую истину. Однако могут иметь место случаи, когда увеличение минимальной зарплаты не влечет за собой увеличение цен на продовольственные товары. Совсем иное дело, когда эта зависимость носит характер экономического закона (или достоверности) в переходный период к рыночной экономике. В данном случае в качестве оценки достоверности упомянутой гипотезы будем использовать теоретическую истину.
На этом примере видна разница между дедуктивным и индуктивным умозаключением. Дедуктивное умозаключение предполагает применение некоторой общей закономерности, например, экономических законов, касающихся функционирования экономики. В данном случае мы не приобретаем новых знаний. Информация, полученная с помощью наблюдений, позволяет формировать новое знание. Таким образом, индуктивное умозаключение, опирающееся на эмпирические наблюдения, способно порождать новые знания. В этом смысле индуктивное умозаключение является более “интеллектуальным”, чем дедуктивное.
В нашем примере предполагаемая причина гипотезы уже выделена из множества возможных причин. В ДСМ-методе формализован не только этап оценки достоверности гипотезы, но и предшествующий ему этап нахождения кандидата в причины, который вызывает интересующее нас следствие.
Причины могут быть различными по типу. Наиболее редкие – необходимые и достаточные причины. Если аi необходимая причина, то bj происходит всегда. Если bj произошло, то аi является достаточной причиной. Следствие bj может быть вызвано и другими достаточными причинами. Для появления bj иногда нужен вполне определенный набор обязательных причин, кроме дополнительных, факультативных.
Наряду с причинами аi могут использоваться так называемые тормоза, которые приводят к непоявлению bj. Так, принятие смертельной дозы яда не приводит к ожидаемому исходу, если до этого было принято противоядие.
Вернемся к нахождению причин-кандидатов для формируемых гипотез при наличии положительных и отрицательных примеров. Вначале рассмотрим группу положительных примеров, подтверждающих истинность гипотезы, и выделим кандидатов в причины. Образуем матрицу М+, в которой строки соответствуют выделенным кандидатам аi, а столбцы – интересующим нас следствиям bj. На пересечении строк и столбцов матрицы будем записывать оценки достоверности qk гипотез n+ijk. Для множества отрицательных примеров строится аналогичным образом другая матрица М, в которой содержатся оценки достоверности отрицательных гипотез n-ijk.
Кандидаты в причины в матрицах М+ и М- могут частично совпадать, так как положительные и отрицательные примеры не образуют полной выборки из всего их множества возможных.
На каждом шаге работы ДСМ-метода используются положительные и отрицательные примеры либо подтверждающие гипотезы, либо противоречащие им. В первом случае увеличиваются оценки достоверности qk, а во втором случае – уменьшаются. Механизм изменения оценок qk может быть различным. В ДСМ-методе применяется следующий способ. Значение n равно числу имеющихся в данный момент положительных или отрицательных примеров. Таким образом, для матриц M+ и М- значение n в общем случае может быть различным. С увеличением значения n растет “дробность” оценок достоверности. Так, оценка 1/n соответствует полному незнанию о достоверности гипотезы. Поэтому в начальный момент матрицы M+ и М- заполнены лишь нулями, единицами и оценками 1/n. Если некоторая положительная или отрицательная гипотеза n-ijk имела оценку k/n, то при появлении нового примера (n заменяется на n+1) проверяется, подтверждает он или нет эту гипотезу. При подтверждении оценка k/n заменяется на (k+1)(n+1), а при неподтверждении – с k/n на k/(n+1). Таким образом, в процессе появления новых примеров оценки гипотез либо приближаются к 0 или 1, либо колеблются между этими значениями. В первом случае гипотеза может на некотором шаге (в случае преодоления априорно заданного нижнего порога достоверности) исчезнуть из М+ или M-. Во втором случае при достижении некоторого верхнего порога достоверности гипотеза может получить оценку, отражающую эмпирическую истину, и запомниться как некий установленный факт в системе. В третьем случае, когда колебания оценок достаточно сильны, может также произойти исключение сформированной ранее гипотезы из M+ и М-. Новые гипотезы формируются не только на основании выделения определенного сходства. Они могут использовать и метод различия, сформулированный Миллем. Различия в описаниях формируются из примеров, относящих к различным группам, и включаются в М+ и M-.
Кроме выявления кандидатов в причины аi для гипотез ищутся тормоза, наличие которых снимает действие аi на появление bj. В качестве кандидатов в причины могут выступать весьма сложные утверждения – логические выражения из отдельных частей описания.
В ДСМ-методе, кроме прямой реализации идей Милля, используется некоторые выводы по аналогии. Для этого на множестве описаний вводится понятие сходства. В случае установления сходства происходит следующий вывод по аналогии. Если гипотеза nijk такова, что ее причина сходна с причиной в гипотезе n’ijk, имеющейся в той же матрице М и оцениваемой с точки зрения достоверности значением 1/n, то на эту гипотезу n’ijk переносится оценка гипотезы nijk и она получает оценку достоверности k/n. Эту процедуру называют правилом положительной аналогии. Существует в этом методе и правило отрицательной аналогии, а также градация тех и других правил по силе учитываемого в них сходства.
Дата добавления: 2019-07-15; просмотров: 131; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!