Логическая школа моделирования агентов: некоторые исходные идеи



Работы этого направления связаны в основном с проблемами формализации автономных агентов. Истоки его восходят к работам П.Коэна и А.Левека [54], которые впервые формализовали намерения и взгляды агентов на базе модальных логик. Значительный вклад в развитие логической школы РИИ внесли М.Джорджеф и А.Рао [83], И.Шоэм [124], М.Вулдридж и Н.Дженнингс [136-138]; К.Кастельфранши и Р.Контэ [55], Б.Шаиб-Дра [103] и др.

Главной идеей логического подхода в МАС является представление характеристик агента в виде логической теории. При этом основные работы логической школы моделирования агентов можно подразделить на два класса: а) расширение классической и многосортной логик с помощью предикатов высокого порядка (см.например [2]); б) обобщение модальных логик, история которых в первую очередь связана с именами К.Льюиса, С.Крипке и И.Хинтикки.

Модальные логики, в которых для описания агентов наряду с обычными высказываниями (предикатами) допускаются модальности типа «возможно» и «необходимо» (алетическая логика), «известно» и «неизвестно» (эпистемическая логика), «обязательно» и «разрешено» (деонтическая логика), «всегда» и «иногда» (временная логика), «верит и не верит» (доксастическая логика), «желает» и «не желает» (оптитативная логика) и т.д., представляют собой расширения классической логики высказываний. Они могут интерпретироваться в различных мирах, тогда как классическая логика интерпретируема в одном-единственном мире. Тогда в русле модели возможных миров, убеждения агента можно представить как совокупность миров, в которых распределены его предпочтения. Пусть агент a работает с множеством возможных миров W. Рассматривая знания и предпочтения агента, из W можно выделить подмножество W0, на котором агент концентрирует свое внимание. Это подмножество W0 содержит миры, совместимые с тем, что агент знает (в чем он убежден) в мире w. Тогда соотнесение подмножества W0, агента a и мира wЄW означает введение некоторого отношения R. Здесь миры из W0 - это такие миры, с которыми w находится в отношении R.

Механизм возможных миров описывается алгебраически с помощью моделей Крипке (W,R,f), где W - множество возможных миров, R - отношение достижимости, а f: W х L ®{0, 1} - соответствие, устанавливаемое между миром wЄW, пропозициональной константой lÎL и значением истинности из двухэлементного множества {0,1}. Здесь различные свойства отношения R индуцируют различные схемы аксиом модальной логики. Эти свойства могут определяться с помощью специальных встраиваемых предикатов multiWorldsSystem и сanSeeWorlds, предназначенных для выбора наиболее подходящих систем модальной логики и отношений достижимости между мирами. Иными словами, для определения того, какой из миров достижим (т.е. может рассматриваться агентом) необходимо выбрать наиболее удобную систему аксиом модальной логики из T, B, S4 или S5 в соответствии со свойствами рефлексивности и/или симметричности и/или транзитивности отношения достижимости (табл.4).

Для установления определенных отношений между мирами могут служить системы поддержки истинности ATMS, в том числе системы, основанные на модальной логики MTMS (Modal logic based Truth Maintenance System). В таких системах для представления спецификаций агента используется понятие возможных миров в модальной логике (например, система аксиом S4), а понятие достижимости между мирами применяется для описания монотонных переходов. Соответственно, MTMS автоматически порождает граф достижимости (формирует древовидную структуру возможных миров), а также генерирует мир, соответствующий удовлетворяемому в текущий момент подмножеству спецификаций.

Логический язык у П.Коэна и А.Левека, помимо обычных операторов логики первого порядка, включает четыре базовых модальных оператора: Happens, Done, Bel и Goal. Подобные операторы позволяют связать убеждения с действиями и целями во времени. Семантика задается через множество возможных миров, где мир определяется как дискретная последовательность событий, расширяемая в прошлое и в будущее. Два базовых временных оператора Happens и Done определяют последовательность событий, которые произойдут в будущем и последовательность уже произошедших событий. Во временной логике возможные миры представляют состояния некоторого мира в различные моменты его эволюции. Сложные действия строятся с помощью операторов динамической логики. Используются также временные операторы š (всегда), ◊, Later, Before. Семантика операторов Bel и Goal задается отношениями достижимости (по убеждениям и целям) на множестве возможных миров. Принимается допущение о том, что отношение достижимости по целям является подмножеством отношения достижимости по убеждениям.

 

Таблица 4. Сводка основных систем модальных логик в зависимости от свойств отношения достижимости

Наименование системы аксиом    Свойства отношения достижимости  
  T     Рефлексивность  
  B     Рефлексивность, симметричность
  S4   Рефлексивность, транзитивность  
  S5     Рефлексивность, симметричность, транзитивность    

 

 

Известно немало различных вариантов построения модальных логик для описания интенциональных характеристик агентов [70,83,103,136 и др.].

Так в [103] развивается подход на основе двух модальных операторов Bel и Agree для формализации ментальных характеристик убеждения (believe) и согласия (agree) и двух модальных операторов для описания действий Happens (действие произойдет) и Done (действие уже произошло). Предполагается, что мир w в любой момент времени описывается множеством пропозиций, представленных в модальной логике. Задаются также следующие типы действий - предварительные условия, тело действий и последствия. В свою очередь, в [70] строится ситуативная модальная логика на основе четырех модальностей, связанных с убежденностью агента a в своих знаниях: Know (a, p, s), Believes (a, p, s), Kwhether (a, p, s), Doubts (a, p, s), где Оператор (a, p, s) читается как: агент a убежден с некоторым уровнем определенности (знает, уверен, сомневается), что в ситуации s имеет место p. Берутся также три модальности, характеризующие целенаправленное поведение: Want (a, p, s), Indif (a, p, s) и Wantstock (a, p, s).

В свою очередь, для моделирования слабых допущений об агентах, т.е. допущений, которые впоследствии могут изменяться (отбрасываться), естественно использовать немонотонные логики. В немонотонных логиках вводится новый символ А, который означает уверенность в некотором факте при отсутствии противоположного факта. Например, p Þ Aq гласит, что «если высказывание p истинно, то Ар означает, что p согласуется с теорией. Высказывание p называется согласованным, если из него не следует отрицания. Предложение Ap выполняется тогда и только тогда, когда нельзя найти ù p. Так цели агентов считаются несовместимыми, если выполнение цели одного из них ведет к невыполнению цели другого. А именно, цель агента a1 несовместима с целью агента a2, если цели определяются как достижение состояний p и q соответственно, и p½=ùq.

 


Дата добавления: 2020-04-08; просмотров: 108; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!