Максимин и минимакс игры. Максиминные и минимаксные стратегии. Нижняя и верхняя цены игры в чистых стратегиях. Соотношение между ними.
Рассмотрим матричную т × п - игру с игроками А и В,в которой игрок А обладает т чистыми стратегиями ={А1,..., Ат}, a игрок В - п чистыми стратегиями ={В1,..., Вп}. Значения функции выигрыша игрока A обозначим через аij,т. е. FA (i, j) = аij, и тогда матрица игры будет иметь вид
Bj
| B 1 | B 2 | … |
| ||
A 1 | a 11 | a 12 | … | a 1 n | ||
A 2 | a 21 | a 22 | … | a 2 n | ||
… | … | … | … | … | ||
Am | am 1 | am 2 | … | amn |
Перед игроком А стоит задача выбора чистой стратегии из множества , эффективной в определенном смысле, в результате применения которой он получит максимально возможный гарантированный выигрыш. Если игрок А выбрал стратегию Аi (i =1, …, m),, то его выигрышем может быть один из выигрышей
аi 1, аi 2, …, аin, (2)
расположенных в i -й строке матрицы (1), в зависимости от выбранной игроком В стратегии. Предполагая поведение игрока А крайне осмотрительным, необходимо считать, что игрок В сыграет наилучшим для себя образом и на выбор игроком А стратегии Аi выберет ту стратегию Bj, при которой выигрыш игрока А окажется минимальным. Обозначим минимальный среди выигрышей (2) через α i:
и назовем его показателем эффективности стратегии Аi. Продолжая действовать разумно, игрок А должен выбрать ту стратегию, которая максимизирует показатель эффективности, т.е. для которой число α i максимально. Если обозначить это максимальное число через α:
(4)
то по формуле (3)
(5)
Описанный принцип (4) или (5) выбора эффективной стратегии игроком А называется максиминным принципом, а выигрыш α - максимином. Стратегия Аi0 соответствующая максимину α, т. е. стратегия Аi0 ,номер i 0 которой максимизирует показатель эффективности α i, т. е.
|
|
называется максиминной стратегией игрока А. Множество всех (чистых) максиминных стратегий игрока А обозначим через
Пусть игрок А выбрал максиминную стратегию Аi0, а игрок В - какую-то произвольную стратегию Bl, l = 1,..., п. Тогда в создавшейся ситуации (Аi0, Bl) выигрыш игрока А в чистых стратегиях будет для которого в силу равенств (3) и (6) будет справедливо неравенство
Неравенство (7) означает, что если игрок А в игре будет следовать максиминной стратегии, то ему при любой игре противника В гарантирован выигрыш в чистых стратегиях, не меньший максимина α. Именно поэтому максимин α, определяемый по формуле (4), называют нижней ценой игры в чистых стратегиях.
Теперь рассмотрим игру с точки зрения игрока В, который стремится минимизировать выигрыш игрока А, исходя из посылки, что игрок А играет наилучшим для себя и наихудшим для игрока В образом. Если игрок В выберет стратегию , то выигрышем игрока А может быть один из
а 1 j, а 2 j, …, аmj, (8)
выигрышей, стоящих в j -м столбце матрицы (1), в зависимости от того, какой стратегии будет придерживаться игрок А. Но так как игрок В предполагает, что игрок А играет наилучшим для себя образом, то выигрышем игрока А будет максимальное из чисел (8); обозначим его через βj:
|
|
и назовем показателем неэффективности стратегии Вj. Таким образом, для любой стратегии Bj игрока В наибольший его проигрыш равен β j. В интересах игрока В - выбрать стратегию с минимальным показателем неэффективности. Наименьшее из чисел (9) обозначим β:
Отсюда в силу формулы (9) получим для β выражение:
Выбор игроком В стратегии с наименьшим показателем β j оправдывает то, что он назван показателем неэффективности.
Критерий (11) выбора эффективной стратегии для игрока В называется минимаксным принципом, а выигрыш β называется минимаксом. Стратегия для которой
называется минимаксной стратегией игрока В. Множество всех (чистых) минимаксных стратегий игрока В обозначим через
При выборе игроком В стратегии , его проигрышем может быть один из проигрышей (8), или, другими словами, его выигрышем может быть один из выигрышей
bj1 = -a1j, bj2 = -a2j,..., bjm = -amj.
Тогда показателем эффективности стратегии Bj (относительно выигрышей игрока В) будет минимальное из этих чисел, которое, в силу обозначения (9), можно представить так:
|
|
а максимином будет число выражающееся с помощью обозначения (10) следующим образом:
Таким образом, показатель эффективности стратегии Bj (относительно выигрышей игрока B) противоположен показателю неэффективности стратегии Bj (относительно проигрышей игрока В) и максимин (относительно выигрышей игрока В) противоположен минимаксу (относительно проигрышей игрока B).
Если игрок В придерживается своей минимаксной стратегии а игрок А - любой своей стратегии Ak, k = 1,..., т, то для проигрыша игрока В в ситуации (Ak, ), с использованием равенств (9) и (12), получим неравенство
которое говорит о том, что игрок В, придерживаясь своей минимаксной стратегии, не может проиграть больше минимакса β независимо от действий противника А. В силу этого величина β называется верхней ценой игры в чистых стратегиях.
Для нахождения нижней и верхней цен игры удобно матрицу игры (1) увеличить в размерах, приписав (n +1)-й столбец показателей эффективности αi: стратегий Аi игрока А и (т+1)-ю строку показателей неэффективности β j стратегий Bj игрока В. В результате получим следующую матрицу:
Bj Ai | B 1 | B 2 | … | Bn | αi | |||
A 1 | a 11 | a 12 | … | a 1 n |
| |||
A 2 | a 21 | a 22 | … | a 2 n | α 2 | |||
… | … | … | … | … | … | |||
Am | am 1 | am 2 | … | amn | αm | |||
βj | β 1 | β 2 | … | βn | α β |
Следующая простая теорема устанавливает соотношение между показателями эффективности α i стратегий Ai игрока А, показателями неэффективности β j стратегий Bj игрока В и выигрышами аij и, как следствие этого соотношения, - неравенство между нижней и верхней ценами игры в чистых стратегиях.
Теорема 1. Для элементов матрицы (13) имеют место неравенства
αi ≤ aij ≤ βj, i = 1,..., m, j = 1,...,n, (14)
и, следовательно, нижняя цена игры не больше ее верхней цены в чистых стратегиях:
α ≤ β. (15)
Доказательство. По определению (3) показателей эффективности α i стратегий Аi игрока А и определению (9) показателей неэффективности β j стратегий Bj игрока В имеем
следовательно, неравенства (14) доказаны.
Так как доказанное неравенство αi ≤ βj справедливо для любых i = 1,..., т, j =1,..., п, то оно будет справедливым в частности для номеров i = i0 и j = j0 соответственно максиминной и минимаксной стратегий и :
Тогда в силу (6) и (12) получим требуемое неравенство (15).
Дата добавления: 2015-12-21; просмотров: 63; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!