Графический метод решения игр



МЕТОДЫ РЕШЕНИЯ КОНЕЧНЫХ ИГР

В СМЕШАННЫХ СТРАТЕГИЯХ

Постановка вопроса

Если игра n×m не имеет седловой точки, то нахождение решения вообще довольно трудная задача, особенно при больших n и m.

Иногда эту задачу удается упростить, предварительно уменьшив число стратегий путем вычеркивания некоторых излишних.

Излишние стратегии бывают: а) дублирующие и б) заведомо невыгодные.

Рассмотрим, например, игру с матрицей:

В А В1   В2   В3   В4  
А1 1 2 4 3
А2 0 2 3 2
А3 1 2 4 3
А4 4 3 1 0

Нетрудно убедиться, что стратегия A3 в точности повторяет ("дублирует") стратегию A1, поэтому любую из этих двух стратегий можно вычеркнуть. Далее, сравнивая почленно строки A1 и A2, видим, что каждый элемент строки A2 меньше (или равен) соответствующего элемента строки А1. Очевидно, что мы никогда не должны пользоваться стратегией А2, она является заведомо невыгодной. Вычеркивая A3 и A2, приводим матрицу к более простому виду:

В А В1   В2   В3   В4  
А1 1 2 4 3
А4 4 3 1 0

Далее замечаем, что для противника стратегия В3 заведомо невыгодна; вычеркивая ее, приводим матрицу к окончательному виду :

В А В1   В2   В4  
А1 1 2 3
А4 4 3 0

Таким образом, игра 4×4 вычеркиванием дублирующих и заведомо невыгодных стратегий сведена к игре 2×3.

Процедура вычеркивания дублирующих и заведомо невыгодных стратегий всегда должна предшествовать решению игры.

Игры 2×2 и 2×m являются наиболее простыми случаями конечных игр, которые всегда можно решить элементарными способами.

3.2. Аналитический метод решения игры 2×2, 2×m и n×2

Пусть игра 2×2 задана платежной матрицей  

а11 а12

А= 

а21 а22

Пусть седловой точки нет и, следовательно, нижняя цена игры не равна верхней: α≠β. Требуется найти оптимальную смешанную стратегию игрока A

A1 A2

                                    Sa* = 

p*1 p*2

Она отличается тем свойством, что, каковы бы ни были действия противника (если только он не выходит за пределы своих "полезных" (активных) стратегий), выигрыш будет равен цене игры n. В игре 2×2 обе стратегии противника являются "полезными", - иначе игра имела бы решение в области чистых стратегий (седловую точку). Значит, если мы придерживаемся своей оптимальной стратегии  S*a, то противник может пользоваться любой из своих чистых стратегий B1, В2, не изменяя среднего выигрыша n.

То есть, если игрок В использует чистую стратегию B1 (это соответствует 1-му столбцу платежной матрицы), выигрыш игрока A, применяющего смешанную стратегию, равен цене игры n:           a11·p1* + a21·p2* = n.

Тот же средний выигрыш получает игрок A, если 2-й игрок применяет стратегию B2, т.е. a12·p*1 + a22·p*2 = n. Учитывая, что p1* + p2* = 1, получаем систему уравнений для определения оптимальной стратегии S*a и цены игры n:

 a11·p*1 + a21·p*2 = n                              (3.1)

 a12·p*1 + a22·p*2 = n

 p*1 + p*2 = 1

Решая эту систему, получим оптимальную стратегию

                     (3.2)

и цену игры

                                      (3.3)

Применяя теорему об активных стратегиях при отыскании S*b - оптимальной стратегии игрока B, получаем, что при любой чистой стратегии игрока A (A1 или A2) средний проигрыш игрока B равен цене игры n, т.е.

a11·q*1+ a12·q*2 = n                                              (3.4)

 a21·q*1 + a22·q*2 = n

 q*1 + q*2 = 1

Тогда оптимальная стратегия S*b (q*1, q*2) определяется формулами:

                              (3.5)

 

Графический метод решения игр

Решение игры 2×2 допускает наглядную геометрическую интерпретацию. Пусть игра задана матрицей A=    аij   , i,j=1,2, приведенной ниже.

В  А В1   В2  
А1 a11 a12
А2 a21 a22

Возьмем участок оси абсцисс длиной 1 (как сумма вероятностей р12=1) -рис. 3.1. Левый конец участка (точка с абсциссой х=0) будет изображать стратегию A1, правый конец участка (х=1)- стратегию A2. Проведем через точки A1 и A2 два перпендикуляра к оси абсцисс: ось I-I и ось II-II. На оси I-I будем откладывать выигрыши при стратегии А1, на оси II-II - выигрыши при стратегии A2. Рассмотрим стратегию противника В1; она дает две точки на осях I-I и II-II c ординатами, соответственно, a11 и а21. Проведем через эти точки прямую В11.

Очевидно, если мы будем применять смешанную стратегию

A1 A2

                                    Sa

                                           p1    p2                 

а игрок В - чистую стратегию B1, то наш средний выигрыш, равный а11·р1 + а21·р2, изобразится точкой М на прямой В11; абсцисса этой точки равна р2. Прямую В11, изображающую выигрыш при стратегии В1, условно будем называть “стратегией В1”.

Очевидно, точно таким же способом может быть построена и стратегия В2 (рис. 3.2).

    I                            II       I                           II

а12
В1
                                  B1  B2                                    

     M                             N

В2
       

                                           a21                           a21    

а11
B1                                                                                                           n      a22

     a11   p2                         p1                                 p2           p1

                                         X                                                 

0  (A1)                  1 (A2) 0 (A1)                    1 (A2)    I                                II        I                          II

                 Рис. 3.1.                         Рис. 3.2.

Нам нужно найти оптимальную стратегию S*a, т.е. такую, для которой минимальный выигрыш (при любом поведении В) обращался бы в максимум. Для этого построим нижнюю границу выигрыша при стратегиях В1, В2, то есть, ломаную В1-N-В2, отмеченную на рис. 3.2 жирной линией. Эта нижняя граница будет выражать минимальный выигрыш игрока А при любых смешанных его стратегиях; точка N, в которой этот минимальный выигрыш достигает максимума, и определяет решение и цену игры. Нетрудно убедиться, что ордината точки N есть цена игры n, а ее абсцисса равна р*2 - частоте применения стратегии A2 в оптимальной смешанной стратегии S*a.

Геометрическая интерпретация дает возможность представить наглядно также нижнюю и верхнюю цену игры.

В нашем случае решение игры определялось точкой пересечения стратегий. Однако, это не всегда будет так; на рис. 3.3 показан случай, когда, несмотря на наличие пересечения стратегий, решение дает для обоих игроков чистые стратегии (А2 и В2), а цена игры n= а22.

В данном случае матрица имеет седловую точку, и стратегия А1 является заведомо невыгодной, т.к. при любой чистой стратегии противника она дает меньший выигрыш, чем А2.

 

I
II
В2
а21
а22
а12
В1
 I                               II

                                                                                                              

                                                                                  

       N                                                 

     
 
В2


                          ν =a22

В1
В2
В1
а21
а11
В1
                                                                                                                       

а11
                                                                                            

                                      X                                                        X

  0 (A1)                           1 (A2)           0 (A1)                    1 (A2)

  I                               II                  I                                          II

              Рис. 3.3.                                            Рис. 3.4

В случае, когда заведомо невыгодная стратегия имеется у противника, геометрическая интерпретация имеет вид, представленный на рис.3.4. В данном случае нижняя граница выигрыша совпадает со стратегией В1; стратегия В2 для противника является заведомо невыгодной.

Пусть мы располагаем двумя стратегиями А1, А2, а противник - m стратегиями: В1, В2, ..., Вm. Матрица аij задана; она состоит из двух строк и m столбцов. Аналогично случаю двух стратегий, дадим задаче геометрическую интерпретацию; m стратегий противника изобразятся m прямыми (рис. 3.5).

 

А3
А1
     I                   II               I                               II

А4
А1
B2                                 B1                      

                                 B3                                                 

А2
N
А4
B3                                                                   B4

     M                                                               

А3
B4                                     B2                                         

А2
X
X
B1                  ν                                                ν

                                                                      

0 (A1) p2         p1   1 (A2)         0 (В1)     q2               q1   1 (B2)

    I                                  II                     I                               II

              Рис. 3.5.                                                Рис. 3.6.

Строим нижнюю границу выигрыша (ломаную В1MNВ2) и находим на ней точку N с максимальной ординатой. Эта точка дает решение игры (стратегию)  

A1 A2

                                    S*a

р*1 p*2

координата точки N равна цене игры n, а абсцисса равна частоте р*2 стратегии А2. В данном случае оптимальная стратегия противника получается применением смеси двух “полезных” (активных) стратегий: В2 и В4, пересекающихся в точке N. Стратегия В3 является заведомо невыгодной, а стратегия В1 - невыгодной при оптимальной стратегии S*a.

Если А будет придерживаться своей оптимальной стратегии, то выигрыш не изменится, какой бы из своих "полезных" стратегий не пользовался В, однако, он изменится, если В перейдет к стратегиям В1 или В3.

Пользуясь геометрической интерпретацией, можно дать простой способ решения любой игры 2´m. Непосредственно по чертежу находим пару "полезных" стратегий противника Вj и Вk, пересекающихся в точке N (если в точке N пересекаются более двух стратегий, берем любые две из них). Мы знаем, что, если игрок А придерживается своей оптимальной стратегии, то выигрыш не зависит от того, в какой пропорции применяет В свои "полезные" стратегии, следовательно

a1j·p1 + a2j·p2 = n                                                              a1k·p1 + a2k·p2 = n

Из этих уравнений и условия р2 =1 - р1 находим р1, р2 и цену игры. Зная цену игры, можно определить оптимальную стратегию игрока В:

Bj Bk

                                    S*b

qj  qk

Для этого решается, например, уравнение:   qj·a1j + qk·a1k = n, где qj + qk = 1.

В случае, когда мы располагаем n стратегиями, а противник - всего двумя, задача решается совершенно аналогичным способом: заменяя знак выигрыша на обратный, можно превратить игрока А из "выигрывающего" в "проигрывающего". Можно решить задачу и без перемены знака выигрыша; тогда задача решается непосредственно для В, но строится не нижняя, а верхняя граница выигрыша (рис. 3.6). На границе ищется точка N с минимальной ординатой, которая и есть цена игры n.

 


Дата добавления: 2018-09-22; просмотров: 461; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!