Способы решения матричных игр



Перед тем, как решать игру m´n, нужно, прежде всего попытаться ее упростить, избавившись от лишних стратегий.

 

Часто при нахождении решения матричной игры существенно помогает выявление превосходства одной стратегии над другой.

 

Определение.

Если для i-й и k-й стратегий первого игрока выполняются соотношения

aij ³ akj  (j = 1, 2, …, n), 

причем хотя бы одно из неравенств является строгим, то говорят, что стратегия i превосходит или доминирует стратегию k.

Аналогично для второго игрока: стратегия j доминирует стратегию r, если выполняются неравенства

aij ³ air  (i = 1, 2, …, m), 

причем хотя бы одно из неравенств является строгим неравенством.

Использование соотношения доминирования позволяет сократить размерность матрицы выигрышей в матричной игре. Это свойство формулируется в виде следующей теоремы.

Теорема 1.

Пусть Г – матричная игра с матрицей А порядка m´n, и i-я стратегия первого игрока доминирует k-ю стратегию. Пусть А1 матрица, получаемая из А путем исключения из нее k-й строки, и пусть Г1 – матричная игра с матрицей А1.

Тогда цена игры Г1 совпадает с ценой игры Г, всякая оптимальная смешанная стратегия второго игрока в Г1 есть также его оптимальная смешанная стратегия в игре Г, если u = (u1, u2, …, uk–1, uk+1, …, um) есть оптимальная смешанная стратегия первого игрока в игре Г1, то его смешанная стратегия х = (u1, u2, …, uk–1, 0, uk+1, …, um)  является оптимальной в игре Г.

Из теоремы следует, что если i-я стратегия первого игрока доминирует k-ю стратегию, то i-я стратегия для первого игрока лучше, чем k-я , т.е. первому игроку не выгодно использовать свою k-ю стратегию и она не должна входить в его оптимальную стратегию. Следовательно, вероятность применения k-й чистой стратегии в оптимальной смешанной стратегии первого игрока должна равняться нулю. Вычеркивая из А эту k-ю строку, получаем матрицу А1, в которой количество строк на единицу меньше. При этом полагаем xk = 0, где xkk-я компонента х. Игру с матрицей А1 решать легче, так как в ней меньше строк. Если в матрице А1 наблюдается доминирование стратегий первого игрока, то далее можно поступать аналогично и таким образом уменьшить размерность матрицы А1.

 

Доминирование стратегий для второго игрока также дает дополнительные возможности для сокращения размера матрицы выигрышей.

С этой целью можно использовать следующее свойство.

Теорема 2.

Пусть Г матричная игра с матрицей А. Пусть q-я чистая стратегия второго игрока доминирует r-ю, матрица А1 получена из А исключением q-го столбца, Г1 – матричная игра с матрицей А1. Тогда цена игры Г1 такая же, как цена игры Г; всякая оптимальная смешанная стратегия первого игрока в Г1 есть также его оптимальная смешанная стратегия в Г; если w = (w1, w2, ..., wq–1, wq+1, ..., w n) есть оптимальная смешанная стратегия второго игрока в Г1, то у = (w1, w2, ..., wq–1, 0, wq+1, ..., w n)  есть оптимальная смешанная стратегия второго игрока в Г.

 

Таким образом, из теоремы 2 следует, что, если q-я чистая стратегия второго игрока доминирует какую-либо его чистую стратегию, то q-й столбец в А можно вычеркнуть, положив yq = 0, где yqq-я компонента оптимальной смешанной стратегии второго игрока. В результате, получаем матрицу А1 меньшей размерности чем А. Если в А1 есть доминирование стратегий, то можно поступать с ней аналогично и уменьшить ее размерность.

Пример 1.

А =

4 3 5 1
4 5 3 5
5 3 5 3
  1 5 4 8

Обозначим оптимальные смешанные стратегии первого и второго игроков соответственно через х и у. Очевидно, третья стратегия первого игрока доминирует его первую стратегию, поэтому можно в матрице А вычеркнуть первую строку, положив х1 = 0. Тогда получим новую матрицу

А1 =

4 5 3 5
5 3 5 3
1 5 4 8

в которой 4-я стратегия второго игрока доминирует его 2-ю стратегию, и поэтому вычеркиваем четвертый столбец, полагая y4 = 0, и получаем новую матрицу

А2 =

4 5 3
5 3 5
1 5 4

В этой матрице уже нет доминирования. Таким образом, исходную игру с матрицей порядка 4´4 с помощью доминирования свели к игре с матрицей порядка 3´3.

 

Пример 2.

Рассмотрим игру со следующей матрицей:

5  2  1

2 1  3

3 6  4

Третья строка этой матрицы доминирует вторую. Исключение второй строки приводит к матрице

5 2 1

3 6 4

Третий столбец в этой урезанной матрице доминирует второй, и исключение второго столбца дает

5  1

3  4

В итоге, если можно найти решение для полученной игры, то его легко использовать для решения исходной игры, просто приписав исключенным строкам и столбцам нулевые вероятности.

 

Матричные игры обладают еще одним интересным свойством, которое формулируется в виде следующей теоремы.

Теорема 3.

Пусть дана матричная игра Г с матрицей А = (aij) и с ценой игры v. Тогда оптимальные смешанные стратегии игроков матричной игры ГВ с матрицей В = (bij) = (daij + с), где d > 0 совпадают с оптимальными смешанными стратегиями соответствующих игроков в матричной игре Г, а цена игры ГВ равна vB = dv + с.

 

Пользуясь теоремой 3, можно несколько упрощать элементы матрицы А с тем, чтобы легче было с ними оперировать при нахождении решения игры.

Пример.

Рассмотрим матричную игру с матрицей

А =

200 300
600 100

Если каждый элемент этой матрицы разделить на 100 и затем из полученных элементов вычесть 1, то получим игру с матрицей

В =

1 2
5 0

которая имеет более простые элементы. Здесь проведено следующее преобразование:

bij = 0,01×aij – 1, т.е. d = 0,01, c = –1.

В этой игре нет седловой точки в чистых стратегиях. Поэтому для решения игры с матрицей В обозначим через х = (x1, x2), у = (y1, у2) оптимальные смешанные стратегии соответственно первого и второго игроков, v – цена игры с матрицей A, vB – цена игры с матрицей В.

Согласно следствию из теоремы 1, х и у должны удовлетворять соотношениям:

x1 + 5x2 ³ vB                                y1 + 2y2 £ vB

2x1 ³ vB                              5y1 £ vB

x1 + x2 = 1                          y1 + y2 = 1

Предположим, что все эти неравенства являются равенствами. Позже будет показано, что это всегда так, если в матричной игре с матрицей порядка 2´2 нет седловой точки в чистых стратегиях. Тогда получим

x1 + 5x2 = vB                                y1 + 2y2 = vB

2x1 = vB                              5y1 = vB

x1 + x2 = 1                          y1 + y2 = 1

Решив данную систему, получим:

vB = 3/5, x1 = 3/10, x2 = 7/10, y1 = 3/25, y2 = 22/25

Тогда решением матричной игры с матрицей А будет

Замечание.

Отметим, что исключение доминируемых (не строго!) стратегий может привести к потере некоторых решений. Если же исключаются только строго доминируемые стратегии, то множество решений игры не изменится.

 

 

Пример 3.

Пусть G = (Х,Y,А), где Х = {1, 2, 3, 4}; Y = {1, 2, 3, 4}, а функция выигрыша А задана следующим образом:

где С > 0.

Решение.

 Прежде всего заметим, что по теореме 3 достаточно решить игру G1 = (Х, Y, А), где А1 = А . В матричной форме игра G1 определяется матрицей выигрышей

Элементы четвертой строки этой матрицы “ £ ” соответствующих элементов третьей строки и поэтому третья стратегия игрока 1 доминирует над четвертой. Кроме того, элементы первого столбца матрицы А1 “ ³ ” соответствующих элементов второго столбца, Следовательно, вторая стратегия игрока 2 доминирует над его первой стратегией.

Далее, из теоремы 1 и 2 следует, что всякое решение игры

 G2 = (Х \{4}, Y \{1}, А1)

является решением игры G1. В матричной форме игру G2 можно представить матрицей

.

Очевидно, что элементы второй строки “ ³” полусуммы соответствующих элементов первой и третьей строк. Кроме того, элементы третьего столбца матрицы А2 “ ³“ соответствующих элементов второго столбца. Применяя теорему3, получим, что всякое решение игры

G 3 = (Х \ {4,2}, Y \ {1,4}, А2)

является решением игры G 2, а следовательно и игры G 1. Игра G 3 определяется матрицей

.

Матрица А 3не имеет седловой точки, т.к. не выполнено равенство

 = ,

а игра G3 не имеет решения в чистых стратегиях, т.е. оптимальные стратегии игроков являются смешанными. Эти стратегии (в данном случае) легко найти из анализа структуры матрицы А3. Поскольку матрица А3симметрична, можно предположить, что игроки в оптимальной стратегии используют свои чистые стратегии с равными вероятностями.

Действительно, если игрок 1 выбирает с равными вероятностями стратегии 1 и 3, то при применении любой из двух чистых стратегий игроком 2 математическое ожидание выигрыша игрока 1 будет равным либо

,  либо .

Аналогично, если игрок 2 использует свои чистые стратегии 2 и 3 с равными вероятностями, то математическое ожидание его проигрыша будет равно 3/2. Следовательно, указанные стратегии являются оптимальными в игре G3, а величины 3/2 – значением игры G3. Из предыдущего следует, что эти стратегии оптимальны и в G1.

Таким образом, стратегия Х = (1/2, 0, 1/2, 0) является оптимальной стратегией игрока 1, стратегия Y = (0, 1/2, 1/2, 0) – оптимальной стратегией игрока 2 в игре G1, а значение игры G1 равно 3/2. В силу свойства 4 решением игры G будет тройка (Х, Y,3С/2).


Решение антагонистических игр 2×2 в смешанных стратегиях

Если игра 2×2 имеет седловую точку, то ее решение очевидно.

Пусть игра 2×2 не имеет седловой точки. Требуется найти цену игры v и оптимальные смешанные стратегии обоих игроков:

.

Чистые стратегии, входящие в оптимальную стратегию с положительными вероятностями, называются активными стратегиями.

 

Для решения матричных игр 2´2 можно использовать аналитический и геометрический методы.

 

Аналитический метод

Теорема об активных стратегиях

Пусть v – цена игры,  и  – оптимальные стратегии игроков. Тогда справедливы следующие утверждения:

– для любой активной стратегии i первого игрока выполняется равенство

                                 E(i, y0) = v;

– для любой активной стратегии j второго игрока имеет место равенство

E(x0, j) = v.

В игре 2×2 все стратегии игроков являются активными (почему?)

 

Выигрыш игрока первого игрока, если он применяет оптимальную стратегию х0, а второй игрок свою активную стратегию 1 равен

По теореме об активных стратегиях этот выигрыш равен цене игры, т.е.

Аналогично для случая, когда первый игрок применяет оптимальную стратегию х0, а второй игрок активную стратегию 2:

Получаем:

                                                   (1)

Получили систему уравнений относительно .

Аналогичную систему получим для оптимальных стратегий второго игрока:

                                         (2)

Решая эти системы, найдем неизвестные оптимальные стратегии игроков х0, у0 и цену игры v.

Цена игры ν общая для обоих игроков, поэтому при решении систем уравнений (1) и (2) должно получиться одинаковое значение ν.

 

Решение игры 2´2 в общем виде выглядит следующим образом

;    х2 = 1 – х1;

;    у2 = 1 – у1;      (***)

.

 

Геометрический метод

Рассмотрим геометрическую интерпретацию игры 2×2.

Пусть игрок А применяет смешанную стратегию, а игрок В – активную стратегию В1. Тогда средний выигрыш игрока А будет:

 

 

Мы получили уравнение прямой, которую обозначим В1, т.к. она соответствует активной стратегии В1 игрока В.

Если игрок В применяет свою активную стратегию В2, а игрок А стратегию (х, (1 – х)), то выигрыш игрока А равен:

Видно, что какую бы стратегию ни применил В, игрок А гарантирует себе выигрыш не меньше, чем ордината ломаной В2МВ1.

 

Ломанная В2МВ1 (на рис. выделена полужирно) определяет минимальные возможные средние выигрыши игрока А при использовании им своих смешанных стратегий. Точка М (самая высокая точка ломанной) – определяет наилучший средний выигрыш игрока А из всех минимальных. Она соответствует оптимальной смешанной стратегии игрока А. При этом: если М имеет координаты (х, у), то р1 = 1 – х, р2 = х, ν = y.

Таким образом, задача сводится к нахождению координат точки М, которая является точкой пересечения прямых В1В1 и В2В2. Для нахождения уравнений прямых В1В1 и В2В2.можно воспользоваться уравнением прямой, проходящей через две точки:

                                 ,

с учетом того, что прямую В1В1 определяют точки (0; a11), (1; а21), а прямую В2В2 определяют точки (0; a12), (1; а22).

 

Для игрока В оптимальная смешанная стратегия находится аналогично, но точка М определяется не самой высокой точкой нижней ломанной, а самой низкой точкой высокой ломанной – полужирная ломанная на рисунке 2.

Пусть В применяет стратегию Y = (у, (1 – у)), а А применяет стратегию А1. Тогда проигрыш игрока В определяется точками прямой:

.

Эту прямую обозначим А1. Если А применяет стратегию А2, а В стратегию Y, то проигрыш В лежит на прямой А2:

 

        

Из графика видно, что какую бы стратегию ни применял игрок А, игрок В гарантирует себе проигрыш не более, чем ордината ломаной А1МА2.

Оптимальной стратегией игрока В будет такая стратегия Y = (у, (1 – у)), при которой ордината ломаной линии А1МА2 будет минимальна. Найдя координаты точки М (х, у), как точки пересечения прямых А1А1 и А2А2, компоненты оптимальной смешанной стратегии игрока В и цену игры: Y*(у1, у2), ν можно найти по следующим формулам:

q1 = 1 – x, q2 = x, ν = y.

 

Пример.

Решить игру с матрицей платежей

Пусть оптимальная смешанная стратегия игрока А есть .

Тогда:

Найдем оптимальную смешанную стратегию  игрока В.

Игру можно решить графически.

 

Пример.

Решить графически игру с матрицей А

 

        

 

 


Решение антагонистических игр m×2

 

    Найдем решение игры со следующей матрицей                                                             

Пусть игрок В применяет смешанную стратегию Y = (у, (1 – у)), а игрок А – чистую стратегию Ai (i = 1, …, m). Тогда средний проигрыш игрока В будет:

Z = ai1×у + ai2×(1 – у)

Это уравнение прямой, которую обозначим Ai.

Для i = 1, …, m, построим все прямые А1, А2, …, А m. Проигрыш игрока В будет не больше максимального значения ординат прямых А1, А2, …, А m, т.е. не больше ординат ломаной MNKC. Оптимальной стратегией игрока В будет такая смешанная стратегия, при которой его максимально возможный проигрыш будет минимальным, т.е. будет минимальна ордината ломаной MNKC. Это точка у0, и оптимальная стратегия (у0, (1 – у0)). Цена игры – ордината точки N.

В качестве активных стратегий игрока А можно выбрать две чистых стратегии, соответствующие прямым, пересекающимся в N. Пусть это Ai и Aj.

Из матрицы исходной игры вычеркнем все строки кроме i-ой и j-ой, т.е. получим матрицу:

Тогда оптимальную смешанную стратегию игрока А X0 = (х0, (1 – х0) ) можно определить как для игры 2´2, т.е. из соотношений

             

 

Тогда:   Х0 = (0, …, 0,  х0,  0, …, 0,  1 – х0,  0, …, 0)

                                    i-я компонента    j-я компонента

 

 

Пример 1:

А1 : 4y + 3 (1 – y) = z

A2 : 2y + 4 (1 – y) = z

A3 :         5 (1 – y) = z

A4 : –y + 6 (1 – y) = z

 

В точке N пересекаются прямые А1 и А4, т.е.

4y + 3 (1 – y) = –y + 6 (1 – y)

y0 = 3/8, Y 0 = (3/8, 5/8)

v = 4×3/8 + 3×(1 – 3/8) = 27/8

 

Поскольку активными стратегиями А являются А1 и А4, то

Отсюда получаем   В1 : 4x0 – (1 – x0) = z0 = v

                                 В2 : 3x0 + 6 (1 – x0) = z0 = v

Или 4x0 – (1 – x0) = 3x* + 6 (1 – x0)

    x0 = 7/8, 1 – x0 = 1/8

 

Тогда Х 0 = (7/8, 0, 0, 1/8).

 

 


Решение антагонистических игр 2× n

 

Рассмотрим матрицу игры 2×n:

Пусть игрок А применяет смешанную стратегию (х, 1–х), а игрок В – активную стратегию Bj (j = 1, …, n).

В i : z = a1i x + a2i (1 – x)

Изобразим прямые В1, …, Вn на плоскости. Какую бы стратегию ни применил игрок В, игрок А получит выигрыш не менее ординаты ломаной линии MNKC.

 

Оптимальная смешанная стратегия первого игрока есть такая смешанная стратегия, при которой он получает максимальный гарантированный выигрыш. На рис. это точка х0, которая соответствует max из ординат ломаной MNKC. Поэтому оптимальная стратегия игрока А:     

Х0 = (x0, (1 – x0)),

а цена игры v равна ординате точки К. В качестве активных стратегий игрока В можно выбрать две чистых стратегии, соответствующих любым двум прямым, пересекающимся в точке К. Пусть это Вi и Вj. Тогда матрицу исходной игры можно записать

Оптимальную смешанную стратегию игрока В найти как в игре 2´2

        

 

 

Тогда:   Y 0 = (0, …, 0,  у0,   0, …, 0,  1 – у0,  0, …, 0)

                                    i-я компонента    j-я компонента

Пример 2:

 

В1 : 2x + 4 (1 – x) = z

В2 : 3x + 2 (1 – x) = z

В3 : x + 3 (1 – x) = z

В4 : 4x + (1 – x) = z

В точке N пересекаются прямые В3 и В4, т.е. x + 3 (1 – x) = 4x + (1 – x), т.е.

              x0 = 2/5, Х 0 = (2/5, 3/5)

v = 2/5 + 3 × 3/5 = 11/5

Активными стратегиями игрока В будут В3 и В4, т.е.

Тогда    А1 : y + 4 (1 – y) = z

              A2 : 3y + (1 – y) = z

y0 = 3/5  Y 0 = (0, 0, 3/5, 2/5)

 

Пример 1.

Решить графическим методом игру .

.

Пусть первый игрок придерживается смешанной стратегии

,

а второй игрок – одной из своих чистых стратегий.

Тогда

Построим прямые , определяющие график функции

В точке максимума , т.е.

,

.

 

Активными стратегиями второго игрока являются вторая и третья стратегии, поэтому оптимальную стратегию этого игрока ищем в виде

.

Для этого решим игру с матрицей

.

По формуле (***) имеем .

Итак,

.

Пример 2

Решить игру, заданную платёжной матрицей.

Ответ: Х = ( ; ), при цене игры v = . Y = (0; ; ).

 

Пример 3 . Найти решение игры, заданной матрицей

Ответ: U = ( ; ); Х = ( ; 0; 0; );  u = .

 


Решение антагонистических игр m´n.
Сведение матричной игры к задаче линейного программирования

Пусть дана игра m´n в нормальной форме, т.е.

Будем считать, что все элементы матрицы больше 0. Если это не так, то ко всем элементам можно прибавить такое число L>0, например,

    ,

где r > 1, чтобы все элементы стали положительными. При этом цена игры возрастает на L, но оптимальные стратегии не меняются. Т.о. aij >0, значит, v > 0

Пусть игрок А применит свою оптимальную стратегию . Тогда его выигрыш будет не менее v при любых действиях игрока В. В частности, если игрок В применит свою чистую стратегию В j, то выигрыш А составит:

j = (1, …, n)

Поделим это неравенство на v и, обозначив

 (i = 1, …, m),

получим:

         zi >= 0   j = (1, …, n)

Вероятности  (i = 1, …, m) должны удовлетворять условию

.

 Поделим это выражение на v и в новых обозначениях запишем

Поскольку игрок А стремиться к максимуму v, то целевая функция будет иметь вид:

Т.о. имеем:

(1)               

Задача (1) – задача линейного программирования.

Пусть  – решение задачи (1).

Тогда

;  (i = 1, …, m).

 

Аналогичные рассуждения можно проделать для игрока В:

Пусть он применяет оптимальную смешанную стратегию , а игрок А – чистую стратегию А i (i = 1, …, m). Тогда проигрыш игрока В составит величину не более v:

 (i = 1, …, m).

Разделим это неравенство на v > 0 и, обозначив

 (j = 1, …, n), получим .

Вероятности  (i = 1, …, m) должны удовлетворять условию

.

Поделим это выражение на v и в новых обозначениях получим:

.

Поскольку игрок В стремиться минимизировать проигрыш, т.е.


v ® min,

получим функцию

.

Т.о. имеем задачу линейного программирования:

(2)        

Пусть  – решение (2).

Тогда

Легко видеть, что задачи (1) и (2) представляют собой пару взаимодвойственных задач линейного программирования. Т.о., решение антагонистической игры m´n можно найти путем решения пары взаимодвойственных задач линейного программирования.

 

Пример

Две отрасли могут осуществлять капитальные вложения в 3 объекта. Стратегии отраслей: i-я стратегия состоит в финансировании i-го объекта (i = 1, 2, 3). Учитывая особенности вкладов и местные условия, прибыли первой отрасли выражаются следующей матрицей:

Величина прибыли первой отрасли считается такой же величиной убытка для второй отрасли - представленная игра может рассматриваться как игра двух игроков с нулевой суммой.

Рассмотрим игрока А. Будем искать оптимальную смешанную стратегию игрока А: Х ( х1, х2, х3), где х i  – частота (вероятность) использования игроком А своей i-стратегии ( i = 1, 2, 3).Обозначим цену игры (средний выигрыш) – v.

Чтобы свести матричную игру для игрока А к задаче линейного программирования преобразуем платежную матрицу так, чтобы все ее элементы были больше нуля – прибавим ко всем элементам матрицы число 4. Получаем преобразованную платежную матрицу:


Дата добавления: 2021-04-05; просмотров: 182; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!