Графический метод решения игр
МЕТОДЫ РЕШЕНИЯ КОНЕЧНЫХ ИГР
В СМЕШАННЫХ СТРАТЕГИЯХ
Постановка вопроса
Если игра n×m не имеет седловой точки, то нахождение решения вообще довольно трудная задача, особенно при больших n и m.
Иногда эту задачу удается упростить, предварительно уменьшив число стратегий путем вычеркивания некоторых излишних.
Излишние стратегии бывают: а) дублирующие и б) заведомо невыгодные.
Рассмотрим, например, игру с матрицей:
В А | В1 | В2 | В3 | В4 |
А1 | 1 | 2 | 4 | 3 |
А2 | 0 | 2 | 3 | 2 |
А3 | 1 | 2 | 4 | 3 |
А4 | 4 | 3 | 1 | 0 |
Нетрудно убедиться, что стратегия A3 в точности повторяет ("дублирует") стратегию A1, поэтому любую из этих двух стратегий можно вычеркнуть. Далее, сравнивая почленно строки A1 и A2, видим, что каждый элемент строки A2 меньше (или равен) соответствующего элемента строки А1. Очевидно, что мы никогда не должны пользоваться стратегией А2, она является заведомо невыгодной. Вычеркивая A3 и A2, приводим матрицу к более простому виду:
В А | В1 | В2 | В3 | В4 |
А1 | 1 | 2 | 4 | 3 |
А4 | 4 | 3 | 1 | 0 |
Далее замечаем, что для противника стратегия В3 заведомо невыгодна; вычеркивая ее, приводим матрицу к окончательному виду :
В А | В1 | В2 | В4 |
А1 | 1 | 2 | 3 |
А4 | 4 | 3 | 0 |
Таким образом, игра 4×4 вычеркиванием дублирующих и заведомо невыгодных стратегий сведена к игре 2×3.
Процедура вычеркивания дублирующих и заведомо невыгодных стратегий всегда должна предшествовать решению игры.
|
|
Игры 2×2 и 2×m являются наиболее простыми случаями конечных игр, которые всегда можно решить элементарными способами.
3.2. Аналитический метод решения игры 2×2, 2×m и n×2
Пусть игра 2×2 задана платежной матрицей
а11 а12
А=
а21 а22
Пусть седловой точки нет и, следовательно, нижняя цена игры не равна верхней: α≠β. Требуется найти оптимальную смешанную стратегию игрока A
A1 A2
Sa* =
p*1 p*2
Она отличается тем свойством, что, каковы бы ни были действия противника (если только он не выходит за пределы своих "полезных" (активных) стратегий), выигрыш будет равен цене игры n. В игре 2×2 обе стратегии противника являются "полезными", - иначе игра имела бы решение в области чистых стратегий (седловую точку). Значит, если мы придерживаемся своей оптимальной стратегии S*a, то противник может пользоваться любой из своих чистых стратегий B1, В2, не изменяя среднего выигрыша n.
То есть, если игрок В использует чистую стратегию B1 (это соответствует 1-му столбцу платежной матрицы), выигрыш игрока A, применяющего смешанную стратегию, равен цене игры n: a11·p1* + a21·p2* = n.
|
|
Тот же средний выигрыш получает игрок A, если 2-й игрок применяет стратегию B2, т.е. a12·p*1 + a22·p*2 = n. Учитывая, что p1* + p2* = 1, получаем систему уравнений для определения оптимальной стратегии S*a и цены игры n:
a11·p*1 + a21·p*2 = n (3.1)
a12·p*1 + a22·p*2 = n
p*1 + p*2 = 1
Решая эту систему, получим оптимальную стратегию
(3.2)
и цену игры
(3.3)
Применяя теорему об активных стратегиях при отыскании S*b - оптимальной стратегии игрока B, получаем, что при любой чистой стратегии игрока A (A1 или A2) средний проигрыш игрока B равен цене игры n, т.е.
a11·q*1+ a12·q*2 = n (3.4)
a21·q*1 + a22·q*2 = n
q*1 + q*2 = 1
Тогда оптимальная стратегия S*b (q*1, q*2) определяется формулами:
(3.5)
Графический метод решения игр
Решение игры 2×2 допускает наглядную геометрическую интерпретацию. Пусть игра задана матрицей A= аij , i,j=1,2, приведенной ниже.
В А | В1 | В2 |
А1 | a11 | a12 |
А2 | a21 | a22 |
Возьмем участок оси абсцисс длиной 1 (как сумма вероятностей р1+р2=1) -рис. 3.1. Левый конец участка (точка с абсциссой х=0) будет изображать стратегию A1, правый конец участка (х=1)- стратегию A2. Проведем через точки A1 и A2 два перпендикуляра к оси абсцисс: ось I-I и ось II-II. На оси I-I будем откладывать выигрыши при стратегии А1, на оси II-II - выигрыши при стратегии A2. Рассмотрим стратегию противника В1; она дает две точки на осях I-I и II-II c ординатами, соответственно, a11 и а21. Проведем через эти точки прямую В1-В1.
|
|
Очевидно, если мы будем применять смешанную стратегию
A1 A2
Sa =
p1 p2
а игрок В - чистую стратегию B1, то наш средний выигрыш, равный а11·р1 + а21·р2, изобразится точкой М на прямой В1-В1; абсцисса этой точки равна р2. Прямую В1-В1, изображающую выигрыш при стратегии В1, условно будем называть “стратегией В1”.
Очевидно, точно таким же способом может быть построена и стратегия В2 (рис. 3.2).
I II I II
|
|
M N
|
a21 a21
|
|
|
a11 p2 p1 p2 p1
X
0 (A1) 1 (A2) 0 (A1) 1 (A2) I II I II
Рис. 3.1. Рис. 3.2.
Нам нужно найти оптимальную стратегию S*a, т.е. такую, для которой минимальный выигрыш (при любом поведении В) обращался бы в максимум. Для этого построим нижнюю границу выигрыша при стратегиях В1, В2, то есть, ломаную В1-N-В2, отмеченную на рис. 3.2 жирной линией. Эта нижняя граница будет выражать минимальный выигрыш игрока А при любых смешанных его стратегиях; точка N, в которой этот минимальный выигрыш достигает максимума, и определяет решение и цену игры. Нетрудно убедиться, что ордината точки N есть цена игры n, а ее абсцисса равна р*2 - частоте применения стратегии A2 в оптимальной смешанной стратегии S*a.
Геометрическая интерпретация дает возможность представить наглядно также нижнюю и верхнюю цену игры.
В нашем случае решение игры определялось точкой пересечения стратегий. Однако, это не всегда будет так; на рис. 3.3 показан случай, когда, несмотря на наличие пересечения стратегий, решение дает для обоих игроков чистые стратегии (А2 и В2), а цена игры n= а22.
В данном случае матрица имеет седловую точку, и стратегия А1 является заведомо невыгодной, т.к. при любой чистой стратегии противника она дает меньший выигрыш, чем А2.
|
|
|
|
|
|
|
N
| |||
ν =a22
|
|
|
|
|
|
|
X X
0 (A1) 1 (A2) 0 (A1) 1 (A2)
I II I II
Рис. 3.3. Рис. 3.4
В случае, когда заведомо невыгодная стратегия имеется у противника, геометрическая интерпретация имеет вид, представленный на рис.3.4. В данном случае нижняя граница выигрыша совпадает со стратегией В1; стратегия В2 для противника является заведомо невыгодной.
Пусть мы располагаем двумя стратегиями А1, А2, а противник - m стратегиями: В1, В2, ..., Вm. Матрица аij задана; она состоит из двух строк и m столбцов. Аналогично случаю двух стратегий, дадим задаче геометрическую интерпретацию; m стратегий противника изобразятся m прямыми (рис. 3.5).
|
|
|
|
B3
|
|
|
M
|
|
|
|
0 (A1) p2 p1 1 (A2) 0 (В1) q2 q1 1 (B2)
I II I II
Рис. 3.5. Рис. 3.6.
Строим нижнюю границу выигрыша (ломаную В1MNВ2) и находим на ней точку N с максимальной ординатой. Эта точка дает решение игры (стратегию)
A1 A2
S*a =
р*1 p*2
координата точки N равна цене игры n, а абсцисса равна частоте р*2 стратегии А2. В данном случае оптимальная стратегия противника получается применением смеси двух “полезных” (активных) стратегий: В2 и В4, пересекающихся в точке N. Стратегия В3 является заведомо невыгодной, а стратегия В1 - невыгодной при оптимальной стратегии S*a.
Если А будет придерживаться своей оптимальной стратегии, то выигрыш не изменится, какой бы из своих "полезных" стратегий не пользовался В, однако, он изменится, если В перейдет к стратегиям В1 или В3.
Пользуясь геометрической интерпретацией, можно дать простой способ решения любой игры 2´m. Непосредственно по чертежу находим пару "полезных" стратегий противника Вj и Вk, пересекающихся в точке N (если в точке N пересекаются более двух стратегий, берем любые две из них). Мы знаем, что, если игрок А придерживается своей оптимальной стратегии, то выигрыш не зависит от того, в какой пропорции применяет В свои "полезные" стратегии, следовательно
a1j·p1 + a2j·p2 = n a1k·p1 + a2k·p2 = n
Из этих уравнений и условия р2 =1 - р1 находим р1, р2 и цену игры. Зная цену игры, можно определить оптимальную стратегию игрока В:
Bj Bk
S*b =
qj qk
Для этого решается, например, уравнение: qj·a1j + qk·a1k = n, где qj + qk = 1.
В случае, когда мы располагаем n стратегиями, а противник - всего двумя, задача решается совершенно аналогичным способом: заменяя знак выигрыша на обратный, можно превратить игрока А из "выигрывающего" в "проигрывающего". Можно решить задачу и без перемены знака выигрыша; тогда задача решается непосредственно для В, но строится не нижняя, а верхняя граница выигрыша (рис. 3.6). На границе ищется точка N с минимальной ординатой, которая и есть цена игры n.
Дата добавления: 2018-09-22; просмотров: 461; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!