Общие методы решения конечных игр.

Приведение матричной игры к задаче линейного

Программирования

Мы рассматривали до сих пор только самые элементарные игры типа 2´m, которые могут быть весьма просто решены и допускают удобную и наглядную геометрическую интерпретацию.

В общем случае решение игры n´m представляет довольно трудную задачу, причем сложность задачи и объем необходимых для решения вычислений резко возрастает с увеличением n и m. Однако эти трудности не носят принципиального характера и связаны только с очень большим объемом расчетов, который в ряде случаев может оказаться практически невыполнимым. Принципиальная сторона метода отыскания решения остается при любом n и m одной и той же.

Проиллюстрируем это на примере игры 3´m. Дадим ей геометрическую интерпретацию - уже пространственную. Три наши стратегии А₁, А₂ и А₃ изобразим тремя точками на плоскости х0у; первая лежит в начале координат (рис. 3.7), вторая и третья - на осях 0x и 0у на расстояниях 1 от начала.

III I II

B₁

a₃₁ a₁₁

0 (A₁) a₂₁

(A₃)

(A₂) X

III I II

Рис. 3.7.

Через точки А₁, А₂ и А₃проводятся оси I-I, II-II и III-III, перпендикулярные к плоскости х0у. На оси I-I откладываются выигрыши при стратегии А₁, на осях II-II и III-III - выигрыши при стратегиях А₂, А₃. Каждая стратегия противника B_jизобразится плоскостью, отсекающей на осях I-I, II-II и III-III отрезки, равные выигрышам при соответствующих стратегиях А₁, А₂ и А₃ и стратегии B_j.

Построив таким образом все стратегии противника, мы получим семейство плоскостей над треугольником A₁, А₂, А₃ (рис. 3.8).

B₂

III I II

B₁

B₃

B₂

B₁

B₃

B₂

0 (A₁)

(A₃) (A₂)

Y X

III I II

Рис. 3.8.

Для этого семейства также можно построить нижнюю границу выигрыша, как мы это делали в случае 2хm, и найти на этой границе точку N с максимальной высотой над плоскостью х0у. Эта высота и будет ценой игры n.

Частоты p₁, р₂, р₃ стратегий A₁, A₂, А₃ в оптимальной стратегии S*_a будут определяться координатами (х, у) точки N, а именно: р₂ = х; р₃ = y; р₁ = 1 - p₂ - p₃.

Однако, такое геометрическое построение даже для случая 3´m нелегко осуществимо и требует больших затрат времени и усилий воображения. В общем же случае игры оно переносится в n‑мерное пространство и теряет всякую наглядность, хотя употребление геометрической терминологии в ряде случаев может оказаться полезным. При решении игр n´m на практике удобнее пользоваться не геометрическими аналогиями, а расчетными аналитическими методами, тем более, что для решения задачи на вычислительных машинах эти методы единственно пригодны.

Вкратце остановимся на одном расчетном методе решения игр n´m - на применении метода линейного программирования.

Пусть игра n´m задана платежной матрицей A= а_ij ,i=1,n; j=1,m. Игрок А обладает стратегиями А₁, A₂,..., A_n, игрок В - стратегиями B₁, B₂,..., B_m. Необходимо определить оптимальные стратегии S*_a= (p*₁,p*₂,..., p*_n) и S*_b = (q*₁,q*₂,..., q*_m), где p*_i, q*_j - вероятности применения соответствующих чистых стратегий A_i, B_j;

Можно записать p*₁+p*₂+ ... +p*_n = 1, q*₁+q*₂+ ... +q*_m = 1.

Оптимальная стратегия S*_a удовлетворяет следующему требованию. Она обеспечивает игроку А средний выигрыш, не меньший, чем цена игры n, при любой стратегии игрока В и выигрыш, равный цене игры n, при оптимальной стратегии игрока В. Без ограничения общности полагаем n>0, этого можно добиться, сделав все элементы а_ij >0. Если игрок А применяет смешанную стратегию S*_a = (p*₁,p*₂,..., p*_n) против любой чистой стратегии B_j игрока B, то он получает средний выигрыш, или математическое ожидание выигрыша a_j = а_1j·p*₁+ a_2j·p*₂+ ... + а_nj·р*_n, j = 1,m (т.е. элементы j-го столбца платежной матрицы почленно умножаются на соответствующие вероятности стратегий A₁, A₂,..., A_n и результаты складываются).

Для оптимальной стратегии S*_a все средние выигрыши не меньше цены игры n, поэтому получаем систему неравенств:

a₁₁·p₁ + a₂₁·p₂ + … + a_n1·p_n ³ n a₁₂·p₁ + a₂₂·p₂ + … + a_n2·p_n ³ n (3.6)

. . . . . . . . . . . . . . . . .

a₁_m·p₁ + a₂_m·p₂ + … + a_nm·p_n ³ n

Каждое из неравенств можно разделить на число n>0. Введем новые переменные:

G₁ = p₁/n, G₂ = p₂/n, ..., G_n = p_n/n (3.7)

Тогда система (3.6) примет вид:

a₁₁·G₁ + a₂₁·G₂ + … + a_n1·G_n ³ 1 a₁₂·G₁ + a₂₂·G₂ + … + a_n2·G_n ³ 1 (3.8)

. . . . . . . . . . . . . . . . .

a₁_m·G₁ + a₂_m·G₂ + … + a_nm·G_n ³ 1

Разделив на n¹0 равенство p₁+p₂+ ... +p_n = 1, получаем, что переменные G_i (i =1,n) удовлетворяют условию: G₁+G₂+ ... +G_n = 1/n.

Цель игрока А - максимизировать свой гарантированный выигрыш, т.е. цену игры n. Максимизация цены игры n эквивалентна минимизации величины 1/n, поэтому задача может быть сформулирована следующим образом: определить значения переменных G_i³ 0, i=1,n, так, чтобы они удовлетворяли линейным ограничениям (3.8) и при этом линейная функция

Z = G ₁ + G ₂ + ... + G _n (3.9)

обращалась в минимум.

Это задача линейного программирования. Решая задачу (3.8)-(3.9), получаем оптимальное решение p*₁,p*₂,...,p*_n и оптимальную стратегию S*_a.

При определении оптимальной стратегии 2-го игрока S*_b=(q*₁, q*₂, ..., q*_m) исходим из того, что средний проигрыш игрока В не превосходит цены игры, какую бы чистую стратегию не применял игрок А. То есть, переменные q₁,q₂,...,q_m удовлетворяют неравенствам

a₁₁·q₁ + a₁₂·q₂ + … + a_1m·q_m≤ n a₂₁·q₁ + a₂₂·q₂ + … + a_2m·q_m≤ n (3.10)

. . . . . . . . . . . . . . . . .

a_n1·q₁ + a_n2·q₂ + … + a_nm·q_m≤ n

Если обозначить U_j = q_j/n, j =1, m (3.11)

то получим систему неравенств:

a₁₁·U₁ + a₁₂·U₂ + … + a_1m·U_m≤ 1 a₂₁·U₁ + a₂₂·U₂ + … + a_2m·U_m≤ 1 (3.12)

. . . . . . . . . . . . . . . . .

a_n1·U₁ + a_n2·U₂ + … + a_nm·U_m≤ 1

Переменные U_j (j = 1, m) удовлетворяют условию

U₁ + U₂ + ... + U_m = 1/n (из равенства q₁+q₂+...+ q_m=1).

Если учесть, что игрок В стремится минимизировать гарантированный выигрыш, т.е. найти max(1/n), игра сведется к следующей задаче.

Определить значения переменных U_j≥0, j=1, m, которые удовлетворяют системе неравенств (3.12) и максимизируют линейную функцию

Z' = U₁ + U₂ + ... + U_m (3.13)

Решение задачи линейного программирования (3.12), (3.13) определяет оптимальную стратегию S*_b=(q*₁, q*₂, ..., q*_m). При этом цена игры

n = 1/maxZ'= 1/minZ (3.14)

Составив расширенные матрицы для задач (3.8)-(3.9) и (3.12)-(3.13), убеждаемся, что:

- одна матрица получилась из другой транспонированием;

- знаки неравенств поменялись на противоположные;

- экстремумы линейных функций имеют противоположный смысл;

- свободные члены системы ограничений и коэффициенты линейных функций поменялись местами.

Таким образом, задачи линейного программирования (3.8)-(3.9) и (3.12)-(3.13) являются взаимно-двойственными. Очевидно, при определении оптимальных стратегий в конкретных задачах следует выбрать ту из взаимно-двойственных задач, решение которой менее трудоемко, а решение другой задачи найти с помощью теорем двойственности.

* * * * * *

Итак, с учетом вышеизложенного можно рекомендовать следующую схему решения произвольной конечной игры размера n×m:

1. Исключить из платежной матрицы заведомо невыгодные стратегии по сравнению с другими стратегиями. Такими стратегиями для игрока А являются те, которым соответствуют строки с элементами, заведомо меньшими по сравнению с элементами других строк. Для игрока В - столбцы с элементами, заведомо большими по сравнению с элементами других столбцов.

2. Определить верхнюю и нижнюю цены игры и проверить, имеет ли игра седловую точку. Если седловая точка есть, то соответствующие ей чистые стратегии игроков будут оптимальными, а цена игры совпадает с верхней и нижней ценами.

3. Если седловая точка отсутствует, то решение следует искать в смешанных стратегиях. Для игр размера 2×2 возможно применение аналитического метода, для игр размера 2×2, 2×m, n×2 - геометрического или сочетания геометрического и аналитического методов решения, для игр размера n×m рекомендуется симплексный метод.

Дата добавления: 2018-09-22; просмотров: 316; Мы поможем в написании вашей работы!

Поделиться с друзьями:

⇐ Предыдущая 123 Следующая ⇒

Мы поможем в написании ваших работ!