Применение методов линейного программирования к решению матричных игр

Вычисление оптимальных стратегий

Соотношения превосходств и концепция доминирования

 

 

ПРИМЕР 2: Рассмотрим игру с матрицей

УКАЗАНИЕ:

 ЦЕНА ИГРЫ В РАССМАТРИВАЕМОЙ ЗАДАЧЕ СООТВЕТСТВУЕТ ОРДИНАТЕ ВЕРХНЕЙ ТОЧКИ НИЖНЕЙ ОГИБАЮЩЕЙ ГРАФИКОВ ФУНКЦИЙ Y = M(x; j); j =1,2,...,n. ЭТО СПРАВЕДЛИВО ДЛЯ ИГР С МАТРИЦЕЙ 2´n.

 

ДЛЯ ИГР С МАТРИЦЕЙ m ´2 ГРАФИЧЕСКОЕ РЕШЕНИЕ АНАЛОГИЧНО, НО В ЭТОМ СЛУЧАЕ ЦЕНА ИГРЫ РАВНА ОРДИНАТЕ НИЖНЕЙ ТОЧКИ ВЕРХНЕЙ ОГИБАЮЩЕЙ ГРАФИКОВ ФУНКЦИЙ z = M (i; y);i =1,2,...,m.

 

 

Решение: Пусть игрок 1 применяет смешанную стратегию с вероятностями ( x,1- x) , а игрок 2 — чистую стратегию   . Обозначим математическое ожидание выигрыша игрока 1 в такой ситуации через M ( x; j) , где j -номер стратегии игрока 2. Тогда математическое ожидание выигрыша для игрока 1, если игрок 2 применяет чистую стратегию , будет равно:

M( x;1)=2 x+ 7(1- x)= 7-5x.

Аналогично, если игрок 2 применяет чистую стратегию  , то:

M( x;2)=3 x+5(1- x)= 5-2x,

а если игрок 2 применяет чистую стратегию , то

M( x;3)=11x+2(1- x)= 2+ 9 x .

Дадим графическую интерпретацию решения. На плоскости введем ортогональную систему координат. По оси абсцисс отложим вероятность x. Тогда точки x =0 и x =1 соответствуют тому, что игрок 1 выберет чистые стратегии   и  соответственно. По оси ординат отложим выигрыш игрока 1, равный M ( x; j) и проведем три прямые

y=7-5x

y=5-2x

y=2+ 9 x, при xÎ[0,1]

Рассуждения: Минимальное значение y при данном значении x соответствует выигрышу игрока 1 при выборе игроком 2 чистых стратегий  при j=1,2,3 соответственно. То есть при каждом выборе игроком 1 стратегии x он может быть уверен в том, что получит, по крайней мере, выигрыш, соответствующий наименьшей из ординат точек построенных графиков.

Точки, удовлетворяющие такому условию, образуют ломаную ABCD , которую будем называть нижней огибающей трех построенных графиков функций. Таким образом, для игрока 1 выбрать оптимальное x ,значит, выбрать такое x , при котором ордината точки нижней огибающей будет наибольшей, то есть СЛЕДУЕТ НАЙТИ ВЕРХНЮЮ ТОЧКУ НИЖНЕЙ ОГИБАЮЩЕЙ.

Для точного нахождения x=p(абсцисса этой точки) и M(мат. ожидание) необходимо решить систему уравнений:

 

 

Решая эту систему получим y=49/11, x=3/11.

Тогда (1- x) = 8/11.

Вывод: Таким образом оптимальная стратегия игрока 1 есть вектор (3/11,8/11) ,

а цена игры при этом равна V =49/11.

Из рисунка видно, что стратегия  в оптимальном решении не участвует, значит оптимальное решение для игрока 2 можно найти из приведенной матрицы вида

 

Решение легко определить графическим методом: пусть игрок 2 применяет смешанную стратегию ( y,1- y) , а игрок 1 выбирает чистые стратегии  и  .

Обозначим математическое ожидание выигрыша игрока 2 через M(i; y) , где i - номер стратегии игрока 1.

Тогда имеем:

M( 1;y)=3y+ 11(1- y)= 11-8y.

M( 2;y)=5 y+2(1- y)= 2-3y,

Чертим графики:

z=11-8y

z=2-3y

 

Находим точку пересечения графиков, решаем систему уравнений

Решение системы: z=q*=49/11, x=M*=9/11.

Таким образом, оптимальная стратегия игрока 2 задается вектором (0 , 9/11 ,2/11) при цене игры V= 49/11.

 

 

Пример 2: Пусть задана платежная матрица

 

Пусть игрок 1 применяет смешанную стратегию (x, 1- x), а игрок 2 – чистые стратегии, тогда проделывая все, как в примере выше получим:

Тогда математическое ожидание выигрыша для игрока 1, если игрок 2 применяет чистую стратегию , будет равно:

M( x;1)=2 x+ 7(1- x)= 7-5x.

Аналогично, если игрок 2 применяет чистую стратегию  , то:

M( x;2)=4x+4(1- x)= 4,

а если игрок 2 применяет чистую стратегию , то

M( x;3)=11x+2(1- x)= 2+ 9 x .

Чертим график. НУЖНО ПРОСЧИТЫВАТЬ ПРИ ПОСТРОЕНИИ ДВЕ ТОЧКИ Х=0 И Х=1 ДЛЯ КАЖДОГО ГРАФИКА:

Решим совместно второе и третье, а также второе и первое уравнения:

и

Из первого x= p 2* =3/5, из второго x= p 1* =2/9. V = M *=4

Значит, оптимальной для игрока 1 является любая стратегия (x,1- x) , где

, при этом цена игры V= 4 . Оптимальная стратегия для игрока 2 в этой игре равна (0,1,0)

Применение методов линейного программирования к решению матричных игр

прибавим ко всем элементам матрицы 2 A число k = 6. Получим матрицу

Задача (1) является двойственной к задаче (2). Для нахождения оптимального плана задачи (1) воспользуемся одной из теорем двойственности. Так как на оптимальном плане задачи (2) второе ограничение выполняется в виде строгого неравенства, оптимальное значение соответствующей ему двойственной переменной . При этом, так как, то оба ограничения задачи (1) выполняются на оптимальном плане в виде равенств . Таким образом, для того, чтобы найти оптимальные значения переменных и , следует решить систему линейных уравнений:

 

Цена игры и оптимальные стратегии игроков (1) и (2) в игре с платежной матрицей A


Дата добавления: 2021-05-18; просмотров: 70; Мы поможем в написании вашей работы!

Поделиться с друзьями:




Мы поможем в написании ваших работ!