Пример 1 «Двухпальцевая игра Морра»



Nbsp; Содержание 1. Предмет и задачи теории игр                                                     4 2. Матричные игры                                                                           8 3. Решение матричных игр в чистых стратегиях                          18 4. Решение матричных игр в смешанных стратегиях                  22 5. Непосредственное решение матричных игр                            28  6. Пример решения матричной игры в смешанных стратегиях методом линейного программирования                                   30 7. Пример решения матричной игры в смешанных стратегиях с помощью  персонального компьютера (ПК)                            32  8. Решение статистических игр по различным критериям         39 9. Тестовые вопросы                                                                      44  10. Задачи контрольных заданий                                                   47       11. Рекомендуемая литература (основная и дополнительная) 48      Предмет и задачи теории игр. В процессе целенаправленной деятельности возникают ситуации, в которых интересы отдельных лиц (участников, групп, сторон), либо прямо противоположны (антагонистичны), либо, не будучи непримиримыми все же не совпадают. Простейшими и наиболее наглядными примерами таких ситуаций являются спортивные игры, споры, военные учения (маневры), борьба между блоками избирателей за своих кандидатов, в международных отношениях – отстаивания интересов своего государства и тому подобное. Здесь каждый из участников сознательно стремиться добиться наилучшего результата за счет другого участника. Подобные ситуации встречаются и в различных сферах производительной деятельности. Для указанных ситуаций (будем называть конфликтными) характерно, что активность решения, принимаемых в ходе конфликта каждой из сторон, существенно зависит от действия другой стороны. При этом ни одна из сторон не может полностью контролировать положение, т.к. и той и другой стороне решения приходится принимать в условиях неопределенности. Так, например, при определенном объеме выпуска продукции на одном предприятии нельзя не учитывать размеры выпуска аналогичной продукции на других предприятиях. В реальных условиях нередко возникают ситуации, в которых антагонизм отсутствует, но существуют противоположные тенденции. Например, для нормального функционирования производства, с одной стороны, необходимо наличие запасов разнообразных ресурсов, но с другой стороны, стремление к чрезвычайному увеличению этих запасов вызывает дополнительные затраты на их содержание и хранение. В этих примерах конфликтные ситуации возникли в результате сознательной деятельности людей. Однако на практике встречаются неопределенности, которые порождаются не сознательным противодействием другой стороны, а недостаточной информированностью об условиях проведения планируемых операций. Раздел математики, изучающий конфликтные ситуации называется теорией игр. Теория игр – это математическая теория конфликтных ситуаций, разрабатывающая рекомендации по наиболее рациональному образу действия каждого из участников в ходе конфликтной ситуации, т. е. таких действий, которые обеспечивали бы ему наилучший результат. Игровую схему можно предоставить различными ситуациями в экономике. Здесь выигрышем могут быть эффективность использования ресурсов, производительных фондов; величина прибыли; себестоимость. Чтобы проанализировать конфликтную ситуацию по ее математической модели, ситуацию необходимо упростить, учтя лишь важные факторы, существенно влияющие на ход конфликта. Отсюда, игра – это упрощенная математическая модель конфликтной ситуации, отличающаяся от реального конфликта тем, что ведется по определенным правилам. Поэтому можно сказать, что игра – это совокупность правил, определяющих возможные действия (чистые стратегии) участников игры. Суть игры состоит в том, что каждый из участников принимает такие решения в развивающейся конфликтной ситуации, которые, как он полагает, могут обеспечить ему наилучший исход. Исход игры – это значение некоторой функции, называемой функцией выигрыша (платежной функцией), которая может задаваться либо аналитическим выражением, либо таблично (матрицей). В дальнейшем будут рассматриваться только такие игры, в которых выигрыш выражается количественно: стоимостью, баллами и т.д. Величина выигрыша зависит от стратегии, применяемой игроком. Стратегия – это совокупность правил, однозначно определяющих последовательность действия игрока в каждой конкретной ситуации, складывающейся в процессе игры. Всякая игра состоит из отдельных партий. Партией называют каждый вариант реализации игры определенным образом. В свою очередь, в партии игроки совершают конкретные ходы. Ход – это выбор и реализация игроком одного из допускаемых вариантов. Ходы бывают личные и случайные. При личном ходе игрок самостоятельно и осознанно выбирает и реализует ту или иную чистую стратегию. Например, в шахматах каждый ход является личным. При случайном ходе выбор чистой стратегии будем производить с использованием, какого – либо механизма случайного выбора, например, с применением таблиц случайных чисел. Конфликтные ситуации, встречаются в практике и  порождают различные виды игр. Классифицировать игры можно по разным признакам: 1.  По количеству игроков А) может участвовать любое конечное число игроков; Б) если игроки объединяются в две группы, преследующие противоположные цели, то имеет место игра двух «лиц»(парная игра). 2. По количеству стратегий они делятся на : А) конечные; Б)бесконечные; 3. По характеру выигрышей: А) с нулевой суммой, когда общий капитал игроков не меняется, а лишь перераспределяется в ходе игры, в связи, с чем сумма выигрыша равна нулю (проигрыш принимается как отрицательный выигрыш); Б) не с нулевой суммой, когда сумма выигрыша отлична от нуля (при проведении лотерей часть взноса участников идет организаторам лотерей). 4. По виду функции выигрышей игры делятся на: А) матричные (при двух участниках выигрыши первого игрока задаются матрицей); Б) биматричные (выигрыш каждого игрока задается своей матрицей); 5. По количеству ходов игры делятся на: А) одноходовые (выигрыш распределяется после одного хода каждого игрока); Б) многоходовые (выигрыш распределяется после нескольких ходов). 6. По объему имеющейся информацией различают игры: А) с полной информацией; Б) с неполной информацией. Будем рассматривать только парные матричные игры с нулевой суммой. Игры, в которых участники стремятся добиться для себя наилучшего результата, сознательно выбирая допустимые правилами игры способы действия, называют иногда стратегическими.   В экономической практике нередко приходится формализовать (моделировать) ситуации, придавая им игровую схему, в которой один из участников безразличен к результату игры. Такие игры называют играми с природой, понимая под термином «природа» всю совокупность внешних обстоятельств, в которых сознательному игроку приходится принимать решение. Например: 1. выбор земельных участков для посева той или иной культуры в надежде получить наилучший урожай; 2. определение объема выпуска сезонной продукции в ожидании наиболее выгодного для ее реализации уровня спроса; 3. формирование пакетов ценных бумаг в расчете на высокие дивиденды и т.п. Здесь в качестве второго игрока выступает: в первом примере – в буквальном смысле природа; во втором – уровень спроса; в третьем – размеры ожидаемой прибыли. Такие игры принято называть статистическими. В играх с природой степень неопределенности для сознательного игрока возрастает. Если в стратегических играх каждый из участников постоянно ожидает наихудшего для себя обратного действия партнера, то в статистических играх «природа», будучи индеферентной в отношении выигрыша, может совершать ответные действия, которые ей совершенно безразличны, а выгодны сознательному игроку.

Матричные игры

Будем рассматривать игры, в которых у каждого из двух игроков А и В имеется конечное число возможных действий – чистых стратегий. Пусть игрок А располагает m чистыми стратегиями А12,…,Аm, а игрок В – n чистыми стратегиями В12,...,Вn.Чтобы игра была полностью определенной, необходимо указать, сопоставляющее каждой паре чистых стратегий Аiи Bj число аij– выигрыш игрока А за счет игрока В или проигрыш игрока В. Мы рассматриваем парные игры с нулевой суммой, в которых выигрыш одного игрока равен проигрышу другого. При аij< 0 игрок А платит игроку В сумму | аij|. Если игра состоит из личных ходов , то выбор пары чистых стратегий (Аi,Bj) единственным образом определяется исход (результат) игры. Если же в игре используются случайные ходы, то исход игры определяется средним значением выигрыша (математическим ожиданием). Если известно значение аijдля каждой пары (Аi,Bj) чистых стратегий, то можно составить матрицу игры – платежную матрицу, являющуюся табличной записью функции выигрыша .

 Таблица 1 Платежная матрица

 

Ai

                                    Bj

  a i

  B1   B2 Bn
  A1   a 11   a 12   a 1n   a 1
  A2   a 21   a 22   a 2n   a 2
  Am   a m1   a m2   a mn   a m
  b j   b 1   b 2   b n  

 

Напомним, что выигрыши могут быть выражены отрицательным числом (означает выигрыш игрока В). Такие игры называются прямоугольными, или матричными. Игрок А выбирает одну из строк платежной матрицы

(одну из своих чистых стратегий). Не зависимо от результата его выбора игрок В выбирает один из столбцов (свою чистую стратегию). Результат игры находится на пересечении строки столбца, которые определяют выигрыш игрока А (проигрыш игрока В) и наоборот, если аij< 0. При аij= 0 исход игры нулевой.

Пример 1 «Двухпальцевая игра Морра»

В нее играли в античные времена в Италии. Играют два человека: каждый из них показывает один или два пальца, и одновременно называют количество пальцев, которые, по его мнению, покажет его противник. Если один из игроков угадывает правильно, то он выигрывает сумму, равную суме пальцев, показанных им и его противником.

Символ | | 12 | | означает, что игрок показывает один палец и предполагает, что его противник показывает два пальца. Платежная матрица для этой игры будет иметь вид:

 

           | | 11 | | | | 12 | | | | 21 | | | | 22 | |     аi

| | 11 | |    0           2          -3        0        -3

| | 12 | |   -2           0          0         3         -2

| | 21 | |   3            0          0       -4         -4

| | 22 | |    0           -3         4         0         -3

bj3           2           4         3

 

В такой игре выигрыш одного игрока равен проигрышу другого и наоборот. Это игра с нулевой суммой.

 

Пример 2.Фирмы Ф1 и Ф2 производят однородный сезонный товар, пользующийся спросом в течении n единиц времени. Доход от продажи товара в единицу времени составляет С ден.ед.. Фирма Ф2, будучи более состоятельной, в ходе конкурентной борьбы, стремиться вытеснить фирму Ф1 с рынка сбыта, способствуя своими действиями минимизации ее дохода, не считаясь при этом с временными потерями части своего дохода. Уровень цены на товар зависит от его качества, и в данный момент реализуется тот товар, качество которого выше. Повышение качества требует дополнительных затрат времени на совершенствование технологии его изготовления, переналадки оборудования. В связи с этим будем предполагать, что качество товара тем выше, чем позже он поступит на рынок. Придадим созданной ситуации игровую схему и построим платежную матрицу.

Решение.Если фирма Ф1предложит свой товар в момент i , а фирма Ф2 в момент j>i , то фирма Ф1, не имея конкурента в течении (j-i) ед.времени, получит доход за этот период в С(j-i) ден.ед.. В момент j на рынок подойдет товар фирмы Ф2 более высокого качества и фирма Ф1 теряет рынок и доход не получает. Если j>i , то фирма Ф2 предлагает товар более высоко качества, будет единолично получать доход на отрезке от i до n, состоящая из (n-i+1) ед.времени. доход фирмы Ф2 на нем будет равен С(n-i+1) ден.ед.. Если i=j , то есть если на рынок поступает товар обеих фирм, то он реализуется с одинаковым спросом с доходом как фирма Ф1 так и фирмы Ф2 и будут составлять 0,5С(n-i+1) ден.ед..

А теперь формализуем  рассмотренную ситуацию в терминах теории игр. Фирмы Ф1и Ф2 приняты соответственно за игрока А и В. Через Аi(i= ) обозначим стратегию игрока в соответствии с которой он поставляет товар в i-тую единицу времени. Через Вj(j= )обозначим чистую стратегию игрока В, в соответствии с которой он поставит свой товар для реализации в i–тую единицу времени (i>j). Игрок В, выбирая i–тую единицу времени поставки своего товара, преследует цель минимизации дохода игрока А. Платежная матрица будет расчитываться согласно следующей функции:

aij=

Если n =5, то функцию можно записать следующей матрицей:

 

  В1 В2 В3 В4 В5
А1 2,5 С С 3,С
А2 С
А3 1,5С С
А4 С С
А5 С С С С 0,5С

 

Пример 3.Для отопление коттеджей в зимний период используется уголь , цена на который зависит от времени года и характера зимы. Летом тонна угля стоит 7,5 у.е., в мягкую зиму – 8,5 у.е., в обычную – 9,0 у.е., а в холодную – 9,5 у.е. расход угля в отопительный сезон полностью определяется характером зимы: на мягкую зиму достаточно 6 т. на обычною зиму требуется 7 т, а в холодную зиму расходуется 8 т. Затраты домовладельца зависят от количества запасенного им с лета угля. При рассмотрении возможного уровня запаса угля следует иметь в виде то, что при необходимости количества угля можно приобрести и зимой. Но надо учесть и то, что продать приобретенный уголь возможности не будет. Используя игровой подход, составим платежную матрицу.

Решение.Одним из участников рассматриваемой ситуации является домовладелец, озабоченный необходимостью заготовки определенного количества угля на предстоящий отопительный сезон. Если описанной ситуации придать игровую схему, то домовладелец выступает в ней в качестве сознательного игрока А, заинтересованного в минимизации затрат на приобретение угля. Вторым участником является природа (игрок П), которая подчиняется своим законам развития. Игрок П является инстанцией, безразличной к результатам тех или иных действий сознательного игрока А.

Заготавливая уголь летом , домовладелец может ориентироваться либо на мягкую (первая его чистая стратегия А1), либо на обычную (вторая чистая стратегия А2), либо на холодную (третья чистая стратегия А3), заказывая соответственно 6,7 и 8 тонн угля. Игрок П может осуществить либо мягкую зиму (первое его возможное состояние П1), либо обычную (второе его возможное состояние П2), либо холодную (третье возможное состояние П3), что потребует затрат 6,7 или 8 тонн угля соответственно. Платежная матрица, таким образом будет:

  Ai П1 (6) П2 (7) П3 (8) αi
А1 (6) -45 -54 -64 -64
А2 (7) -52,5 -52,5 -62 -62
А3 (8) -60 -60 -60 -60
j -45 -52,5 -60  

 

Приступаяк вычислению элементов aij платёжной матрицы, будем исходить из того, что элементы aij называют выигрышем игрока А, а наилучшим для игрока А считается стратегия, при которой выигрыш максимален. В данном случае плата домовладельца за уголь лишь условно может называться его «выигрышем», так как будет выражаться отрицательными числами, а наилучшей стратегией будет та стратегия, при которой затраты будут максимальными.

Элемент а11 соответствует ситуации (А11). Это наиболее благоприятный случай.

Домовладелец в расчете на мягкую зиму купил летом 6т угля, заплатив 6х 7,5 = 45д.ед. наступившая зима оказалась мягкой и потому дополнительных затрат не потребовалось. В ситуации (А12) т.е.когда домовладелец приобретает летом 6т угля в расчете на мягкую зиму, а зима оказалась обыкновенной поэтому пришлось дополнительно купить зимой 1т угля по цене 9 д.ед. и его расходы составили 45+9=54 д.ед.

В ситуации (А1; П3) общие расходы, с учетом холодной замы, составил 45+2х9,5=64 д.ед.

Рассуждая аналогично, находил и остальные элементы платежной матрицы. Равенство а21 = а22 =-52,5 и а3133 =-60 объясняется тем, что неизрасходованный на отопление уголь продать для возмещения лишних затрат возможности нет (по условиям задачи).

Пример 4. Известно, что на больших туристических дорогах большим успехом пользуются придорожные гостиницы, и пусть некоторый бизнесмен решает вложить свои сбережения в эксплуатацию такой гостиницы. Купив площадку на обочине дороги, он предполагает построить на этой площадке гостиницу со стоянкой. Но он не знает, сколько комнат в этой гостинице оборудовать: 20,30,40 или 50.

Но он знает, что:

1. Ежегодные затраты, не зависящие от числа построенных комнат S:

1 Благоустройство территории 100 т.д.ед.: Допускается, что постройка и благоустройство будут длиться в течении 10 лет, указанные затраты будут также погашаться 10 лет. Отсюда годовая часть затрат на первичное благоустройство составляют   10 т.д.ед.
 2 Затраты на ремонт и содержание: Допускается, что затраты составляют фиксированную величину, не зависящую от числа комнат. Эта фиксированная часть затрат в год равна     1,5 т.д.ед.
 3 Один ночной дежурный. Пусть вместе с различными премиями это составляет в год 6 т.д.ед.
 4 Один служащий для уборки. Пусть вместе с дополнительной оплатой в год   8 т.д.ед.
 5 Стоимость покупки площадки не учитывается, т.к. стоимость этой недвижимости полагается примерно равно капиталу, который она собой представляет, вложенному в банк с обычными процентами.   Нет
Итог Общая фиксированная сумма ежегодных затрат составляет   25,5 т.д.ед.

2. Ежегодные затраты, пропорциональные числу построенных комнат S (в т.д.ед.):

 

Виды затрат

S-количество построенных комнат

20 30 40 50
1 Постройка, благоустройство, мебелировка. Одна комната стоит 4 т.д.ед., и амортизация длится 10 лет, что дает при различных предположениях 80 120 160 200
2 На 10 комнат полагается одна горничная: Ежегодные затраты, включая дополнительные расходы, составляют 6 т.д.ед. на одну горничную 12 18 24 30
3 Содержание и ремонт (150 д.ед. на одну комнату в год). 3 4,5 6 7,5
4   Страхование на случай пожара, (25 д.ед. а комнату в год), откуда 0,5 0,75 1 1,25
  Итого: 95,5 143,25 191 238,75

 

3. Ежегодные затраты, пропорциональные среднему числу R, занятых комнат (тыс.д.ед.)

 

Виды затрат

R-количество занятых комнат

0 10 20 30 40 50
1 Стирка, уборка: 5 д.ед. в день на комнату (360 дн) 0 18 36 54 72 90
2 Электричество, газ и вода: 5 д.ед. в день на комнату 0 18 36 54 72 90
  Итого: 0 36 72 108 144 180

 

Доходы.

Пусть ежедневно стоимость комнаты R в гостинице составляет 60 д.ед. тогда доход будет выражаться в следующих суммах (тыс.д.ед.) (365 дн. в году)

 

R-среднее число занятых комнат

0 10 20 30 40 50
Доходы 0 219 438 657 876 1095

 

Придадим описанной ситуации игровую схему и построим платежную матрицу.

Решение: Одни м из участников рассматриваемой ситуации является бизнесмен, озабоченный заполняемостью гостиницы. Если описанной ситуации придать игровую схему, то бизнесмен выступает в качестве игрока А, заинтересованным в получении максимальной выручки от сдачи комнат. Вторым участником является природа (игрок П), подчиняющаяся своим законам развития.

Игрок А может ориентироваться на сдачу 20 комнат (первая чистая стратегия А1), 30 комнат (вторая чистая стратегия А2), 40 комнат (третья чистая стратегия А3), 50 комнат(четвертая часть стратегия А4).

Игрок П может реализовать шесть стратегий ( П (0); П (10); П (20); П (30); П (40); П (50)). Платежная матрица таким образом будет размером(4х6)

  П1(0) П2(10) П3(20) П4(30) П5(40) П6(50)
А1(20) -121 62 245 245 245 245
А2(30) -168,75 14,25 197,25 380,25 380,25 380,25
А3(40) -216,5 -33,5 149,5 332,5 515,5 515,5
А4(50) -264,5 -81,25 101,75 284,75 467,75 650,75

Элементы матрицы aijназываем выигрышем игрока А. Если aij< 0, то это означает, что игрок А терпит убытки.

Элемент a11 соответствует ситуации (А11). Это один из неблагоприятных случаев, когда в гостинице 20 номеров и не один не занят. Нет дохода. Расходы составляют (25,5+95,5 = 121) 121 тыс. д.ед.

В ситуации (А12) расходы составляют (25,5+95,5+36 = 157), а доходы 219, т.е. выручка составит 219 – 157 = 62 тыс.д.ед.

Элементы a13 = a14 = a15 =a16 = 245 тыс.д.ед., так как при чистой стратегии А1, т.е. имеющихся 20 комнатах спрос на 30,40 и 50 комнат не может быть удовлетворен[438-(25,5+95,5+72)] = 245 тыс.д.ед.

Рассуждая аналогично, находим и остальные элементы платежной матрицы.

Из матрицы видно, что построив гостиницу на 20 комнат можно заработать максимум, 245 тыс.д.ед., но есть риск потерпеть убытки в 121 тыс.д.ед.; для 30 комнат возможный доход выше, но и убыток становиться большим,ит.д.

Пример 5. В новом жилом районе создается ателье для ремонта в стационарных условиях не более 8 тыс. телевизоров в год. Для упрощения примем, что поток заявок на ремонт выражается  числами 2,4, 6, и 8 тыс. заявок в год.Опыт работы аналогичных предприятий показывает, что прибыль от ремонта одного телевизора в условиях ателье составляет 9 ден. ед.; потери вызванные отказом в ремонте ввиду недостатка мощностей – 5 ден. ед., а убытки от простоя специалистов и оборудования при отсутствии заявок - 6 ден.ед.

Дать рекомендации о мощности создаваемого ателье.

Решение. В качестве сознательного игрока А выступает орган, принимающий решение о мощности создаваемого ателье. Его стратегиями будут: А1 – решение об открытии ателье для ремонта на 2 тыс. телевизоров в год в стационарных условиях; А2 на 4 тыс., А3 на 6 тыс., А4 на 8 тыс. телевизоров в год.

В качестве второго игрока будем рассматривать совокупности всех внешних факторов, в которых формируется поток заявок на ремонт телевизоров в условиях ателье – природу П. природа может реализовать любое из четырех состояний:

П1 - поток состоит из 2 тыс. заявок, П2  - 4 тыс., П3 – 6 тыс., П4 – 8 тыс.

Описанная ситуация формализуется в статистическую игру размерности 4*4 и имеет вид:

Аi Пj П1(2) П2(4) П3(6) П4(8) vj Gi

А1(2)

18 8 -2 -12 -12 -6

А2(4)

6 36 26 16 6 12

А3(6)

-6 24 54 44 -6 6

А4(8)

-18 12 42 72 -18 0

Выигрыш игрока А – это значение совокупного показателя эффективности работы создаваемого ателье при любом стечении обстоятельств (Аi; Пj). Наиболее благоприятными будут комбинации ( А11), (А2 ; П2), (А3; П3) и (А4 ; П4), когда количество поступивших заявок в точности совпадает с возможностями ателье: все заявки будут удовлетворены и прибыль составит А11 =2*9=18тыс. ден. ед.; А22 =4*9=36 тыс. ден.ед.;

А33 =6*9= 54тыс.ден.ед.; А44 =8*9=72 тыс. ден.ед.

В ситуации ( А12) в ателье можно отремонтировать 2 тыс. телевизоров из 4тыс. заявленных. За это ателье получит 2*9=18 тыс.ден.ед. прибыли, а

2 тыс. останутся без удовлетворения. В этом случае потери составят 2*5=10 тыс.ден.ед.

Показатели эффективности работы ателье в этом случае А21 =2*9-2*5=8 тыс.ден.ед. вычислим еще один элемент, например П31 , соответствующий комбинации (А3; П1), когда ателье получит 2*9=18 тыс.ден.ед. прибыли, но вместе с тем несет убытки от простоя специалистов и оборудования в размере 6(6-2)=24тыс.ден.ед.

Совокупный показатель эффективности составит А31 =18-24=

-6тыс.ден.ед. Аналогично вычислены все остальные элементы матрицы.


Дата добавления: 2018-06-27; просмотров: 4395; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!