Критерий Ходжа-Лемана



1) Предположим, что матрицей выигрышей игрока А является матрица А.

2) Известны вероятности q i= p (Пj), j =1,…, n, состояний природы Пj, j =1,…, n, удовлетворяющие условию (1).

Таким образом, игроку А надлежит принимать решение в условиях риска.

3) Пусть l =2,

(11)

· показатель эффективности стратегии Аi по критерию Вальда,

(12)

· показатель эффективности стратегии Аi по критерию Байеса.

Матрица В примет вид

В =

т.е. bi 1= Wi, bi 2= Bi, i =1,…, m.

4) Коэффициенты l1, l2 выбираются следующим образом:

l1=1-l, l2=l, где lÎ[0, 1]. (13)

Очевидно, что эти коэффициенты удовлетворяют условию (2).

5) По формуле (3), с учетом (11), (12), и (13), показатель эффективности стратегии Аi по критерию Ходжа-Лемана равен:

Gi=libi1 + l2bi2= (1 -l) Wi + lBi= (1- l) aij+l qiaj i =1,…, m. (14)
   

В правой части формулы (14) коэффициент l Î[0, 1] есть количественный показатель степени доверия игрока А данному распределению вероятностей qi = p (Пj), j =1,…,n, состояний природы Пj, j =1,…, n, а коэффициент (1- l) характеризует количественно степень пессимизма игрока А. Чем больше доверия игрока А данному распределению вероятностей состояний природы, тем меньше пессимизма и наоборот.

6) Цену игры по критерию Ходжа-Лемана находим по формуле (4):

7) Оптимальной стратегией по критерию Ходжа-Лемана является стратегия Аk с наибольшим показателем эффективности:

Gk = G.

Отметим, что критерий Ходжа-Лемана является как-бы промежуточным критерием между критериями Байеса и Вальда. При l =1, из (14) имеем: Gi = Bi и потому критерий Ходжа-Лемана превращается в критерий Байеса. А при l =0, из (14): Gi = Wi и, следовательно, из критерия Ходжа-Лемана получаем критерий Вальда.

Пример.

Исходная матрица

  q=0,4 П1 q=0,3 П2 q=0,1 П3 q=0,2 П4
S1        
S2        

Далее используя формулы –

матрица выигрышей

матрица потерь

каждый элемент в столбце на соответствующий коэффициент q. Получим следующую таблицу:

 

Vi1*q1 Vi2*q2 Vi3*q3 Vi4*q4  

 

2,4 0,9 0,8 0,5 4,6
1,6 0,9 1,2 0,5 4,2

Принимая =0,6

Получим итоговые данные, для выйгрыша выберем макс. Элемент, для потерь – мин.

 

HL(выйгрыш) HL (потеря)
4,02 5,22
3,66 4,86

 

 

Получаем следующий ответ: S*=S1, V*=4,02 - выигрыш

S*=S2, V*=4,86 - потеря

 


Дата добавления: 2015-12-21; просмотров: 151; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!