Критерий Ходжа-Лемана
1) Предположим, что матрицей выигрышей игрока А является матрица А.
2) Известны вероятности q i= p (Пj), j =1,…, n, состояний природы Пj, j =1,…, n, удовлетворяющие условию (1).
Таким образом, игроку А надлежит принимать решение в условиях риска.
3) Пусть l =2,
(11) |
· показатель эффективности стратегии Аi по критерию Вальда,
(12) |
· показатель эффективности стратегии Аi по критерию Байеса.
Матрица В примет вид
В = |
т.е. bi 1= Wi, bi 2= Bi, i =1,…, m.
4) Коэффициенты l1, l2 выбираются следующим образом:
l1=1-l, l2=l, где lÎ[0, 1]. | (13) |
Очевидно, что эти коэффициенты удовлетворяют условию (2).
5) По формуле (3), с учетом (11), (12), и (13), показатель эффективности стратегии Аi по критерию Ходжа-Лемана равен:
Gi=libi1 + l2bi2= (1 -l) Wi + lBi= (1- l) aij+l qiaj i =1,…, m. | (14) |
В правой части формулы (14) коэффициент l Î[0, 1] есть количественный показатель степени доверия игрока А данному распределению вероятностей qi = p (Пj), j =1,…,n, состояний природы Пj, j =1,…, n, а коэффициент (1- l) характеризует количественно степень пессимизма игрока А. Чем больше доверия игрока А данному распределению вероятностей состояний природы, тем меньше пессимизма и наоборот.
6) Цену игры по критерию Ходжа-Лемана находим по формуле (4):
7) Оптимальной стратегией по критерию Ходжа-Лемана является стратегия Аk с наибольшим показателем эффективности:
Gk = G.
Отметим, что критерий Ходжа-Лемана является как-бы промежуточным критерием между критериями Байеса и Вальда. При l =1, из (14) имеем: Gi = Bi и потому критерий Ходжа-Лемана превращается в критерий Байеса. А при l =0, из (14): Gi = Wi и, следовательно, из критерия Ходжа-Лемана получаем критерий Вальда.
|
|
Пример.
Исходная матрица
q=0,4 П1 | q=0,3 П2 | q=0,1 П3 | q=0,2 П4 | |
S1 | ||||
S2 |
Далее используя формулы –
матрица выигрышей
матрица потерь
каждый элемент в столбце на соответствующий коэффициент q. Получим следующую таблицу:
Vi1*q1 | Vi2*q2 | Vi3*q3 | Vi4*q4 |
| |
2,4 | 0,9 | 0,8 | 0,5 | 4,6 | |
1,6 | 0,9 | 1,2 | 0,5 | 4,2 |
Принимая =0,6
Получим итоговые данные, для выйгрыша выберем макс. Элемент, для потерь – мин.
HL(выйгрыш) | HL (потеря) |
4,02 | 5,22 |
3,66 | 4,86 |
Получаем следующий ответ: S*=S1, V*=4,02 - выигрыш
S*=S2, V*=4,86 - потеря
Дата добавления: 2015-12-21; просмотров: 151; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!