Постановка задачи динамического программирования
Функция Беллмана.
В начальный момент времени система находится в состоянии S0.
На 1-м шаге под действием переменной управления x1 система переходит из состояния S0 в состояние S1, то есть S1=S1(S0,x1).
Целевая функция (ЦФ) равна F1(S0,x1).
На 2-м шаге система переходит в состояние S2, то есть S2=S2(S1,x2).
ЦФ - F2(S1,x2).
На 3-м шаге система переходит в состояние S3, то есть S3=S3(S2,x3)
ЦФ - F3(S2,x3).
На последнем n-м шаге под действием переменной управления хп система переходит из состояния Sn–1 в состояние Sn, Sn=Sn(Sn-1,xn).
ЦФ - Fn(Sn-1,xn).
X=(x1,x2,...,xn) - управление, переводящее систему за n шагов из начального состояния S0 в конечное состояние Sn.
ЦФ на k-м шаге Fk(Sk-1,xk)(k=1,2,...n)- функция Беллмана.
2. Определить оптимальные варианты из множества решений, заданных матрицей решений с использованием критерия Гурвица ZHW. При решении задачи учесть, что степень доверия к позиции крайней осторожности ZMM должна быть не более 0.3
По условию - это степень доверия к позиции крайней осторожности ZMM, или вероятность (коэффициент) возникновения минимаксного критерия, описанного в первой задаче ZMM.
Возьмем , тогда - это степень доверия к позиции критерия азартного игрока ZAG
Критерий Гурвица ZHW можно представить в виде:
ZHW= ZMM+ ZAG, а в этой задаче с коэффициентами ZHW= cZMM+ (1-c)ZAG
Решение (считается построчно):
а.) Минимальный (min) элемент строки умножается на 0.3 а максимальный элемент строки умножается на 0.7
|
|
б.) Результаты умножений складываются и записываются в дополнительный столбец
Вычисление:
e1r=(-3)*0.3+7*0.7=4
e2r=(-1)*0.3+6*0.7=3.9
e3r=(-3)*0.3+11*0.7=6.8
e4r=1*0.3+7*0.7=5.2
г.) Выбирается максимальное значение дополнительного столбца (max) – это и есть ответ.
Ответ:
Дата добавления: 2018-04-15; просмотров: 430; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!