Постановка задачи динамического программирования



Функция Беллмана.

В начальный момент времени система находится в состоянии S0.

На 1-м шаге под действием переменной управления x1 система переходит из состояния S0 в состояние S1, то есть S1=S1(S0,x1).

Целевая функция (ЦФ) равна F1(S0,x1).

На 2-м шаге система переходит в состояние S2, то есть S2=S2(S1,x2).

ЦФ - F2(S1,x2).

На 3-м шаге система переходит в состояние S3, то есть S3=S3(S2,x3)

ЦФ - F3(S2,x3).

На последнем n-м шаге под действием переменной управления хп система переходит из состояния Sn–1 в состояние Sn, Sn=Sn(Sn-1,xn).

ЦФ - Fn(Sn-1,xn).

X=(x1,x2,...,xn) - управление, переводящее систему за n шагов из начального состояния S0 в конечное состояние Sn.

ЦФ на k-м шаге Fk(Sk-1,xk)(k=1,2,...n)- функция Беллмана.

 

2. Определить оптимальные варианты из множества решений, заданных матрицей решений с использованием критерия Гурвица ZHW. При решении задачи учесть, что степень доверия к позиции крайней осторожности ZMM должна быть не более 0.3

 

 

 

По условию     - это степень доверия к позиции крайней осторожности ZMM, или вероятность (коэффициент) возникновения минимаксного критерия, описанного в первой задаче ZMM.

Возьмем , тогда  - это степень доверия к позиции критерия азартного игрока ZAG

Критерий Гурвица ZHW можно представить в виде:

 ZHW= ZMM+ ZAG,  а в этой задаче с коэффициентами ZHW= cZMM+ (1-c)ZAG

 

Решение (считается построчно):

а.) Минимальный (min) элемент строки умножается на 0.3 а максимальный элемент строки умножается на 0.7

б.) Результаты умножений складываются и записываются в дополнительный столбец

 

Вычисление:

 

e1r=(-3)*0.3+7*0.7=4

e2r=(-1)*0.3+6*0.7=3.9

e3r=(-3)*0.3+11*0.7=6.8

4r=1*0.3+7*0.7=5.2

 

 

 

г.) Выбирается максимальное значение дополнительного столбца (max) – это и есть ответ.

 

 

Ответ:

 


Дата добавления: 2018-04-15; просмотров: 430; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!