Постановка задачи динамического программирования

Функция Беллмана.

В начальный момент времени система находится в состоянии S0.

На 1-м шаге под действием переменной управления x1 система переходит из состояния S0 в состояние S1, то есть S1=S1(S0,x1).

Целевая функция (ЦФ) равна F1(S0,x1).

На 2-м шаге система переходит в состояние S2, то есть S2=S2(S1,x2).

ЦФ - F2(S1,x2).

На 3-м шаге система переходит в состояние S3, то есть S3=S3(S2,x3)

ЦФ - F3(S2,x3).

На последнем n-м шаге под действием переменной управления хп система переходит из состояния Sn–1 в состояние Sn, Sn=Sn(Sn-1,xn).

ЦФ - Fn(Sn-1,xn).

X=(x1,x2,...,xn) - управление, переводящее систему за n шагов из начального состояния S0 в конечное состояние Sn.

ЦФ на k-м шаге Fk(Sk-1,xk)(k=1,2,...n)- функция Беллмана.

2. Определить оптимальные варианты из множества решений, заданных матрицей решений с использованием критерия Гурвица Z_HW. При решении задачи учесть, что степень доверия к позиции крайней осторожности Z_MM должна быть не более 0.3

По условию - это степень доверия к позиции крайней осторожности Z_MM, или вероятность (коэффициент) возникновения минимаксного критерия, описанного в первой задаче Z_MM_.

Возьмем , тогда - это степень доверия к позиции критерия азартного игрока Z_AG

Критерий Гурвица Z_HW можно представить в виде:

Z_HW₌ Z_MM₊ Z_AG_, а в этой задаче с коэффициентами Z_HW₌ cZ_MM₊ (1-c)Z_AG

Решение (считается построчно):

а.) Минимальный (min) элемент строки умножается на 0.3 а максимальный элемент строки умножается на 0.7

б.) Результаты умножений складываются и записываются в дополнительный столбец

Вычисление:

e₁_r=(-3)*0.3+7*0.7=4

e₂_r=(-1)*0.3+6*0.7=3.9

e₃_r=(-3)*0.3+11*0.7=6.8

e₄_r=1*0.3+7*0.7=5.2

г.) Выбирается максимальное значение дополнительного столбца (max) – это и есть ответ.

Ответ:

Дата добавления: 2018-04-15; просмотров: 430; Мы поможем в написании вашей работы!

Поделиться с друзьями:

⇐ Предыдущая 12

Мы поможем в написании ваших работ!