Метод конфигураций (метод Хука и Дживса)

Алгоритм включает в себя два основных этапа поиска.

а) В начале обследуется окрестность выбранной точки (базисной точки), в результате находится приемлемое направление спуска; б) Затем в этом направлении находится точка с наименьшим значением целевой функции. Таким образом находится новая базисная точка.

Эта процедура продолжается пока в окрестностях базисных точек удается находить приемлемые направления спуска.

Схема алгоритма

Шаг 1. Задаются начальное приближение (первая базисная точка)

начальный шаг h для поиска направления спуска, точность решения d(предельное значение для шага h). Присваивается к=0.

Шаг 2. (Первый этап).

Определяется направление минимизации целевой функции

f(x)=f(x⁽¹⁾,x⁽²⁾,…,x⁽ⁿ⁾) в базисной точке

. Для этого последовательно дают приращение переменным x⁽^j⁾ в точке х_к. Присвоим z=x_k. Циклически даем приращение переменным x⁽^j⁾ и формируем z⁽^j⁾=x_k⁽^j⁾+h, если f(z)<f(x_k), если же нет, то z⁽^j⁾=x_k⁽^j⁾-h, если f(z)<f(x_k), иначе z⁽^j⁾=x_k⁽^j⁾. Так для всех j(j=1,2,…,n).

Шаг 3. Если z=x_k, то есть не определилось подходящее направление, то обследование окрестности базисной точки х_к повторяется, но с меньшим шагом h (например, h=h/2).

Если h>d, то перейти к шагу 2, то есть повторить обследование точки х_к.

Если h£d, то поиск заканчивается, то есть достигнуто предельное значение для шага h и найти приемлемое направление спуска не удается. В этом случае полагается

Шаг 4. (Второй этап).

Если z¹x_k, то требуется найти новую базисную точку в направлении

вектора z-x_k: x_k₊₁=x_k + l(z-x_k), где l - коэффициент «ускорения поиска».

Определяется такое значение l=l_к, при котором достигается наименьшее значение целевой функции в выбранном направлении, то есть функции

f(x_k +l(z-x_k) = j(l).

В зависимости от способа выбора l_к возможны варианты метода:

а) l_к=l=const постоянная для всех итераций; б) задается начальное l₀=l, а далее l_к=l_к-1, если f(x_k₊₁)<f(x_k), иначе дробим l_к, пока не выполнится это условие; в) l_к определяется решением задачи одномерной минимизации функции j(l).

Таким образом определяется новая базисная точка x_k₊₁=x_k + l(z-x_k). Полагаем к=к+1 и поиск оптимального решения повторяется с шага 2.

Метод симплекса

Под симплексом понимается n-мерный выпуклый многогранник n-мерного пространства, имеющий n+1 вершину. Для n=2 это треугольник, а при n=3 это тетраэдр.

Идея метода состоит в сравнении значений функции в n+1 вершинах симплекса и перемещении симплекса в направлении лучшей точки. В рассматриваемом методе симплекс перемещается с помощью операций отражения. Далее принято следующее: х₀(k), х₁(k), … , х_n(k) – вершины симплекса, где к - номер итерации.

Схема алгоритма

Шаг 1. Построение начального симплекса.

Для этого задаются начальная точка х₀(0) и длина ребра симплекса l. Формируются остальные вершины симплекса:

x_i(0) = x₀(0) + l*e_i (i=1,2,…,n), где e_i – единичные векторы.

Шаг 2. Определение направления улучшения решения.

Для этого на к-й итерации вычисляются значения целевой функции в каждой точке симплекса. Пусть для всех i: f(x_min(k))£f(x_i(k))£f(x_max(k)), где min, max, i – номера соответствующих вершин симплекса. Опр–м центр тяжести всех точек, исключая точку x_max(k), C_k=(Sx_i(k))/n .

Тогда направление улучшения решения опр–ся вектором C_k-x_max(k).

Шаг 3. Построение отраженной точки.

Замена вершины x_max(k) с максимальным значением целевой функции на новую точку с помощью операции отражения, результатом которой является новая точка:

u_k=c_k+(c_k-x_max(k))=2c_k-x_max(k)

Шаг 4. Построение нового симплекса.

Вычисляем f(u_k). При этом возможен один из двух случаев:

а) f(u_k)<f(x_max(k); б) f(u_k)³f(x_max(k).

Случай а): вершина x_max заменяется на u_k, чем определяется набор вершин к+1-й итерации и к-я итерация заканчивается.

Случай б): в результате отражения получается новая точка u_k, значение функции в которой еще хуже, чем в точке x_max, то есть отражать симплекс некуда. Поэтому в этом случае производится пропорциональное уменьшение симплекса (например, в 2 раза) в сторону вершины x_min(k): x_i(k+1)=x^{^}_i=(x_i(k)+x_min(k))/2, где i=0,1,…,n.

На этом к-я итерация заканчивается.

Шаг 5. Проверка сходимости.

Если

то поиск минимума заканчивается и полагается

В противном случае к=к+1 и происходит переход к шагу 2.

Метод деформируемого симплекса (метод Нелдера – Мида)

Метод деформируемого симплекса обладает большей общностью и позволяет учитывать локальные свойства поверхности целевой функции. Симплексы вытягиваются в направлении наклона поверхности, их оси поворачиваются при встрече с оврагом на поверхности целевой функции, вблизи минимума они сжимаются.

В рассматриваемом методе симплекс перемещается с помощью трех основных операций над симплексом: отражение, растяжение и сжатие.

Схема алгоритма.

Шаг 1. Построение начального симплекса.

Задаются начальная точка х₀(0) и длина ребра l. Формируются остальные вершины симплекса: x_i(0)=x₀(0)+le_i (i=1,2,…,n), где e_i – единичные векторы.

Шаг 2. Определение направления улучшения решения.

Для этого на каждой итерации вычисляются значения целевой функции в каждой вершине симплекса. Пусть для всех i

f(x_min(k))≤ f(x_i(k)) ≤ f(x_m(k)) ≤ f(x_max(k)),

где min, m, max, i-номера соответствующих вершин симплекса. Определим центр тяжести всех точек, исключая точку x_max(k),

Тогда направление улучшения решения определяется векторов C_k- x_max(k).

Шаг 3. Построение нового симплекса.

Замена вершины x_max(k) с максимальным значением целевой функции на новую точку с помощью операции отражения, результат которой является новая точка

u_k=C_k+a*(C_k-x_max(k)), где a-коэффициент отражения.

Шаг 4. Построение нового симплекса.

Вычисляем f(u_k), при этом возможно один из трех случаев:

а) f(u_k)< f(x_min(k));

б) f(u_k)>f(x_m(k));

в) f(x_min(k))≤ f(u_k) ≤ f(x_m(k));

Случай а): отражённая точка является точкой с наилучшим значением целевой функции. Поэтому направление отражение является перспективным и можно попытаться растянуть симплекс в этом направлении. Для этого строиться точка

V_k= C_k+b*(u_k-C_k), где b>1 –коэффициент расширения.

Если f(v_k)<f(u_k), то вершина x_max(k) заменяется на v_k, в противном случае на u_k и k-ая итерация заканчивается.

Случай б): в результате отражения получается новая точка u_k, которая, если заменить x_max(k), сама станет наихудшей. Поэтому в этом случае производится сжатие симплекса. Для этого строится точка v_k:

где 0<g<1 –коэффициент сжатия.

Если f(v_k)<min{f(x_max(k)),f(u_k)}, то вершина x_max(k) заменяется на v_k .

В противном случае вершинам x_i(k+1) (i=0,1,2,..,n) присваивается значение:

и на этом k-ая итерация заканчивается.

в) вершина x_max(k) заменяется на u_k, чем определяется набор вершин k+1-й итерации и k –ая итерация заканчивается.

Шаг 5.

Проверка сходимости. Если

то поиск минимума заканчивается и полагается

В противном случае к=к+1 и происходит переход к шагу 2.

Опыт использования описанного алгоритма показывает, что целесообразно брать следующие значения параметров: a=1, b=2, g=0.5.

Метод Ньютона

В методе Ньютона последовательность точек спуска определяется формулой (4). Для текущей точки x_k направление и величина спуска определяется вектором p_k = – (f ''(x_k))^–1·f '(x_k). Хотя в определении вектора p_k фигурирует обратная к f ''(x_k) матрица (f ''(x_k))^–1, на практике нет необходимости вычислять последнюю, так как направление спуска p_k можно найти как решение системы линейных уравнений

f ''(x_k)·p_k = – f '(x_k) (5) каким-нибудь из методов.

Схема алгоритма.

шаг 1:

На первой итерации, при k = 0, вводятся начальное приближение x₀ и условие останова ε₃. Вычисляются градиент f '(x₀) и матрица f ''(x₀).

шаг 2:

Определяется направление спуска p_k, как решение системы линейных уравнений f ''(x_k)·p_k = – f '(x_k) ( например, методом исключений Гаусса).

шаг 3:

Определяется следующая точка спуска:x_k₊₁ = x_k + p_k.

шаг 4:

Вычисляются в этой точке x_k+1 градиент f '(x_k+1) и матрица f ''(x_k+1).

шаг 5:

Если ||f '(x_k+1)|| £ ε₃, то поиск на этом заканчивается и полагается x = x_k+1 и y = f(x_k+1). Иначе k = k + 1 и переход к шагу 2.

Особенностью метода Ньютона является то, что для квадратичной целевой функции он находит минимум за один шаг, независимо от начального приближения x₀ и степени овражности.

В общем случае, когда минимизируемая функция не квадратична, вектор p_k = – (f ''(x_k))^–1·f '(x_k) не указывает в точку её минимума, однако имеет большую составляющую вдоль оси оврага и значительно ближе к направлению на минимум, чем антиградиент. Этим и объясняется более высокая сходимость метода Ньютона по сравнению с градиентными методами при минимизации овражных целевых функций.

Недостатками метода Ньютона является то, что он, во-первых, предполагает вычисление вторых производных и, во-вторых, может расходиться, если начальное приближение находится слишком далеко от минимума.

Методы с регулировкой шага (методы Ньютона – Рафсона)

Удачный выбор начального приближения x₀ гарантирует сходимость метода Ньютона. Однако отыскание подходящего начального приближения – далеко не простая задача. Поэтому необходимо как-то изменить формулу (4), чтобы добиться сходимости независимо от начального приближения. Доказано, что в некоторых предположениях для этого достаточно в методе Ньютона кроме направления движения (f ''(x))^–1·f '(x) выбирать и длину шага вдоль него. Такие алгоритмы называются методами Ньютона с регулировкой шага (методами Ньютона – Рафсона) и выглядят так:

x_k+1 = x_k – a_k(f ''(x_k))^–1·f '(x_k). (6)

Как и в градиентных методах величина a_k выбирается так, чтобы обеспечить убывание целевой функции на каждой итерации. Мы рассмотрим два способа выбора шага a_k. Первый из них связан с проверкой неравенства

f(x_k + a_kp_k ) – f(x_k) £ d·a_k(f '(x_k), p_k), (7)

где p_k = – (f ''(x_k))^–1·f '(x_k) – направление спуска, а 0 < d < ½ – некоторое заданное число, общее для всех итераций. Если это неравенство выполнено при a_k= 1, то шаг принимается равным единице и осуществляется следующая итерация. Если нет – дробится до тех пор, пока оно не выполнится.

Схема метода Ньютона – Рафсона с дроблением шага.

шаг 1:

На первой итерации, при k = 0, вводятся исходные данные x_0, d, ε₃. Вычисляются значения градиента f '(x₀) и матрица f ''(x₀).

шаг 2:

Присваивается a = 1. Определяется направление спуска p_k, как решение системы линейных уравнений f ''(x_k)·p_k = – f '(x_k).

шаг 3:

Проверяется условие f(x_k + a_kp_k ) – f(x_k) £ d·a_k(f '(x_k), p_k). Если выполняется, то переход к шагу 4.Иначе дробим значение шага a (например, a = a/2) и повторяем шаг 3.

шаг 4:

Определяется следующая точка: x_k₊₁ = x_k + a·p_k.

шаг 5:

Вычисляются значение градиента f '(x_k+1) в точке x_k+1.

шаг 6:

Если ||f '(x_k+1)|| £ ε₃, то поиск на этом заканчивается и полагается x = x_k+1 и y = f(x_k+1). Иначе k = k + 1 и переход к шагу 2.

Второй метод определения шага a_k в схеме (6), как и в методе наискорейшего спуска состоит в минимизации функции

f(x_k + a_kp_k ) = min f(x_k + a_kp_k ).

Схема метода Ньютона – Рафсона с выбором оптимального шага. α≥0

шаг 1:

При k = 0, вводятся x₀, ε₃. Вычисляются f '(x₀) и f ''(x₀).

шаг 2:

Определение направления спуска p_k, как решение системы линейных уравнений f ''(x_k)·p_k = – f '(x_k).

шаг 3:

Определяется следующая точка спуска: x_k₊₁ = x_k + ap_k, где a - решение задачи одномерной оптимизации: min f(x_k + ap_k ).

шаг 4:

Вычисляются в точке x_k+1: f '(x_k+1) и f ''(x_k+1).

шаг 5:

Если ||f '(x_k+1)|| £ ε₃, то поиск заканчивается и полагается x = x_k+1 и y = f(x_k+1). α≥0 Иначе k = k + 1 и переход к шагу 2.

Модификации метода Ньютона

Значительные трудности, возникающие при практической реализации метода Ньютона, связаны с необходимостью вычислить матрицу f ''(x). Мы рассмотрим две модификации метода Ньютона, которые используют не точные значения, а некоторые приближённые аналоги матрицы вторых производных. В результате уменьшается трудоёмкость методов, но, конечно, ухудшается их сходимость.

В качестве первой модификации метода Ньютона рассмотрим следующий алгоритм:

x_k+1 = x_k – a_k(f ''(x_k))^–1·f '(x_k), a_k ≥ 0. (8)

здесь для построения направления спуска используется один раз вычисленная и обращённая матрица вторых производных f ''(x₀).

Схема модификации I метода Ньютона.

шаг 1:

При k = 0, вводятся x₀, ε₃. Вычисляются f '(x₀) и f ''(x₀).

шаг 2:

Определение обратной матрицы (f ''(x₀))^–1.

шаг 3:

Определение направления спуска p_k:p_k = – f '(x_k)·(f ''(x₀))^–1.

шаг 4:

Определение следующей точки: x_k₊₁ = x_k + a·p_k, где a – решение задачи одномерной минимизации функции φ(a) = f(x_k + a·p_k), при a ≥ 0.

шаг 5:

Вычисление в точке x_k+1.градиента f '(x_k+1)

шаг 6:

Если ||f '(x_k+1)|| £ ε₃, то поиск заканчивается и полагается x = x_k+1 и y = f(x_k+1). Иначе k = k + 1 и переход к шагу 3.

В рассмотренной схеме для выбора шага a_k используется способ аналогичный исп–му в методе наискорейшего спуска. Но можно было бы воспользоваться и способом аналогичным используемому в градиентном методе с дроблением шага.

Если матрица f ''(x) положительно определена, то итерационный процесс (d) является одной одной из модификаций градиентного спуска, независимо от начального приближения x₀.

Дата добавления: 2018-08-06; просмотров: 619; Мы поможем в написании вашей работы!

Поделиться с друзьями:

⇐ Предыдущая 1 234 Следующая ⇒

Мы поможем в написании ваших работ!