Пример 3.4. Преобразование к виду суммы квадратов



Рассмотрим функцию

f(x) = 4x + 3x  – 4x x + x

и преобразование

x = z + ½ z , x = z ,

или

Преобразованная квадратичная функция принимает следующий вид:

f(z)= 4z + 2z + z + ½ z .

Заметим, что это преобразование не является единственным, поскольку система векторов t  не удовлетворяет условию ортонормированности. В частности, нетрудно проверить, что преобразование

также приводит матрицу квадратичной формы к диагональному, виду. Задавая начальную точку x = [0, 0] и два столбца матрицы преобразования

t = [1, 0] , t = [½, 1] ,

можно найти точку оптимума [ , ]T в результате проведения двух последовательных поисков в направлениях t  и t  Поиск в направлении t  по формуле

x = x + λt

позволяет получить значение λ =  и точку х(1) =[ , 0] . Далее из точки х(1) проводится поиск в направлении t2. Получаем значение λ =  и решение х(2) = [ , ]T.

Из рассмотренного примера и предыдущего изложения следует, что если система векторов t , j = 1,...,N, или система сопряженных направлений, построена, то точку оптимума квадратичной функции можно найти в результате реализации в точности N одномерных поисков, которые проводятся вдоль каждого из N направлений t , j = 1,...,N. Таким образом, нерешенными остаются лишь вопросы, связанные с построением системы векторов t . Если матрица С известна, то матрицу преобразования Т можно найти с помощью метода Гаусса — Жордана (как это выполнено в приложении А). Метод Гаусса — Жордана позволяет представить матрицу С в виде произведения

C = PTDP, откуда                                      (3.30)

(P ) C(P ) = D и T = P                          (3.31)

Однако матрица С (или ее оценка) в данном случае неизвестна, по­скольку речь идет о построении метода решения задач безусловной оптимизации с целевой функцией f(x), при реализации которого используются только значения функции и не используются значе­ния первых и тем более вторых производных. Тем не менее и в этом случае можно определить систему сопряженных направлений на основе следующего элементарного свойства квадратичных функ­ций.

Свойство параллельного подпространства

Пусть заданы квадратичная функция q(x), две произвольные не­совпадающие точки x(1) и х(2),а также направление d. Если точка y(1) минимизирует q(x(1)+λd), a точка y(2) минимизирует q(x(1)+ λd), то направление (y(2) - y(1)) сопряжено с d.

Рис. 3.10 иллюстрирует сформулированное свойство для случая двух переменных. Нетрудно видеть, что поиск, проводимый из точки y(1) или y(2) в направлении (y(2) - y(1)), обеспечивает получение точки минимума. Таким образом, в случае двух переменных реализация трех одномерных поисков позволяет построить систему сопряженных направлений и, кроме того, найти точку оптимума квадратичной функции. Прежде чем продолжать алгоритмические построения, докажем теорему о свойстве параллельного подпространства.


Рис. 3.10. Сопряженные направления на плоскости.

Напомним, что по определению С-сопряженные направления задаются системой вектор-столбцов матрицы Т, которая приводит матрицу С к диагональному виду:

Т CТ = D                                                (3.32)

Поскольку все внедиагональные элементыD равны нулю, отсюда следует, что

         (3.33)

где t  i-й столбец матрицы Т. Таким образом, мы получили возможность дать более удобное, эквивалентное и, по-видимому, более конструктивное определение сопряженности направлений.

 

Сопряженные направления

Пусть С — симметрическая матрица порядка N N; направления s(1), s(2), s(3),..., s , r ≤ N,называются С-сопряженными, если эти направления линейно независимы и

s Cs = для всех i ≠ j.                        (3.34)

Опять обратимся к квадратичной функции общего вида

q(x) = a + bTx+(1/t)xTCx.

Точки прямой, исходящей из х(1) в направлении d, задаются формулой

x = x +λd.

Минимум q(x) вдоль направления d определяется путем нахождения значения λ*, при котором q/ λ=0. Вычислим эту производную по правилу дифференцирования сложной функции:

= = b + x Cd.                    (3.35)


По предположению теоремы минимум достигается в точке y(1) следовательно,

[(y(1) ) C b  ] d = 0.                             (3.36)

Аналогично, так как минимум q(x) при движении из точки х(2) в направлении d достигается в точке y(2) имеем

[(y(2) ) C b  ] d = 0.                                  (3.37)

Вычитая (3.36) из (3.37), получаем

(y(2) - y(1) ) Cd = 0                                          (3.38)

В соответствии с данным выше определением направления d и (y(2) - y(1) ) оказываются С-сопряженными, и свойство параллельного подпространства для квадратичных функций доказано.


Дата добавления: 2018-06-01; просмотров: 374; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!