Пример 3.4. Преобразование к виду суммы квадратов

Рассмотрим функцию

f(x) = 4x + 3x – 4x x + x

и преобразование

x = z + ½ z , x = z ,

или

Преобразованная квадратичная функция принимает следующий вид:

f(z)= 4z + 2z + z + ½ z .

Заметим, что это преобразование не является единственным, поскольку система векторов t не удовлетворяет условию ортонормированности. В частности, нетрудно проверить, что преобразование

также приводит матрицу квадратичной формы к диагональному, виду. Задавая начальную точку x = [0, 0] и два столбца матрицы преобразования

t = [1, 0] , t = [½, 1] ,

можно найти точку оптимума [– ,– ]^T в результате проведения двух последовательных поисков в направлениях t и t Поиск в направлении t по формуле

x = x + λt

позволяет получить значение λ = – и точку х⁽¹⁾ =[– , 0] . Далее из точки х⁽¹⁾ проводится поиск в направлении t₂. Получаем значение λ = – и решение х⁽²⁾ = [– ,– ]^T.

Из рассмотренного примера и предыдущего изложения следует, что если система векторов t , j = 1,...,N, или система сопряженных направлений, построена, то точку оптимума квадратичной функции можно найти в результате реализации в точности N одномерных поисков, которые проводятся вдоль каждого из N направлений t , j = 1,...,N. Таким образом, нерешенными остаются лишь вопросы, связанные с построением системы векторов t . Если матрица С известна, то матрицу преобразования Т можно найти с помощью метода Гаусса — Жордана (как это выполнено в приложении А). Метод Гаусса — Жордана позволяет представить матрицу С в виде произведения

C = P^TDP, откуда (3.30)

(P ) C(P ) = D и T = P (3.31)

Однако матрица С (или ее оценка) в данном случае неизвестна, поскольку речь идет о построении метода решения задач безусловной оптимизации с целевой функцией f(x), при реализации которого используются только значения функции и не используются значения первых и тем более вторых производных. Тем не менее и в этом случае можно определить систему сопряженных направлений на основе следующего элементарного свойства квадратичных функций.

Свойство параллельного подпространства

Пусть заданы квадратичная функция q(x), две произвольные несовпадающие точки x⁽¹⁾ и х⁽²⁾,а также направление d. Если точка y⁽¹⁾ минимизирует q(x⁽¹⁾+λd), a точка y⁽²⁾ минимизирует q(x⁽¹⁾+ λd), то направление (y⁽²⁾ - y⁽¹⁾) сопряжено с d.

Рис. 3.10 иллюстрирует сформулированное свойство для случая двух переменных. Нетрудно видеть, что поиск, проводимый из точки y⁽¹⁾ или y⁽²⁾ в направлении (y⁽²⁾ - y⁽¹⁾), обеспечивает получение точки минимума. Таким образом, в случае двух переменных реализация трех одномерных поисков позволяет построить систему сопряженных направлений и, кроме того, найти точку оптимума квадратичной функции. Прежде чем продолжать алгоритмические построения, докажем теорему о свойстве параллельного подпространства.

Рис. 3.10. Сопряженные направления на плоскости.

Напомним, что по определению С-сопряженные направления задаются системой вектор-столбцов матрицы Т, которая приводит матрицу С к диагональному виду:

Т CТ = D (3.32)

Поскольку все внедиагональные элементыD равны нулю, отсюда следует, что

(3.33)

где t — i-й столбец матрицы Т. Таким образом, мы получили возможность дать более удобное, эквивалентное и, по-видимому, более конструктивное определение сопряженности направлений.

Сопряженные направления

Пусть С — симметрическая матрица порядка N N; направления s⁽¹⁾, s⁽²⁾, s⁽³⁾,..., s , r ≤ N,называются С-сопряженными, если эти направления линейно независимы и

s Cs = для всех i ≠ j. (3.34)

Опять обратимся к квадратичной функции общего вида

q(x) = a + b^Tx+(¹/_t)x^TCx.

Точки прямой, исходящей из х⁽¹⁾ в направлении d, задаются формулой

x = x +λd.

Минимум q(x) вдоль направления d определяется путем нахождения значения λ*, при котором q/ λ=0. Вычислим эту производную по правилу дифференцирования сложной функции:

= = b + x Cd. (3.35)

По предположению теоремы минимум достигается в точке y⁽¹⁾ следовательно,

[(y⁽¹⁾ ) C b ] d = 0. (3.36)

Аналогично, так как минимум q(x) при движении из точки х⁽²⁾ в направлении d достигается в точке y⁽²⁾ имеем

[(y⁽²⁾ ) C b ] d = 0. (3.37)

Вычитая (3.36) из (3.37), получаем

(y⁽²⁾ - y⁽¹⁾ ) Cd = 0 (3.38)

В соответствии с данным выше определением направления d и (y⁽²⁾ - y⁽¹⁾ ) оказываются С-сопряженными, и свойство параллельного подпространства для квадратичных функций доказано.

Дата добавления: 2018-06-01; просмотров: 374; Мы поможем в написании вашей работы!

Поделиться с друзьями:

⇐ Предыдущая 1 2 3 4 567 8 9 10 Следующая ⇒

Мы поможем в написании ваших работ!