Стационарные точки функции Лагранжа.



В этом пункте будет дано описаие стационарных точек функции Лагранжа (6.10) посредством фукции 0(xm+1,xm+2,…,xn), введенной в пункте 6.2 (см.(6.8)).Предварительно докажем одну простую лемму из линейной алгебры.

Пусть задана система линейных однородных уравнений

ai1x1+…+ ainxn=0 i=1,2,…,m                   (6.16)

и еще одно линейное однродное уравнение

b1x1+…+ bnxn=0                                       (6.17)

Cистему уравнений , полученную присоединением к системе (6.16) уравнения (6.17), будем называть расширенной системой (6.16)-(6.17).

Лемма: Для того чтобы расширенная система (6.16)-(6.17) была равносильна основной системе (6.16) необходимо и достаточно , чтобы уравнение (6.17) являлось линейной комбинацией уравнений системы (6.16).

Следствие:Для того чтобы уравнение (6.17) было линейной комбинацией уранений (6.16) или , что то же самое , чтобы вектор

 b==(b1,…,bn)                                           (6.18)

был линейной комбинацией векторов

       ai ==(ai1,…,ain) i=1,2,…,m                     (6.19)

необходимо и достаточно , чтобы каждое решение системы (6.16) являлось решением уравнения (6.17).

Доказательство леммы . Пусть ранг матрицы (aij) коэффициентов системы (6.16) равен m0 . Очевидно , что m0<m . Если m0<m, то уравнений системы (6.16) являются линейными комбинациями остальных. Отбросив те m-m0 линейных уравнений , которые являются линейными комбинациями оставшихся , получили систему из m0 линейно независимых уравнений . равносильную системе (6.16), причем уравнение (6.17) является линейной комбинацией уравнений системы (6.16) тогда и только тогда , когда оно является линейной комбинацией указанной системы из оставшихся m0 уравнений. Поэтому будем с самого начала считать , что , m0=m т.е. что ранг матрицы (aij) коэффициентов системы (6.16) равен m– числу уравнений этой системы.

Пусть система (6.16) и (6.16)-(6.17) равносильны. Это означает, что пространства их решений совпадают.Поскольку все уравнения основной системы (6.16) входят в расширенную систему (6.16)-(6.17), то каждое решение расширенной системы является и решением основной системы , т.е. пространство решений расширенной системы содержится в пространстве решений основной системы. Следовательно , слвпадение этих пространств равносильно равенству их размерностей.

Размерность s пространства решений системы линейных днородных уравнений равны , как известно , числу неизвестных n этой системы , из которого вычтем ранг r матрицы коэффициентов системы : s=n-r.Отсюда следует , что равносильность систем (6.16) и (6.16)-(6.17) означает равенство рангов их матриц.Ранг матрицы коэффициентов системы (6.16) по условию равен m , т.е. векторы (6.19) линейно независимы.

Ранг матрицы коэффициентов расширенной системы (6.16)-(6.17) согласно сказанному в наших условиях также равен m.Поэтому векторы (см.(6.18) и (6.19))

b, a1,…, am                                         (6.20)

линейно зависимы.А это означает , что b является линейной комбинацией векторов a1,…, am.

В самом деле , линейная зависимость векторов (6.20) означает , что существуют такие числа 0, 1,…,  m, не все равные нулю . что

0b+ 1a1+…+ mam=0                                (6.21)

Здесь заведамо 0=0, так как в противном случае векторы a1,…, am оказались бы линейно зависимыми. Поделив равенство (6.21) на 0, получим , что b является линейной комбинацией векторов a1,…, am .

Обратно, если b является линейной комбинацией векторов (6.19), то в системах векторов (6.19) и (6.20) имеется в точности по m линейно независимых векторов , т.е. ранги матриц коэффициентов систем уравнений (6.16) и (6.16)-(6.17) равны.

Итак, условие , что вектор b является линейной комбинацией векторов (6.19) :

1a1+…+ mam=b

эквивалентно равенству рангов матриц коэффициентов рассматриваемых основной и расширенной системв уравнений, следовательно, эквивалентно их равносильности.

                                                                     ч.т.д.

Доказательство следствия сразу следует из леммы, поскольку системы (6.16) и (6.16)-(6.17) очевидно равносильны тогда и только тогда , когда каждое решение системы (6.16) является и решением уравнения (6.17) – остальные уравнения систем просто совпадают.

                                                                         ч.т.д. 

Замечание 1 : доказанная лемма и ее следствие имеют простую геометрическую интерпритацию в n–мерном евклидовом векторном пространстве Rn, т.е. в n–мерном пространстве со скалярным произведением.Используя обозначение скалярного произведения, систему (6.16) можно записать в виде

(ai,x)=0 i=1,2,…,m                                           (6.22)

а уравнение (6.17) в виде

(b,x)=0                                                               (6.23)

где векторы a1,…, am и определены в (6.18) и (6.19) , а x=(x1,x2,…,xm+1)

Множество всевозможных линейных комбинаций векторов a1,…, am образуют подпространство пространства Rn и называется подпространством, натянутым на эти векторы.Обозначим его через Z=( a1,…, am).

Множество решений системы (6.22) состоит из всех векторов х, ортоганальных подпространству Z=( a1,…, am) Обозначим это множество решений через Т.Оно также является подпространством пространства Rn.

Подпространства L==Z(a1,…, am) и Т называются ортоганальными дополнениями друг друга в пространстве Rn.

Поскольку L=Z( a1,…, am), то представимость вектора b в виде линейной комбинации векторов a1,…, am равносильна его принадлежности подпространству L пространства Rn:b L.Это условие в свою очередь, равносильно ортоганальности вектора b подпространству Т:b _Т, которая означает, что для всех x Т имеет место равенство (b,x)=0,т.е.что любое реение х системы (6.22) является решением уравнения (6.23).Это и является утверждением следствия леммы.

Замечание 2 : напомним метод, которым можно получить все решения однородной системы линейных уравнений.Пусть система (6.16) состоит из линейно независимых уравнений.Тогда ранг матрицы его коэффициентов равен m.Это означает , что существует минор этой матрицы порядка m, не равный нулю.Пусть для определенности

                                       a11… a1m

                                       am1… amm                       (6.24)

 

В этом случае все решения системы (6.16) можно получить , задавая произвольно последние n-m координаты вектора (x1,x2,…,xn). Остальные координаты однозначно находятся из системы уравнений (6.16).В самом деле, возьмем произвольное решение (x1(0),x2(0),…,xn(0)) системы (6.16).После подстановки xm+1= x(0) m+1,…, xn= xn(0) в (6.16) получится система из m линейных уравнений (с m неизвестными x1,x2,…,xn), матрицы коэффициентов которой в силу условия (6.24) невырожденная.Поэтому существуют единственные значения x1,x2,…,xn, удовлетворяющие получившейся системе.Поскольку (x(0)1,x(0)2,…,x(0)n). также было решением системы (6.16), то x1=x(0)1, x2=x(0)2,…, xm=x(0)m .

Перейдем теперь к анализу стационарных точек функции Лагранжа.

Теорема 6.2: Пусть функции f0, f1, f2,…, fm непрерывно дифференцируема в области G Rn, x(0) G

fi(x)=0, i=1,2,3,…,n

 а ранг матрицы Якоби функций f1, f2,…, fm в точке x(0)  равен m.Для того чтобы в точке x(0)=(x(0)1,x(0)2,…,x(0)n) градиент f0 являлся линейной комбинацией градиентов f1, f2,…, fm необходимо и достаточно, чтобы точка x(0)=(x(0)1,x(0)2,…,x(0)n) была стационарной точкой для функции.

g(x)=g(xm+1,…,xn)

     Напомним,что если в точке x(0) градиент f0 является линейной комбинацией

                  f0= 1f1+ 2f2+…+ mfm                  (6.25)

градиентов f1, f2,…, fm, то это равносильно тому, что существует функция Лагранжа

F= f0- 1f1- 2f2-…- mfm                                     (6.26)

для которой точка x(0) является стационарной :

              F(x(0))

                  xi     i=1,2,…,n                                    (6.27)

Это просто координатная запись (6.25) ,ибо в силу (6.26)

F(x(0))   f0     f1      f2          fm

xi         xi     xi     xi         xi i=1,2,…,m

Доказательство: По условию ранг матрицы Якоби системы функций f1, f2,…, fm в точке x(0) равен m .Будем считать для определенности , как и в пункте 6.2 ,что

                        (f1, f2,…, fm)

                                      (x1,x2,…,xm) x(0)    (6.28)

Подставим в уравнение связи (6.3) функции (6.5) , являющиеся решением этих уравнений , и продеффиренцируем получившееся относительно переменных xm+1,…,xn тождества.Получим для точки x(0) равенства dfi(x(0))=0, i=1,2,…,m,    справедливые для любых приращений dxm+1,…,dxn независимых переменных xm+1,…,xn (напомним, что дифференциал являетсся линейной функцией , определенной на всем пространстве)Использовав инвариантность формы первого дифференциала относительно выбора переменных , получим , что в точке выполняется равенство

fi      fi          fi           fi   i=1,2,…,m

x1     xm     xm+1         xn       (6.29)

где xm+1,…,xn произвольные , а x1,…,xm находятся изформул (6.5). Таким образом вектор dx=( dx1,…,dxm,dxm+1,…,dxn) является решением линейной однородной системы (6.29).

Отметим , что в силу условия (6.28) значения dx1,…,dxm при заданных dxm+1,…,dxn однозначно находятся и из системы (6.29). Из замечания 2 следует также , что указанным способом получаются все решения системы (6.29).

Стационарность точки x(0) для функции g(x)=g(xm+1,…,xn)

 означает , что dg(x(0)).Это равенство , в силу инвариантности формы первого дифференциала, можно более подробно записать в виде

               f0      f0          f0           f0     

               x1      xm     xm+1         xn       (6.31)

 где dxm+1,…,dxn можно задавать произвольно, а dx1,…,dxm следует находить из формул (6.5) или , что дает тотже результат из формул (6.29). Инач говоря , любое решение системы уравнений (6.29) является и решением уравнения (6.31). Согласно следствию из леммы это возможно тогда и тoлько тогда , когда уравнение (6.31) является линейной комбинацией уравнений системы (6.29) , т.е. когда существуют такие числа , что

                    f0= 1f1+ 2f2+…+ mfm

                                                                       ч.т.д.

  Замечание 3 : Согласно замечанию 2 совокупность всех решений систеиы уравнений (6.29) образуют подпространство Т пространства Rn, являющееся ортогональным дополнением к подпространству L=Z( f1, f2,…, fm) . Любой вектор y T ортогонален каждому градиенту fi , а поэтому его естественно назвать касательным вектором в точке x(0) к гиперповерхности fi(x)=0 , являющиеся множеством уровня функций fi,i=1,2,…,m.

Таким образом , пространство решений Т системы (6.29) состоит из векторов , касательных одновременно ко всем гиперповерхностям fi(x)=0 ,i=1,2,…,m, и потому его называют касательным пространством персечений всех гиперповерхностей fi(x)=0 ,i=1,2,…,m . Напомним , что векторы касательноо пространства Т ,т.е. решения системы (6.29), были обознаены через dx (см.(6.30)).

Поскольку в точке условного экстремума согласно теореме 2 имеет место включение

f0 L=Z( f1, f2,…, fm)

то

          f0 T

 Иначе говоря, градиент f0 одновременно ортогонален всем касательным dx к гиперповерхностям fi(x)=0 ,i=1,2,…,m:

              ( f0,dx)=0

 (это другая запись уравнения (6.31)), т.е. градиент f0 перпендикулярен касательному пространству Т в точке x(0) .Но множество всех векторов , ортогональных к f0, образуют (n-1)– мерное пространство Т0 , называемое касательным пространством к гиперповерхности f0(x)= f0(x(0)) .В силу сказанного выше , каждый вектор из Т , будучи ортогонален градиенту f0, принадлежит к Т0 , т.е. Т Т0.

Итак , если x(0) – точка условного экстремума , то . Т Т0 , т.е. касательное пространство в точке x(0) пересечения всех гиперповерхностей , задаваемых уравнениями связи , содержится в касательном пространстве в той же точке гиперповерхности.

Замечание 4 : Из теоремы 2 еще раз вытекает следствие теоремы 1.В самом деле , если x(0) является точкой условногo экстремума , то является x(0) точкой обычного экстремума для функции () и , следовательно , ее стационаоной точкой . Поэтому согласно теореме 2 точка x(0) является стационарной точкой для функции Лагранжа , т.е.выполняется условие .

 


Дата добавления: 2019-07-15; просмотров: 146; Мы поможем в написании вашей работы!

Поделиться с друзьями:






Мы поможем в написании ваших работ!