Экстремумы функций многих переменных.
Необходимые условия экстремума.
Пусть функция u=f(x1,x2,…,xn) определена в области D и (x10,x20,…,xn0) будет внутренней точкой этой области.
Говорят, что функция u=f(x1,x2,…,xn) в точке (x10,x20,…,xn0) имеет максимум (минимум), если её можно окружить такой окрестностью
(x10 x10 x20 x20 xn0 xn0 )
что бы для всех точек этой окрестности выполнялось неравенство
f(x1,x2,…,xn)<f(x10,x20,…,xn0)
(>)
Если эту окрестность взять настлько малой, что бы знак равенства был исключён, т. е. чтобы в каждой её точке, кроме самой точки (x10,x20,…,xn0) выполнялось строгое неравенство
f(x1,x2,…,xn)<f(x10,x20,…,xn0)
(>)
то говорят, что в точке (x10,x20,…,xn0) имеет место собственный максимум (минимум), в противном случае максимум (минимум) называют несобственным.
Для обозначения максимума и минимума (как и в случае одной переменной) употребляется общий термин – экстремум.
Предположим, что наша функция в некоторой точке (x10,x20,…,xn0) имеет экстремум,
Покажем, что если в этой точке существуют (конечные) частные производные
fx1’(x10,x20,…,xn0) ,…, f ’xn(x10,x20,…,xn0)
то все эти частные производные равны нулю, так что обращение в нуль частных производныхпервого порядка является необходимым условием существования экстремума.
С этой целью положим x2=x20,…,xn= xn0 сохраняя x1 переменным ; тогда у нас получится функция от одной переменной x1 :
|
|
u=f(x1, x20,…,xn0)
Так как мы предположили, что в точке (x10,x20,…,xn0) существует экстремум (для определенности - пуcть это будет максимум), то, в частности, отсюда следует, что в некоторой окрестности(x10- , x10+ ) точки x1= x10, необходимо должно выполняться неравенство
f(x1, x20,…,xn0)< f(x10,x20,…,xn0)
так что упомянутая выше функция одной переменной в точке x1= =x10 будет иметь максимум, а отсюда по теореме Ферма следует, что
fx1’(x10,x20,…,xn0)=0
Таким образом можно показать, что в точке (x10,x20,…,xn0) и остальные частные производные равны нулю.
Итак, “подозрительными” на экстремум являются те точки, в которых частные производные первого порядка все обращаются в нуль: их координаты можно найти, решив систему уравнений
fx1’(x10,x20,…,xn0)=0
……………………. (5.1)
f ’xn(x10,x20,…,xn0)=0
Как и в случае функции одной переменной, подобные точки называются стационарными.
Замечения :Необходимое условие существования экстремума в случае дифференцируемой функции кратко можно записать так :
d f(x1,x2,…,xn)=0
так как, если fx1’= fx2’=…= f ’xn , то каковы бы ни были dx1,dx2,…,dxn всегда
f(x1,x2 d,…,xn)= fx1’ dx1+ fx2’ dx2+…+ f ’xn dxn=0
И обратно : если в данной точке тождественно выполняется это условие, то ввиду произвольности dx1,dx2,…,dxn производные fx1’, fx2’,…, f ’xn порознь равны нулю.
|
|
Обычно, рассматриваемая функция f(x1,x2,…,xn) имеет (конечные) частные производные во всей области, и тогда точки, доставляющие функции экстреммы, следует искать лишь среди стационарных точек. Однако встречаются случаи, когда в отдельных точках некоторые частные производные имеют бесконечные значения или вовсе не существуют (в то время как остальные равны нулю). Подобные точки, собственно, тоже следует причислить к “подозрительным” по экстремуму, наряду со стационарными.
Иногда дается и не прибегая к достаточным условиям выяснить характер стационарной точки функции. Так, если из условия задачи непременно следует, что рассматриваемая функция имеет где-то максимум или минимум и при этом системе уравнений (5.1) удовлетворяет только одна точка, то ясно, что эта точка и будет искомой точкой экстремума функции.
Заметим, наконец, что точками экстремума непрерывной функции могут быть точки, в которых функция недифференцируема (им соответствуюя, например, острия поверхности – графика функции).
Достаточные условия экстремума.
Так же как и для функции одной переменной, необходимый признак экстремума в случае многих переменных не является достаточным. Это значит, что из равенства нулю частных производных в данной точке вовсе не следует, что этаточка обязательно является точкой эксремума.
|
|
Достаточные условия экстремума для функций нескольких переменных носит значительно более сложный характер, чем для функции одной переменной.
Пусть функция f(x1,x2,…,xn) определена, непрерывна и имеет непрерывные производные первого и второго порядковокрестности некоторой стационарной точки (x10,x20,…,xn0).Разлагая разность
= f(x1,x2,…,xn)-f(x10,x20,…,xn0)
по формyле Тейлора, получим
= { fx ’’ x12+fx ’’ x22+…+fx ’’ xn2+2fx1x2 ’’ x1 x2+ +2fx1x3 ’’ x1 x3+…+2fxn-1xn ’’ xn-1 xn}= fxixj ’’ xi xj
где x= xi-xi0 ; производные все вычеслены в некоторой точке
(x10+0 x1, x20+0 x2,…, xn0+0 xn) (0<0<1)
Введём и здесь значения
fxixj ’’ (x10,x20,…,xn0)=aik (i,k=1,2,…,n) (5.2)
так что
fxixj ’’ (x10+0 x1, x20+0 x2,…, xn0+0 xn)= aik+ ik
и
ik 0 при x1 0,…, xn 0 (5.3)
Теперь интеесующее нас выражение можно написать в виде:
= { aik xi xk+ ik xi xk} (5.4)
На первом месте в скобках здесь стоит второй дифференциал функции f в рассматриваемой точке : он представляет собой однородный одночлен второй степени или, как говорят, квадратичную форму от переменных x1,…, xn. От свойств этой квадратичной формы, как мы увидим, и зависит решение интересующего нас вопроса.
|
|
В высшей алгебре квадратичную форму
aik yi yk (aik = aki) (5.5)
от переменных y1,…,yn называют определенной положительно (отрицательно), если она имеет положительные (отрицательные) значения при всех значениях аргументов, не равных одновременно нулю.
Необходимое и достаточное условие для того, чтобы форма (5.5) была определенной и положительной принадлежит ,как было уже сказано выше , Сильвестеру (J.J.Sylvester). Оно выражается цепью неравенств:
a11 a12 a11 a12 a13 a11 a12… a1n
a11>0, a21 a22 , a21 a22 a23 >0,…, a21 a22… a2n
a31 a32 a33 …………………
an1 an2… ann
Так как определенная отрицательная форма с изменением знака всех её членов переходит в определенню положительную, и обратно, то отсюда легко найти и характеристику отицательной формы : она дается цепью неравенств, которая получается из написанной выше изменением смысла неравенств через одно (начиная с первого).
Пользуясь этими понятиями. Сформулируем достаточные для существования экстремума условия :
Если второй дифференциал,т. е. квадратичная форма
aik xi xk (5.6)
со значениями (5.2) коэффициентов – оказывается определенной положительной (отрицательной) формой, то в используемой точке (x10,x20,…, xn0) будет собственный минимум (максимум).
Для доказательства введем расстояние
= x12+…+ xn2
между точками (x10,x20,…,xn0) и (x1,x2,…,xn). Вынося в (5.5) за скобку и полагая
xi (i=1,2,…,n)
перепишем выражение для в виде
= { aik Ei Ek+ ik Ei Ek} (5.7)
Числа Ei зараз не обращаются в нуль, поэтому, если форма (5.7) – положительная, первая сумма в скобках в формуле (5.7) иммет всегда положительный знак. Больше того, так как
Ei=1 (5.8)
то найдется такое постоянное положительное число m, что при всех возможных значениях Ei будет
aik Ei Ek>m
Действительно, эта сумма представляет собой непрерывную функцию от аргументов Ei во всем пространстве,в частности же и в множестве М тех точек(E1,…, En), которые удовлетворяют соотношению (5.8) (“сферическая поверхность”). Но множество это, как нетрудно видеть, замкнуто, т. е. содержит все свои точки сгущения ; а тогда, по теореме Вейерштрасса, названная сумма будет иметь в М наименьшее значение , необходимо положительное (как и все ее значения в М).
С другой стороны, ввиду (5.3) вторая сумма в (5.7) для достаточно малых ,очевидно, будет по абсолютной величине уже меньше m, так что вся скобка окажется положительной. Итак, в достаточно малой сфере, с центром в точке (x10,x20,…,xn0) разность будет положительна, откуда и явствует, что в названной точке функция f(x1,x2,…,xn) имеет собственный минимум.
Аналогично исчерпывается и случай, когда форма (5.6) будет определенной, но отрицательной.
Для того, чтобы квадратичная форма (5.6) была отрицательно определенной, необходимо и достаточно, чтобы
a11 a12 a11 a12 a13 a11 a12… a1n
a11<0, a21 a22 , a21 a22 a23 <0,…,(-1)n a21 a22… a2n
a31 a32 a33 …………………
an1 an2… ann
Дата добавления: 2019-07-15; просмотров: 128; Мы поможем в написании вашей работы! |
Мы поможем в написании ваших работ!