Метод вычисления критериев Сильвестера.

⇐ ПредыдущаяСтр 5 из 8Следующая ⇒

Применение критерия Сильвестера для определения экстремума функции многих переменных требует вычисления определителей порядка. Рассмотрим один из возможных методов диагонализации матриц и соответственно получения треугольных определителей.Метод основан на последовательном понижении порядка определителя. При этом :

1.На каждом этапе понижения порядка определителя, удобная для применения вычислительной техники.

2.Получаемые в результате диагональные элементыопределителей являются элементами критерия Сильвестера и позволяют, так сказать, в “ходе вычисления” вести контроль знакоопределенности квадратичной формы.

В основу алгоритма вычислений положины два свойства определителей.

1.Известно, что

a₁₁ a₁₂

a₂₁ a₂₂

Впредь замена любого определителя второго порядка элементом a₁₁ назовем “сверткой” определителя.

2.Определитель порядка не изменится, если элементы какой-либо строки умножить (разделить) на какое-либо число, не равное нулю, и сложить (вычесть) с элементами другой строки.

Итак, рассмотрим определитель n-го порядка, составленный из вторых частных производных некоторой функции n– переменных f(x₁,x₂,…,x_n).

Положим a_ik= f_xixk’’ .Имеем

a₁₁ a₁₂… a_1n

_{…………………} (5.9)

a_n1 a_n2… a_nn

Умножим в (5.9) элементы первой строки на a_21/ a₁₁ и вычтем их из элементов второй строки.

Умножим в (5.9) элементы первой строки на a_31/ a₁₁и вычтем их из элементов третьей строки. …

Умножим в (5.9) элементы первой строки на a_n1/ a₁₁ и вычтем их из элементов последней строки.

Выполнив последовательно эти операции, получим

a₁₁ a₁₂… a_1n

0 a₂₂- a₁₂ a_21/ a₁₁… a_2n -a_1n a_n1/ a₁₁

_{………………………………………………………}(5.10)

0 a_n2- a₁₂ a_n1/ a₁₁… a_nn- a_1n a_n1/ a₁₁

Умножим каждую строку в (5.10), начиная со второй на a₁₁,при этом определитель (5.10) умножится на a₁₁^n-2

----------- (5.11)

a₁₁^n-2

где

a₁₁ a₂₂- a₁₂ a₂₁a₁₁ a₂₃- a₁₃ a₂₁… a₁₁ a_2n- a_1n a₂₁

a₁₁ a₃₂- a₁₂ a₃₁a₁₁ a₃₃- a₁₃ a₃₁… a₁₁ a_13n- a_1n a₃₁

………………………………………………… (5.12)

a₁₁ a_n2- a₁₂ a_n1a₁₁ a_n3- a₁₃ a_n1… a₁₁ a_nn- a_1n a_n1

Рассмотрим более внимательно элементы (5.12). Перепишем (5.12) в виде

a₁₁ a₁₂… a_1n-1

a₂₁ a₂₂… a_2n-1

_{…………………} (5.13)

a_n-11 a_n-12… a_n-1n-1

Из сравнения (5.12) и(5.13) видно, что

a₁₁ – есть свертка определителя a₁₁ a₁₂

a₂₁ a₂₂

a₁₂ – есть свертка определителя a₁₁ a₁₃

a₂₁ a₂₃

…………………………………………………..

a_1n-1 – есть свертка определителя a₁₁ a_1n

a₂₁ a_2n

Таким образом, первая строка _1n-1 является сверткой элементов первых двух строк определителя _n. Более наглядно это можно сфрмклировать так : последовательно каждый “прямоугольник” элементов первой и второй строк заменяется его сверткой ; причем первые элементы двух строк “участвуют” во всех прямоугольниках этих строк.

a₁₁ a₁₂a₁₃… a_1n

a₁₁ a₁₂ a_1n-1

a₂₁ a₂₂a₂₃… a_2n

Аналогично вторая строка определителя _n-1 является сверткой элементов первой и третьей строк исходного определителя.

a₁₁ a₁₂a₁₃… a_1n

a₂₁ a₂₂ a_2n-1

a₃₁ a₃₂a₃₃… a_3n

Наконец для последней строки _n-1 имеем

a₁₁ a₁₂a₁₃… a_1n

a_{n-1 1} a_{n-1 2} a_n-1n-1

a_n1 a_n2a_n3… a_nn

Если теперь применить те же опервции к определителю _n-1, т. е. к (5.13), получим

……

a₁₁^n-3 (5.14)

где

a₁₁ a₁₂… a₁ _n-2

a₂₁ a₂₂… a₂ _n-2

_{…………………}_{…………..}

a_{n-2 1} a_{n-2 2}… a_{n-2 n-2}

а элементы a_ik являются сверткой соответствующих определителей – прямоугольников.

Очевидно, повторяя эту операцию n–1 раз, получим следующую формулу, предварительно введя более простые обозначения :

a₁₁ = a₁– левый угловой верхний элемент

a₁₁ = a₂ – левый угловой верхний элемент

a₁₁ = a₃ – левый угловой верхний элемент

…………………………………………

a₁₁ = a_n – левый угловой верхний элемент.

С учетом этого

a_n

_{………………………..}

a₁^n-2 a₂^n-3… a_n-1(5.15) n>2

Пример №1.

2 1 5 3

0 4 7 2 1 2*4-1*0 2*7-5*0 2*2-3*0 1 8 14 4

5 6 3 1 2²2*6-5*1 2*3-5*5 2*1-5*3 2² 7 –19 -13

0 2 1 3 2*2-0*1 2*1-5*0 2*3-3*0 4 2 6

4 7 2

7 –19 –13 1 4*(-19)-7*7 4*(-13)-2*7 1 -72-49 -52-14

2 3 1 4 4*1-2*7 4*3-2*2 4 -10 8

1 -121 -66 1 -121 -66 1

4 -10 8 2 -5 4 2 (-121*4-66*5)= -121*2-33*5=

= -242 –165= -407

Пример №2.

3 0 2 1 5

0 4 1 3 6 1 3*4-0*0 3*1-2*0 3*3-0*1 3*6-5*0

1 2 3 5 1 3³ 3*2-5*0 3*3-5*2 3*5-5*1 3*1-5*5

0 3 4 0 6 3*3-2*0 3*4-2*2 3*0-2*1 3*6-2*5

1 2 3 4 5 3*2-1*0 3*3-1*2 3*4-1*1 3*5-1*5

12 3 9 18 -30 66 -264-108

1 6 –1 10 -22 1 69 -105 96-162

3³ 9 8 -2 8 3³*12² 66 78 120-108

6 7 11 10

-30 66 -372 30*105-66*69 30*66+69*372

1 69 -105 -66 1 -30*78-66*66 -30*12+66*372

3³*12² 66 78 12 3³*12²*(-30)

1 3150-4554 1980+25668 1 -1404 27648

3³*12²*(-30) -2340-4356 -360+24552 3³*12²*(-30) –6696 24192

-1404*24192+6696*27648 33965568-182476800-2654208

3³*12²*(-30) 3³*12²*30

31311360-182476800 15116544 15116544

3³*12²*30 3³*12² 3888

=3888

Вычесленные в порядке получения определителий _n, _n-1, …, ₂ их верхние левые угловые элементы a₁,a₂,…,a_n являются критерием Сильвестера в части знаков, т.е.

sign a₁₁=sign a₁

sign a₁₁=sign a₂=sign a₁₁ a₁₂

a₂₁ a₂₂

………

a₁₁… a_1n

sign a₁₁=sign a_n=sign

………..

a_n1… a_nn

По сути метод дает возможность вычисления определителей . Однако нас интересуют лишь знаки определителей.Это существенно упрощает задачу.

Рассмотрим функцию f(x₁,x₂,…,x_n). имеющую экстремум,а именно максимум в точке М₀(x₁⁰,x₂⁰,…,x_n⁰).Это значит,что все коэффициенты a₁, a₂,…, a_n должны быть положительными. Поэтому процесс определения максимума функции в точке М₀ заканчивается на любом этапе понижения определителя ,если после положительных a₁, a₂,…, a_k коэффициент а_k+1 стал отрицательным или нулевым.

Если же в точке М₀ – минимум, то коффициенты a₁, a₂,…, a_n образуют знакочередующуюся последоватнльность, а именно

a₁<0, a₂>0, a₃<0,…

Аналогично процесс прекращается, если нарушается эта знакопеременность.

Итак, общая схема выглядит следующим образом :

1.Определяются стационарные точки функции, в которых

2.Определяются коэффициенты а_ik в этих точках

²f

x_ix_r

3.Выясняем знак первого диагонального элемента а₁₁=а₁

а) если а₁₁>0, то все последующие элементы а₂,а₃,…,а_n должны быть положительными,если в точке М₀ действительно максимум

б)если а₁₁<0, то знаки последующих элементов а₂,а₃,…,а_n должны чередоваться, если в точке М₀ действительно минимум.

4.При нарушении какой-либо из закономерностей в п.3 процесс прекращается и формулируется вывод о том,что в точке М₀ экстремума нет.

Наконец отметим следующее важное обстоятельство. Так как коэффициенты а_ik являются частными производными второго порядка и для дифференцируемой функции с непрерывными ²f/ x_ix_r в соответствии с теоремой Шварца эти частные производные не зависят от порядка дифференцирования, то а_ik= а_ki. Это важное свойство приводит к тому, что матрица (а_ik) является симметрической вместе со своим определителем а_ikПокажем, что учет этого факта сокращант объем вычислений по крайней мере вдвое .

Во-первых, покажем, что определитель _n-1 также остается симметрическим,т. е. применяется операция понижения порядка инварианта и сохраняет это свойство при переходе от_n-1 к _n и т.д.

Диагональные элементы любого определителя, очевидно, равны сами себе.

Рассмотрим произвольный элемент а_ik в определителе _n-1, i=k, i,k=1,2,…,n-1.

а_ik= а_ik– а_{1 k} а_1i / а₁₁ (*)

Если переставить индексы i,k ,то

a_ki= а_ki– а_{1 i} а_1k / а₁₁ (**)

Сравнивая (*) и (**) видим, что из того, что а_ik= а_ki следует, что а_ik= а_ki. Этим доказано, что из того, что _n- симметрический определитель, определитель _n-1 также симметрический.Что это дает для вычисления _n-1 ?

Пусть вычислена первая строка коэффициентов а_1k(k=1,2,…,n-1) определителя _n-1 , т.е.

а₁₁, а₁₂, а₁₃,…, а_1n-1

Теперь вычислим первый столбец , он имеет вид

а₁₁

а₂₁

а₃₁

_…..

а_{n-1 1}

Но ввиду симметричности коэффициентов, этот столбец совпадает со строкой. Другими словами, сосчитав элементы первой строки, первый столбец уже считать нет необходимости, его нужно просто записать. Для наглядности запишем

a₁₁ a₁₂… a_{1 n-1}

a₂₁ a₂₂… a_{2 n-1}

_{………………….}

a_n1 a_n2… a_{n-1 n-1}

Вычислим теперь элементы второй строки, начиная с а₂₂ ,т.е. а₂₂, а₂₃, а₂₄,…, а_{2 n-1}.Эта строка полностью совпадает со вторым столбцом, начиная с а₂₂,т.е.

а₂₂

а₃₁

_…..

а_{n-1 2}

Итак, второй столбец автоматически заполняется элементами второй строки.Т.е. иммем

a₁₁ a₁₂а₁₃… a_{1 n-1}

a₂₁ a₂₂а₂₃… a_{2 n-1}

_n-1= a₃₁ a₃₂а₃₃… a_{3 n-1}

…………………………..

a_{n-1 1}a_{n-1 2}a_{n-1 3}… a_{n-1 n-1}

И т.д.

Общий вывод : необходимо расчитать лишь правую треугольную часть элементов. Нижняя же левая часть определителя заполняется автоматически. Формально ее можно вообще не заполнять, т.е. оставлять в виде

a₁₁ a₁₂а₁₃… a_{1 n-1}

a₂₂а₂₃… a_{2 n-1}

_n-1= а₃₃… a_{3 n-1}(5.16)

…………..

a_{n-1 n-1}

Отсюда для получения следующегоопределителя можно применить правило, условно назовем, треугольника.

a₁₁= a₁₁ a₂₂- a₁₂²

a₂₂= a₁₁ a₃₃- a₁₃² и т.д.

Для недиагоналных элементов схема несколько сложнее

a₁₂= a₁₁ a₂₃- a₁₃ a₁₂ a₁₁ a₁₂а₁₃

а₂₃ и т.д.

Пример №3.

Исследовать на экстремум функцию z=x³+y³-3xy

1.Находим

z z

---- и ----

y x

---- = 3x²-3y

---- = 3y²-3x

2.Находим стационарные точки, решая систему

3x²-3y=0

3y²-3x=0

Получили две стационарные точкм (0;0) и (1;1).

3.Находим

²z²z ²z

------- --------- --------

x² y² x y

²z²z ²z

------- =6x --------- =6y -------- = -3

x² y² x y

4.Для точки (0;0) имеем

a₁₁=0 a₂₂=0 a₁₂= a₂₁= -3

Для точки (1;1) иммем

b₁₁=6 b₂₂=6 a₁₂= a₂₁= -3

5.Находим

a₁₁ a₁₂ 0 -3

a₂₁ a₂₂ -3 0

b₁₁ b₁₂ 6 -3

b₂₁ b₂₂ -3 6

Так как <0 , то в точке (0;0) экстремума нет.

Так как >0 и a₁₁>0, то (1;1) – точка минимма функции, причем z_min = -1.

Пример №4.

Исследовать на экстремум функцию w=x^2/3+y^2/3+z^2/3

Ищем критические точки

2 2 2

w`_x= ------ w`_y= --------- w`_z= ----------

3 ³ x 3 ³ y 3 ³ z

Эти частные производные не обращаются в нуль ни при каких значениях x, y, z; они не сужествуют (обращаются в бесконечность) в точке P₀(0;0;0). Точка P₀ лежит внутри области определения функции w, которая представляет совокупность всех точек (x;y;z) пространства. Поэтому P₀ критическая точка.

Исследуя знак разности w(P)-w(P₀)= x^2/3+y^2/3+z^2/3 вблизи точки P₀, убеждаемся, что при любых отличных от нуля значениях x,y,z она сохраняет положительный знак. Поэтому P₀ есть точка минимума, w_min=w(P₀)=0

Экстремумы на множествах.

Следует обратить внимание на то, что мы указали необходимые и достаточные условия экстремума функции лишь во внутренней точке области определения. Таким образом, при отыскании абсолютного максимума или минимума функции необходимо наряду с внутренними критическими точками функции исследовать также точки границы области определения, поскрльку максимальное или минимальное значение функция может принять в одной из таких граничных точек.

Пусть функция f дифференцируема на открытом ограниченом G и непрерывна на его замыкании G. Пусть требуется найти наибольшее и наименьшее значения функции на множестве G. Для этого можно, например, найти все стационарные точки функции f в G, вычислить в них значения функции и выбрать, если, конечно это возможно (а теоретически возможно это, например, когда число стационарных точек конечно), точки, в которых функция принимает наибольшее и наименьшее значения из всех значений в стационарных точках. После этого следует сравнивать эти значения со значениями, которые функция принимает на границе открытого множества G, например, найдя, если это удается сделать, наибольшее и наименьшее значения функции f на границе области G. Сравнив наибольшее и наименьшее значения в стационарных точках с наибольшим и наименьшим значениями на границе множества G, мы можем, очевидно, найти искомый максимум и минимум f на G.

В случае, когда G – плоская область и ее граница является кривой, заданной некоторым представлением x=x(t), y=y(t), <t< вопрос о нахождении экстремальных значений функции f(x,y) на границе G сводится к исследованию на экстремум функции одного переменного f(x(t),y(t)), что делается уже известными нами методами.

Методы, которые можно применять в многомерном случае для отыскания экстремальных точек на границе области будут рассмотрены позже (см. раздел, посвященный условному экстремуму).

Полезно лишь иметь ввиду, что при отыскании максимумов и минимумов часто наряду с формальной техникой, а иногда и вместо нее можно использовать некоторые простые соображения, связанные с природой задачи. Например, если рассматриваемая в Rⁿ дифференцируемая функция по смыслу задачи должна иметь минимум и вместе с тем она не ограничена сверху, то при условии, что функция имеет единственную критическую точку, можно без дальнейшего исследования утверждать, что в этой точке она принимает минимальное знычение.

Условный экстремум.

Постановка вопроса.

Одним из наиболее ярких популярных достижений дифференциального исчисления являются предполагаемые им рецепты отыскания экстремумов функций. Необходимые условия и достаточные дифференциальные признаки экстремума, которые мы получили из формулы Тейлора, относятся, как уже отмечалось к внутренним экстремумам.

Иными словами, эти результаты применимы только к исследованию поведения функции Rⁿ x f(x) R в окрестности точки тогда, когда аргумент может принимать любое значение из некоторой окрестности Rⁿ в точки x₀.

Часто возникает более сложная и с практической точки зрения даже более интересная ситуация,когда ищется экстремум функции при некоторых условиях, ограничивающих область измерения аргумента. Типичным примером может служить изопериметрическая задача, когда ищется тело, имеющее максимальный объем при условии, что ограничивающая его поверхность имеет заданную площадь. Чтобы получить доступную нам математичкую запись такой задачи, упростим постановку и будем считать, что задача состоит в том, чтобы среди прямоугольников, имеющих заданный периметр 2р, найти тот, который имеет наибольшую площадь . Обозначив через х и у длины сторон прымоугольника, запишем, что

(х,у)=х-у

х+у=р

Итак, надо найти экстремум функции (х,у) при условии, что переменные х,у связаны соотношением х+у=р. Таким образом, экстремум функции ищется только на множестве тех точек плоскости R², которые удовлетворяют указанному соотношению. Эта конкретная задача, конечно, решается без труда : достаточно, записав, что у=р-х, подставить это выражение в формулу для (х,у) и найти обычными методами максимум функции х(р-х). Она нам была нужна лишь для постановки вопрса. В следующих пунктах мы рассмотрим общий случай решения подобных задач.

Дата добавления: 2019-07-15; просмотров: 129; Мы поможем в написании вашей работы!

Поделиться с друзьями:

⇐ Предыдущая 1 2 3 456 7 8 Следующая ⇒

Мы поможем в написании ваших работ!