I. Определение функции нескольких переменных

advertisement
I. Определение функции нескольких переменных. Область определения
При изучении многих явлений приходится иметь дело с функциями
двух и более независимых переменных. Например, температура тела в
данный момент времени t может изменяться от точки к точке, поэтому ее
значения будут определяться значениями четырех переменных x , y , z , t ,
где x , y , z – координаты точки.
Определение 1. Если каждой паре ( x, y ) значений двух независимых
одна от другой, переменных величин x и y из некоторой области их
изменения D соответствует определенное значение величины z , то мы
говорим, что z есть функция двух независимых переменных x и y ,
определенная в области D .
Символически функция двух переменных обозначается z = f ( x, y ) ;
z = z ( x, y ) . Функция f двух переменных x и y может быть задана
аналитическим, табличным, графическим и другими способами.
Определение 2. Совокупность пар ( x, y ) значений x и y , при которых
определена функция z = f ( x, y ) , называется областью определения или
областью существования этой функции.
Линию, которая ограничивает данную область, называют границей
области. Область определения функции z = f ( x, y ) есть некоторая
совокупность точек на плоскости. В частности, областью определения
функции z = f ( x, y ) может быть и вся плоскость. Точки области, не
принадлежащие границе области, называются внутренними точками области.
Область, которая состоит только из внутренних точек, называется открытой
или незамкнутой. Если же к открытой области присоединяются и точки
границы, то область называется замкнутой. Область называется
ограниченной, если существует такая константа C , что расстояние
произвольной точки M области от начала координат O меньше, чем C , т.е.
OM < C .
Определение функции двух переменных можно обобщить на случай
трех и более переменных.
Определение 3. Если каждой совокупности значений переменных x1 ,
x2 , …, xn соответствует определенное значение переменной ω , то будем
называть ω функцией независимых переменных x1 , x2 , …, xn и писать
ω = F ( x1 , x2 ,..., xn ) .
Аналогично, как и для функции двух переменных, можно говорить об
области определения функции трех, четырех и более переменных.
Так, для функции трех переменных областью определения является
некоторая совокупность троек чисел ( x, y, z ) , а так как каждая тройка чисел
задает некоторую точку M ( x, y, z ) в системе координат Oxyz , то область
определения функции трех переменных есть некоторая совокупность точек
1
пространства. Область определения функции четырех или большего числа
переменных уже не допускает простой геометрической интерпретации.
2. График функции двух переменных
Рассмотрим функцию z = f ( x, y ) , определенную в области D на
плоскости Oxy (эта область может быть, в частности, и всей плоскостью), и
систему прямоугольных декартовых координат Oxyz (рис.1). В каждой точке
( x, y ) восстановим перпендикуляр к плоскости Oxy , на котором отложим
отрезок, равный f ( x, y ) .
z
z
P
0
x
x
y
y
0
D
y
x
Рис. 1
Рис. 2
Тогда мы получаем в пространстве точку P с координатами
(x, y, z ) = (x, y, f (x, y )) (Рис. 1).
Определение.
Множество
точек
P,
координаты
которых
удовлетворяют уравнению z = f ( x, y ) , называется графиком функции двух
переменных.
Из курса аналитической геометрии известно, что уравнение z = f ( x, y )
определяет в пространстве некоторую поверхность. Таким образом, график
функции двух переменных есть поверхность, которая проектируется на
плоскость Oxy в область определения функции. Каждый перпендикуляр к
плоскости Oxy пересекает поверхность z = f ( x, y ) не более чем в одной
точке.
Например, график функции z = x 2 + y 2 есть параболоид вращения.
Замечание. Функцию трех и более переменных отобразить с помощью
графика в пространстве невозможно.
3. Частное и полное приращения функции двух переменных
Пусть z = f ( x, y ) – функция двух переменных, а D – область ее
определения. Возьмем произвольную точку M ( x, y ) ∈ D и придадим x
приращение ∆x , а значение y оставим неизменным. Тогда функция
z = f ( x, y ) получает приращение
∆ x z = ∆ x f ( x, y ) = f ( x + ∆x, y ) − f ( x, y ) ,
2
которое называется частным приращением функции z = f ( x, y ) по
переменной x в точке M ( x, y ) .
Аналогично, считая x неизменной и придавая y приращение ∆y ,
получаем частное приращение функции z = f ( x, y ) по переменной y в точке
M ( x, y ) :
∆ y z = ∆ y f ( x, y ) = f ( x, y + ∆y ) − f ( x, y ) .
Полным приращением функции z = f ( x, y ) в точке M ( x, y ) называется
разность
∆z = ∆f ( x, y ) = f ( x + ∆x, y + ∆y ) − f ( x, y ) .
Геометрически частные и полное приращения функции ∆ x z , ∆ y z , ∆z
можно изобразить отрезками A1 B1 , A2 B2 , A3 B3 (рис. 3)
z
B1
∆xz
B3
A1
B2
A
x
M
∆z
∆yz
A2
y
0
x
A3
∆x
∆y
Рис. 3
4. Предел функции двух и нескольких переменных
Введем понятия δ -окрестности данной точки M 0 ( x0 , y0 ) и понятие
сходящейся последовательности точек плоскости.
Определение 1. Множество (M ( x, y )) всех точек плоскости,
координаты x и y которых удовлетворяют неравенству
(x − x )
+ ( y − y0 ) < δ ,
или, короче r (M 0 M ) < δ , называется δ - окрестностью точки M 0 ( x0 , y0 ) и
обозначается Oδ ( x0 ) .
Другими словами, δ -окрестность точки M 0 – это все точки, которые
находятся внутри круга с центром M 0 .
Определение 2. Проколотой окрестностью точки M 0 радиуса δ
называется множество точек M , которые удовлетворяют неравенству
0 < r (M 0 M ) < δ ;
2
0
3
def
Oδ (M 0 ) = {M | 0 < r (M 0 M ) < δ} .
Рассмотрим последовательность точек M 1 ( x1 , y1 ) , M 2 ( x2 y 2 ) , …,
M n ( xn , y n ) плоскости Oxy , которую обозначают (M n ) .
Для задания последовательности (M n ) необходимо задать две
числовые последовательности ( xn ) и ( y n ) , так как точка на плоскости
определяется двумя координатами.
Определение 3. Последовательность точек (M n ) называется
сходящейся к точке M 0 ( x0 , y0 ) , если для каждого ε > 0 существует номер
такой N (ε ) > 0 такой, что для n > N (ε ) имеет место неравенство r (M 0 M n ) < ε .
При этом точка M 0 называется пределом последовательности (M n ) .
Предел M 0 последовательности (M n ) , n = 1, ∞ обозначают lim
Mn = M0
n →∞
или M n → M 0 при n → ∞ . Понятие сходящейся последовательности точек
плоскости
является
обобщением
понятия сходящейся
числовой
последовательности.
Приведем понятие предела функции двух переменных на языке
последовательностей (по Гейне).
Определение 4. Число A называется пределом функции z = f ( x, y ) в
точке
M 0 ( x0 , y0 ) , если для каждой сходящейся к
M 0 ( x0 , y 0 )
(M n ∈ Oδ (M 0 ))
n = 1, ∞
последовательности
точек
M n ( xn , y n ) ,
соответствующая последовательность f (M 1 ) , f (M 2 ) , …, f (M n ) , ….
значений функции сходится к A . Обозначают это следующим образом
lim f (M ) = A или lim f ( x, y ) = A .
M →M
0
x → x0
y → y0
Символически:
def
A = Mlim
f (M ) ⇔ ∀M n ( xn , y n ) : lim
M n ( xn , y n ) = M 0 ( x0 , y0 ) ⇒ lim
f (M n ) = f (M 0 )
→M
n→∞
n→∞
0
.
Аналогично, как и для функции одной переменной можно дать
эквивалентное определение предела на языке « ε − δ » (по Коши).
Определение 5. Число A называется пределом функции z = f ( x, y ) при
x → x0 , y → y0 , это значит в точке M 0 ( x0 , y0 ) , если для каждого ε > 0
существует δ(ε ) > 0 такое, что для произвольной точки M ( x, y ) ∈ Oδ (M 0 )
имеет место неравенство f ( x, y ) − A < ε .
Символически:
def
A = lim f ( x, y ) ⇔ ∀ε > 0 ∃ δ(ε ) > 0 : ∀M ∈ Oδ (M 0 ) ⇒ f (M ) ∈ Oε ( A) .
x → x0
y → y0
Как и в случае функции одной переменной, можно показать, что
определение
предела
функции
двух
переменных
на
языке
последовательностей эквивалентно определению предела функции по Коши.
4
Определение предела функции n переменных при n > 2 тождественно
определению предела функции двух переменных, если в пространстве n
измерений ввести понятие δ -окрестности точки.
Определение 6. В n -мерном пространстве δ -окрестностью точки
0
M 0 (x1 , x20 , xn0 ) называется множество всех точек M ( x1 , x2 ,..., xn ) , расстояние
каждого из которых от точки M 0 меньше чем δ , т.е.
(x
− x10 ) + (x2 − x20 ) + ... + (xn − xn0 ) < δ .
Очевидно, что в пространстве трех измерений Oxyz ( n = 3 ) δ окрестностью точки M 0 ( x0 , y0 , z 0 ) является множество всех внутренних точек
шара с центром в точке M 0 и радиусом δ .
На функции нескольких переменных можно перенести основные
теоремы о пределах для функции одной переменной.
Пример 1. Найти пределы:
sin( xy )
x
; б) lim
.
а) lim
x→2
x →0
y
y →0
y →0 x + y
Решение. а) Так как функция не определена в предельной точке, то
раскрываем неопределенность так, как и для функции одной переменной:
sin( xy )
sin ( xy )
lim
= lim x ⋅ lim
= 2 ⋅1 = 2 ,
x→2
x→2
x→2
y
xy
y →0
y →0
sin α
учитывая, что lim
= 1.
α →0
α
y
1
x
б) lim
не существует, так как отношение
не имеет
= lim
x →0
x →0
y
x
y →0 x + y
y →0
1+
x
определенного предела при произвольном стремлении точки M ( x, y ) к точке
y
= k , т.е.
M 0 (0,0 ) . Например, если M → M 0 вдоль прямой y = kx , то
x
зависит от углового коэффициента прямой, по которой движется точка
M ( x, y ) .
Понятие предела функций двух переменных легко обобщается на
функции трех и более переменных.
2
2
2
1
5. Непрерывность функции нескольких переменных
Определение 1. Пусть на некотором множестве D определена функция
f (M ) = f ( x, y ) , точка M 0 ( x0 , y0 ) ∈ D и каждая δ -окрестность точки M 0
содержит точки множества D .
Функция z = f (M ) = f ( x, y ) называется непрерывной в точке
M 0 ( x0 , y0 ) , если предел функции в этой точке существует и равен значению
функции в этой точке, т.е.
5
lim f (M ) = f (M 0 ) или lim f ( x, y ) = f ( x0 , y 0 ) ,
M →M 0
x → x0
y → y0
(5.1)
при этом точка M ( x, y ) стремится к точке M 0 ( x0 , y 0 ) произвольным образом,
оставаясь в области определения функции.
Согласно с определением предела функции в терминах
последовательностей, данное определение непрерывности функции в точке
M 0 эквивалентно тому. что для каждой последовательности (M n ) , (M n ∈ D ) ,
такой, что lim
M n = M 0 , последовательность ( f (M 0 )) сходится и
n →∞
lim
f (M n ) = f (M 0 ) или lim
f ( x n , y n ) = f ( x0 , y 0 ) .
n →∞
n →∞
Если обозначить x = x0 + ∆x , y = y0 + ∆y , то равенство (5.1) можно
переписать так:
lim f ( x0 + ∆x, y0 + ∆y ) = f ( x0 , y0 )
(5.1’)
∆x →0
∆y →0
или
lim f ( x0 + ∆x, y0 + ∆y ) − f ( x0 , y0 ) = 0 .
(5.1”)
∆x →0
∆y →0
Обозначим ∆r = (∆x ) + (∆y ) . При ∆x → 0 и ∆y → 0 ∆r → 0 , и
наоборот, если ∆r → 0 , то ∆x → 0 и ∆y → 0 .
Замечая далее, что выражение, находящееся в скобках в формуле (5.1”),
является полным приращением ∆z функции z = f ( x, y ) . Равенство (5.1”)
можно записать в виде
(5.1)
lim ∆z = 0 .
2
2
∆r →0
Таким образом, имеем
Определение 2. Функция z = f (M ) называется непрерывной в точке
M 0 ( x0 , y0 ) , если ее полное приращение в этой точке есть бесконечно малая
( f (M ) − f (M 0 )) или lim ∆z = 0 .
при M → M 0 функция, т.е. Mlim
∆z = Mlim
→M
→M
0
∆r →0
0
f (M ) = f (M 0 ) из
Это условие, очевидно, эквивалентно условию Mlim
→M
0
определения 1.
Сформулируем определение непрерывности функции, используя
определение предела функции в терминах « ε − δ ».
Определение 3. Функция z = f (M ) называется непрерывной в точке
M 0 , если для каждого ε > 0 существует δ(ε ) > 0 такое, что всех точке M ∈ D ,
которые удовлетворяют условию r (M , M 0 ) < δ , имеет место неравенство
f (M ) − f ( M 0 ) < ε .
∀ε > 0
∃δ(ε ) > 0 , ∀M ∈ D ,
r (M , M 0 ) < δ :
Символически: ∀
f (M ) − f ( M 0 ) < ε .
Из определения 1 следует, что для непрерывности функции
f (M ) = f ( x, y ) в точке M 0 ( x0 , y0 ) необходимо и достаточно выполнение
следующих условий:
6
1. Функция f (M ) = f ( x, y ) должна быть определена в точке M 0 ( x0 , y0 ) и
некоторой окрестности этой точки.
2. Существует Mlim
f (M ) .
→M
0
f ( M ) = f (M 0 ) .
3. Mlim
→M
0
Если в точке N ( x1 , y1 ) нарушается хотя бы одно из трех выше
названных условий, то эта точка называется точкой разрыва функции
z = f ( x, y ) . Это может произойти в следующих случаях:
1) z = f ( x, y ) определена во всех точках некоторой окрестности точки
N ( x, y ) , за исключением самой точки N ( x1 , y1 ) ;
2) функция z = f ( x, y ) определена во всех точках окрестности точки
N ( x1 , y1 ) , но не существует предел lim f ( x, y ) ;
x → x1
y → y1
3) функция z = f ( x, y ) определена во всех точках окрестности точки
f ( x, y ) , но lim f ( x, y ) ≠ f ( x1 , y1 ) .
N ( x1 , y1 ) и существует предел lim
x→ x
x→ x
1
y → y1
1
y → y1
Для функции z = f ( x, y ) двух независимых переменных точки разрыва
могут быть изолированными, образовывать линию или поверхность разрыва.
Пример 2. Найти точки разрыва функций:
2
1
1
а) z =
; в) u = 2
.
2
2
2 ; б) z =
2
2
x
y
(x − 1) + ( y − 2)
x −y
2
+ + z −1
4 9
Решение. а) Данная функция определена на R 2 всюду, кроме точки
M 0 (1,2) , которая является точкой разрыва функции.
1
определена для произвольных x, y , таких, что
б) Функция z = 2
x − y2
y ≠ ± x . Таким образом, прямые y = ± x есть линии разрыва функции.
2
определена для произвольных x, y, z ,
в) Функция u = 2
2
x
y
2
+ + z −1
4 9
x2 y2
x2 y2
2
+ + z ≠ 1 . Эллипсоид
+ + z 2 = 1 и есть поверхность
таких, что
4 9
4 9
разрыва функции.
Определение 4. Функция u = f (P ) называется непрерывной на
множестве D , если она непрерывная в каждой точке этого множества.
Аналогично, как и для функции одной переменной, используя данные
определения непрерывности и соответствующие теоремы о пределах, можно
доказать, что арифметические операции над непрерывными функциями и
построение сложных функций из непрерывных функций приводит к
непрерывным функциям.
7
Функции нескольких переменных, непрерывные на замкнутых
ограниченных множествах имеют свойства, аналогичные свойствам функции
одной переменной, непрерывной на отрезке.
Приведем основные свойства непрерывных функций двух переменных
(без доказательства).
Теорема 1. Если функция z = f (M ) = f ( x, y ) непрерывна в замкнутой
ограниченной области, то она ограниченная в этой области, т.е. существует
число C такое, что для всех точек области имеет место неравенство
f (M ) ≤ C .
Теорема 2. Если функция z = f (M ) = f ( x, y ) непрерывна в замкнутой и
ограниченной области D , то она достигает в этой области, по крайней мере,
один раз своего наибольшего значения M и наименьшего значения m .
Теорема 3. Если функция z = f (M ) непрерывна в области, то она
принимает все промежуточные значения между двумя произвольными
своими значениями, это значит, если A < C < B , где A и B – определенные
значения функции f (M ) в данной области, то в этой области существует
точка M 0 , такая, что f (M 0 ) = C .
Отсюда, в частности, следует, что если M 1 и M 2 – точки данной
области и f (M 1 ) < 0 , а f (M 2 ) > 0 , то в области существует точка M 0 , такая,
что f (M 0 ) = 0 .
В конце отметим, что понятие непрерывности и перечисленные
свойства функций двух переменных легко обобщаются на функции трех и
более переменных
6. Частные производные функции нескольких переменных и их
геометрический смысл
Определение 1. Частной производной функции z = f ( x, y ) по
переменной x в точке M 0 ( x0 , y0 ) называется предел отношения частного
приращения функции ∆ x z к соответствующему приращению аргумента ∆x ,
если ∆x произвольным образом стремится к нулю:
f ( x0 + ∆x, y0 ) − f ( x0 , y0 )
.
lim
∆x → 0
∆x
Частная производная функции z = f ( x, y ) по переменной x в
∂z
∂f
∂f ( x, y ) ∂z ( x, y )
, z′x ,
, f x′ ,
,
,
произвольной точке M ( x, y ) обозначается
∂x
∂x
∂x
∂x
f x′( x, y ) , z′x ( x, y ) .
Таким образом, по определению:
.
Определение 2. Частной производной функции z = f ( x, y ) по
переменной y в точке M 0 ( x0 , y0 ) называется предел отношения частного
8
приращения функции ∆ y z к соответствующему приращению аргумента ∆y ,
если ∆y произвольным образом стремится к нулю:
f ( x0 , y0 + ∆y ) − f ( x0 , y0 )
lim
.
∆y →0
∆y
Частная производная функции z = f ( x, y ) по переменной y в
∂z
∂f
∂f ( x, y ) ∂z ( x, y )
, z′y ,
, f y′ ,
,
,
произвольной точке M ( x, y ) обозначается
∂y
∂y
∂y
∂y
f y′( x, y ) , z′y ( x, y ) .
Таким образом, по определению
∆ z
∂z def
f ( x0 , y0 + ∆y ) − f ( x0 , y0 )
.
= lim y = lim
∂y ∆y →0 ∆y ∆y →0
∆y
Частные приращения и частные производные функции n переменных в
точке M 0 при n > 2 определяются и обозначаются аналогично. Например,
для функции трех переменных u = f ( x, y, z ) частная производная по
переменной x в точке M 0 ( x0 , y0 , z0 )
∆ xu
∂u
f ( x0 + ∆x, y0 , z0 ) − f ( x0 , y0 , z0 )
= lim
=
.
lim
∂x ∆x→0 ∆x ∆x→0
∆x
Таким образом, частная производная функции нескольких переменных
определяется как производная функции одной из этих переменных при
условии, что все остальные переменные являются постоянными. Поэтому все
правила и формулы дифференцирования, которые справедливы для
производных функций одной переменной, имеют место и для частных
производных. Однако необходимо помнить, что при нахождении частной
производной по какой-нибудь переменной во всех этих формулах и правилах
все остальные переменные являются постоянными.
x
Пример 3. Найти частные производные функции z = arctg .
y
∂z
находим как производную данной
Решение. Частную производную
∂x
функции по x , считая y неименной. Тогда
∂z
1
1
y
.
=
= 2
2 ⋅
2
∂x
⎛x⎞ y x + y
1 + ⎜⎜ ⎟⎟
⎝ y⎠
Аналогично
⎛ 1⎞
1
x
∂z
⎟
.
=
−
=
−
2 ⋅ x ⋅⎜
2
2
2
⎜ y ⎟
x
y
∂y
+
⎛x⎞
⎝
⎠
1 + ⎜⎜ ⎟⎟
⎝ y⎠
9
∂z ∂z
,
функции z = f ( x, y ) мы
∂x ∂y
определили в такой точке M , в окрестности которой функция определена,
т.е. во внутренней точке области определения функции. Если M ( x, y ) –
граничная точка области определения функции, то ∆ x z ( ∆ y z ) может быть не
Отметим, что частные производные
определена, так как точки M 1 ( x + ∆x, y ) , M 2 ( x, y + ∆y ) могут не принадлежать
области определения функции ни при каких ∆x ≠ 0 ( ∆y ≠ 0 ). Это, например,
имеет место для точки M 0 на рис. 4.
y
M0
x
0
Рис. 4.
∂z
во внутренних
∂x
z′x (M ) , то на основании определения
точках M области и существует Mlim
→M
В этом случае, если существует частная производная
0
считают
z′x (M 0 ) = Mlim
z′x (M ) .
→M
Аналогично определяется z′y (M 0 ) .
0
∂z
функции
∂x
z = f ( x, y ) . График функции z = f ( x, y ) есть некоторая поверхность (σ ) . На
поверхности (σ ) ей соответствует точка P0 ( x0 , y0 , z0 ) . Пусть плоскость y = y0
пересекает график данной функции, т.е. поверхность (σ ) . В результате
пересечения получаем кривую z = f ( x, y0 ) (на рис. 5 это кривая AP0 B ),
которую можно рассматривать как график функции одной переменной
z = f ( x, y0 ) в плоскости y = y0 .
Выясним геометрический смысл частной производной
10
z
(σ)
P0
B
N
y0
0
M0
y
α
x
Рис. 5.
Тогда на основании геометрического смысла производной функции
∂z
одной переменной значение частной производной
функции z = f ( x, y ) в
∂x
точке M 0 ( x0 , y0 ) равно тангенсу угла α , который образован положительным
направлением оси Ox и касательной, проведенной в точке P0 ( x0 , y0 , z0 ) к
линии пересечения поверхности z = f ( x, y ) и плоскости y = y0 (см. рис. 5).
7. Частные производные высших порядков
Частные производные функции нескольких переменных являются
функциями тех же переменных. Эти функции, в свою очередь, могут иметь
частные
производные,
которые
называются
вторыми
частными
производными (или частными производными второго порядка) исходной
функции.
Так, например, функция z = f ( x, y ) двух переменных имеет четыре
частные производные второго порядка, которые определяются следующим
образом:
⎛ ∂z ⎞
∂⎜ ⎟
2
⎝ ∂x ⎠ = ∂ ⎛ ∂z ⎞ = ∂ z = f ′′ ( x, y ) = f ′′ ,
⎜ ⎟
xx
xx
∂x
∂x ⎝ ∂x ⎠ ∂x 2
⎛ ∂z ⎞
∂⎜⎜ ⎟⎟
2
⎝ ∂y ⎠ = ∂ ⎛⎜ ∂z ⎞⎟ = ∂ z = f ′′ ( x, y ) = f ′′ ,
yy
yy
∂y
∂y ⎜⎝ ∂y ⎟⎠ ∂y 2
⎛ ∂z ⎞
∂⎜⎜ ⎟⎟
2
⎝ ∂y ⎠ = ∂ ⎛⎜ ∂z ⎞⎟ = ∂ z = f ′′ ( x, y ) = f ′′ ,
yx
yx
∂x
∂x ⎜⎝ ∂y ⎟⎠ ∂y∂x
11
⎛ ∂z ⎞
∂⎜ ⎟
2
⎝ ∂x ⎠ = ∂ ⎛ ∂z ⎞ = ∂ z = f ′′ ( x, y ) = f ′′ .
⎜ ⎟
xy
xy
∂y
∂y ⎝ ∂x ⎠ ∂x∂y
Частные производные от частных производных второго порядка
называются частными производными третьего порядка.
Функция имеет восемь частных производных третьего порядка
∂3 z ∂3 z
∂3 z
∂3 z
∂3 z
∂3 z ∂3 z
∂3 z
,
,
,
,
,
,
,
.
∂x 3 ∂x 2∂y ∂x∂y∂x ∂x∂y 2 ∂y∂x 2 ∂y∂x∂y ∂y 2∂x ∂y 3
Аналогично определяются и обозначаются частные производные
четвертого, пятого и других высших порядков: частной производной n -го
порядка функции нескольких переменных называется частная производная
первого порядка от частной производной (n − 1) -ого порядка той же функции.
Частная производная второго или более высокого порядка, взятая по
нескольких разных переменных, называется смешанной частной
производной.
Пример 4. Найти смешанные частные производные второго порядка
3 4
z=x y .
Решение. Находим частные производные первого порядка:
∂z
∂z
= 3x 2 y 4 ,
= 4 x3 y 3 .
∂x
∂y
Затем находим частные производные второго порядка:
∂2 z
∂ ⎛ ∂z ⎞
′
= ⎜⎜ ⎟⎟ = (3 x 2 y 4 )y = 12 x 2 y 3 ,
∂x∂y ∂y ⎝ ∂y ⎠
∂2 z
∂ ⎛ ∂z ⎞
′
= ⎜⎜ ⎟⎟ = (4 x 3 y 3 )x = 12 x 2 y 3 .
∂y∂x ∂x ⎝ ∂y ⎠
∂2 z
∂2 z
и
,
Заметим здесь, что смешанные частные производные
∂x∂y
∂y∂x
которые отличаются между собой только порядком последовательного
дифференцирования одной и той же функции, оказались тождественно
равными. Этот результат не является случайным. Относительно смешанных
частных производных имеет место теорема, которую мы приводим без
доказательства.
Теорема. Две смешанные частные производные одной и той же
функции, которые отличаются только порядком дифференцирования, равны
между собой при условии их непрерывности.
В частности, для функции двух переменных z = f ( x, y ) имеем
∂2 z
∂2z
=
.
∂x∂y ∂y∂x
8. Полный дифференциал функции
12
Определение 1. Функция z = f ( x, y ) называется дифференцируемой в
точке M ( x, y ) , если ее полное приращение ∆z можно представить в виде
(8.1)
∆z = A ⋅ ∆x + B ⋅ ∆y + ω(∆x, ∆y ) ,
где ∆x и ∆y – произвольные приращения аргументов x и y в некоторой
окрестности точки M ( x, y ) ; A и B – константы (т.е. величины, не зависящие
от ∆x и ∆y ); ω(∆x, ∆y ) – бесконечно малая более высокого порядка малости,
между точками
M ( x, y )
и
ω(∆x, ∆y )
M 1 ( x + ∆x, y + ∆y ) (это значит, что lim
= 0 ).
r →0
∆r
Таким образом, если функция z = f ( x, y ) дифференцируема в данной
точке, то на основании формулы (8.1) ее полное приращение в этой точке
состоит из главной части приращения A ⋅ ∆x + B ⋅ ∆y , линейной относительно
∆x и ∆y , и нелинейной части ω(∆x, ∆y ) более высокого порядка малости, чем
главная часть приращения.
Определение 2. Главная часть приращения функции z = f ( x, y ) ,
линейная относительно приращений ее аргументов ∆x и ∆y , называется
полным дифференциалом этой функции и обозначается символом dz или
df ( x, y ) , т.е.
dz = A ⋅ ∆x + B ⋅ ∆y .
(8.2)
В выражении для дифференциала A ⋅ ∆x + B ⋅ ∆y величины A и B не
зависят от ∆x и ∆y , но зависят от точки M ( x, y ) , в которой рассматривается
этот дифференциал. Другими словами, A и B есть функции x и y . Вид этих
функций устанавливает следующая теорема.
Теорема 1 (необходимые условия дифференцируемости). Если функция
z = f ( x, y ) в точке M ( x, y ) дифференцируема (т.е. имеет дифференциал
∂z
A ⋅ ∆x + B ⋅ ∆y ), то она имеет в точке M ( x, y ) первые частные производные
∂x
∂z
∂z
∂z
= A,
= B.
, при этом
и
∂y
∂y
∂x
Доказательство.
Так как по условию теоремы функция z = f ( x, y ) дифференцируема в
точке M ( x, y ) , то ее полное приращение ∆z в этой точке выражается по
формуле (8.1), которая имеет место для произвольных достаточно малых ∆x
и ∆y . Возьмем ∆y = 0 , а ∆x ≠ 0 . Но тогда приращение функции ∆z
становится частным приращением ∆ x z и формула (8.1) примет вид
∆ x z = A ⋅ ∆x + ω .
Разделяя обе части этого равенства на ∆x и переходя к пределу при
∆x → 0 . получаем
чем
расстояние
∆r =
(∆x ) + (∆y )
2
2
13
lim
∆x → 0
Покажем, что
∆r =
(∆x ) + (∆y )
lim
∆x →0
∆xz
ω
= A + lim
.
∆x →0
∆x
∆x
ω
= 0 . В самом деле, так как
∆x
∆y = 0 , то
= ∆x . Следовательно,
ω
ω
ω
lim
=
±
lim
=
±
lim
= 0.
∆x → 0
∆x →0
∆r →0
∆x
∆x
∆r
∆xz
∆ x z ∂z
существует
и
равен
A
.
Но
lim
= , и
Таким образом, lim
∆x →0
∆x → 0
∆x
∆x ∂x
∂z
в точке M ( x, y ) существует и равна A .
поэтому частная производная
∂x
∂z
в точке M ( x, y )
Аналогично можно показать, что частная производная
∂y
существует и равна B .
Заменяя теперь в формулах (8.1) и (8.2) A и B частными
∂z
∂z
производными
и
, получаем
∂x ∂y
∂z
∂z
∆z = ⋅ ∆x + ⋅ ∆y + ω(∆x, ∆y ) ,
(8.3)
∂x
∂y
∂z
∂z
∆z = ⋅ ∆x + ⋅ ∆y .
∂x
∂y
Можно показать, что обратная теорема, вообще говоря, неверна, т.е. из
существования частных производных не следует существование полного
дифференциала. Однако, если допустить, что частные производные не только
существуют, но и непрерывны, то функция будет дифференцируемой.
Другими словами, имеет место следующая теорема.
Теорема 2 (достаточные условия дифференцируемости). Если функция
z = f ( x, y ) имеет частные производные в некоторой окрестности точки
M ( x, y ) и эти производные непрерывны в самой точке M ( x, y ) , то функция
z = f ( x, y ) дифференцируема в этой точке.
Доказательство. Придадим переменным x и y настолько малые
приращения ∆x и ∆y , чтобы точка M 1 ( x + ∆x, y + ∆y ) не вышла за границы
указанной окрестности точки M .
Представим полное приращение функции в следующем виде:
∆z = f ( x + ∆x, y + ∆y ) − f ( x, y ) = ( f ( x + ∆x, y + ∆y ) − f ( x, y + ∆y )) +
2
2
+ ( f ( x, y + ∆y ) − f ( x, y ))
Выражение f ( x + ∆x, y + ∆y ) − f ( x, y + ∆y ) можно рассматривать как
приращение функции f ( x, y + ∆y ) одной переменной x (второй аргумент
имеет постоянное значение, равное y + ∆y ).
14
Так как по условию теоремы эта функция имеет производную
f x′( x, y + ∆y ) , то на основании теоремы Лагранжа имеем
f ( x + ∆x, y + ∆y ) − f ( x, y ) = f x′( x + θ1 ⋅ ∆x, y + ∆y ) ⋅ ∆x , 0 < θ1 < 1 .
Рассуждая аналогично, для выражения f ( x, y + ∆y ) − f ( x, y ) имеем
f ( x, y + ∆y ) − f ( x, y ) = f y′( x, y + θ 2 ⋅ ∆y ) ⋅ ∆y , 0 < θ2 < 1 .
Производные f x′ и f y′ непрерывны в точке M ( x, y ) , поэтому
lim f x′( x + θ1 ∆x, y + ∆y ) = f x′( x, y ) ,
∆x→0
∆y →0
lim f y′( x, y + + θ2 ∆y ) = f y′( x, y ) .
∆x→0
∆y →0
Из последних равенств, согласно с определением предела, следует, что
f x′( x + θ1∆x, y + ∆y ) = f x′( x, y ) + α(∆x, ∆y ) ,
f y′( x, y + θ 2 ∆y ) = f y′( x, y ) + β(∆x, ∆y ) ,
где α(∆x, ∆y ) и β(∆x.∆y ) – бесконечно малые функции при ∆x → 0 , ∆y → 0 .
Подставляя полученные выражения в формулу для ∆z , находим
∆z = f x′( x, y )⋅ ∆x + f y′( x, y )⋅ ∆y + α(∆x, ∆y ) ⋅ ∆x + β(∆x, ∆y ) ⋅ ∆y ,
(8.5)
а это и означает, что функция z = f ( x, y ) дифференцируема в точке M .
Следствие. Из непрерывности частных производных следует
непрерывность самой функции.
Теорема 2 имеет важное значение для проверки дифференцируемости
функций, так как непосредственную проверку дифференцируемости функции
с помощью определения часто трудно осуществить, в то время как проверка
«непрерывности» частных производных производится более легко.
Как и в случае функции одной переменной, для приращения
независимых переменных x и y имеют место равенства ∆x = dx , ∆y = dy .
Тогда выражение для дифференциала функции двух переменных
примет вид
∂z
∂z
dz = ⋅ dx + ⋅ dy
∂x
∂y
или
dz = f x′( x, y )dx + f y′( x, y )dy .
Все вышесказанное легко распространяется на функции трех и
большего количества переменных. Так, например, для дифференцируемой
функции трех переменных u = f ( x, y, z ) полное приращение ∆u выражается
формулой
∂u
∂u
∂u
∆u = ∆x + ∆y + ∆z + ω(∆x, ∆y, ∆z )
∂x
∂y
∂z
ω
2
2
2
при условии, что lim
= 0 , ∆r = (∆x ) + (∆y ) + (∆z ) , а ее полный
r →0
∆r
дифференциал имеет вид
15
∂u
∂u
∂u
⋅ dx + ⋅ dy + ⋅ dz .
∂x
∂y
∂z
Пример 5. Найти полный дифференциал функции
z = ex +y .
Решение. Замечая, что частные производные
∂z
∂z
= 2x ⋅ ex +y ,
= 3y2 ⋅ ex +y
∂x
∂y
непрерывны при всех значениях x , y , z , находим
∂z
∂z
dz = dx + dy = e x + y (2 xdx + 3 y 2 dy ) .
∂x
∂y
du =
2
2
3
3
2
2
3
3
9. Применение полного дифференциала в приближенных вычислениях
Полный дифференциал функции нескольких переменных можно
использовать для приближенных вычислений. Пусть дана дифференцируемая
функция z = f ( x, y ) . Ее полное приращение выражается формулой
∆z = f x′( x, y ) ⋅ ∆x + f y′( x, y ) ⋅ ∆y + ω(∆x, ∆y ) ,
ω(∆x, ∆y ) стремится к нулю быстрее, чем ∆r = (∆x ) + (∆y ) . Поэтому при
малых r , т.е. при малых ∆x и ∆y слагаемые ω(∆x, ∆y ) можно отбросить и
писать
∆z ≈ f x′( x, y ) ⋅ ∆x + f y′( x, y ) ⋅ ∆y ,
это значит, приращение функции приближенно можно заменить ее полным
дифференциалом.
Так как для функции z = f ( x, y )
∆z = f ( x + ∆x, y + ∆y ) − f ( x, y ) ,
то, подставляя сюда вместо ∆z его приближенное значение, получаем
f ( x + ∆x, y + ∆y ) − f ( x, y ) ≈ f x′( x, y ) ⋅ ∆x + f y′( x, y ) ⋅ ∆y ,
откуда
f ( x + ∆x, y + ∆y ) ≈ f ( x, y ) + f x′( x, y ) ⋅ ∆x + f y′( x, y ) ⋅ ∆y .
Последней формулой можно пользоваться для приближенных
вычислений значений функции двух переменных в точке M ( x0 + ∆x, y0 + ∆y ) ,
близкой к точке M 0 ( x0 , y0 ) , если известны значения функции и ее частных
производных в самой точке M 0 ( x0 , y0 ) :
f ( x0 + ∆x, y0 + ∆y ) ≈ f ( x0 , y0 ) + f x′( x0 , y0 ) ⋅ ∆x + f y′( x0 , y0 ) ⋅ ∆y .
(9.1)
Аналогичные формулы имеют место для функции n переменных при
n > 2 . Например, при n = 3
f ( x0 + ∆x, y0 + ∆y, z0 + ∆z ) ≈
≈ f ( x0 , y0 , z0 ) + f x′( x0 , y0 , z0 ) ⋅ ∆x + f y′( x0 , y0 , z0 ) ⋅ ∆y + f z′( x0 , y0 , z0 ) ⋅ ∆z.
2
2
Пример 6. Вычислить приближенно arctg (1,04) .
16
Решение. Используем формулу (9.1). Здесь f ( x ) = arctgx , x0 = 1,
1
∆x = 0,04 , f ′( x ) =
.
1 + x02
Тогда
1
π
arctg(1,04) ≈ arctg1 +
⋅ 0,04 ≅ + 0,02 ≈ 0,785 + 0,02 ≈ 0,805 ≈ 460 7! .
2
1+1
4
10. Дифференцирование сложной функции
Пусть z = f (u, v ) – функция двух переменных, каждая из которых в
свою очередь есть функция независимых переменных x и y :
u = u ( x, y ) , v = v ( x, y ) .
Тогда z = f (u ( x, y ), v( x, y )) = F ( x, y ) – сложная функция двух
независимых переменных x и y , а переменные u и v – промежуточные
аргументы.
Теорема. Если функция z = f (u, v ) дифференцируемая в точке
P0 (u0 , v0 ) ∈ y , а функции u = u ( x, y ) , v = v( x, y ) дифференцируемые в точке
M 0 ( x0 , y0 ) ∈ D( f ) , то сложная функция z = f (u, v ) , где u = u ( x, y ) , v = v( x, y )
дифференцируема в точке M 0 ( x0 , y0 ) ∈ D( f ) , а ее частные производные
находятся по формулах:
∂z ∂z ∂u ∂z ∂v
= ⋅ + ⋅ ,
(10.1)
∂x ∂u ∂x ∂v ∂x
∂z ∂z ∂u ∂z ∂v
= ⋅ + ⋅ ,
∂y ∂u ∂y ∂v ∂y
или, используя более короткую запись
z′x = zu′ ⋅ u′x + zv′ ⋅ v′x , z′y = zu′ ⋅ u′y + zv′ ⋅ v′y .
Доказательство. Докажем первую из формул (10.1). В точке P0 ( x0 , y0 )
переменной x придадим приращение ∆x , сохраняя значение y неизменным.
Тогда функции u и v получают частные приращения ∆ x u , ∆ x v , а функция z
полное приращение ∆z (так как ∆ x u , ∆ x v – приращения по обеим
промежуточным аргументам). Функция z = f (u, v ) , дифференцируема в точке
M 0 (u0 , v0 ) , поэтому ее приращение в этой точке можно представить в виде
∂z
∂z
∆z = ⋅ ∆ x u + ⋅ ∆ x v + α(∆ x u , ∆ x v ) ⋅ ∆ x u + β(∆ x u , ∆ x v ) ⋅ ∆ x v .
∂u
∂v
Разделим обе части этого равенства на ∆x ≠ 0 :
∆z ∂z ∆ x u ∂z ∆ x v 1
1
= ⋅
+ ⋅
+
⋅ α(∆ xu , ∆ x v ) ⋅ ∆ x u +
⋅ β(∆ x u , ∆ x v ) ⋅ ∆ x v .
∆x ∂u ∆x ∂v ∆x ∆x
∆x
Если ∆x → 0 , то ∆ x u → 0 и ∆ x v → 0 на основании непрерывности
функций u ( x, y ) и v( x, y ) . Но тогда α(∆ x u , ∆ x v ) и β(∆ x u, ∆ x v ) также стремятся
к нулю. Переходя к пределу при ∆x → 0 , получаем
17
∆ x v ∂v
∆z ∂z
∆ x u ∂u
=
, lim
=
,
lim
= ,
∆x ∂x ∆x→0 ∆x ∂x ∆x→0 ∆x ∂x
∆ xu
∆ xv
(
)
(
)
u
v
u
v
lim
α
∆
,
∆
⋅
=
0
,
lim
β
∆
,
∆
⋅
= 0,
x
x
x
x
∆x→0
∆x →0
∆x
∆x
и, следовательно,
∂z ∂z ∂u ∂z ∂v
= ⋅ + ⋅ .
∂x ∂u ∂x ∂v ∂x
Аналогично можно доказать, что
∂z ∂z ∂u ∂z ∂v
= ⋅ + ⋅ .
∂y ∂u ∂y ∂v ∂y
Рассмотрим функцию трех переменных ω = f (u , v, t ) , каждая из
которых в свою очередь есть функция независимых переменных x , y , z :
u = u ( x, y, z ) , v = v( x, y, z ) , t = t ( x, y,.z ) .
Тогда функция ω = f (u ( x, y, z ), v( x, y, z ), t ( x, y, z )) = F ( x, y, z ) является
сложной функцией трех независимых переменных x , y , z , а переменные u ,
v , t называются промежуточными. Частные производные этой функции
находятся по формулах
ω′x = ω′u ⋅ u′x + ω′v ⋅ v′x + ω′t ⋅ t ′x ,
ω′y = ω′u ⋅ u′y + ω′v ⋅ v′y + ω′t ⋅ t ′y ,
ω′z = ω′u ⋅ u′z + ω′v ⋅ v′z + ω′t ⋅ t ′z .
Рассмотрим частные случаи задания сложной функции ω = f (u , v, t ) .
1. Пусть ω = f (u , v, t ) , u = u ( x, y ) , v = v( x, y ) , t = t ( x, y ) . Тогда
ω = f (u ( x, y ), v( x, y ), t ( x, y )) = F ( x, y ) является сложной функцией только двух
∂ω ∂ω
аргументов, и, следовательно, имеем две частные производные
,
.
∂x ∂y
z = f ( x, y , u ) ,
y = y(x ) ,
u = u ( x ) . Очевидно, что
2. Пусть
z = f ( x, y ( x ), u ( x )) = F ( x ) является функцией одной переменной x , и можно
dz
ставить вопрос о нахождении
.
dx
Эта производная находится по первой из формул (10.1):
dz ∂z ∂x ∂z ∂y ∂z ∂u
= ⋅ + ⋅ + ⋅ .
dx ∂x ∂x ∂y ∂x ∂u ∂x
Так как y = y( x ) , u = u ( x ) – функции только одной переменной x , то их
частные производные превращаются в обыкновенные производные. Кроме
∂x
того,
= 1 , поэтому имеем
∂x
dz ∂z ∂z ∂y ∂z ∂u
(10.2)
= + ⋅ + ⋅ .
dx ∂x ∂y ∂x ∂u ∂x
lim
∆x→0
18
dz
сложной функции z = f ( x, y ( x ), u ( x )) , найденная по
dx
∂z
и
формуле (10.2), называется полной производной. Между частной
∂x
dz
производными, которые входят в формулу (10.2) есть
полной
dx
dz
существенная разница. Полная производная
– это обыкновенная
dx
∂z
есть частная производная от z по
производная от z как функция x , а
∂x
переменной x , которая непосредственно входит в выражение функции, это
значит при условии, что другие переменные y и u , которые зависят от x ,
при дифференцировании остаются неизменными.
Для функции трех переменных u = F ( x, y, z ) , где x = x(t ) , y = y (t ) ,
z = z (t ) , имеем
du ∂u ∂x ∂u ∂y ∂u ∂z
(10.2)
=
⋅ + ⋅ + ⋅ .
dt ∂x dt ∂y dt ∂z dt
Полученные результаты легко обобщаются на случай сложной
функции произвольного количества аргументов.
Пример 7. Найти частные производные сложной функции двух
x
переменных z = u 2 ⋅ v 2 , где u = 2 x + y , v = .
y
∂z
∂u
∂z
∂v 1 ∂v − x
∂u
Решение. Имеем
= 2uv 2 ,
= 2vu 2 ,
= 2,
.
= ,
= 1,
=
∂u
∂v
∂x
∂x y ∂y y 2
∂y
Используя формулы (10.1), получаем:
⎛ x 2x + y ⎞
⎛
dz ∂z ∂u ∂z ∂v
u ⎞ 2x
1
⎟⎟ =
= ⋅ + ⋅ = 2u ⋅ v 2 ⋅ 2 + 2vu 2 ⋅ = 2uv⎜⎜ 2v + ⎟⎟ = (2 x + y )⎜⎜ +
dx ∂u ∂x ∂v ∂x
y
y
y
y
y
⎠
⎠
⎝
⎝
Производная
2x
(2 x + y ) ⋅ (3x + y )
y2
⎛
⎛ x ⎞
dz ∂z ∂u ∂z ∂v
ux ⎞
= ⋅ + ⋅ = 2u ⋅ v 2 ⋅1 + 2vu 2 ⋅ ⎜⎜ − 2 ⎟⎟ = 2uv⎜⎜ v − 2 ⎟⎟ =
dy ∂u ∂y ∂v ∂y
y ⎠
⎝
⎝ y ⎠
⎛ x x(2 x + y ) ⎞
x
2 x3
(2 x + y ).
⎟
=
−
= 2 (2 x + y )⎜⎜ −
2
3
⎟
y
y
y
y
⎠
⎝
Пример 8. Найти полную производную сложной функции
z = ln (e x + e − y ) , где x = t 2 , y = t 3 .
∂z
ex
dx
dy
∂z
e− y
= x −y ,
= − x −y ,
= 2t ,
= 3t 2 .
Решение. Имеем
dt
dt
∂x e + e
∂y
e +e
Используя формулу (10.2), получаем
=
19
dz ∂z ∂x ∂z ∂y
ex
e− y
= ⋅ + ⋅ = x
⋅
2
t
=
⋅ 3t .
dx ∂x dt ∂y dt e + e − y
e x + e−y
Учитывая, что x = t 2 , y = t 3 , находим
2
3
(
)
dz
et
e−t
t
= t
⋅ 2t − t
⋅ 3t 2 = t
2et − 3te −t .
−t
−t
−t
dx e + e
e +e
e +e
2
3
2
3
2
3
2
3
11. Инвариантность формы полного дифференциала
Как известно, для дифференциала функции одной переменной y = f ( x )
имеет место инвариантность его формы. Это означает, что выражение для
дифференциала dy = f ′( x )dx остается правильным независимо от того,
является x независимой переменной или функцией некоторой переменной
x = ϕ(t ) .
Найдем
теперь
полный
дифференциал
сложной
функции
∂z ∂z
,
,
z = f (u ( x, y ), v( x, y )) в точке M 0 ( x0 , y0 ) . Подставим выражения
∂x ∂y
определенные равенствами (10.1) в формулу полного дифференциала
сложной функции двух переменных
∂z
∂z
(11.1)
dz = ⋅ dx + ⋅ dy .
∂x
∂y
Получаем
⎛ ∂z ∂u ∂z ∂v ⎞
⎛ ∂z ∂u ∂z ∂v ⎞
dz = ⎜ ⋅ + ⋅ ⎟dx + ⎜⎜ ⋅ + ⋅ ⎟⎟dy
⎝ ∂u ∂x ∂v ∂x ⎠
⎝ ∂u ∂y ∂v ∂y ⎠
или
∂v ⎞
∂z ⎛ ∂u
∂u ⎞ ∂z ⎛ ∂v
dz = ⎜⎜ dx + dy ⎟⎟ + ⎜⎜ dx + dy ⎟⎟ .
∂y ⎠
∂u ⎝ ∂x
∂y ⎠ ∂v ⎝ ∂x
∂z
∂z
∂u
∂u
∂v
∂v
Так как
dx + dy = du ,
dx + dy = dv , то dz = ⋅ du + ⋅ dv (11.2).
∂u
∂v
∂x
∂y
∂x
∂y
Сравнивая формулы (11.1) и (11.2), замечаем, что форма записей
полного дифференциала функции двух переменных не зависит от того,
являются u и v независимыми переменными или функциями других
независимых переменных. отсюда и следует инвариантность формы первого
дифференциала функции нескольких переменных.
12. Производная от функции, заданной неявно
Начнем рассмотрение этого вопроса с функции одной переменной,
заданной неявно.
Теорема. Пусть некоторая функция y = f ( x ) задана неявно уравнением
F ( x, y ) = 0 ,
(12.1)
20
где F ( x, y ) , Fx′( x, y ) , Fy′( x, y ) – непрерывные функции в некоторой области
D , которая содержит точку ( x, y ) , координаты которой удовлетворяют
уравнению (12.1), кроме того в этой точке Fy′( x, y ) ≠ 0 .
Тогда функция y от x имеет производную
F ′( x, y )
y′x = − x
.
(12.2)
Fy′( x, y )
Доказательство. Пусть некоторому значению x соответствует
определенное значение функции y . При этом F ( x, y ) = 0 .
Придадим независимой переменной x приращение ∆x , тогда функция
y получит приращение ∆y , т.е. значению аргумента x + ∆x соответствует
значение функции y + ∆y . На основании уравнения F ( x, y ) = 0 будем иметь
F ( x + ∆x, y + ∆y ) = 0 .
Следовательно, F ( x + ∆x, y + ∆y ) − F ( x, y ) = 0 .
Так как левая часть последнего равенства есть полное приращение
функции двух переменных, то его можно на основании (8.5) записать так:
∂F
∂F
F ( x + ∆x , y + ∆y ) − F ( x , y ) =
⋅ ∆x +
⋅ ∆y + α(∆x, ∆y ) ⋅ ∆x + β(∆x, ∆y ) ⋅ ∆y ,
∂x
∂y
где α(∆x, ∆y ) и β(∆x, ∆y ) стремятся к нулю при стремлении к нулю ∆x и ∆y .
Так как левая часть последнего равенства равна нулю, можно записать:
∂F
∂F
⋅ ∆x +
⋅ ∆y + α(∆x, ∆y ) ⋅ ∆x + β(∆x, ∆y ) ⋅ ∆y = 0 .
∂x
∂y
∆y
Разделив обе части последнего равенства на ∆x , выразим
:
∆x
∂F
+ α(∆x, ∆y )
∆y
∂
x
=−
.
∂F
∆x
+ β(∆x, ∆y )
∂y
Переходя к пределу при ∆x → 0 в последнем равенстве и учитывая, что
∂F
при этом α(∆x, ∆y ) и β(∆x, ∆y ) также стремятся к нулю и что
≠ 0, в
∂y
результате получаем
∂F
dy
= − ∂x .
∂F
dx
∂y
dy
от функции, заданной
Мы доказали и существование производной
dx
неявно, и нашли формулу для ее вычисления.
Рассмотрим теперь уравнение вида
21
F ( x, y , z ) = 0 .
(12.3)
Если каждой паре чисел x , y из некоторой области соответствует одно
или несколько значений z , которые удовлетворяют уравнению (12.3), то это
уравнение неявно определяет одно или несколько значений однозначных
функций z от x и y .
Например, уравнение x 2 + y 2 + z 2 − R 2 = 0 неявно определяет две
непрерывные функции z от x и y , которые можно выразить явно, разрешая
уравнение относительно z ; в этом случае мы получаем
z = R2 − x2 − y2 и z = − R2 − x2 − y2 .
∂z
∂z
и
неявной функции z от x и y ,
Найдем частные производные
∂x
∂y
∂z
определенной уравнением (12.3). Если мы находим
, то считаем y
∂x
неизменным. Поэтому здесь можно использовать формулу (12.2), если только
считать x независимой переменной, а функцией z . Следовательно,
∂F
∂z
= − ∂x .
∂F
∂x
∂z
Таким же образом находим
∂F
∂z
∂y
=−
.
∂F
∂y
∂z
∂F
При этом считаем, что
≠ 0.
∂z
Аналогичным образом определяются неявные функции произвольного
количества переменных и находятся их частные производные.
Замечание. Все рассуждения этого параграфа проводились при
допущении, что уравнение F ( x, y ) = 0 определяет некоторую функцию одной
переменной y = ϕ( x ) ; уравнение F ( x, y.z ) = 0 определяет некоторую функцию
двух переменных z = f ( x, y ) . Приведем без доказательства теорему, которая
определяет, каким условиям должна удовлетворять функция F ( x, y ) , чтобы
уравнение F ( x, y ) = 0 определяло бы функцию y = ϕ( x ) .
Теорема. Пусть функция F ( x, y ) непрерывна в окрестности точки
(x0 , y0 ) и имеет там непрерывные частные производные, причем Fy′(x, y ) ≠ 0 и
пусть F ( x0 , y0 ) = 0 . Тогда существует окрестность, которая содержит точку
(x0 , y0 ) , в которой уравнение F (x, y ) = 0 определяет однозначную функцию
y = ϕ( x ) .
22
Аналогичная теорема имеет место и для условий существования
неявной функции, которая определяется уравнением F ( x, y, z ) = 0 .
Замечание. Все рассуждения этого параграфа проводились при
допущении, что уравнение F ( x, y ) = 0 определяет некоторую функцию двух
переменных z = f ( x, y ) . Приведем без доказательства теорему, которая
определяет, каким условиям должна удовлетворять функция F ( x, y ) , чтобы
уравнение F ( x, y ) = 0 определяло бы функцию y = ϕ( x ) .
Теорема. Пусть функция F ( x, y ) непрерывна в окрестности точки
(x0 , y0 ) и имеет там непрерывные частные производные, причем Fy′(x, y ) ≠ 0 и
пусть F ( x0 , y0 ) = 0 . Тогда существует окрестность, которая содержит точку
(x0 , y0 ) , в которой уравнение F (x, y ) = 0 определяет однозначную функцию
y = ϕ( x ) .
Аналогичная теорема имеет место и для условий существования
неявной функции, которая определяется уравнением F ( x, y, z ) = 0 .
Замечание. При выводе правил дифференцирования неявных функций
мы пользовались условиями, которые определяют существование неявных
функций.
Пример 9. Найти производную функции, заданной неявно уравнением
sin ( xy ) − e xy − x 2 y = 0 .
∂F
Решение. Имеем F ( x, y ) = sin ( xy ) − e xy − x 2 y ,
= y cos( xy ) − ye xy − 2 xy ,
∂x
∂F
∂F
= x cos( xy) − ye xy − 2 xy ,
= x cos( xy ) − xe xy − x 2 .
∂y
∂y
Тогда получаем
∂F
dy
ye xy − y cos( xy ) + 2 xy y (e xy − cos( xy ) + x )
∂
x
=−
=
=
.
∂F
dx
x cos( xy ) − xe xy − x 2
x(cos( xy ) − e xy − x )
∂y
Пример 10. Найти частные производные неявной функции
2 + z 2 − 4x + 2z + 2 = 0
∂F
= 2x − 4 ,
Решение. Имеем F ( x, y, z ) = x 2 − 2 y 2 + z 2 − 4 x + 2 z + 2 = 0 ,
∂x
∂F
∂F
= −4 y ,
= 2z + 2 .
∂y
∂z
Следовательно,
∂F
∂F
(− 4 y ) = 2 y .
∂z
2 x − 4 2 − z ∂z
∂y
= − ∂x = −
=
=−
,
=−
∂F
∂F
∂x
2 z + 2 z + 1 ∂y
2z + 2 z + 1
∂z
∂z
23
13. Скалярное поле
13.1 Скалярное поле и его геометрическое изображение
Определение. Скалярным полем называется часть пространства (или
все пространство), каждой точке M которой соответствует численное
значение некоторой скалярной величины u .
Например, неоднородное тело, каждой точке которой соответствует
определенное значение плотности, можно рассматривать как скалярное поле.
Другими примерами скалярных полей являются поле распределения
электрического потенциала и т.п. Во всех случаях будем считать, что
скалярная величина u не зависит от времени, а зависит только от положения
точки M в пространстве, это значит, рассматривается как функция точки M :
u = f (M ) . Эта функция называется функцией поля. Если в пространстве
выбрана система координат Oxyz , то скалярная величина u является
функцией координат x , y , z , т.е.
u = f (M ) = f ( x , y , z )
Наоборот, каждая функция трех переменных u = f ( x, y, z ) задает
некоторое скалярное поле.
Геометрическим изображением скалярного поля являются поверхности
уровня.
Определение. Поверхностью уровня (или эквипотенциальной
поверхностью) скалярного поля называется множество всех точек
пространства, в которых функция поля u = f ( x, y, z ) имеет одно и то же
значение C .
Уравнение поверхности уровня имеет вид:
F ( x, y , z ) = C .
Придавая C разные значения, получаем семейство поверхностей
уровня. Например, если поле задано функцией u = x 2 + y 2 + z 2 , то
поверхностями уровня являются сферы x 2 + y 2 + z 2 = C 2 с центром в начале
координат. Если скалярное поле есть поле распределения температуры в
некоторой части пространства, то поверхностями уровня будут
изотермические поверхности, т.е. поверхности, на каждой из которых
температура неизменная.
Наряду со скалярными полями в пространстве рассматриваются также
плоские скалярные поля. Плоское скалярное поле определяется как часть
плоскости (или вся плоскость), каждой точке M ( x, y ) которой соответствует
численное значение скалярной величины z . Функция плоского скалярного
поля зависит от двух переменных: z = f ( x, y ) . Плоские скалярные поля
геометрически изображается с помощью т.н. линий уровня. Линии уровня
определяются как множество точек плоскости, в которых функция плоского
скалярного поля имеет одно и то же значение. Для функции z = f ( x, y )
плоского скалярного поля уравнение линии уровня имеет вид
24
f ( x, y ) = C ,
где C – константа.
Например, для плоского скалярного поля, заданного функцией
2
z = x − y 2 , линиями уровня являются равнобочные гиперболы x 2 − y 2 = C
(рис. 6).
y
x
0
Рис. 6
При C = 0 получаем x − y = 0 или ( x − y ) ⋅ ( x + y ) = 0 . Это означает,
что асимптоты гипербол y = x и y = − x (биссектрисы координатных углов)
также являются линиями уровня данного поля.
2
2
13.2 Производная по направлению
Пусть задана дифференцируемая функция скалярного поля
u = f ( x, y, z ) . Рассмотрим точку M ( x, y, z ) этого поля и произвольный
единичный вектор
= cos α ⋅ i + cos β ⋅ j + cos γ ⋅ k ,
который выходит из точки N , а α , β , γ – углы вектора с осями координат.
Для характеристики скорости изменения функции в точке M ( x, y, z ) по
направлению вектора введем понятие производной по направлению. Для
этого проведем через точку M луч так, чтобы одно из направлений на нем
совпадало с направлением вектора . Пусть M 1 ( x + ∆x, y + ∆y, z + ∆z ) – какаянибудь другая точка этого луча.
Разность значений функции u скалярного поля в точках M и M 1
назовем приращением этой функции по направлению
и обозначим через
∆ u . Тогда
∆ u = f ( x + ∆x, y + ∆y, z + ∆z ) − f ( x, y, z ) .
Обозначим через ∆ расстояние между точками M и M 1 : ∆ = MM 1 .
25
∆u
при ∆ → 0 ( M 1 → M ), если он
∆
существует, называется производной функции u = f ( x, y, z ) в точке M ( x, y, z )
∂u
по направлению вектора и обозначается
, это значит
∂
∆ u ∂u
lim
=
.
∆ →0
∂
∆
Заметим, что если производная функции u в точке M ( x, y, z ) по
данному направлению
положительная, то функция u по этому
∂u
направлению возрастает, если же
< 0 , то функция u по направлению
∂
∂u
дает скорость изменения
убывает. Можно говорить, что производная
∂
функции u по этому направлению.
Получим формулу для вычисления производной по направлению.
Заметим, что приращения ∆x , ∆y , ∆z координат точки M связаны с длиной
Определение. Предел отношения
отрезка MM 1 = ∆
и направляющими косинусами вектора
следующими
соотношениями (рис. 7):
∆x = ∆ ⋅ cos α , ∆y = ∆ ⋅ cos β , ∆z = ∆ ⋅ cos γ .
z
M1
γ
α
∆z
β
M
∆y
∆x
y
0
x
Рис. 7.
Так как функция u по условию дифференцируемая, то ее приращение
∆ u в точке M ( x, y, z ) направлении можно представить в виде
∆ u = f x′( x, y, z ) ⋅ ∆x + f y′( x, y, z ) ⋅ ∆y + f z′( x, y, z ) ⋅ ∆z + ω(∆x, ∆y, ∆z ) ,
причем ω стремится к нулю быстрее, чем ∆r =
ω
lim
= 0.
∆r → 0
∆r
(∆x ) + (∆y ) + (∆z )
2
2
2
, т.е.
26
Тогда имеем
∆ u = f x′( x, y, z ) ⋅ ∆ ⋅ cos α + f y′( x, y, z ) ⋅ ∆ ⋅ cos β + f z′( x, y, z ) ⋅ ∆ ⋅ cos γ + ω .
Разделяя обе части этого равенства на ∆ и переходя к пределу при
∆ → 0 , получаем
ω
∂u
∆u
′( x, y, z ) ⋅ cos α + f y′( x, y, z ) ⋅ cos β + f z′( x, y, z ) ⋅ cos γ ) + lim .
(
= lim
=
lim
f
x
∆ →0
∆ →0
∆ →0
∆
∂
∆
Но f x′( x, y, z ) , f y′( x, y, z ) , f z′( x, y, z ) и направляющие косинусы не
ω
ω
= lim
= 0 , то окончательно имеем
∆ →0
∆r → 0
∆
∆r
зависят от ∆ , и так как lim
∂u
= f x′( x, y, z ) ⋅ cos α + f y′( x, y, z ) ⋅ cos β + f z′( x, y, z ) ⋅ cos γ .
(13.1)
∂
Из формулы (13.1) следует, что производная по направлению является
линейной комбинацией частных производных, причем направляющие
косинусы являются как бы весовыми множителями, которые показывают
вклад в производную по направлению соответствующей частной
производной.
Из формулы (13.1) очевидно, что если вектор совпадает с одним из
ортов i , j , k , то производная u по направлению
совпадает с
соответствующей частной производной этой функции. Например, если = i ,
то cos α = 1 , cos β = 0 , cos γ = 0 , и, следовательно,
∂u
= f x′( x, y, z ) .
∂
Если скалярное поле плоское, то функция поля, как уже было сказано,
зависит от двух переменных: z = f ( x, y ) . Вектор в этом случае находится в
плоскости Oxy (cos γ = 0 ) и = cos α ⋅ i + cos β ⋅ j или = − cos α ⋅ i + sin α ⋅ j ,
так как cos β = sin α (рис. 8). Формула (13.1) для производной по
направлению в случае плоского скалярного поля имеет следующий вид:
∂z
= f x′( x, y ) ⋅ cos α + f y′( x, y ) ⋅ sin α .
(13.2)
∂
y
α
M
∆y
∆x
x
0
Рис. 8.
27
Пример 11. Найти производную функции u = x 2 − 2 xz + y 2 в точке
M 1 (1,2,−1) по направлению от точки M 1 до точки M 2 (2,4,−3) .
Решение. Находим вектор
M 1M 2 = (2 − 1)i + (4 − 2 ) j + (− 3 + 1)k = i + 2 j − 2k
и соответствующий ему единичный вектор
MM
i + 2 j − 2k
1
2
2
= 1 2 =
= i + j− k .
2
3
3
M 1M 2
12 + 2 2 + (− 2 ) 3
имеем следующие направляющие косинусы:
1
2
2
cos α = , cos β = , cos γ = − .
3
3
3
2
Найдем частные производные функции u = x − 2 xz + y 2
∂u
∂u
′
′
= (x 2 − 2 xz + y 2 )x = 2 x − 2 z ,
= (x 2 − 2 xz + y 2 )y = 2 y ,
∂x
∂y
∂u
′
= (x 2 − 2 xz + y 2 )z = −2 x
∂y
и их значения в точке M 1 (1,2,−1) :
Таким образом, вектор
∂u
∂x
= (2 x − 2 z )M = 4 ,
1
M1
∂u
∂y
= (2 y )M = 2 ⋅ 2 = 4 ,
1
M1
∂u
∂z
= − 2 x M = −2 ⋅1 = −2 .
M1
1
Подставляя в формулу (13.1) найденные значения частных
производных и направляющих косинусов, получаем искомую производную:
∂u
1
2
⎛ 2 ⎞ 16
= 4 ⋅ + 4 ⋅ + (− 2 ) ⋅ ⎜ − ⎟ = .
∂
3
3
⎝ 3⎠ 3
Пример 12. Найти производную от функции z = ln( x + 2 y ) в точке
x2
по направлению касательной
M 1 (1,2) , которая принадлежит параболе y =
2
к этой параболе.
Решение.
Находим
частные
производные
от
функции
f ( x, y ) = ln( x + 2 y ) .
1
1
, f x′( x, y ) =
f x′( x, y ) =
x + 2y
x + 2y
⎛ 1⎞
и их значения в точке M 1 ⎜1, ⎟ :
⎝ 2⎠
1
2
1
⎛ 1⎞
⎛ 1⎞
f x′⎜1, ⎟ =
= , f x′⎜1, ⎟ =
= 1.
⎝ 2 ⎠ 1+ 2 ⋅ 1 2
⎝ 2 ⎠ 1+ 2 ⋅ 1
2
2
Для того, чтобы найти cos α и sin α , которые входят в формулу (13.2),
⎛ 1⎞
найдем угловой коэффициент касательной в точке M 1 ⎜1, ⎟ :
⎝ 2⎠
28
′
⎛ x2 ⎞
k = tgα = y′ M = ⎜ ⎟
⎝2⎠
= x x=1 = 1 .
x =1
Таким образом, tgα = 1 , откуда получаем два значения α : α1 = 45 и
α 2 = 225 , которые соответствуют двум взаимно перпендикулярным
направлениям касательной.
2
2
При α1 = 45 имеем cos α1 = cos 45 =
, sin α1 = sin 45 =
.
2
2
Следовательно, по формуле (13.2) получаем
∂u 1 2
2 3 2
= ⋅
+ 1⋅
=
.
∂
2
4
2 2
∂u
3 2
При α 2 = 225 аналогично имеем
=−
.
∂
4
13.3 Градиент скалярного поля
При изучении скалярных полей наравне с функцией поля u = f ( x, y, z )
рассматривается некоторый вектор, который тесно связан с этой функцией –
градиент скалярного поля.
Определение. Градиентом в точке M ( x, y, z ) скалярного поля,
заданного дифференцируемой функцией u = f ( x, y, z ) , называется вектор,
координаты которого равны соответствующим частным производным
f x′( x, y, z ) , f y′( x, y, z ) , f z′( x, y, z ) в точке M ( x, y, z ) :
f x′( x, y, z )i + f y′( x, y, z ) j + f z′( x, y, z )k .
Градиент функции u = f ( x, y, z ) обозначается одним из символов
grad f ( x, y, z ) , grad f (M ) .
Следовательно, по определению
grad f ( x, y, z ) = f x′( x, y, z )i + f y′( x, y, z ) j + f z′( x, y, z )k ,
или короче
∂u
∂u
∂u
(13.3)
grad u = i +
j+ k.
∂x
∂y
∂z
Таким образом, каждой точке M ( x, y, z ) скалярного поля, заданного
дифференцируемой функцией u = f ( x, y, z ) , соответствует не только
значение этой функции, но и совершенно определенный вектор grad f (M ) .
Между градиентом функции u = f ( x, y, z ) в данной точке и
∂u
производной по направлению
в той же точке существует связь, которая
∂
выражается следующей теоремой.
29
Теорема. Проекция вектора
grad u
на единичный вектор
= cos α ⋅ i + cos β ⋅ j + cos γ ⋅ k равна производной функции u в направлении
:
∂u
np grad u = .
(13.4)
∂
Доказательство. Пусть u = u ( x, y, z ) . Из векторной алгебры известно,
что проекция какого-нибудь вектора на единичный вектор равна скалярному
произведению этих векторов. Но
grad u = f x′( x, y, z )i + f y′( x, y, z ) j + f z′( x, y, z )k .
Поэтому
∂u
np grad u = (grad u , ) = f x′( x, y, z ) cos α + f y′( x, y, z ) cos β + f z′( x, y, z ) cos γ = ,
∂
что и требовалось доказать.
∂u
Учитывая, что производная по направлению
выражает скорость
∂
изменения скалярного поля u = f ( x, y, z ) по этому направлению, формулу
(13.4) можно прочитать и так: проекция grad u на единичный вектор равна
скорости изменения поля u = f ( x, y, z ) по направлению вектора .
Обозначим через ϕ угол между единичным вектором
и grad u .
Тогда
np grad u = grad u ⋅ cos ϕ .
Поэтому на основании формулы (13.4) имеем
∂u
= grad u ⋅ cos ϕ .
∂
Очевидно, когда направления векторов и grad u совпадают (ϕ = 0) ,
∂u
то производная по направлению
имеет наибольшее значение, равное
∂
grad u ⋅ cos 0 = grad u .
Таким образом, мы приходим к следующему выводу: grad u есть
вектор, который показывает направление наибольшего возрастания поля в
данной точке, а его модуль равен скорости этого возрастания.
Отсюда следует, что grad u функции скалярного поля u = f ( x, y, z )
определяется самим полем и не зависит от системы координат, в которой
рассматривается функция поля.
Выясним взаимное размещение grad u = grad f ( x, y, z ) в данной точке
M 0 ( x0 , y0 , z0 ) и поверхности уровня, которая проходит через эту точку. Пусть
уравнение поверхности имеет вид
f ( x, y, z ) = C0 или f ( x, y, z ) − C0 = 0 .
(13.5)
30
Рассмотрим кривую L , которая лежит на поверхности (13.5) и
проходит через точку M 0 (рис. 9). Допустим, что эта кривая задана
уравнениями
x = x(t ) , y = y (t ) , z = z (t ) , t ∈ T0 ,
где x(t ) , y (t ) , z (t ) – дифференцируемые функции параметра t , причем
x0 = x(t0 ) , y0 = y (t0 ) , z0 = z (t0 ) .
z
grad f (M 0 )
r ⋅ (t 0 )
90
M0
0
L
y
x
Рис. 9
Каждая точка кривой имеет координаты x(t ) , y (t ) , z (t ) , которые
удовлетворяют уравнению (13.5) поверхности уровня, так как кривая L
полностью лежит на этой поверхности. Таким образом, должно выполняться
тождество
f ( x(t ), y (t ), z (t )) − C0 = 0 .
Дифференцируя обе части этого тождества по t , получаем (на
основании формулы для производной сложной функции)
∂F
∂F
∂F
⋅ x′(t ) +
⋅ y′(t ) +
⋅ z ′(t ) = 0 .
∂x
∂y
∂z
В частности, при t = t0 имеем
Fx′( x0 , y0 , z0 ) ⋅ x′(t0 ) + Fy′( x0 , y0 , z0 ) ⋅ y′(t0 ) + Fz′( x0 , y0 , z0 ) ⋅ z′(t0 ) = 0 .
Левая часть последнего равенства есть скалярное произведение вектора
grad u (M 0 ) = Fx′( x0 , y0 , z0 ) ⋅ i + Fy′( x0 , y0 , z0 ) ⋅ j + Fz′( x0 , y0 , z0 ) ⋅ k
и
вектора
r ′(t0 ) = x′(t0 ) ⋅ i + y (t0 ) ⋅ j + z′(t0 ) ⋅ k , который направлен по касательной к кривой
L.
Таким образом,
(grad u (M 0 ), r ′(t0 )) = 0 .
(13.6)
Допустим, что grad u (M 0 ) ≠ 0 . Тогда из равенства (13.6) следует, что
grad u (M 0 ) перпендикулярен к вектору r ′(t0 ) , который направлен по
касательной к кривой L в точке M 0 . Так как эта кривая была выбрана
произвольно, то мы приходим к следующему заключении. Если скалярное
31
поле задано дифференцируемой функцией u = f ( x, y, z ) , то все касательные,
приведенные в точке M 0 к линиям, лежащим на поверхности уровня и
проходящим через точку M 0 , расположены в одной плоскости,
перпендикулярной к вектору grad f (M 0 ) , при условии, что этот вектор не
равен нулю.
В случае плоского скалярного поля, заданного дифференцируемой
функцией двух переменных z = f ( x, y ) , градиент определяется формулой
grad f ( x, y ) = f x′( x, y ) ⋅ i + f y′( x, y ) ⋅ j .
Его связь с произвольной по направлению
∂z
выражается равенством
∂
∂z
∂z
или
= grad z ⋅ cos ϕ ,
∂
∂
где ϕ – угол между единичным вектором и grad z . Можно показать, что
если поле задано дифференцируемой функцией z = f ( x, y ) , то вектор
grad f ( x0 , y0 ) перпендикулярен к касательной, которая проведена к линии
уровня в точке M 0 ( x0 , y0 ) .
Пример 13. Найти градиент функции u = x 2 + 3 y 2 − 2 z 2 − 4 в точке
M 0 (1,1,0) .
Решение. Обозначим f ( x, y, z ) = x 2 + 3 y 2 − 2 z 2 − 4 . Тогда f x′( x, y, z ) = 2 x ,
np grad z =
f y′( x, y, z ) = 6 y , f z′( x, y, z ) = −4 z , f x′ M = 2 ⋅1 = 2 , f y′ M = 6 ⋅1 = 6 , f z′ M = −4 ⋅ 0 = 0 .
0
0
0
Пользуясь формулой (13.3), получаем
grad u (M 0 ) = f x′(M 0 ) ⋅ i + f y′(M 0 ) ⋅ j + f z′(M 0 ) ⋅ k = 2 ⋅ i + 6 ⋅ j + 0 ⋅ k .
Пример 14. Найти наибольшую скорость возрастания функции
2
z = x y − 5y 3 в точке M 0 (2,1) .
Решение. Наибольшая скорость возрастания функции равна модулю
градиента этой функции.
Находим
∂z
∂z
∂z
∂z
= 2 xy ,
= x 2 − 15 y 2 ,
= 2 ⋅ 2 ⋅1 = 4 ,
= 2 2 − 15 ⋅12 = −11.
∂x
∂x M
∂y
∂y M
0
0
В точке M 0 (2,1) grad z = 4i − 11 j . Следовательно, наибольшая скорость
возрастания функции в данной точке равна
grad x M = 4 2 + 112 = 137 .
0
13.4 Касательная плоскость и нормаль к поверхности
Пусть поверхность задана уравнением
F ( x, y , z ) = 0 ,
(13.7)
левая часть которого есть дифференцируемая в некоторой области функция.
32
Эта функция u = f ( x, y, z ) определяет скалярное поле, для которого
данная поверхность (13.7) является одной из поверхностей уровня (это
значит, где u = c = 0 ), Пусть в точке M 0 ( x0 , y0 , z0 ) grad F ( x, y, z ) не равен
нулю. Тогда, на основании параграфа 13.3. все касательные, проведенные в
точке M 0 к линиям, лежащим на поверхности (13.7) и проходящим через
точку M 0 , расположены в одной плоскости, которая перпендикулярна к
вектору grad F (M 0 ) . Эта плоскость называется касательной к поверхности
F ( x, y, z ) = 0 в точке M 0 ( x0 , y0 , z0 ) (рис. 10)
z
grad F ( x0 , y 0 , z 0 )
касательная плоскость
M0
0
F ( x, y , z ) = 0
y
Рис. 10.
Найдем уравнение этой плоскости. Искомая плоскость, очевидно,
проходит через точку M 0 ( x0 , y0 , z0 ) , поэтому ее уравнение имеет вид
A( x − x0 ) + B( y − y0 ) + C ( z − z0 ) = 0 .
Так как вектор
grad F (M 0 ) = Fx′( x0 , y0 , z0 ) ⋅ i + Fy′( x0 , y0 , z0 ) ⋅ j + Fz′( x0 , y0 , z0 ) ⋅ k
по условию перпендикулярен касательной плоскости, то его можно считать
нормальным вектором этой плоскости, это значит, положить
A = Fx′( x0 , y0 , z0 ) , B = Fy′( x0 , y0 , z0 ) , C = Fz′( x0 , y0 , z0 ) .
Тогда уравнение касательной плоскости к поверхности (13.7) имеет вид
Fx′( x0 , y0 , z0 ) ⋅ ( x − x0 ) + Fy′( x0 , y0 , z0 ) ⋅ ( y − y0 ) + Fz′( x0 , y0 , z0 ) ⋅ ( z − z0 ) = 0 .
Пусть поверхность (13.7) имеет в некоторой ее точке M 0 касательную
плоскость. Прямая, проходящая через точку M 0 ( x0 , y0 , z0 ) , перпендикулярная
этой касательной плоскости, называется нормалью к поверхности (13.7) в
точке M 0 ( x0 , y0 , z0 ) . Вектор grad F (M 0 ) , очевидно, направлен вдоль нормали,
и поэтому его можно взять в качестве направляющего вектора прямой. Таким
образом, каноническое уравнение нормали имеет следующий вид:
x − x0
y − y0
z − z0
=
=
.
(13.9)
Fx′( x0 , y0 , z0 ) Fy′( x0 , y0 , z0 ) Fz′( x0 , y0 , z0 )
33
Рассмотрим теперь случай, когда поверхность задана уравнением
z = f ( x, y ) .
(13.10)
Этот случай можно свести к предыдущему, записывая уравнение в виде
f ( x, y ) − z = 0
и считая f ( x, y ) − z = F ( x, y, z ) .
Fz′( x, y, z ) = 1 и,
Тогда
Fx′( x, y, z ) = f x′( x, y ) ,
Fy′( x, y, z ) = f y′( x, y ) ,
следовательно,
grad F ( x0 , y0 , z0 ) = Fx′( x0 , y0 , z0 ) ⋅ i + Fy′( x0 , y0 , z0 ) ⋅ j + Fz′( x0 , y0 , z0 ) ⋅ k =
= f x′( x0 , y0 ) ⋅ i + f y′( x0 , y0 ) ⋅ j − k .
Поэтому уравнение касательной плоскости в точке M 0 ( x0 , y0 , z0 )
запишется в виде
f x′( x0 , y0 ) ⋅ ( x − x0 ) + f y′( x0 , y0 ) ⋅ ( y − y0 ) − ( z − z0 ) = 0
или
z − z0 = f x′( x0 , y0 ) ⋅ ( x − x0 ) + f y′( x0 , y0 ) ⋅ ( y − y0 ) ,
(13.11)
а уравнение нормали к поверхности в виде
(x − x0 ) = ( y − y0 ) = (z − z0 ) .
(13.12)
−1
f x′( x0 , y0 ) f y′( x0 , y0 )
Пример 15. Найти уравнения касательной плоскости и нормали к
однополостному гиперболоиду
x2 + 2 y2 − z 2 − 5 = 0
в точке M 0 (2,−1,1) .
Решение. Так как F ( x, y, z ) = x 2 + 2 y 2 − z 2 − 5 , Fx′(M 0 ) = 2 x x=2 = 2 ⋅ 2 = 4 ,
Fy′(M 0 ) = 4 y y =−1 = 4 ⋅ (− 1) = −4 , Fz′(M 0 ) = − 2 z z =1 = −2 ⋅1 = −2 , то
grad F (M 0 ) = Fx′(M 0 ) ⋅ i + Fy′(M 0 ) ⋅ j + Fz′(M 0 ) ⋅ k = 4 ⋅ i − 4 ⋅ j − 2 ⋅ k .
Поэтому уравнение касательной плоскости к данной поверхности
запишется в виде
4( x − 2 ) − 4( y + 1) − 2(2 − 1) = 0 или 2 x − 2 y − z − 5 = 0 ,
а уравнение нормали в виде
x − 2 y +1 z −1
x − 2 y +1 z −1
=
=
=
или
=
.
4
−2
2
−2
−1
−4
Пример 16. Найти уравнение касательной плоскости и нормали к
y2
2
эллиптическому параболоиду z = x +
в точке M 0 (1,−2,3) .
2
y2
2
Решение. Считая x +
= f ( x, y ) , получаем
2
f x′( x, y ) = 2 x , f y′( x, y ) = y , f x′(1,−2 ) = 2 , f y′(1,−2 ) = −2 .
Тогда, пользуясь формулами (13.11) и (13.12), запишем уравнение
касательной плоскости
z − 3 = 2( x − 1) − 2( y + 2) или 2 x − 2 y − z − 3 = 0 ,
34
и нормали
x −1 y + 2 z − 3
.
=
=
2
−2
−1
13.5 Геометрический смысл полного дифференциала функции двух
переменных
Пусть функция z = f ( x, y ) имеет в точке M 0 ( x0 , y0 ) дифференциал
dz = f x′( x0 , y0 )∆x + f y′( x0 , y0 )∆y
или
dz = f x′( x0 , y0 ) ⋅ ( x − x0 ) + f y′( x0 , y0 ) ⋅ ( y − y0 ) .
(13.13)
Рассмотрим в этой точке уравнение касательной плоскости
z − z0 = f x′( x0 , y0 ) ⋅ ( x − x0 ) + f y′( x0 , y0 ) ⋅ ( y − y0 ) .
(13.14)
Очевидно, что правая часть этого равенства совпадает с правой частью
выражения (13.13) для дифференциала dz . Следовательно, и левые части
этих равенств также равны.
Но в равенстве (13.13) левая часть есть дифференциал функции
z = f ( x, y )
в точке M 0 ( x0 , y0 ) , а в равенстве (13.14) левая часть есть соответствующее
приращение аппликаты касательной плоскости, проведенной к поверхности
z = f ( x, y ) .
Мы приходим к следующему выводу, который выясняет
геометрический смысл дифференциала функции двух переменных.
Дифференциал функции двух переменных равен соответствующему
приращению аппликаты касательной плоскости к поверхности, заданной
уравнением этой функции (рис. 11)
z
P ( x, y , z )
N
dz
∆z
P0 ( x0 , y0 , z 0 )
y
0
M 0 ( x0 , y0 )
∆y
∆x
x
35
Рис. 11.
14. Дифференциалы высших порядков
В параграфе 8 было введено понятие дифференцируемой в точке M
функции z = f (M ) и получена формула
dz = f x′( x, y ) dx + f y′( x, y ) dy .
Будем называть dz дифференциалом первого порядка.
Пусть функции f x′( x, y ) и f y′( x, y ) дифференцируемы в точке M . Будем
рассматривать dx и dy в выражении для dz представляет собой функцию
только переменных x и y , дифференцируемую в точке M , и ее
дифференциал имеет вид:
d (dz ) = d ( f x′( x, y )dx + f y′( x, y )dy ) =
(14.1)
′
′
′
′
′
′
= ( f x ( x, y )dx + f y ( x, y )dy )x ⋅ dx + ( f x ( x, y )dx + f y ( x, y )dy )y ⋅ dy
Дифференциал d (dz ) от дифференциала dz в точке M называется
дифференциалом второго порядка функции z = f (M ) в точке M и
обозначается dz . В свою очередь дифференциал d (d 2 z ) от d 2 z называется
дифференциалом третьего порядка функции z = f (M ) и обозначается d 3 z и
т.д. Дифференциал d (d n z ) от дифференциала d n−1 z
называется
дифференциалом n -ого порядка функции z = f (M ) и обозначается d n z .
Таким образом, для дифференциала n -ого порядка функции z = f (M )
имеет место формула
d n z = d (d n−1 z ).
С помощью формулы (14.1) найдем выражение для дифференциала
второго порядка:
2
′
′
d 2 z = d (dz ) = ( f x′dx + f y′dy )x ⋅ dx + ( f x′dx + f y′dy )y ⋅ dy = f xx′′ ⋅ (dx ) + f xy′′ ⋅ dx ⋅ dy +
+ f yx′′ ⋅ dy ⋅ dx + f yy′′ ⋅ (dy )
Если f xy′′ и f yx′′ непрерывны, то слагаемые f xy′′ ⋅ dx ⋅ dy и f yx′′ ⋅ dy ⋅ dx равны,
так что
2
2
d 2 z = f xx′′ ⋅ (dx ) + 2 f xy′′ ⋅ dx ⋅ dy + f yy′′ ⋅ (dy ) .
Аналогично
3
2
2
3
d 3 z = f x′′′ ⋅ (dx ) + 3 f x′′′y ⋅ (dx ) ⋅ dy + 3 f xy′′′ ⋅ dx ⋅ (dy ) + f y′′′ ⋅ (dy )
2
3
2
2
3
…
n(n − 1)...(n − (k − 1)) ( n )
n
n −1
n−k
k
d n z = f x( n ) ⋅ (dx ) + n ⋅ f x( n )y (dx ) dy + ... +
f x y ⋅ (dx ) (dy ) +
k!
n
(n )
+ ... + f y ⋅ (dy )
n
n −1
n−k k
n
36
Формула для d n z напоминает разложения двучлена в n -ой степени по
формуле Ньютона. Поэтому выражение для d n z символически можно
записать в виде, более удобном для запоминания:
n
⎛∂
⎞
∂
d z = ⎜⎜ dx + dy ⎟⎟ f ( x, y ) .
(14.2)
∂y ⎠
⎝ ∂x
x
Пример 17. Найти d 2 z для функции z = arctg .
y
x2 − y2
y
x
′
′
′
f
=
= f ′′ ,
Решение. Имеем f x′ = 2
,
,
f
=
−
xy
y
x + y2
x2 + y2
(x 2 + y 2 )2 yx
2 xy
2 xy
′
′
f
,
.
f x′′ = − 2
=
2
yz
(x + y 2 )
(x 2 + y 2 )2
2
2
− 2 xy ⋅ (dx ) + 2(x 2 − y 2 )dx ⋅ dy + 2 xy ⋅ (dy )
2
d z=
.
(x 2 + y 2 )2
n
2
15. Формула Тейлора для функции двух переменных
Аналогично функции одной переменной функцию двух переменных
можно представить в виде суммы многочлена n -ой степени и некоторого
остаточного члена. Докажем следующую теорему.
Теорема. Пусть функция z = f ( x, y ) непрерывна вместе со всеми
частными производными до (n + 1) -ого порядка включительно в некоторой
окрестности точки M ( x, y ) . Пусть точка M 1 ( x + ∆x, y + ∆y ) принадлежит этой
окрестности. Тогда приращение ∆f = f (M 1 ) − f (M ) этой функции в точке M
можно представить в следующем виде:
d 2 f ( x, y )
d n f ( x, y ) d n+1 f ( x + θ∆x, y + θ∆y )
. (15.1)
∆f = df ( x, y ) +
+ ... +
+
(n + 1)!
n!
2!
Формула (15.1) называется формулой Тейлора для функции z = f ( x, y ) .
Доказательство. Для доказательства введем вспомогательную функцию
F (t ) = f ( x + t ⋅ ∆x, y + t ⋅ ∆y ) ,
которая является сложной функцией независимой переменной t , t ∈ [0,1] и
имеет (n + 1) -ую производную по t на отрезке [0,1].
Дифференцируя функцию F (t ) по t , получаем
F ′(t ) = f x′( x + t ⋅ ∆x, y + t ⋅ ∆y ) ∆x + f y′( x + t ⋅ ∆x, y + t ⋅ ∆y ) ∆y =
⎛∂
⎞
∂
= ⎜⎜ ∆x + ∆y ⎟⎟ f ( x + t∆x, y + t∆y ),
∂y ⎠
⎝ ∂x
2
F ′′(t ) = f xx′′ ( x + t ⋅ ∆x, y + t ⋅ ∆y )(∆x ) + 2 f xy′′ ( x + t ⋅ ∆x, y + t ⋅ ∆y ) ∆x ∆y +
2
⎛∂
⎞
∂
+ f yy′′ ( x + t ⋅ ∆x, y + t ⋅ ∆y )(∆y ) = ⎜⎜ ∆x + ∆y ⎟⎟ f ( x + t∆x, y + t∆y ).
∂y ⎠
⎝ ∂x
По индукции найдем
2
37
n
⎛∂
⎞
∂
F (t ) = ⎜⎜ ∆x + ∆y ⎟⎟ f ( x + t∆x, y + t∆y ) ;
∂y ⎠
⎝ ∂x
(n )
n +1
⎛∂
⎞
∂
F (t ) = ⎜⎜ ∆x + ∆y ⎟⎟ f ( x + t∆x, y + t∆y ) .
∂y ⎠
⎝ ∂x
С другой стороны, используя для функции F (t ) , как функции одной
переменной t , формулу Маклорена и считая t = 1 , получаем
F ′(0 ) F ′′(0 )
F ( n ) (0 ) F ( n−1) (θ)
F (1) = F (0 ) +
+ ... +
+
+
, 0 < θ < 1.
(15.2)
(n + 1)!
1!
2!
n!
Но
F (1) = f ( x + ∆x, y + ∆y ) = f (M 1 ) ,
F (0 ) = f ( x, y ) = f (M ) ,
( n +1)
⎛∂
⎞
∂
F ′(0 ) = ⎜⎜ ∆x + ∆y ⎟⎟ f ( x, y ) = df ( x, y ) ,
∂y ⎠
⎝ ∂x
2
⎛∂
⎞
∂
F ′′(0 ) = ⎜⎜ ∆x + ∆y ⎟⎟ f ( x, y ) = d 2 f ( x, y ) ,
∂y ⎠
⎝ ∂x
…
n
⎛∂
⎞
∂
F (0 ) = ⎜⎜ ∆x + ∆y ⎟⎟ f ( x, y ) = d n f ( x, y ) ,
∂y ⎠
⎝ ∂x
(n )
n +1
⎛∂
⎞
∂
F (0 ) = ⎜⎜ ∆x + ∆y ⎟⎟ f ( x + θ∆x, y + θ∆y ) = d n+1 f ( x + θ∆x, y + θ∆y ) .
∂y ⎠
⎝ ∂x
Учитывая эти равенства, из формулы (15.2) имеем
d 2 f ( x, y )
d n f ( x, y )
F (1) − F (0 ) = f (M 1 ) − f (M ) = df ( x, y ) +
+ ... +
+
n!
2!
( n+1)
d n+1 f ( x + θ∆x, y + θ∆y )
+
, 0 < θ < 1,
(n + 1)!
т.е. получена формула (15.1).
Формула Тейлора для функции двух переменных напоминает формулу
Тейлора для функции одной переменной. Но на самом деле, если раскрыть
выражения для дифференциалов функции f ( x, y ) в формуле (15.1), то
получаем формулу более громоздкую и сложную, чем для функции одной
переменной.
Формула Тейлора для функций большего количества переменных
имеет аналогичный вид.
Замечание. При n = 0 из (15.1) получается формула Лагранжа (или
формула конечных приращений) для функции двух переменных
∆f = df ( x + θ∆x, y + θ∆y ) = f x′( x + θ∆x, y + θ∆y ) ∆x + f y′( x + θ∆x, y + θ∆y ) ∆y ,
0 < θ <1
38
из которой, в частности, следует, что если f x′ = f y′ ≡ 0 , то полное приращение
функции тождественно равно нулю и функция f ( x, y ) является постоянной.
16. Экстремум функции двух переменных
16.1 Определение экстремума. Необходимые условия экстремума
Пусть функция z = f ( x, y ) определена в некоторой окрестности точки
M0 .
Определение. Говорят, что функция z = f ( x, y ) имеет в точке M 0
локальный максимум, если существует такая окрестность точки M 0 , что для
всех точек M ( x, y ) этой окрестности, отличных от M 0 , выполняется
неравенство f (M 0 ) < f (M ) .
Точки локального максимума и локального минимума называются
точками экстремума.
Из определения следует, что если функция z = f ( x, y ) имеет экстремум
в точке M 0 , то полное приращение ∆z = f (M ) − f (M 1 ) этой функции в точке
M 0 удовлетворяет в некоторой окрестности точки M 0 одному из следующих
условий:
∆z ≤ 0 (в случае локального максимума),
∆z ≥ 0 (в случае локального минимума).
И, наоборот, если в некоторой окрестности точки M 0 выполняется
одно из этих неравенств, то функция имеет экстремум в точке M 0 .
Теорема (необходимые условия экстремума). Если функция z = f ( x, y )
имеет в точке M 0 ( x0 , y0 ) экстремум и имеет в точке M 0 частные производные
первого порядка, то в этой точке частные производные первого порядка
равны нулю, это значит
f x′( x0 , y0 ) = f y′( x0 , y0 ) = 0 .
(16.1)
Доказательство. Докажем, например, равенство нулю частной
производной f x′( x0 , y0 ) . Для этого рассмотрим в окрестности точки M 0
только те точки, для которых y = y0 . Получена функция f ( x, y0 ) одной
переменной x которая имеет в точке x = x0 экстремум и в точке x = x0
производную f x′( x0 , y0 ) . Следовательно, в этой точке выполняется
необходимое условие экстремума функции одной переменной: f x′( x0 , y0 ) = 0 ,
что и требовалось доказать. Аналогично, рассматривая функцию f ( x0 , y )
одной переменной y , находим f y′( x0 , y0 ) = 0 .
Условие (16.1) не является достаточным условием экстремума.
Например, частные производные функции z = x 2 − y 2 равны нулю в точке
O(0,0) , однако эта функция не имеет экстремума в точке O , так как z (0,0 ) = 0
и ни в какой окрестности точки O(0,0) не сохраняется знак: если x = 0 , то
39
z < 0 , а если y = 0 , то z > 0 . График функции z = x 2 − y 2 есть
гиперболический параболоид.
Заметим, что функция может иметь экстремум также в тех точках, где
не существует в конечном виде хотя бы одна из частных производных.
Например, функция z = x 2 + y 2 , очевидно, имеет минимум в точке O(0,0) ,
но не имеет конечных частных производных в этой точке.
Точки, в которых первые частные производные f x′( x, y ) и f y′( x, y )
функции z = f ( x, y ) равны нулю или не существуют.
критическими или стационарными точками этой функции.
называются
16.2 Достаточные условия экстремума
Теорема. Пусть в критической
окрестности функция z = f ( x, y ) имеет
второго порядка. Положим
f xx′′ ( x0 , y0 )
∆=
f xy′′ ( x0 , y0 )
точке M 0 ( x0 , y0 ) и некоторой ее
непрерывные частные производные
f xy′′ ( x0 , y0 )
.
f yy′′ ( x0 , y0 )
Тогда:
а) если ∆ > 0 , то в точке M 0 функция имеет экстремум, причем при
f xx′′ ( x0 , y0 ) < 0 – локальный максимум, при f xx′′ ( x0 , y0 ) > 0 – локальный
минимум;
б) если ∆ < 0 , в точке M 0 нет экстремума.
Доказательство. а) Пусть ∆ > 0 . Введем следующие обозначения:
f xx′′ ( x0 , y0 ) = A , f xy′′ ( x0 , y0 ) = B , f yy′′ ( x0 , y0 ) = C .
По условию f x′( x0 , y0 ) = f y′( x0 , y0 ) = 0 , A > 0 (или A < 0 ).
По формуле Тейлора (15.1), взятой для n = 1 , полное приращение
функции f ( x, y ) в точке M 0 можно записать в виде
1
2
2
∆f =
A′ ⋅ (∆x ) + 2 B′ ⋅ ∆x ⋅ ∆y + C ′ ⋅ (∆y ) ,
(16.2)
2!
где A′ = f xx′′ ( x0 + θ ∆x, y0 + θ ∆y ) , B′ = f xy′′ ( x0 + θ ∆x, y0 + θ ∆y ) ,
C ′ = f yy′′ ( x0 + θ ∆x, y0 + θ ∆y ) , 0 < θ < 1.
(
)
Из непрерывности частных производных второго порядка в точке
следует:
lim A′ = f xx′′ ( x0 , y0 ) = A > 0 (или A < 0 ),
∆x→0
∆y →0
а также
lim( A′C ′ − B′2 ) = f xx′′ ( x0 , y0 ) ⋅ f yy′′ ( x0 , y0 ) − ( f xy′′ ( x0 , y0 )) = ∆ > 0 .
2
∆x→0
∆y →0
Поэтому для достаточно малых ∆x и ∆y имеем
A′ > 0 (или A′ < 0 ), A′C ′ − B′2 = ∆′ > 0 .
40
Так как A′ ≠ 0 , то соотношение (16.2) можно переписать в виде
1 1
2
2
A′ 2 ⋅ (∆x ) + 2 A′B ′ ⋅ ∆x ⋅ ∆y + A′C ′ ⋅ (∆y ) ,
∆f = ⋅
2 ! A′
или, дополняя до полного квадрата
1 1
( A′ ⋅ ∆x + B′ ⋅ ∆y )2 + (A′C ′ − B′2 )⋅ (∆y )2 .
∆f = ⋅
2! A′
Выражение в скобках неотрицательное, поэтому, если A′ > 0
( f xx′′ ( x0 , y0 ) > 0 ), то ∆f ≥ 0 , и, следовательно, в точке M 0 локальный минимум,
если же A′ < 0 ( f xx′′ ( x0 , y0 ) < 0 ), то ∆f ≤ 0 , и, следовательно, в точке M 0
локальный максимум, что и требовалось доказать.
б) Пусть теперь ∆ = AC − B 2 < 0 и по-прежнему A = f xx′′ ( x0 , y0 ) ,
B = f xy′′ ( x0 , y0 ) , C = f yy′′ ( x0 , y0 ) . Рассмотрим многочлен A + 2 Bx + Cx 2 . Так как
(
)
(
)
B 2 − AC > 0 , то можно найти два числа x1 и x2 такие. что
A + 2 Bx1 + Cx12 > 0 , A + 2 Bx2 + Cx22 < 0 .
Полное приращение функции f ( x, y ) в точке M 0 как и в параграфе а)
запишем в виде 16.2. На основании непрерывности частных производных
второго порядка
(A′ + 2 B′x1 + C ′x12 ) = A + 2 Bx1 + Cx12 > 0 .
lim
∆x→0
∆y →0
Следовательно, существует δ -окрестность точки M 0 такая. что если
точка M ( x0 + ∆x, y0 + ∆y ) принадлежит этой окрестности, то
A′ + 2 B′x1 + C ′x12 > 0 .
(16.3)
Рассмотрим теперь произвольную δ′ -окрестность точки M 0 такую, что
δ′ ≤ δ . Можно выбрать число t > 0 настолько малым, что точка
M 1 ( x + t , y + tx1 ) будет принадлежать δ′ -окрестности точки M 0 .
Положим в (16.2) ∆x = t , ∆y = tx1 . Поэтому на основании (16.3)
получаем
1
∆f = f ( x0 + ∆x, y0 + ∆y ) − f ( x0 , y0 ) = t 2 ( A′ + 2 B′x1 + C ′x12 ) > 0 .
2
Рассуждая аналогично по отношению к переменной x2 , получим. что в
произвольной δ′ -окрестность точки M 0 существует точка M 2 ( x + ∆x, y + ∆y ) ,
для которого
∆f = f ( x0 + ∆x, y0 + ∆y ) − f ( x0 , y0 ) = 0 .
Это означает, что приращение функции f ( x, y ) в любой сколь угодно
малой окрестности точки M 0 не сохраняет знак, и, следовательно, в точке
M 0 нет экстремума.
Замечание. Если ∆ = 0 , то функция f ( x, y ) в критической точке M 0
может иметь экстремум, но может и не иметь его.
Пример 18. Найти экстремумы функции z = x 3 + 3 xy 2 − 30 x − 18 y .
41
Решение. Находим первые частные производные
f x′( x, y ) = 3 x 2 + 3 y 2 − 30 , f y′( x, y ) = 6 xy − 18 .
Приравнивая эти производные к нулю, имеем
⎧ x 2 + y 2 = 15
⎨
⎩2 xy = 6.
Складывая и отнимая почленно уравнения системы, получаем
⎧ x 2 + 2 xy + y 2 = 16
⎧ x + y = ±4
или
⎨ 2
⎨
2
⎩ x − y = ±2.
⎩ x − 2 xy + y = 4
Разрешив эту систему (эквивалентную исходной), находим четыре
критические точки
M 1 (3,1) , M 2 (1,3) , M 3 (− 1,−3) , M 4 (− 3,−1) .
Теперь находим вторые частные производные данной функции
f xx′′ = 6 x , f xy′′ = 6 y , f yy′′ = 6 x
и получаем выражение
2
∆(M ) = f xx′′ (M ) ⋅ f yy′′ (M ) − ( f xy′′ (M )) = 36(x 2 − y 2 ) .
Очевидно. что:
1) ∆(M 1 ) > 0 , f xx′′ (M 1 ) > 0 , M 1 – точка локального минимума;
2) ∆(M 2 ) < 0 , в точке M 2 нет экстремума;
3) ∆(M 3 ) < 0 , в точке M 3 нет экстремума;
4) ∆(M 4 ) < 0 , f xx′′ (M 1 ) < 0 , M 4 – точка локального максимума.
Таким образом, данная функция имеет два экстремума; в точке M 1 –
локальный минимум, f (M 1 ) = −72 , в точке M 4 – локальный максимум,
f (M 4 ) = 72 .
16.3 Наибольшее
переменных
и
наименьшее
значения
функции
двух
Пусть функция z = f ( x, y ) непрерывна в ограниченной замкнутой
области G и дифференцируема внутри этой области.
Тогда она имеет в этой области наименьшие значения, которые
достигаются или внутри области, или на его границе. Если свои наибольшее
или наименьшее значения функция принимает во внутренних точках области
G , то эти точки, очевидно, будут точками экстремума функции z = f ( x, y ) .
Таким образом, точки, в которых функция имеет наибольшее или
наименьшее значения, будут или точками экстремума функции, или
граничными точками области G .
Мы приходим к следующему правилу нахождения наибольшего и
наименьшего значений функции двух переменных.
Для того, чтобы найти наибольшее и наименьшее значения функции
z = f ( x, y ) в ограниченной замкнутой области G , необходимо найти
значения этой функции в критических точках области, а также ее
42
наименьшее и наибольшее значения на границе области G . Наибольшее из
всех этих значений и будет наибольшим значением функции z = f ( x, y ) в
области G . Наименьшее из этих значений функции будет ее наименьшим
значением в области G .
В некоторых случаях при отыскании наибольшего и наименьшего
значений функции двух переменных в ограниченной замкнутой области
границу этой области удобно разбить на части, каждая из которых задается
своим уравнением.
Пример 19. Найти наибольшее и наименьшее значения функции
z = xy(4 − x − y ) в треугольнике, который образован линиями x = 0 , y = 0 ,
x + y = 6 (рис. 12).
y
B
M2
M4
M3
0
A
x
M1
Рис. 12.
Находим критические точки данной функции, которые принадлежат
области D . Так как
∂z
∂z
= 4 y − 2 xy − y 2 ,
= 4 x − x 2 − 2 xy ,
∂x
∂y
то для определения критических точек получаем следующую систему
уравнений:
⎧ y (4 − 2 x − y ) = 0
⎨
⎩ x(4 − x − 2 y ) = 0
Так как первому уравнению системы удовлетворяет значение y = 0 , то,
подставляя его в другое уравнение системы, получаем: 4 − x = 0 , x = 4 , т.е.
M 1 (4,0) – критическая точка данной функции, принадлежащая области D .
Так как второму уравнению системы удовлетворяет значение x = 0 , то,
подставляя его в первое уравнение, имеем 4 − y = 0 , y = 4 , т.е. M 2 (0,4) –
критическая точка, принадлежащая области D . Точка O(0,0 ) ∈ D и также
является критической, так как ее координаты удовлетворяют полученной
системе уравнений.
Если x ≠ 0 , y ≠ 0 , то имеем систему
⎧4 − 2 x − y = 0
⎧2 x + y = 4
или ⎨
⎨
⎩4 − x − 2 y = 0
⎩ x + 2 y = 4,
43
4
4
⎛4 4⎞
откуда находим x = , y = , т.е. точка M 3 ⎜ , ⎟ ∈ D является критической.
3
3
⎝3 3⎠
Вычислим значения функции в точках M 1 , M 2 , M 3 : z (4,0 ) = 0 ,
⎛ 4 4 ⎞ 64
z (0,4 ) = 0 , z (0,0 ) = 0 , z ⎜ , ⎟ =
.
⎝ 3 3 ⎠ 27
Исследуем функцию на каждой из линий, которые образуют границу
области D .
На отрезке OA , где y = 0 , имеем z = 0 . На отрезке OB , где x = 0 , также
z = 0 . Уравнение прямой AB : y = 6 − x . Подставляя это выражение в
функцию z = xy(4 − x − y ) , получаем:
z = x(6 − x )(4 − x − (6 − x )) = −2 x(6 − x ) = 2 x 2 − 12 x .
Тогда z′x = 4 x − 12 , 4 x − 12 = 0 , это значит x = 3∈ [0,6] является
критической точкой функции z = 2 x 2 − 12 x , а y (3) = 6 − 3 = 3 .
Таким образом, M 4 (3,3) принадлежит отрезку AB и является
критической точкой исходной функции, а z (3,3) = 3 ⋅ 3(4 − 3 − 3) = −18 .
Вычисляя значения функции на концах отрезка AB , имеем
z (0,6 ) = z (6,0 ) = 0 .
Выбирая из всех найденных значений функции наибольшее и
наименьшее, окончательно получаем
⎛ 4 4 ⎞ 64
zнаиб . ⎜ , ⎟ = , zнаим. (3,3) = −18 .
⎝ 3 3 ⎠ 27
16.4 Условный экстремум
Во многих задачах на отыскание локальных максимумов и минимумов
функций нескольких переменных вопрос сводится к нахождению
экстремумов функции нескольких переменных, которые не являются
независимыми, а связаны одна с другой некоторыми дополнительными
условиями (например, они должны удовлетворять данным условиям).
Рассмотрим такую задачу. Из данного куска фанеры площадью 2a
нужно сделать закрытый ящик в форме прямоугольного параллелепипеда,
который имеет наибольший объем. Обозначим длину, ширину и высоту
ящика через x , y и z . Задача сводится к отысканию максимума функции
v = x⋅ y⋅z
при условии. что 2 xy + 2 xz + 2 yz = 2a .
Здесь мы имеем задачу на условный экстремум; переменные x , y , z
связаны условием
2 xy + 2 xz + 2 yz = 2a .
Изучим метод решения таких задач.
Рассмотрим сначала вопрос об условном экстремуме функции двух
переменных, если эти переменные связаны одним условием.
44
Пусть необходимо найти максимумы и минимумы функции z = f ( x, y )
при условии, что x и y связаны между собой уравнением связи
(16.4)
ϕ( x, y ) = 0 .
При наличии условия (16.4) из двух переменных x и y независимой
переменной будет только одна, например, x , так как y определяется из
равенства (16.4), как функция от x . Если бы удалось разрешить уравнение
(16.4) относительно y , то подставляя в равенство z = f ( x, y ) вместо y его
выражение через x , мы получили бы функцию одной переменной
z = f ( x, y ( x )) = ψ( x )
и в результате имели бы задачу: исследовать на экстремум функцию одной
переменной.
Решим поставленную задачу, не решая уравнение ϕ( x, y ) = 0
относительно x или y . Для этого используют метод множителей Лагранжа.
Суть этого метода состоит в следующем.
Функция z = f ( x, y ) может иметь локальный максимум или локальный
минимум при тех значениях x , при которых производная от z по
dz
переменной x равна нулю. Найдем полную производную
:
dx
dz ∂f ∂f dy
=
+ ⋅ .
dx ∂x ∂y dx
Следовательно, в точках экстремума имеем
∂f ∂f dy
+ ⋅ = 0.
(16.5)
∂x ∂y dx
Дифференцируя уравнение связи ϕ( x, y ) = 0 по x , получаем
∂ϕ ∂ϕ dy
(16.6)
+
⋅ = 0.
∂x ∂y dx
Равенство (16.6) выполняется при всех x и y , которые удовлетворяют
уравнению (16.4), это значит для точек которые находятся на линии L ,
которая задается уравнением связи ϕ( x, y ) = 0 . Умножая все слагаемые
равенства (16.6) на неизвестный пока коэффициент A и прибавляя к ним
соответствующие слагаемые равенства (16.5), получаем
⎛ ∂f ∂f dy ⎞ ⎛ ∂ϕ ∂ϕ dy ⎞
⎜⎜ + ⋅ ⎟⎟ + λ⎜⎜ +
⋅ ⎟⎟ = 0
∂
x
∂
y
dx
∂
x
∂
y
dx ⎠
⎝
⎠ ⎝
или
dϕ ⎞ ⎛ ∂f
dϕ ⎞ dy
⎛ ∂f
= 0.
(16.7)
⎜ + λ ⋅ ⎟ + ⎜⎜ + λ ⋅ ⎟⎟
dx ⎠ ⎝ ∂y
dy ⎠ dx
⎝ ∂x
Равенство (16.7) выполняется во всех точках локального экстремума,
которые находятся на линии L . Выберем число λ так, чтобы для значений x
и y , которые соответствуют экстремуму функции z = f ( x, y ) , выполнялось
равенство
45
∂f ∂ϕ
+
⋅λ = 0
∂y ∂y
∂ϕ
≠ 0 ).
∂y
Но тогда при этих значениях x и y из равенства (16.7) следует
равенство
∂f ∂ϕ
+
⋅λ = 0.
∂x ∂x
Таким образом, получается, что точки экстремума. которые находятся
ни линии L (она задается уравнением связи ϕ( x, y ) = 0 ) должны
удовлетворять следующим условиям:
∂ϕ
⎧ ∂f
⎪ ∂x + λ ⋅ ∂x = 0
⎪
∂ϕ
⎪ ∂f
=0
(16.8)
⎨ +λ⋅
∂
∂
y
y
⎪
⎪ϕ( x, y ) = 0
⎪⎩
Разрешив систему (16.8), найдем критические точки и число A ,
которое играет вспомогательную роль.
Система уравнений (16.8) представляет собой необходимые условия
существования условного экстремума: не всякая критическая точка
M 0 ( x0 , y0 ) , координаты x0 , y0 которой удовлетворяют системе уравнений
(16.8), будет точкой условного экстремума. Для исследования характера
критической точки необходимо провести дополнительный анализ знака
приращения ∆z в окрестности критической точки M 0 , которая находится на
линии L .
Заметим, что левые части уравнений (16.8) являются частными
производными функции
(16.9)
F ( x, y, λ ) = f ( x, y ) + λ ϕ( x, y ) ,
которая называется функцией Лагранжа по переменным x , y , λ .
Введение
вспомогательной
функции
Лагранжа
позволяет
сформулировать правило нахождения точек условного экстремума. Для того,
чтобы определить точки условного экстремума функции z = f ( x, y ) , которые
удовлетворяют уравнению связи ϕ( x, y ) = 0 , необходимо:
1) записать функцию Лагранжа F ( x, y, λ ) = f ( x, y ) + λ ϕ( x, y );
2) вычислить частные производные функции Лагранжа по x , y , λ ;
3) записать систему уравнений (16.8), решить ее и определить
возможного условного
координаты критических точек M
экстремума;
(для определенности будем считать, что в критических точках
46
4) определить знак приращения ∆z в окрестностях критических точек
по тем точкам окрестности, которые удовлетворяют уравнению
ϕ( x, y ) = 0 , т.е. находятся на линии L .
Если получается, что
(∀M ∈ L ) ∩ (M ∈ Oδ (M 0 )) ⇒ ∆z = f (M ) − f (M 0 ) > 0 ,
то M 0 ( x0 , y0 ) – точка условного минимума; если же
(∀M ∈ L ) ∩ (M ∈ Oδ (M 0 )) ⇒ ∆z = f (M ) − f (M 0 ) < 0 ,
то M 0 ( x0 , y0 ) – точка условного максимума.
Рассмотренный метод распространяется на исследование на экстремум
функции произвольного количества переменных.
Пусть требуется найти экстремумы функции u = f ( x1 , x2 ,..., xn ) при
условии, что переменные x1 , x2 , …, xn связаны m ( m < n ) уравнениями
ϕ1 ( x1 , x2 ,..., xn ) = 0
ϕ2 ( x1 , x2 ,..., xn ) = 0
(16.10)
………………….
ϕm ( x1 , x2 ,..., xm ) = 0 .
Для того, чтобы найти значения x1 , x2 , …, xn , при которых могут быть
условные экстремумы функции u = f ( x1 , x2 ,..., xn ) , нужно записать
вспомогательную функцию
F ( x1 , x2 ,..., xn , λ1 , λ 2 ,..., λ m ) − f ( x1 , x2 ,..., xn ) + λ1 ϕ1 ( x1 , x2 ,..., xn ) + λ 2 ϕ2 ( x1 , x2 ,..., xn ) +
+ ... + λ m ϕm ( x1 , x2 ,..., xn ),
приравнять к нулю ее частные производные по x1 , x2 , …, xn :
∂ϕ
∂ϕ
∂f
+ λ1 1 + ... + λ m m = 0 ;
∂x1
∂x1
∂x1
∂ϕ
∂ϕ
∂f
+ λ1 1 + ... + λ m m = 0 ;
(16.11)
∂x2
∂x2
∂x2
……………………………….
∂ϕ
∂ϕ
∂f
+ λ1 1 + ... + λ m m = 0
∂xn
∂xn
∂xn
и из m + n уравнений (16.10) и (16.11) определить x1 , x2 , …, xn и
вспомогательные неизвестные λ1 , λ 2 , …, λ n . Вопрос о том, будет ли при
найденных значениях неизвестных рассматриваемая функция иметь
максимум или минимум или совсем не будет иметь экстремума, мы
оставляем открытым. При решении конкретных задач этот вопрос мы будем
выяснять на основании дополнительных соображений.
Пример 20. Вернемся к задаче, сформулированной в начале параграфа
16.4: найти максимум функции v = xyz при условии
xy + xz + yz − z = 0 ( x > 0, y > 0, z > 0)
(16.12)
Решение. Запишем вспомогательную функцию
F ( x, y, z , λ ) = xyz + λ( xy + xz + yz − a ) .
47
Найдем ее частные производные по всем переменным и приравняем их
к нулю:
⎧ yz + λ( y + z ) = 0
⎪
(16.13)
⎨ xz + λ( x + z ) = 0
⎪ xy + λ( x + y ) = 0
⎩
Задача сводится к решению системы четырех уравнений (16.12) и
(16.13) с четырьмя неизвестными первое из уравнений (16.13) на x , второе –
на y , третье – на z и сложим их. Принимая во внимание равенство (16.12),
находим
3xyz
λ=−
.
2a
Подставляя в уравнения (16.13) найденные значения λ , получаем
⎧ ⎛ 3x
⎞
⎪ yz ⋅ ⎜1 − 2a ( y + z )⎟ = 0
⎠
⎪ ⎝
⎪ ⎛ 3y
⎞
(16.14)
⎨ xz ⋅ ⎜1 − ( x + z )⎟ = 0
2
a
⎠
⎝
⎪
⎪ ⎛ 3z
⎞
⎪ xy ⋅ ⎜1 − ( x + y )⎟ = 0
⎠
⎩ ⎝ 2a
Так как x , y , z по смыслу задачи отличны от нуля, то из системы
уравнений (16.14) имеем
3x
( y + z ) = 1, 3 y ( x + z ) = 1 , 3 z ( x + y ) = 1 .
a
a
a
Однако из первых двух уравнений находим x = y , со второго и третьего
уравнений – аналогично y = z . Но в таком случае из уравнения (16.12)
получаем значения
a
x= y=z=
,
3
которые будут единственными значениями x , y , z , при которых может быть
максимум или минимум функции v = xyz при условии (16.12).
Можно доказать, что полученное решение дает максимум, что
очевидно из геометрических соображений (по условию задачи объем ящика
не может быть неограниченно большим, следовательно, естественно
ожидать, что при некоторых определенных значениях сторон этот объем
будет наибольшим.
Таким образом, для того, чтобы объем ящика был в условиях
поставленной задачи наибольшим, этот ящик должен иметь форму куба,
a
.
ребро которого равно
3
17. Метод наименьших квадратов
48
В разных исследованиях приходится использовать формулы,
составленные на основе эксперимента. Одним из лучших способов
получения таких формул является метод наименьших квадратов.
Пусть на основе эксперимента необходимо найти функциональную
зависимость между двумя переменными величинами x и y . По результатам
измерений составляют следующую таблицу:
…
x1
x2
x3
xn
x
y
…
y1
y2
y3
yn
Установим теперь вид функции y = f ( x ) по характеру размещения на
координатной плоскости экспериментальных точек. Пусть, например, точки,
взятые из таблицы, размещены так, как показано на рис. 12. В данном случае
естественно допустить. что между x и y существует линейная зависимость,
которая выражается формулой
y = ax + b .
(17.1)
y
yn
yi
y2
y3
y1
0
x1
x2
xi
x3
xn
x
Рис. 12.
Ограничимся случаем линейной зависимости. Так как точки ( x1 , y1 ) ,
(x2 , y2 ) , …, (xn , yn ) не лежат точно на прямой. а только вблизи нее, то
формула (17.1) является приближенной.
Поэтому, подставляя значения координат точек в выражение y = ax + b ,
получаем равенства
y1 − (ax1 + b ) = δ1 , y2 − (ax2 + b ) = δ 2 , …, yn − (axn + b ) = δ n ,
где δ1 , δ 2 , …, δ n – некоторые числа, которые назовем погрешностями.
Поставим задачу подобрать коэффициенты a и b таким образом,
чтобы эти погрешности были как можно меньше по абсолютной величине.
Для решения этой задачи используем метод наименьших квадратов,
суть которого состоит в том, что искомую прямую выбираем таким образом,
чтобы сумма квадратов погрешностей
n
∑ ( y − (ax
i =1
i
n
)) = ∑ δi2
i +b
2
i =1
49
имела наименьшее значение. Так как xi , yi – заданные числа (известные из
эксперимента), то
n
∑δ
i =1
2
i
является функцией параметров a и b :
n
n
S (a, b ) = ∑ ( yi − (axi + b )) = ∑ δi2 ,
2
i =1
(17.2)
i =1
которые нужно исследовать на экстремум. Найдем значения параметров a и
b , при которых S (a, b ) имеет минимум.
Имеем
n
n
∂S
∂S
= −2∑ ( yi − (axi + b )) xi ,
= −2∑ ( yi − (axi + b )) .
∂a
∂b
i =1
i =1
Приравнивая эти частные производные к нулю, получаем линейную
систему двух уравнений с неизвестными a и b :
⎧ n x y = a n x2 + b n x
∑
∑
i
i
i
i
⎪∑
i =1
i =1
i =1
(17.3)
⎨n
n
⎪∑ yi = a ∑ xi + n ⋅ b .
⎩ i=1
i =1
Из этой системы находим числа a и b и, подставляя их в уравнение
(17.1), получаем уравнение искомой прямой.
Тот факт, что функция S (a, b ) в найденной точке M (a, b ) имеет
минимум, легко проверяется с помощью частных производных второго
порядка. Имеем
n
n
∂2S
∂2S
∂2S
2
= 2∑ xi ,
= 2∑ xi ,
= 2n .
∂a 2
∂a∂b
∂b 2
i =1
i =1
Следовательно,
2
2
n
n
∂2S ∂2S ⎛ ∂2S ⎞
2
⎛
⎞
∆ = 2 ⋅ 2 −⎜
⎟ = 4n∑ xi − ⎜ 2∑ xi ⎟ .
∂a ∂b ⎝ ∂a∂b ⎠
i =1
⎝ i =1 ⎠
Это выражение можно записать в виде ∆ = 2∑∑ (xi − x j ) , откуда
n
n
2
i =1 j =1
следует, что ∆ > 0 . Так как
∂S
> 0 , то в точке M (a, b ) функция S (a, b ) имеет
∂a 2
2
минимум.
Если экспериментальные данные такие, что при построении графика
они приблизительно размещаются на квадратной параболе, то можно искать
приближенную зависимость в форме y = ax 2 + bx + c . Для нахождения
значений коэффициентов a , b , c необходимо найти минимум выражения
S (a, b, c ) = ∑ (axi2 + bxi + c − yi ) .
n
2
i =1
Нахождение минимума функции трех переменных S (a, b, c ) сводится к
решению системы трех уравнений первой степени
50
⎧a n x 4 + b n x 3 + c n x 2 = n x 2 y
∑
∑
∑
i
i
i
i
i
⎪ ∑
i =1
i =1
i =1
i =1
⎪ n
n
n
n
⎪
3
2
(17.4)
+
+
=
a
x
b
x
c
x
xi yi
∑
∑
∑
⎨ ∑ i
i
i
i =1
i =1
i =1
i =1
⎪
⎪a n x 2 + b n x + c ⋅ n = n y ,
∑
∑
i
i
i
⎪⎩ ∑
i =1
i =1
i =1
из которой определяется неизвестные параметры a , b , c .
Пример. Пусть в результате эксперимента получены пять значений
искомой функции при разных значениях независимой переменной.
0
1
1,5
2,1
3
x
y
2,9 6,3 7,9 10,0 13,2
Построив соответствующие точки, убедимся, что они размещены
приблизительно на одной прямой. Это означает, что зависимости между x и
y близка к линейной: y = ax + b . Используя метод наименьших квадратов,
найдем неизвестные параметры a и b . Составим соответствующую таблицу.
∆y
xi
yi
xi yi
yS
xi2
1
0
2,9 0,00 0,00 2,86 0,04
2
1,0 6,3 1,00 6,30 6,28 0,02
3
1,5 7,9 2,25 11,85 7,99 0,09
4
2,1 10,0 4,41 21,00 10,04 0,04
5
3,0 13,2 9,00 39,00 13,12 0,08
7,6 40,3 16,66 78,75
Разместим вычисления, как показано в таблице, и составим систему
уравнений вида (17.3)
⎧16,66 a + 7,6 b = 78,75
⎨
⎩7,6 a + 5 b = 40,3 ,
разрешая которую, находим a = 3,42 , b = 2,86 . Таким образом, получаем
y = 3,42 x + 2,86 .
(17.5)
В шестом столбце таблицы находятся значения y , вычисленные по
формуле (17.5), седьмой столбец содержит абсолютные значения отклонений
экспериментальных данных от значений y , вычисленных по формуле (17.5).
51
СОДЕРЖАНИЕ
I. Определение функции нескольких переменных. Область определения
2. График функции двух переменных
3. Частное и полное приращения функции двух переменных
4. Предел функции двух и нескольких переменных
5. Непрерывность функции нескольких переменных
6. Частные производные функции нескольких переменных и их геометрический смысл
7. Частные производные высших порядков
8. Полный дифференциал функции
9. Применение полного дифференциала в приближенных вычислениях
10. Дифференцирование сложной функции
11. Инвариантность формы полного дифференциала
12. Производная от функции, заданной неявно
13. Скалярное поле
13.1 Скалярное поле и его геометрическое изображение
13.2 Производная по направлению
13.3 Градиент скалярного поля
13.4 Касательная плоскость и нормаль к поверхности
13.5 Геометрический смысл полного дифференциала функции двух переменных
14. Дифференциалы высших порядков
15. Формула Тейлора для функции двух переменных
16. Экстремум функции двух переменных
16.1 Определение экстремума. Необходимые условия экстремума
16.2 Достаточные условия экстремума
16.3 Наибольшее и наименьшее значения функции двух переменных
16.4 Условный экстремум
17. Метод наименьших квадратов
52
Download