Функции многих переменных

advertisement
ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
Мы определяли функцию одного вещественного аргумента как отображение f : D → R некоторого подмножества D ⊂ R действительных чисел в действительные числа. Аналогичное определение можно дать и в случае нескольких аргументов:
Определение 1. Пусть D ⊂ Rn — подмножество множества n-мерного арифметического пространства. Отображение f : D → R называется функцией n вещественных аргументов (x1 , . . . , xn ).
При этом множество D называется областью определения функции f , а множество
V = { u ∈ Rn | u = f (x) }
— областью допустимых значений. Графиком функции u = f (x) называется множество
{ (x1 , . . . , xn , u) | u = f (x1 , . . . , xn ) } ⊂ Rn+1 .
Это определение, однако, является слишком общим, широким, и в следующем параграфе мы
уточним, какие области определения допускаются нами к рассмотрению. Чтобы это сделать, нам
понадобятся элементарные сведения из топологии пространств Rn .
1. Непрерывность
Зафиксируем некоторое число n ∈ N и рассмотрим пространство Rn .
Определение 2. Расстоянием между точками x = (x1 , . . . , xn ) и y = (y1 , . . . , yn ) пространства Rn называется величина
p
ρ = ρ(x, y) = (x1 − y1 )2 + · · · + (xn − yn )2 .
Открытым шаром размерности n, радиуса r > 0 и с центром в точке x ∈ Rn называется множество
B n (x, r) = { y ∈ Rn | ρ(x, y) < r } ⊂ Rn .
Замкнутым шаром размерности n, радиуса r > 0 и с центром в точке x ∈ Rn называется множество
B̄ n (x, r) = { y ∈ Rn | ρ(x, y) 6 r } ⊂ Rn .
Пример 1. Рассмотрим простейшие случаи — n − 1 (прямая), n = 2 (плоскость) и n = 3
(трёхмерное пространство).
1) Расстоянием между двумя точками с координатами x и y на прямой является величина |x − y|, т.е. длина соединяющего их отрезка. Открытый шар радиуса r с центром в
точке x — это интервал (x − r, x + r), а замкнутый — отрезок [x − r, x + r].
2) Расстояние на плоскости — это
p
ρ(x, y) = (x1 − y2 )2 + (x2 − y2 )2 ,
т.е. «самое обычное» расстояние. Двумерным открытым шаром является круг без границы,
а замкнутым — тот же круг, но вместе с описывающей его окружностью.
3) В трёхмерном пространстве расстоянием также является длина отрезка, соединяющего
соответствующие точки, открытым шаром — «настоящий» шар (без граничной сферы), а
замкнутым — тот же шар, но уже с ограничивающей его сферой.
Открытый шар, содержащий некоторую точку, называется её окрестностью.
Определение 3. Множество M ⊂ Rn называется открытым, если у любой точки x ∈ M
найдётся окрестность, целиком содержащаяся в M .
1
2
ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
Пример 2. Любой открытый шар являеьтся открытым множеством в смысле определения 3.
Открытыми являются пустое множество и всё пространство Rn .
Расмотрим некоторое множество M ⊂ Rn .
Определение 4. Замыканием множества M называется множество
M̄ = { x ∈ Rn | B n (x, r) ∩ M 6= ∅, ∀r }.
Множество называется замкнутым, если оно совпадает со своим замыканием.
Пример 3. Замыканием открытого шара B n (x, r) является замкнутый шар B̄ n (x, r), и, значит,
последний замкнут в смысле определения 4. Пустое множество и всё пространство Rn также
замкнуты.
Замечание 1. Замыкание множества состоит из точек этого множества, а также точек, которые невозможно отделить от рассматриваемого множество, «бесконечно к нему близких». Такими,
например, являются крайние точки a и b по отношению к интервалу (a, b).
Кривой в n-мерном пространстве называется совокупность непрерывных функций
x1 = x1 (t), . . . , xn = xn (t),
t ∈ [a, b].
Определение 5. Множество M ⊂ Rn называется связным, если для любых двух точек x
и y ∈ Rn можно построить такую кривую, что
(x1 (a), . . . , xn (a)) = x,
(x1 (b), . . . , xn (b)) = y
и
(x1 (t), . . . , xn (t)) ∈ M,
∀t ∈ [a, b].
Таким образом, связным является такое множество, каждые две точки которого можно соединить кривой, целиком лежащей в этом множестве.
Замечание 2. Множества, которые мы назвали связными, в математической литературе часто
называются линейно связными. Мы для простоты будем пользоваться термином «связный».
Пример 4. Любой шар, открытый или замкнутый, связен. Связным также является всё пространство Rn . Множество
M = { x ∈ R | x2 − 1 > 0 }
несвязно — оно является объединением двух непересекающихся подмножеств
M− = { x ∈ R | x 6 −1 },
M+ = { x ∈ R | x > 1 },
и ни одну точку из M− нельзя связать с точкой из M+ кривой, целиком лежащей в M .
Определение 6. Открытой (замкнутой) областью в Rn называется открытое (замкнутое)
связное множество D ⊂ Rn .
Всюду в дальнейшем мы будем рассматривать функции, чья область определения является
областью в указанном выше смысле.
Замечание 3. Конечно, легко придумать функцию чья область определения не является областью в смысле определения 6. Простой пример:
p
y = x2 − 1.
Здесь область определения распадается на два непересекающихся подмножества (см. пример 4),
но мы можем рассматривать нашу функцию на подмножествах M− и M+ как две разные функции.
Пределы. Теория пределов для функций многих аргументов является непосредственным обобщением теории пределов, развитой нами для функций одного действительного аргумента.
ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
3
Определение 7. Рассмотрим функцию u = f (x1 , . . . , xn ) с областью определения D ⊂ Rn .
Пусть точка a принадлежит замыканию множества D. Говорят, что число A является пределом
функции f в точке a (и пишут A = lim f (x)), если для любого числа ε > 0 найдётся такое
x→a
число δ > 0, что для любой точки x ∈ D ∩ B n (a, r) выполнено неравенство
|f (x) − A| < ε,
если r < δ.
Аналогично определяются бесконечные пределы. Например, lim f (x) = +∞, если для любого
x→a
числа A найдётся такое число δ > 0, что для любого открытого шара с центром в точке a и
радиуса r < δ будет выполняться неравенство
∀x ∈ D ∩ B n (a, r).
f (x) > A,
Так же, как и в случае функций одного аргумента, определяется предел функций нескольких
переменных при x → ∞.
Для функций многих переменных справедливы те же теоремы о пределах суммы, разности,
произведения и частного.
Пример 5.
lim
x31 x2
= 0.
+ x22
x→0 x2
1
Пример 6. Если «совсем немного» изменить функцию из предыдущего примера и положить
x1 x2
u= 2
,
x1 + x22
то предел lim f (x) уже не будет существовать.
x→0
Вычислять пределы функций многих переменных, пользуясь только их определением, как правило, чрезвычайно трудно. Мощным и эффективным инструментом вычисления таких пределов
является формулируемая ниже теорема 1. Суть её такова (для простоты мы рассмотрим случай
двух переменных).
Предположим, нам нужно вычислить предел lim f (x1 , x2 ) и точка a имеет координаты (a1 , a2 ).
x→a
Стремление точки x к a означает, что x1 → a1 и x2 → a2 , и можно попытаться сделать следующее. Зафиксируем какое-нибудь значение переменной x2 и рассмотрим предел lim f (x1 , x2 ).
x1 →a1
Последний, если он существует, является функцией переменной x2 , и мы можем рассмотреть так
называемый двойной предел lim lim f (x1 , x2 ). Возникает естественный вопрос: справедливо ли
x2 →a2 x1 →a1
равенство
lim f (x1 , x2 ) = lim lim f (x1 , x2 )?
(1)
x→a
x2 →a2 x1 →a1
Пример 7. Обратимся к примеру 5:
lim lim
x2 →0
и, значит, равенство (1) выполняется.
x31 x2 0 = 0,
2 = xlim
x1 →0 x2
2 →0
1 + x2
Пример 8. Наоборот, в примере 6 это равенство уже не выполняется.
Теорема 1. Пусть:
1) существует (конечный или бесконечный) предел
A = lim f (x1 , x2 );
x→a
2) при любом x2 существует конечный простой предел
g(x2 ) = lim f (x1 , x2 ).
x1 →a1
(2)
4
ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
Тогда существует двойной пределе
lim g(x2 ) = lim
x2 →a2
lim f (x1 , x2 )
x2 →a2 x1 →a1
и он совпадает с пределом (2).
Определение 8. Пусть u = f (x1 , . . . , xn ) — функция n переменных и точка a принадлежит
области её определения. Функция называется непрерывной в точке a = (a1 , . . . , an ), если
lim f (x1 , . . . , xn ) = f (a1 , . . . , an ).
x→a
Функция называется непрерывной внекоторой области, если она непрерывна в каждой точке этой
области.
Свойства непрерывных функций. Опишем основные свойства непрерывных функций многих переменных.
Предложение 1. Пусть функция u = f (x1 , . . . , xn ) непрерывна в точке a (области D) как
функция n переменных. Тогда она непрерывна и как функция каждой из переменных xi , i =
1, . . . , n.
Предложение 2. Пусть функции u = f (x1 , . . . , xn ) и u = g(x1 , . . . , xn ) непрерывны в точке a
(области D). Тогда функции
f (x1 , . . . , xn ) ± g(x1 , . . . , xn ),
f (x1 , . . . , xn ) · g(x1 , . . . , xn )
также непрерывны в этой точке (области). Функция
f (x1 , . . . , xn )
g(x1 , . . . , xn )
непрерывна во всех точках a, где g(a) 6= 0.
Определение 9. Рассмотрим функцию n аргументов u = f (x1 , . . . , xn ) и совокупность
x1 = ϕ1 (t1 , . . . , tk ), . . . , xn = ϕn (t1 , . . . , tk ),
состоящую из n функций, зависящих от k аргументов. Тогда функция
u = f ϕ1 (t1 , . . . , tk ), . . . , ϕn (t1 , . . . , tk )
называется суперпозицией функций (или, иначе, сложной фунции).
Предложение 3. Если функция u = f (x1 , . . . , xn ) непрерывна в точке a = (a1 , . . . , an ), функции
x1 = ϕ1 (t1 , . . . , tk ), . . . , xn = ϕn (t1 , . . . , tk ),
непрерывны в точке b = (b1 , . . . , bk ) и
a1 = ϕ1 (b1 , . . . , bk ), . . . , an = ϕn (b1 , . . . , bk ),
то их суперпозиция непрерывна в точке b.
Для функций многих переменных справедливы теоремы Больцано–Коши и Вейерштрасса.
Сформулируем их.
Теорема 2 (первая теорема Больцано–Коши). Пусть функция u = f (x1 , . . . , xn ) определена и
непрерывна в области D и в некоторых точках a, b ∈ D принимает значения разных знаков. Тогда
найдётся точка o ∈ D, в которой функция принимает нулевое значение.
Теорема 3 (вторая теорема Больцано–Коши). Пусть функция u = f (x1 , . . . , xn ) определена и
непрерывна в области D и в некоторых точках a, b ∈ D принимает значения A = f (a) и B = f (b),
A < B. Тогда для любого числа C ∈ [A, B] найдётся точка c ∈ D, в которой функция принимает
значение C.
ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
5
Определение 10. Область D ⊂ Rn называется ограниченной, если существует шар, целиком
её содержащий: D ⊂ B n (x, r).
Теорема 4 (первая теорема Вейерштрасса). Пусть функция u = f (x1 , . . . , xn ) определена и
непрерывна в ограниченной замкнутой области D. Тогда она ограничена сверху и снизу в этой
области, т.е. существуют такие числа m и M , что
m 6 f (x) 6 M
для любой точки x ∈ D.
Теорема 5 (вторая теорема Вейерштрасса). Пусть функция u = f (x1 , . . . , xn ) определена и
непрерывна в ограниченной замкнутой области D. Тогда в этой области она достигает своих
точных верхней и нижней граней.
2. Дифференцируемость
Пусть функция u = f (x1 , . . . , xn ) определена в некоторой открытой области и x = (x1 , . . . , xn ) —
точка этой области. Рассмотрим такое приращение ∆x переменной xi , что точки с координатами
x1 , . . . , xi−1 , xi + ∆x, xi+1 , . . . , xn
по-прежнему лежат в этой области. Положим
∆i f = f (x1 , . . . , xi−1 , xi + ∆x, xi+1 , . . . , xn ) − f (x1 , . . . , xi−1 , xi , xi+1 , . . . , xn ).
Определение 11. Предел (если он существует)
∆i f
∂f
= lim
∂xi ∆x→0 ∆x
называется i-ой частной производной функции f (или частной производной по переменной xi ).
p
Пример 9. Пусть r = x2 + y 2 . Тогда
Если ϕ = arctg xy , то
x
∂r
=p
,
∂x
x2 + y 2
∂ϕ
y
=− 2
,
∂x
x + y2
y
∂r
=p
.
∂y
x2 + y 2
x
∂ϕ
= 2
.
∂y
x + y2
Важное свойство частных производных, которое неоднократно будет использоваться в дальнейшем, связано с дифференцированием суперпозиций (см. определение 9).
Теорема 6 (производная сложной функции). Рассмотрим функцию u = f (x1 , . . . , xn ), зависящую от переменных x1 , . . . , xn , и пусть
x1 = ϕ1 (t1 , . . . , tk ), . . . , xn = ϕn (t1 , . . . , tk ).
Предположим, что существуют все частные производные
∂f
∂f
,...,
,
∂x1
∂xn
и
∂ϕ1 ∂ϕ2
∂ϕj
∂ϕn
∂ϕ1
,...,
,
,...,
,...,
.
∂t1
∂tk ∂t1
∂ti
∂tk
(3)
6
ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
∂f
, j = 1, . . . , k, и справедливы равенства
Тогда определены производные ∂t
j

n

∂f ∂x1
∂f ∂x2
∂f ∂xn X ∂f ∂xi
∂f


=
+
+ ··· +
=
,


∂t1
∂x1 ∂t1
∂x2 ∂t1
∂xn ∂t1
∂xi ∂t1


i=1


n

X

∂f ∂xi
 ∂f = ∂f ∂x1 + ∂f ∂x2 + · · · + ∂f ∂xn =
,
∂t2
∂x1 ∂t2
∂x2 ∂t2
∂xn ∂t2
∂xi ∂t2
i=1



.......................................................



n


∂f ∂x1
∂f ∂x2
∂f ∂xn X ∂f ∂xi
∂f


.

 ∂t = ∂x ∂t + ∂x ∂t + · · · + ∂x ∂t =
∂x ∂t
k
1
2
k
Замечание 4. Рассмотрим столбцы

∂f
∂t1
n
k

∂f
 
= . . . ,
∂t
∂f
∂tk
k
i=1
i
(4)
k
∂f 
∂x1

∂f
= ... ,
∂x
∂f
∂xn
понимаемые как k × 1- и n × 1-матрицы соответственно, а также k × n-матрицу


∂x2
∂x1
∂xn
.
.
.
∂t1
∂t1
∂t1
∂x2
∂xn 
1
D(x1 , . . . , xn ) 
.
.
.
 ∂x
∂t2 
=  ∂t2 ∂t2
.
D(t1 , . . . , tk )
 . . . . . . . . . . . . . . . . . . .
∂x1
∂x2
n
. . . ∂x
∂tk
∂tk
∂tk
(5)
Тогда систему равенств (5) в матричном виде можно переписать следующим образом
D(x1 , . . . , xn ) ∂f
∂f
=
◦
.
∂t
D(t1 , . . . , tk ) ∂x
(6)
Такая запись является точным аналогом формулы для производной сложной функции, которую
мы выписывали для функций одного аргумента.
Определение 12. Матрица (5) называется якобианом системы функций
x1 = ϕ1 (t1 , . . . , tk ), . . . , xn = ϕn (t1 , . . . , tk ).
Пример 10. Рассмотрим функцию u = f (x, y) и предположим, что x = ϕ(z), y = ψ(t). Тогда u
является функцией переменных z и t в силу равенств
u = f (ϕ(z, t), ψ(z, t)).
При этом
∂f
∂f ∂x ∂f ∂y
=
+
,
∂z
∂x ∂z
∂y ∂z
∂f
∂f ∂x ∂f ∂y
=
+
.
∂t
∂x ∂t
∂y ∂t
Рассмотрим случай, когда в равенствах (3) количество новых переменных t1 , . . . , tk совпадает
с количеством старых x1 , . . . , xn , т.е. n = k. Тогда эти равенства можно понимать как замену
переменных, т.е. переход от переменных x к переменным t.
Определение 13. Замена переменных
x1 = ϕ1 (t1 , . . . , tn ), . . . , xn = ϕn (t1 , . . . , tn )
(7)
называется невырожденной в некоторой точке, если соответствующий якобиан является невырожденной матрицей, т.е.
∂x1 ∂x2 . . . ∂xn ∂t1 ∂t1
∂t1 ∂x1 ∂x2
n
∂t2 ∂t2 . . . ∂x
∂t2 6= 0.
. . . . . . . . . . . . . . . . . . .
∂x1 ∂x2
n
∂t
. . . ∂x
∂t
∂t
n
n
n
ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
7
Предложение 4. Если замена переменных невырождена в точке t = (t1 , . . . , tn ), то она невырождена и в некоторой окрестности этой точки.
Теорема 7 (теорема об обратной функции). Пусть задана замена переменных (7), невырожденная в некоторой точке. Тогда найдётся окрестность этой точки, в которой рассматриваемая
замена обратима, т.е. найдутся такие функции
t1 = ψ1 (x1 , . . . , xn ), . . . , tn = ψ1 (x1 , . . . , xn ),
(8)
что
и

t1 = ψ1 (ϕ1 (t1 , . . . , tn ), . . . , ϕn (t1 , . . . , tn )),



t = ψ (ϕ (t , . . . , t ), . . . , ϕ (t , . . . , t )),
2
2 1 1
n
n 1
n
.................................................................



tn = ψn (ϕ1 (t1 , . . . , tn ), . . . , ϕn (t1 , . . . , tn ))

x1 = ϕ1 (ψ1 (x1 , . . . , xn ), . . . , ψn (x1 , . . . , xn )),



x = ϕ (ψ (x , . . . , x ), . . . , ψ (x , . . . , x )),
2
2 1 1
n
n 1
n

.................................................................



xn = ϕn (ψ1 (x1 , . . . , xn ), . . . , ψn (x1 , . . . , xn )).
При этом якобианы замен (3) и (8) являются взаимно обратными матрицами, т.е.
D(t1 , . . . , tn ) D(x1 , . . . , xn )
◦
= E,
D(x1 , . . . , xn ) D(t1 , . . . , tn )
D(x1 , . . . , xn ) D(t1 , . . . , tn )
◦
= E,
D(t1 , . . . , tn ) D(x1 , . . . , xn )
где E — единичная n × n-матрица.
Следствие 1. Рассмотрим систему уравнений


ϕ1 (x1 , . . . , xn ) = a1 ,
.......................


ϕn (x1 , . . . , xn ) = an
(9)
относительно неизвествных x1 , . . . , xn в орестности точки, в которой якобиан
D(ϕ1 , . . . , ϕn )
D(x1 , . . . , xn )
невырожден. Тогда, если ai принадлежит области допустимых значений функции ϕi в рассматриваемой окрестности, i = 1, . . . , n, то эта система имеет единственное решение в той же окрестности.
Следствие 2 (теорема о неявной функции). Рассмотрим систему уравнений


ϕ1 (x1 , . . . , xn ; y1 , . . . , ym ) = 0,
(10)
.......................


ϕn (x1 , . . . , xn ; y1 , . . . , ym ) = 0,
относительно неизвестных x1 , . . . , xn , где y1 , . . . , ym — некоторые параметры, и предположим,
1 ,...,ϕn )
что в окрестности некоторой точки x ∈ Rn якобиан D(ϕ
D(x1 ,...,xn ) невырожден. Тогда существует
окрестность этой точки, в которой система (10) разрешима, т.е. приводится к виду


x1 = ψ1 (y1 , . . . , ym ),
(11)
.......................


xn = ψn (y1 , . . . , ym ).
При этом выполняется матричное равенство
D(ϕ1 , . . . , ϕx ) D(x1 , . . . , xn ) D(ϕ1 , . . . , ϕn )
◦
+
= 0,
D(x1 , . . . , xn ) D(y1 , . . . , ym ) D(y1 , . . . , ym )
(12)
8
ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
или
где якобиан
D(x1 ,...,xn )
D(y1 ,...,ym )
D(ϕ , . . . , ϕ ) −1 D(ϕ , . . . , ϕ )
D(x1 , . . . , xn )
1
n
1
x
◦
=−
,
D(y1 , . . . , ym )
D(x1 , . . . , xn )
D(y1 , . . . , ym )
(13)
вычисляется в силу равенств (11), а остальные — в силу (10).
Теперь мы определим для функций многих переменных понятие дифференцируемости. Рассмотрим функцию u = f (x1 , . . . , xn ) и точку x, принадлежащую области её определения. Задим
каждому аргументу xi приращение ∆xi , i = 1, . . . , n, и положим
p
∆ρ = (∆x1 )2 + · · · + (∆x2n ).
Таким образом, величина ∆ρ измеряет расстояние, на которое точка отстоит от исходной после
приращения её координат. Положим
∆f = f (x1 + ∆x1 , . . . , xn + ∆xn ) − f (x1 , . . . , xn ).
Иными словами, ∆f — соответствующее приращение функциию
Определение 14. Функция u = f (x1 , . . . , xn ) называется дифференцируемой в точке x, если в
рассматриваемой точке её приращение имеет вид
∆f = α1 ∆x1 + · · · + αn ∆xn + o(ρ),
(14)
где α1 , . . . , αn — постоянные, а o(ρ) — величина, бесконечно малая по отношению к ρ. Величина
df = α1 dx1 + · · · + αn dxn
(15)
называется главной частью приращения функции, или её дифференциалом.
Теорема 8. Если у функции u = f (x1 , . . . , xn ) существуют непрерывные частные производные
в некоторой окрестности точки x, то она дифференцируема в этой точке, причём её дифференциал
имеет вид
∂f
∂f
df =
dx1 + · · · +
dxn .
(16)
∂x1
∂xn
Следствие 3. Если функция u = f (x1 , . . . , xn ) обладает непрерывными производными в некоторой точке, то и сама функция непрерывна в этой точке.
Рассмотрим некоторую функцию u = f (x1 , . . . , xn ) и предположим, что переменные x1 , . . . , xn
сами являются функциями некоторых параметров t1 , . . . , tk :
x1 = ϕ1 (t1 , . . . , tm ), . . . , xn = ϕn (t1 , . . . , tm ).
(17)
Тогда u становится сложной функцией, зависящей от t1 , . . . , tm , и её дифференциал можно вычислить двумя способами:
1) вычислить частные производные
df =
∂f
∂tj
и положить
∂f
∂f
dt1 + · · · +
dtm ;
∂t1
∂tm
(18)
2) сначала вычислить дифференциал фунции u как функции переменных x1 , . . . , xn , т.е. положить
∂f
∂f
dx1 + · · · +
dxn ,
(19)
df =
∂x1
∂xn
а потом вычислить дифференциалы функций xi = ϕi (t1 , . . . , tm ):
dxi =
∂ϕi
∂ϕi
dt1 + · · · +
dtm
∂t1
∂tm
и подставить выражения (20) в формулу (19).
(20)
ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
9
В итоге мы получим
∂f ∂ϕn
∂ϕ1
∂ϕn
∂f ∂ϕ1
dt1 + · · · +
dtm + · · · +
dt1 + · · · +
dtm =
df =
∂x1 ∂t1
∂tm
∂xn ∂t1
∂tm
∂f ∂ϕ
∂f ∂ϕ1
∂f ∂ϕn
∂f ∂ϕn 1
dt1 + · · · +
dtm . (21)
+ ··· +
+ ··· +
=
∂x1 ∂t1
∂xn ∂t1
∂x1 ∂tm
∂xn ∂tm
Однако в силу теоремы 6 (равенства (4)) правая часть равенств (21) совпадает с правой частью
равенств (18). Иначе говоря, оба способа вычисления дифференциала приводят к одному и тому
же результату. Это свойство дифференциала называется его инвариантностью.
Следствиями инвариантности дифференциала являются формулы для дифференциалов элементарных арифметических выражений:
d(cf ) = c df,
(22)
d(f ± g) = df ± dg,
(23)
d(f g) = f dg + g df,
(24)
f g df − f dg
d
=
,
(25)
g
g2
где c — постоянная, а f и g — функции произвольного (и, возможно, различного) числа аргументов.
Дифференциал и приближённые вычисления. Формула (18) для диффренциала функции,
а также его инвариантность позволяют решить вполне практическую задачу об оценке погрешности различных вычислений.
Пример 11. Погрешность измерения линейных размеров комнаты составляет 5%. Какова погрешность вычисления её площади и объёма?
Пример 12. Погрешность измерения сторон прямоугольного треугольника равна 10%. Какова
погрешность вычисления его гипотенузы?
Пример 13. Погрешность измерения длины пути составляет 5%, а времени — 1%. Какова погрешность вычисления скорости?
Прежде чем ответить на эти вопросы, напомним определения.
Определение 15. Пусть a — точное значение некоторой величины и a∗ — его приближённая
оценка (полученная прямым измерением или вычислением). Тогда величины
|a − a∗ |
|a∗ |
называются соответственно абсолютной и относительной погрешностями оценки.
|a − a∗ |,
(26)
Пусть теперь a зависит от некоторых параметров p1 , . . . , pn и известны отклонения ∆p1 , . . . , ∆pn
оценки каждого из параметров от точных значений. Тогда, если предположить, что функция a =
a(p1 , . . . , pn ), описывающая зависимость рассматриваемой величины от параметров, является дифференцируемой, имеет место приближённое равество
∂a
∂a
∆a ∼
∆p1 + · · · +
∆pn ,
∂p1
∂pn
из которого, при «небольших» значениях отклонений ∆pi следует неравенство
∂a ∂a |∆pn |.
|∆p1 | + · · · + |∆a| 6 ∂p1 ∂pn Обозначая через δ максимальное значение абсолютной погрешности, мы приходим к равенству
∂a ∂a δpn ,
δa = δp1 + · · · + (27)
∂p1 ∂pn 10
ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
которое и используется для оценки погрешности вычисленной величины.
В частности, из формулы (23) следует, что
δ(a ± b) = δa + δb,
(28)
т.е. при сложении или вычитании величин их абсолютные погрешности всегда складываются.
Заметим теперь, что из инвариантности дифференциала вытекает равенство
da
,
d(ln a) =
a
откуда, в силу того, что
a
ln(ab) = ln a + ln b,
ln = ln a − ln b,
b
следует, что
δ(ab)
δa
δb
δ(a/b)
δa
δb
=
+ ,
=
+ .
(29)
|ab|
|a| |b|
|a/b|
|a| |b|
Таким образом, при умножении или делении величин их относительные погрешности всегда
складываются.
Пример 14. Теперь мы можем ответить на вопросы, поставленные в примерах 11–13.
Пример 11: Из первого равенства (29) мы немедленно поллучаем, что относительная погрешность определения площади составляет 5%+5% = 10%, а объёма — 5%+5%+5% = 15%.
Пример 12: Пусть a и c — катеты,
а b — гипотенуза рассматриваемого треугольника. Тогда
√
2
2
по теореме Пифагора c = a + b и в силу равенства (27)
b
a
δa + √
δb,
δc = √
2
2
2
a +b
a + b2
или
δc
δa
δb
a2
b2
·
· .
=√
+√
c
a2 + b2 a
a2 + b2 b
Значит, если относительные погрешности измерения катетов совпадают и равны, скажем, e,
то относительная погрешность вычисления гипотенузы равна 2e = 20%.
Пример 13: Пусть s — путь, t — время и v — скорость. Тогда из второго равенства (29)
следует, что
δv
δs δt
=
+
= 5% + 1% = 6%.
v
s
t
3. Исследование функций многих переменных
В этом параграфе мы изучим, как находить минимумы и максимумы функций многих переменных.
Определение 16. Пусть функция u = f (x1 , . . . , xn ) определена в открытой области и x — точка
этой области. Говорят, что функция u достигает в точке x локального минимума (максимума),
если существует такая окрестность B n (x, r), что f (x) 6 f (x′ ) (f (x) > f (x′ )) для любой точки x′ ∈
B n (x, r). Локальные минимумы или максимумы называются экстремумами.
Необходимое условие существование экстремума для функций многих переменных формулируется аналогично случаю функции одного аргумента.
Теорема 9. Пусть функция u = f (x1 , . . . , xn ) определена в некоторой окрестности точки x и
∂f
в самой точке существуют все частные призводные ∂x
, i = 1, . . . , n. Тогда все они обращаются в
i
нуль в рассматриваемой точке.
Точки области определения функции, в которых все её производные обращаются в нуль, называются стационарными. Как и вслучае одной переменной, обращение в нуль первых производных
не является достаточным для существования экстремума.
ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
11
Пример 15. Производные функции u = x2 − y 2 равны
∂u
∂u
= 2x,
= −2y
∂x
∂y
и, очевидно, обращаются в нуль в точке (0, 0), однако функция не достигает в этой точке ни
максимума, ни минимума.
Достаточные условия существования экстремума у функций многих переменных значительно
сложнее, чем в случае функций одного аргумента. Чтобы из сформулировать, введём нужные
нам понятия.
Производные высших порядков. Рассмотрим вначале простейший случай функции двух переменных u = f (x, y). Предположим, что в некоторой области существуют частные производные
этой функции по обеим переменным. Тогда эти производные сами являются являются функциями
двух переменных и их тоже можно продифференцировать, рассмотрев производные
∂ ∂f ∂ 2 u
∂ ∂f ∂2u
∂ ∂f ∂2u
∂ ∂f ∂ 2 u
=
,
=
,
=
,
=
.
∂x ∂x
∂x2
∂x ∂y
∂x∂y
∂y ∂x
∂y∂x
∂y ∂y
∂y 2
Эти производные (если, конечно, они существуют) называются частными производными второго
порядка.
Пример 16. Возвращаясь к примеру 15, мы видим, что
∂2u
= 2,
∂x2
∂2u
∂2u
=
= 0,
∂x∂y
∂y∂x
∂2u
= −2.
∂y 2
Заметим, что в рассмотренном примере вторые производные функции u по x и по y, взятые в
разном порядке (такие производные называются смешанными), совпадают. Этот факт не случаен,
и справедлив следующий результат.
Теорема 10. Предположим, что:
1) функция u = f (x, y) определена в открытой области D ⊂ R2 ;
2) в этой области существуют первые производные
∂u
,
∂x
∂u
∂y
и вторые смешанные производные
∂2u
∂x∂y
∂2u
;
∂y∂x
3) последние производные непрерывны в рассматриваемой точке.
Тогда имеет место равенство
∂2u
∂2u
=
.
∂x∂y
∂y∂x
Непрерывность смешанных производных существенна для того, чтобы утверждение теоремы 10
оставалось справедливым.
Пример 17. Рассмотрим функцию

2
2
xy x − y , если x2 + y 2 6= 0,
2
f (x, y) =
x + y2

0,
если x = 0, y = 0.
Тогда
 2
2 2
2
y x − y + 4x y
∂f
, если x2 + y 2 6= 0,
=
x2 + y 2 (x2 + y 2 )2
∂x 
0,
если x = 0, y = 0.
12
ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
и
откуда следует, что
 2
2
2 2
x x − y − 4x y
∂f
, если x2 + y 2 6= 0,
=
x2 + y 2 (x2 + y 2 )2

∂y
0,
если x = 0, y = 0,
∂2f
= 1.
∂y∂x
∂2f
= −1,
∂x∂y
Если производные второго порядка можно продифференцировать, то мы получим шесть производных третьего порядка
∂ ∂2f ∂3f
∂ ∂2f ∂ ∂2f ,
,
=
,
∂x ∂x2
∂x3
∂x ∂x∂y
∂x ∂y 2
∂ ∂2f ∂3f
∂ ∂2f ∂ ∂2f ,
.
,
=
∂y ∂x2
∂y ∂x∂y
∂y ∂y 2
∂x3
Среди этих производных четыре являются смешанными, и, если они непрерывны, то, в силу
теоремы 10, выполняются равенства
∂ ∂2f ∂ ∂2f ∂ ∂2f ∂3f
∂3f
∂ ∂2f =
,
=
.
=
=
∂x ∂x∂y
∂y ∂x2
∂x2 ∂y
∂x ∂y 2
∂y ∂x∂y
∂x∂y 2
Вообще, если все частные производные функции u = f (x, y) порядка n существуют и непрерывны,
то мы имеем n + 1 производную
∂nf
∂nf
∂nf
∂nf
∂nf
∂nf
,
,
,
.
.
.
,
,
.
.
.
,
,
.
∂xn ∂xn−1 ∂y ∂xn−2 ∂y 2
∂xn−i ∂y i
∂x∂y n−1 ∂y n
Для функций произвольного числа переменных имеет место следующий результат, обобщающий теорему 10:
Теорема 11. Пусть функция u = f (x1 , . . . , xn ) определена в открытой обрасти D ⊂ Rn и имеет
в этой области все частные производные до порядка n − 1 включительно, а также смешанные производные порядка n, причём последние непрерывны в рассматриваемой области. Тогда значение
любой n-й смешанной производной не зависит от порядка, в котором производятся последовательные дифференцирования функции u.
Теперь можно сформулировать достаточные условия существования экстремума. Мы сделаем
это для функций, зависящих от двух переменных.
Определение 17. Пусть функция u = f (x, y) определена в области D и имеет в этой области
непрерывные производные первого и второго порядка. Матрица
!
2
2
H(f ) =
∂ f
∂x2
∂2f
∂x∂y
∂ f
∂x∂y
∂2f
∂y 2
(30)
называется гессианом функции f .
Обозначим через
∆H(f ) =
определитель гессиана, а через
∂ 2 f ∂ 2 f ∂ 2 f 2
−
∂x2 ∂y 2
∂x∂y
trH(f ) =
его след.
∂2f
∂2f
+
∂x2
∂y 2
Теорема 12 (достаточные условия существования экстремума). Путь функция u = f (x, y)
определена в открытой области D и имеет в этой области непрерывные производные первого и
второго порядка. Рассмотрим стационарную точку x ∈ D и значения ∆H(f ) и trH(f ) в этой точке.
Тогда:
ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
13
1) если ∆H(f ) > 0 и trH(f ) < 0, то функция достигает максимума в точке x;
2) если ∆H(f ) > 0 и trH(f ) > 0, то функция достигает минимума в точке x;
3) если ∆H(f ) < 0, то экстремума нет (при равенстве tr Hf = 0 имеет место седло).
Если в стационарной точке определитель гессиана обращается в нуль, то для выяснения того,
является ли эта точка экстремальной, нужно привлекать более тонкие критерии, рассмотрение
которых входит за рамки настоящего текста.
4. Поверхности
Так же как кривые обобщают понятие графика функции одного аргумента, понятие поверхности является обобщением понятия графика функции двух аргументов.
Определение 18. Множество точек S трёхмерного пространства, координаты которых удовлетворяют уравнению
F (x, y, z) = 0,
(31)
называются поверхностью, если в каждой точке множества S хотя бы одна из частных производ∂F ∂F
ных ∂F
∂x , ∂y , ∂z отлична от нуля.
Пример 18. Множество точек, задаваемых уравнением
x2 + y 2 + z 2 = R2 ,
(32)
является сферой радиуса R с центром в начале координат.
Из теоремы 2 о неявной функции следует, что в окрестности каждой точки, лежащей на поверхности, уравнение (31) можно разрешить относительно хотя бы одной из неизвестных, т.е. представить её в одном из видов
x = g(y, z),
y = h(x, z),
z = f (x, y),
(33)
т.е. в виде графика функции.
Замечание 5. Представление (33), вообще говоря, возможно именно в некоторой окрестности, и оно может меняться при переходе от точки к точке. Например, при z > 0 сферу можно
представить в виде
p
z = x2 + y 2 ,
но при z < 0 такое представление уже не имеет места.
Обобщением представления (33) является задание поверхностей в виде
x = ϕ(u, v),
y = ψ(u, v),
z = χ(u, v),
(34)
где точка (u, v) ∈ R2 принадлежит некоторой открытой области плоскости. При этом мы будем
считать, что функции ϕ, ψ и χ дифференцируемы. Точка, лежащая на поверхности, называется
неособой (или точкой общего положения), если векторы
∂ϕ ∂ψ ∂χ ∂ϕ ∂ψ ∂χ U=
,
,
,
,
,
V =
(35)
∂u ∂u ∂u
∂v ∂v ∂v
линейно независимы в этой точке.
В каждой точке общего положения векторы (35) определяют плоскость, которая называется
касательной плоскостью к поверхности в рассматриваемой точке. Из определения касательной
плоскости немедленно следует, что её параметрические уравнения имеют вид
x=
∂ϕ(a)
∂ϕ(a)
λ+
µ + x0 ,
∂u
∂v
y=
∂ψ(a)
∂ψ(a)
λ+
µ + y0 ,
∂u
∂v
z=
∂χ(a)
∂χ(a)
λ+
µ + z0 ,
∂u
∂v
(36)
14
ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
где a = (x0 , y0 , z0 ) — рассматриваемая точка поверхности и λ, µ ∈ R. Те же уравнения можно
записать в виде
x − x0 y − y0 z − z0 ∂ϕ(a)
∂ψ(a)
∂χ(a) (37)
∂u
∂u = 0,
∂u
∂ψ(a)
∂χ(a) ∂ϕ(a)
или
∂ψ(a) ∂χ(a)
∂v
∂v
∂v
∂ϕ(a) ∂χ(a) ∂χ(a) ∂ϕ(a) ∂χ(a) ∂ψ(a) (x − x0 ) −
−
(y − y0 )+
∂u
∂v
∂u
∂v
∂u
∂v
∂u
∂v
∂ϕ(a) ∂ψ(a) ∂ψ(a) ∂ϕ(a) −
(z − z0 ). (38)
+
∂u
∂v
∂u
∂v
Если поверхность задана уравнением (31), то касательная плоскость определяется уравнением
−
∂F (a)
∂F (a)
∂F (a)
(x − x0 ) +
(y − y0 ) +
(z − z0 ) = 0.
(39)
∂x
∂y
∂z
Прямая, перпендикулярная касательной плоскости и проходящая через точку касанаия, называется нормалью к поверхности в данной точке. Параметрические уравнения нормали имеют
вид

∂χ(a) ∂ψ(a)
∂ψ(a) ∂χ(a)

−
x
=

∂u
∂v λ + x0 ,


∂u ∂v
∂ϕ(a) ∂χ(a)
∂χ(a) ∂ϕ(a)
(40)
y=
− ∂u ∂v λ + y0 ,

∂u ∂v


∂ψ(a)
∂ψ(a)
∂ϕ(a)
∂ϕ(a)
z =
λ + z0 ,
∂u
∂v − ∂u
∂v
λ ∈ R, или
x=
∂F (a)
λ + x0 ,
∂x
x=
∂F (a)
λ + y0 ,
∂y
x=
∂F (a)
λ + z0 .
∂z
(41)
Пример 19. Если S — сфера, заданная уравнением (32), то
x0 x + y0 y + z0 z = R2
— уравнение касательной плоскости, а
x = x0 (2λ + 1),
y = y0 (2λ + 1),
z = x0 (2λ + 1)
— уравнение нормали, проходящих через точку (x0 , y0 , z0 ) ∈ S.
Сечения и линии уровня. Пусть поверхность S задана параметрическими уравнениями (34)
и
u = u(t), v = v(t),
t ∈ [t0 , t1 ],
— кривая в плоскости параметров (u, v). Тогда в пространстве R3 возникает кривая
x = ϕ(u(t), v(t)) = x(t),
y = ψ(u(t), v(t)) = y(t),
z = χ(u(t), v(t)) = z(t),
целиком лежащая на поверхности S.
Частным случаем таких кривых являются сечения. Пусть a ∈ S — точка рассматриваемой
поверхности, в некоторой окрестности которой матрица
 2

2
2
∂ x
2
 ∂u
∂2y
 ∂u
2
∂2z
∂u2
∂ x
∂u∂v
∂2y
∂u∂v
∂2z
∂u∂v
∂ x
2
∂v
∂2y 
2
∂v
∂2z
∂v2
отлична от нулевой, и P — плоскость, проходящая через эту точку. Тогда пересечение S∩P является плоской кривой, которая называется сечением поверхности S плоскостью P . Если поверхность
задана уравнением z = f (x, y), то её сечения плоскостями z = c, где c — число, называются
линиями уровня.
Пример 20. Любое сечение сферы — это окружность.
ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
15
Ориентируемость. В дальнейшем нам понадобится важная характеристика поверхностей, называемая ориентируемостью.
Пусть a ∈ S — точка поверхности. Кривая
x = x(t),
y = y(t),
z = z(t),
t ∈ [t0 , t1 ],
лежащая на этой поверхности и такая, что
a = (x(t0 ), y(t0 ), z(t0 )) = (x(t1 ), y(t1 ), z(t1 )),
называется замкнутой 1.
Предположим, что все точки поверхности неособые. Тогда в каждой точке определена нормаль
и можно рассмотреть единичный вектор, приложенный к рассматриваемой точке и направленный
вдоль нормали. Таких векторов два. Рассмотрим в некоторой точке a ∈ S замкнутую кривую,
лежащую на поверхности, начинающуюся и заканчивающуюся в этой точке, и выберем один
из единичных нормальных векторов, приложенных к данной точке. Будем двигать это вектор
вдоль выбранной кривой так, чтобы он непрерывно зависел от точки (т.е. чтобы его координаты
непрерывно зависели от координат точки) и оставался нормальным. Поскольку кривая замкнута,
при t = t1 мы вернёмся в исходную точку. При этом возможны два случая:
1) вектор нормали, который мы двигали вдоль кривой вернётся в исходное положение;
2) вектор нормали при возвращении в исходную точку совпадёт с противоположным тому, с
которого мы начинали.
Если для любой точки поверхности и для любой замкнутой кривой возможен только случай 1,
то поверхность называется ориентируемой, а выбор одного из единичных векторов нормали в
какой-нибудь из её точек — ориентацией этой поверхности. Если хотя бы для одной из точек
и одной из петель, проходящих через эту точку, реализуется случай 2, поверхность называется
неориентируемой.
Пример 21 (лист Мёбиуса). Возьмите длинную полоску бумаги и склейте её концы так, чтобы
один из них повернулся относительно другого на 180◦ . Легко убедиться, что полученная поверхность неориентирума. Она называется листом Мёбиуса.
Поверхности второго порядка. Простейшими поверхностями (кроме, разумеется, плоскости)
являются поверхности второго порядка.
Определение 19. Множество точек пространства, задаваемое уравнением
a11 x2 + 2a12 xy + 2a13 xz + a22 y 2 + 2a23 yz + a33 z 2 + 2b1 x + 2b2 y + 2b3 z + c = 0,
(42)
где ходя бы одно из чисел aij , 1 6 i 6 j 6 3, отлично от нуля, называется поверхностью второго
порядка.
Как и в случае кривых второго порядка, тип любой поверхности второго порядка определяется
инвариантами её характеристических матриц




a11 a12 a13 b1
a11 a12 a13
a12 a22 a23 b2 


A = a12 a22 a23  ,
a13 a23 a33 b3 
a13 a23 a33
b1 b2 b3 c
и любое уравнение (42) заменами координат можно привести к каноническому виду. Существует
семнадцать типов поверхностей второго порядка. Приведём их список вместе с соответствующими
каноническими уравнениями.
Эллипсоиды: Есть два типа эллипсоидов.
1Замкнутая кривая называется также контуром или петлёй.
16
ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
I. Действительный эллипсоид задаётся каноническим уравнением
x2 y 2 z 2
+ 2 + 2 = 1, a > b > c > 0.
a2
b
c
II. Мнимый эллипсоид задаётся уравнением
x2 y 2 z 2
+ 2 + 2 = −1, a > b > c > 0.
a2
b
c
Гиперболоиды: Есть два типа гиперболоидов.
III. Двуполостный гиперболоид задаётся уравнением
x2 y 2 z 2
+ 2 − 2 = −1, a > b > 0, c > 0.
a2
b
c
IV. Однополостный гиперболоид задаётся уравнением
x2 y 2 z 2
+ 2 − 2 = 1, a > b > 0, c > 0.
a2
b
c
Параболоиды: Есть два типа параболоидов.
V. Эллиптический параболоид задаётся уравнением
x2 y 2
+
= 2z,
p
q
p > q > 0.
(43)
(44)
(45)
(46)
(47)
VI. Гиперболический параболоид задаётся уравнением
x2 y 2
−
= 2z,
p
q
p > 0, q > 0.
(48)
Конусы: Существует два типа конусов.
VII. Действительный конус задаётся уравнением
x2 y 2 z 2
+ 2 − 2 = 0,
a2
b
c
a > b > 0, c > 0,
(49)
a > b > 0 > c > 0,
(50)
причём a12 + b12 + c12 = 1.
VIII. Мнимый конус задаётся уравнением
x2 y 2 z 2
+ 2 + 2 = 0,
a2
b
c
причём a12 + b12 + c12 = 1.
Цилиндры: Есть четыре типа цилиндров.
IX. Действительный эллиптический цилиндр задаётся уравнением
x2 y 2
+ 2 = 1,
a > b > 0.
a2
b
X. Мнимый эллиптический цилиндр задаётся уравнением
x2 y 2
+ 2 = −1,
a > b > 0.
a2
b
XI. Гиперболический цилиндр задаётся уравнением
x2 y 2
− 2 = 1,
a > 0, b > 0.
a2
b
XII. Параболический цилиндр задаётся уравнением
y 2 = 2px,
p > 0.
(51)
(52)
(53)
(54)
Пары плоскостей: Имеется пять типов пар плоскостей, понимаемых как кривые второго
порядка.
ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ
17
XIII. Пара действительных пересекающихся плоскостей задаётся уравнением
x2 y 2
− 2 = 0,
a2
b
a > 0, b > 0,
(55)
где a12 + b12 = 1.
XIV. Пара мнимых пересекающихся плоскостей задаётся уравнением
x2 y 2
+ 2 = 0,
a2
b
a > 0, b > 0,
(56)
где a12 + b12 = 1.
XV. Пара действиетельных параллельных плоскостей задаётся уравнением
y 2 − b2 = 0,
b > 0.
y 2 + b2 = 0,
b > 0.
(57)
XVI. Пара мнимых параллельных плоскостей задаётся уравнением
(58)
XVII. Наконец, пара совпадающих плоскостей задаётся уравнением
y 2 = 0.
(59)
Замечание 6. Сечениями поверхностей второго порядка являются кривые второго порядка.
Более того, любую кривую второго порядка можно получить как сечение действительного конуса.
Поэтому кривые второго порядка иногда называются коническими сечениями.
Download