06-Глава-4-Функции-нескольких

advertisement
ГЛАВА 4. ФУНКЦИИ НЕСКОЛЬКИХ ПЕРЕМЕННЫХ
4.1. Основные понятия
Реальные явления и процессы, как правило, зависят от нескольких
переменных. Поэтому необходимо расширить известное понятие
функциональной зависимости на случаи двух и большего числа переменных путём обобщения соответствующих определений и понятий
для функции одной переменной.
О п р е д е л е н и е 1. Пусть даны три переменные величины x, y, z.
Если каждой упорядоченной паре (x, y)  D по определённому правилу
или закону f ставится в соответствие единственное значение переменной z, то говорят, что на множестве D задана функция f и пишут
z = f (x, y). При этом x и y называются независимыми переменными
(аргументами), z – зависимой переменной или значением функции f в
точке (x, y); D называется областью определения функции.
Ставя в соответствие каждой точке M (x, y)  D аппликату z = f (x, y),
мы получим множество точек (x, y, z = f (M)) трёхмерного пространства, изображаемое некоторой поверхностью. Поэтому равенство z = f (x,
y) называют также уравнением поверхности, которая и является графиком функции двух переменных.
Областью определения D функции двух переменных может быть
вся плоскость Oxy или её часть. В последнем случае линию, ограничивающую область, называют границей области. Точки области, не лежащие на границе, называются внутренними. Область, состоящая
только из своих внутренних точек, называется открытой или незамкнутой, а с присоединённой к ней границей называется замкнутой.
Область D называется ограниченной, если существует круг конечного
радиуса, внутри которого она расположена. В противном случае область
D содержит бесконечно удалённую точку и называется неограниченной.
О п р е д е л е н и е 2. Окрестностью точки M0 (x0, y0) радиуса δ
называется множество точек M (x, y), для которых расстояние ρ (M0, M)
до точки M0 (x0, y0) меньше δ:
ρ (M0, M) =
( x  x0 ) 2  ( y  y 0 ) 2  δ .
(4.1)
Геометрически окрестность точки изображается внутренностью
круга радиуса δ с центром в точке M0.
О п р е д е л е н и е 3. Пусть функция z = f (x, y) определена в некоторой окрестности точки M0 (x0, y0), кроме, быть может, самой точки.
Говорят, что число l есть предел функции при стремлении точки M (x, y)
к точке M0 (x0, y0) по любому пути и пишут
73
lim f ( x, y )  l или lim f ( M )  l ,
x x 0
y y 0
M M 0
(4.2)
если ε > 0 δ = δ(ε) > 0 такое, что из неравенства ρ (M0, M) < δ следует
неравенство | f (x, y) – l | < ε.
О п р е д е л е н и е 4. Функция z = f (x, y) называется бесконечно
малой при M (x, y)  M0 (x0, y0), если lim f (M) = 0, и называется бесконечно большой, если lim f (M) = ∞.
О п р е д е л е н и е 5. Пусть функция z = f (x, y) определена в некоторой окрестности точки M0 (x0, y0) и в самой точке, и пусть M (x, y)
– произвольная точка этой окрестности. Функция z = f (x, y) называется
непрерывной в точке M0 (x0, y0), если бесконечно малым приращениям
аргументов Δx = x – x0 и Δy = y – y0 соответствует бесконечно малое
приращение Δz = f (M) – f (M0) функции:
(4.3)
lim  z  0 .
x0
y0
Если равенство (4.3) выполняется в каждой точке области D, то
говорят, что функция непрерывна в области D. С помощью основных
понятий предела в точке и непрерывности функции в точке и области
доказываются основные теоремы о пределах функций двух переменных и формулируются свойства неперерывных в области D функций,
аналогичные указанным в п.2.8 и п.2.11.
Понятие функции трёх переменных, а также определения предела
и непрерывности для неё вводятся аналогичным образом. В более общем случае упорядоченный набор n переменных величин (x1, x2, …, xn)
называется точкой в n-мерном пространстве. Если при этом каждому
набору (x1, x2, …, xn) из некоторого множества X по определённому
правилу или закону f ставится в соответствие единственное значение
переменной величины z, то говорят, что на множестве X задана функция n переменных и пишут z = f (x1, x2, …, xn).
В случае числа переменных n > 3 основные понятия вводятся
формально и аналогично случаю двух переменных. В дальнейшем основные факты теории будем излагать для функции двух переменных и,
при необходимости, формулировать их для функций n переменных.
4.2. Частные производные и полный дифференциал
функции двух переменных
Пусть в области D задана непрерывная функция z = f (x, y). Так
как x и y являются независимыми переменными, то одну из них можно
изменять, сохраняя постоянное значение другой. Пусть сначала y сохраняет постоянное значение, а переменная x получает приращение Δx.
74
В этом случае функция z = f (x, y) получит приращение
Δx z = f (x + Δx, y) – f (x, y) ,
(4.4)
которое называется частным приращением по переменной x и является,
по существу, функцией одной переменной Δx.
О п р е д е л е н и е 1. Если существует конечный предел
 z
f ( x  x, y )  f ( x, y )
lim x  lim
,
(4.5)
x 0 x
x 0
x
то он называется частной производной функции z = f (x, y) по переменf
z
ной x и обозначается одним из символов z x , , f x ,
.
x
x
Аналогично при постоянном значении x определяется частное
приращение по переменной y:
Δy z = f (x, y + Δy) – f (x, y) .
(4.6)
О п р е д е л е н и е 2. Если существует конечный предел
yz
f ( x, y  y )  f ( x, y )
lim
 lim
,
(4.7)
y 0 y
y 0
y
то он называется частной производной по переменной y и обозначается
f
z
одним из символов z y , , f y ,
.
y
y
Производную функции одной переменной y   f (x) после введения частных производных принято называть обыкновенной производной. Частные производные находят по тем же формулам и правилам,
по которым находятся обыкновенные производные, так как при нахождении частной производной z x ( x, y) величина y считается постоянной,
а при вычислении частной производной zy ( x, y) постоянной считается
величина x.
Если величины x и y одновременно получают независимые приращения Δx и Δy, то функция z = f (x, y) получает полное приращение
по обеим переменным, которое при наличии непрерывных частных
производных выражается следующей формулой полного приращения:
z  f ( x  x, y  y )  f ( x, y )  z x x  z y y  1 x   2 y , (4.8)
где 1 (x, y) ,  2 (x, y) – бесконечно малые функции, для которых
lim ε1 = lim ε2 = 0 при Δx  0, Δy  0.
В формуле (4.8) сумма двух первых слагаемых zx x  zy y является линейной, т. е. 1-й степени, функцией относительно Δx и Δy. При
|Δx| < 1 и |Δy| < 1 она представляет собой главную часть полного приращения по сравнению с нелинейной частью 1 x   2 y .
75
О п р е д е л е н и е 3. Главная линейная часть полного приращения функции z = f (x, y) называется её полным дифференциалом и обозначается символом dz:
z
z
(4.9)
dz  dx 
dy ,
x
y
где приняты обозначения dx = Δx, dy = Δy.
При малых значениях |Δx| < 1 и |Δy| < 1 неизвестное полное приращение Δz функции z = f (x, y) обычно приближённо заменяют её
полным дифференциалом, т. е. пользуются приближённым равенством
z
z
z  f ( x  x, y  y )  f ( x, y )  dz  dx 
y .
(4.10)
x
y
Частные приращения, частные производные, полное приращение
и полный дифференциал функции трёх и более переменных определяют и обозначают аналогичным образом.
4.3. Производная по направлению и градиент
Понятие частных производных по x и по y можно обобщить
на случай любого направления изменения функции. Пусть функция
z = f (x, y) определена в точке M (x, y) и в некоторой её окрестности.
Проведём из точки M (x, y) вектор l  l x i  l y j , на котором возьмём
вторую точку M1 (x + Δx, y + Δy) (рис. 54). При переходе из точки M (x, y)
в точку M1 (x + Δx, y + Δy) вдоль вектора l функция получит полное
приращение
l z  f (M1 )  f (M )  f ( x  x, y  y)  f ( x, y) .
О п р е д е л е н и е. Предел вида
l z
f ( x  x, y  y)  f ( x, y)
lim
 lim
M 1 M | M M 1 |
x0
(x) 2  (y) 2
(4.11)
(4.12)
y0
при стремлении M1  M вдоль вектора l называется производной по
z
направлению и обозначается символом
.
l
Производная по направлению имеет физический смысл скорости
изменения функции z = f (x, y) в направлении вектора l , в то время
как частные производные z x ( x, y) и zy ( x, y) имеют физический
смысл скорости изменения функции в направлениях координатных
осей Ox и Oy соответственно.
76
Обозначим углы вектора l с осями координат
Ox и Oy соответственно α и β. Тогда,
l
y  y
после
перехода
в равенстве (4.12) к пределу с
y

y M 
помощью
формулы
(4.8) полного приращения
x
функции z = f (x, y), получим формулу произx x   x x водной по направлению в точке M (x, y) вида
0
Рис. 54
z
 z x ( x, y ) cos   z y ( x, y ) cos  . (4.13)
l
Правую часть формулы (4.13) можно записать иначе в виде скалярного произведения двух векторов. Для этого введём: единичный
y
M1
вектор l 1  l
ly
l
l
l1 
 x i
j  cos  i  cos  j
|l | |l | |l |
и второй вектор
grad z  z x ( x, y ) i  z y ( x, y ) j ,
(4.14)
(4.15)
который называется градиентом функции z = f (x, y).
Используя определение скалярного произведения двух векторов,
данное формулой (1.61), и определение единичного вектора, формулу
(4.13) можно записать теперь в следующей форме:
z
 grad z  l 1 | grad z |  | l 1 | cos  | grad z | cos  ,
(4.16)
l
grad z
где φ – угол между векторами l и grad z (рис. 55). Если
l

M
l1
угол φ = 0, т. е. направление векторов l и grad z совпадает, то cos φ = cos 0 = 1. Производная по направлению в этом случае принимает наибольшее значение,
равное модулю (длине) вектора grad z:
Рис. 55
z
| grad z | ( z x ) 2  ( z y ) 2 .
(4.17)
l grad z
Из формул (4.16) и (4.17) теперь следует, что градиент функции есть вектор, в направлении которого скорость изменения функции
z = f (x, y) в точке M (x, y) имеет наибольшее значение.
4.4. Частные производные высших порядков
Пусть функция z = f (x, y) имеет непрерывные частные производные zx и zy . Будем называть их частными производными первого порядка и рассматривать как новые функции независимых переменных x и y.
Тогда каждая из них будет иметь две частные производные, которые
77
называются частными производными второго порядка. Они определяются следующими равенствами:
  z   2 z
  z   2 z
 ( zx )y  zxy
 ,
   2  ( z x )x  z x 2 ,
 
y  x  x y
x  x  x
  z   2 z
  z   2 z
 ( zy )x  zyx
 ( zy )y  zy 2 .
 ,
 
 
x  y  y x
y  y  y 2
Среди этих четырёх частных производных второго порядка две
z xy
 и z yx
 называются смешанными частными производными второго
порядка. Для них доказана следующая теорема.
Т е о р е м а. Если смешанные частные производные второго по и z yx
 непрерывны в точке M (x, y), то они равны между собой:
рядка z xy
z xy
  z yx
 .
(4.18)
Рассматривая частные производные второго порядка как новые
функции независимых переменных x и y, найдём аналогично частные
производные третьего порядка. С помощью указанной теоремы доказывается, что смешанные частные производные третьего порядка, т. е.
найденные по обеим переменным в различной последовательности,
вновь равны между собой. В результате из восьми частных производных третьего порядка различными оказываются следующие четыре:
3 z
3 z
3)
( 3)
( 3)
 z x(32) y  z (yx
,

z
2  z xyx ,
3
x
x 2 y
x3
3 z
3 z
( 3)
( 3)
 z (y3)3 ,
 z (y3)2 x  z xy
2  z yxy .
3
y
y 2 x
Частные производные любого n-го порядка находятся аналогично
и обозначаются символами
n z
 z x(n) y  , где α + β = n.
(4.19)
x  y 
Частные производные при n  2 называются частными производными высших порядков. Аналогично можно определить также частные
прозводные функций трёх и более независимых переменных.
x
  zx  zy  0 .
П р и м е р. Дано: z  e y . Доказать, что F  y zxy
Р е ш е н и е. По определению частной производной находим zx ,
считая y фиксированной постоянной величиной, тогда
zx 
x
z
1
1
 (e y )  e y ( x)  e y .
x
x y
x
y
x
x
78
Аналогично находим частную производную zy , считая x фиксированной постоянной величиной:

x
x
z
x x
1
z y   (e y ) y  e y x     2 e y .
y
y
 y y
Находим смешанную частную производную 2-го порядка, используя правило дифференцирования произведения двух функций:

x
x
 x
  z   1 y 
1 y 
1
y
z xy
      e     e  (e ) y 
y  x   y 
y
 y y

y
x
x
x
x
1
1  x
1
x
  2 ey  ey  2   2 ey  3 ey .
y
y  y 
y
y
Находим согласно условию функцию F:
x
x
x
x
1
x
1
x
  z x  z y   e y  2 e y  e y  2 e y  0 ,
F  y z xy
y
y
y
y
что и требовалось доказать.
4.5. Экстремум функции двух переменных
Пусть функция z = f (x, y) определена и непрерывна в точке
M0 (x0, y0)  D и в некоторой её окрестности.
О п р е д е л е н и е. Точка M0 (x0, y0) называется точкой максимума функции z = f (x, y), если для каждой точки M (x, y), отличной от
точки M0 (x0, y0), в указанной окрестности выполняется неравенство
f (x, y) < f (x0, y0). Если же выполняется неравенство f (x, y) > f (x0, y0), то
M0 (x0, y0) называется точкой минимума.
Значение функции z0 = f (x0, y0) в точке максимума (или минимума) называется максимумом (минимумом) функции z = f (x, y). Максимум и минимум функции называют её экстремумом. В силу определения точка экстремума лежит всегда внутри области определения функции D. Максимум и минимум носят локальный (местный) характер, так
как значение f (x0, y0) сравнивается со значениями f (x, y) лишь в некоторой сколь угодно малой окрестности точки M0 (x0, y0). В области
определения D функция может иметь несколько экстремумов или
может не иметь ни одного.
Выясним необходимые условия существования экстремума функции. Предположим для этого, что в точке M0 (x0, y0) экстремум есть.
Тогда он будет достигаться и по каждой переменной x и y в отдельности.
79
Будем считать, что функция z = f (x, y) непрерывна и имеет в точке
M0 (x0, y0) и в её окрестности непрерывные частные производные. Тогда, согласно необходимому условию экстремума функции одной переменной, в точке M0 (x0, y0) должны быть равными нулю обе частные
производные:
z x ( x, y)  0 ,
zy ( x, y)  0 ,
(4.20)
образующие систему двух уравнений с двумя неизвестными x и y.
Точки, в которых выполнены необходимые условия экстремума
(4.20), называются стационарными. Из равенства нулю частных производных в стационарной точке вытекает, что в ней равен нулю градиент функции, а также производная по любому направлению. Геометрически это означает, что в стационарной точке касательная плоскость к
поверхности z = f (x, y) параллельна плоскости Oxy и имеет уравнение
z = f (x0, y0).
Для выяснения характера экстремума в стационарной точке, или
его отсутствия, необходимо использовать достаточные условия.
Т е о р е м а. (Достаточные условия экстремума). Пусть в стационарной точке M0 (x0, y0) и в некоторой её окрестности функция z =
f (x, y) имеет непрерывные частные производные 2-го порядка. Вычислим в точке M0 (x0, y0) следующие значения:
 ( x0 , y0 ) , C  f y2 ( x0 , y0 ) , Δ = AC – B2. (4.21)
A  f x2 ( x0 , y0 ) , B  f xy
Тогда:
1) Если Δ > 0, то в точке M0 (x0, y0) экстремум есть. При этом, если
A > 0, то в точке M0 находится минимум; если A < 0, то в точке M0
находится максимум.
2) Если Δ < 0, то в точке M0 (x0, y0) экстремума нет.
3) Если Δ = 0, то этот случай называется сомнительным и необходимы дополнительные исследования.
Исследование функции двух переменных на экстремум следует
проводить по следующей схеме:
1. Найти частные производные z x ( x, y) , zy ( x, y) .
2. Используя необходимые условия экстремума, решить систему
уравнений (4.20) и указать стационарные точки.
3. Найти частные производные 2-го порядка, вычислить их значения в каждой стационарной точке и с помощью теоремы о достаточных
условиях сделать вывод о наличии экстремума в каждой из них.
4. Найти все экстремумы функции.
З а м е ч а н и е. Основная трудность при исследовании на экстремум состоит в решении системы (4.20). По этой причине многие практические задачи указанным методом решить не удаётся.
80
4.6. Наибольшее и наименьшее значения функции
двух переменных
Пусть замкнутая ограниченная область D задаётся на плоскости
Oxy системой неравенств:
D: { a  x  b , y1 ( x)  y  y2 ( x) },
(4.22)
где y = y1 (x) – уравнение нижней границы, а y = y2 (x) – уравнение
верхней границы области D (рис. 56). Для нахождения наибольшего
и наименьшего значений, которые достигаются
y
y  y 2 ( x)
функцией в точках, расположенных внутри области D, или в точках, лежащих на границе обB
D
A
ласти, надо:
1. Из условий (4.20) найти все стационарy  y1 ( x)
ные точки функции z = f (x, y) , принадлежащие
x
0 a
b
открытой области D, и вычислить в них значеРис. 56
ния функции.
2. Используя уравнения границ области D, ввести две функции
одной переменной x:
z = f1 (x, y1 (x)) и z = f2 (x, y2 (x)), a  x  b .
(4.23)
Из условий f1( x)  0 и f 2( x)  0 найти стационарные точки,
принадлежащие интервалу (a, b), в которых затем вычислить соответствующие значения функций z = f1 (x) и z = f2 (x).
3. Найти два значения z = f (A) и z = f (B) в точках A и B, разделяющих границу области D на нижнюю и верхнюю части (рис. 56).
4. Из вычисленных значений функции z = f (x, y) во внутренних и
граничных точках области D выбрать наибольшее M и наименьшее m.
.
.
4.7. Условный экстремум функции двух переменных.
Метод множителей Лагранжа
Пусть требуется найти экстремум функции z = f (x, y) лишь в точках линии g (x, y) = 0, расположенной в D (рис. 57). Уравнение g (x, y) = 0
называется уравнением связи переменных
y
grad f ( x0 , y0 )
x и y, а экстремум функции z = f (x, y) в
M0
точках линии называется условным эксg ( x, y)  0
тремумом. Точка M0 (x0, y0) линии назыgrad g ( x0 , y0 )
вается точкой условного экстремума, если
D
для всех точек из её окрестности, удовлетx
0
воряющих уравнению связи g (x, y) = 0, выРис. 57
полняется одно из неравенств
f (x, y) < f (x0, y0)
или
f (x, y) > f (x0, y0).
(4.24)
.
81
В тех случаях, когда уравнение связи g (x, y) = 0 удаётся разрешить относительно одной из переменных, например, выразить из него
y через x в форме y = φ(x), тогда, подставив полученное выражение в
функцию двух переменных, получим функцию одной переменной:
z = f (x, y) = f (x, φ(x)).
(4.25)
Её экстремум и будет условным экстремумом функции z = f (x, y).
В более сложных случаях сделать это не удаётся. Для отыскания
условного экстремума в общем случае используется метод множителей Лагранжа. Для этого вводится функция трёх переменных
L (x, y, λ) = f (x, y) + λ g (x, y),
(4.26)
называемая функцией Лагранжа, где число λ называется множителем
Лагранжа. Далее используется следующая теорема.
Т е о р е м а. Если точка M0 (x0, y0) есть точка условного экстремума функции z = f (x, y) при дополнительном условии g (x, y) = 0, то
существует такое значение λ0, что точка (x0, y0, λ0) является точкой экстремума функции L (x, y, λ).
Из теоремы следует, что в точке (x0, y0, λ0) должны выполняться
необходимые условия экстремума вида:
L ( x, y, )  0,
 f x ( x, y )   g x ( x, y )  0,
 x

Ly ( x, y, )  0,   f y ( x, y )   g y ( x, y )  0,
 

L  ( x, y, )  0,
 g ( x, y )  0.
(4.27)
Последнее уравнение системы (4.27) совпадает с уравнением связи, а два первых уравнения можно записать в виде одного векторного
уравнения
grad f ( x, y)   grad g ( x, y) ,
(4.28)
т. е. в точке условного экстремума M0 (x0, y0) градиенты функций f (x, y)
и g (x, y) коллинеарны с коэффициентом пропорциональности λ и противоположно направлены (рис. 57).
Достаточные условия условного экстремума имеют более сложную формулировку. Однако во многих экономических задачах стационарная точка функции Лагранжа оказывается единственной и соответствует наибольшему или наименьшему значению функции z = f (x, y) в
точках линии, заданной уравнением связи g (x, y) = 0.
Если рассматривается функция нескольких переменных
z = f (x1, x2, …, xn), n > 2, то может быть и несколько уравнений связи
gi (x1, x2, …, xn) = 0, i = 1, 2, …, k. Соответственно в этом случае будет
и несколько множителей Лагранжа λi, i = 1, 2, …, k.
82
Download