Высшая школа экономики, 2011-12 учебный год Факультет прикладной политологии Алгебра и анализ

advertisement
Высшая школа экономики, 2011-12 учебный год
Факультет прикладной политологии
Алгебра и анализ
И. А. Хованская, И. В. Щуров, Ю. Г. Кудряшов, К. И. Сонин (РЭШ)
Тейлоровские приближения: где искать контрабандистов?
Обсуждая понятие производной, мы говорили, что производная — это мгновенная скорость
изменения функции. Вернемся к примеру с машиной на прямолинейной дороге, который
мы уже рассматривали. Пусть в момент времени t она находится на расстоянии f (t) от
«начальной точки» (скажем, дело происходит в России, и расстояние меряется до Москвы; дорогу мы считаем прямой и проходящей через Москву). Тогда f ′ (t) — это скорость
изменения расстояния, то есть просто скорость движения машины в момент времени t.
Допустим, вы знаете, что 13 апреля 1965 года в 18:00 (пусть это «начальный момент
времени», т.е. t = 0) бежевая «Волга» с номером 28-70 ОГО с контрабандистами и похищенным ими Семеном Семеновичем Горбунковым находилась на Ленинградском шоссе на
расстоянии 300 км от Москвы. Где вы будете искать её через два часа? Если вы ничего не
знаете о том, куда она едет (в сторону Москвы или от Москвы), и с какой скоростью, то
самое лучшее, что вы можете сделать — это искать её там же, где она была. Если вы знаете,
что она двигалась от Москвы с некоторой известной скоростью — вы вычислите, сколько
километров она могла проехать с такой скоростью за два часа, и сделаете соответствующую
поправку — будете искать машину дальше от Москвы. Допустим теперь, что вы не только
знаете, с какой скоростью машина ехала, но знаете также, что водитель при этом давил
на газ и машина ускорялась. Тогда вы сделаете еще одну поправку — учтете, что скорость
увеличивалась, и значит машина уехала еще дальше. Получая больше информации о том,
как вела себя машина в нулевой момент времени, вы всё лучше и лучше сможете оценить,
где она будет находиться через два часа.
Именно в этом состоит идея, которая будет обсуждаться на сегодняшней лекции: если
мы знаем значение функции и её производных в какой-то точке, как мы можем вычислить
(хотя бы приблизительно) значение этой функции в других точках?
Давайте проследим за приведенными выше рассуждениями более подробно. Если вы
ничего не знаете про функцию f (t), кроме того, что f (0) = 300 (начальное положение
машины), то самое лучшее, что вы можете сказать про f (2), это f (2) ≈ f (0) = 300. То же
самое справедливо и для любого другого момента времени t. Иными словами, мы можем
приблизить нашу функцию только константой (см. рис. 1).
Допустим теперь, мы знаем, что в момент времени t = 0 «Волга» двигалась по направлению к государственной границе (т.е. от Москвы) на большой скорости — скажем,
100 км/ч. Иными словами, мы знаем, что f (0) = 300 и f ′ (0) = 100. Где мы будем искать
машину через два часа? Если она двигалась в начальный момент времени со скоростью
100 км/ч, и мы ничего не знаем про её ускорение, разумно считать, что эта скорость была
постоянной. Значит, через два часа она проедет 200 километров и окажется на расстоянии
300 км+ 100 км/ч × 2 ч = 500 км. В общем случае, для положения машины в момент времени t, мы напишем: f (t) ≈ f (0)+f ′ (0)t = 300+100t. Эта формула, конечно, приблизительная:
она выписана в предположении, что скорость неизменна, а на самом деле скорость может со
временем меняться. Но если считать, что скорость со временем меняется не слишком быстро, то эта формула будет достаточно точной, если только время t не слишком большое.
1
ВШЭ, 2011-12, «Алгебра и анализ», И. А. Хованская, И. В. Щуров, Ю. Г. Кудряшов, К. И. Сонин
(РЭШ)
700
600
500
400
300
200
100
0
-0.5
f (t) (реальная)
нулевое приближение (300)
0
0.5
1
1.5
2
2.5
3
Рис. 1: График функции f (t) (зависимость расстояния от времени) и нулевое приближение
к нему
Иными словами, формула дает приближение с заданной точностью в какой-то окрестности
точки t = 0.
На самом деле, мы сейчас не сказали ничего нового — мы просто приблизили нашу
неизвестную функцию линейной. На графике (см. рис. 2) это соответствует тому, что мы
нарисовали касательную к графику функции, и сказали, что график касательной проходит
близко к графику самой функции — по крайней мере, пока мы не слишком далеко отошли
от точки, в которой касательная построена.
Добавим больше информации: допустим, мы теперь знаем не только расстояние и скорость машины в момент времени t = 0, но и ускорение — то есть мгновенную скорость
изменения скорости. Допустим, мы знаем, что машина двигалась с ускорением 60 км/ч2
(т.е. набирала по 60 км/ч в час, или f ′′ (0) = 60). Где тогда мы будем искать машину через
2 часа? Очевидно, что она проедет больше, чем 200 километров, и значит мы будем искать
её не на расстоянии 500 км от Москвы, а дальше. Насколько дальше?
Прежде, чем мы ответим на этот вопрос, давайте попробуем упростить задачу. Пусть
в момент времени t = 0 машина находилась на расстоянии 0 км от Москвы и её мгновенная скорость равнялась 0 км/ч, но ускорение составляло 60 км/ч2 — иными словами, она
только начала разгоняться. Обозначим функцию, выражающую зависимость расстояния от
времени, через g(t) (чтобы отличать её от функции f (t) в исходной задаче).
Если разгон был равномерным, то есть ускорение не менялось со временем, то скорость
должна возрастать линейно — на 60 км/ч каждый час. Иными словами, в этом случае
g′ (t) = 60t. Какой может быть функция g(t), чтобы её производная равнялась g′ (t) = 60t?
Мы умеем дифференцировать степенную функцию (tn ), и помним, что производная квадратичной функции является линейной ((t2 )′ = 2t). Легко проверить, что искомыми свойствами обладает именно квадратичная функция: если g(t) = ct2 (где c — некоторое число),
то g′ (t) = c · 2t = 2ct и значит g(0) = 0, g′ (0) = 0, g′′ (0) = 2c. Остается подобрать коэффициент c таким образом, чтобы вторая производная равнялась 60: иными словами, мы хотим,
ВШЭ, 2011-12, «Алгебра и анализ»
ВШЭ, 2011-12, «Алгебра и анализ», И. А. Хованская, И. В. Щуров, Ю. Г. Кудряшов, К. И. Сонин
(РЭШ)
700
600
500
400
300
200
100
0
-0.5
f (t) (реальная)
нулевое приближение (300)
первое приближение (300 + 100t)
0
0.5
1
1.5
2
2.5
3
Рис. 2: Первое приближение (касательная)
чтобы 2c = 60. Очевидно, нужно взять c = 60/2 = 30. Таким образом, искомая функция
g(t) = 30t2 .
Вернемся к нашей исходной задаче. Мы хотим, чтобы расстояние в начальный момент
времени равнялось 300 километров (f (0) = 300), скорость равнялась 100 км/ч (f ′ (0) = 100)
и ускорение равнялось 60 км/ч2 (f ′′ (0) = 60). Раньше мы нашли функцию, которая обладала нужным значением и нужной производной (300 + 100t) и нулевым ускорением. Теперь мы нашли функцию, обладающую заданным ускорением, но её значение в нуле и
значение скорости в нуле у неё нулевые, а не те, которые нам нужны. Оказывается, если добавить к линейной функции найденную квадратичную, мы получим то, что нужно:
f (t) ≈ 300+100t+30t2 . Таким образом, мы теперь приближаем нашу неизвестную функцию
f (t) не прямой, а графиком квадратичной функции (параболой), см. рис. 3. Нетрудно видеть, что каждое из слагаемых этой функции «отвечает» за соответствующую производную.
Слагаемое 300 отвечает за значение функции в нуле. Слагаемое 100t при дифференцировании превращается в 100 и отвечает за первую производную. Слагаемое 30t2 при первом
дифференцировании превращается в 60t (и равно нулю в нуле, поэтому «не портит» первую
производную), а при втором дифференцировании превращается в 60 и отвечает за вторую
производную.
f (t) = 300 +100t
+30t2
f (0) = 300
+100 · 0 +30 · 02 =300
f ′ (t) = 0
+100
+60t
′
+100
+60 · 0
′′
+0
+60
′′
+0
+60
f (0) = 0
f (t) = 0
f (0) = 0
=100
=60
Допустим теперь, что нам известна не только вторая производная, но и третья. Как
мы можем учесть эту информацию, чтобы еще лучше оценить местоположение машины?
ВШЭ, 2011-12, «Алгебра и анализ»
ВШЭ, 2011-12, «Алгебра и анализ», И. А. Хованская, И. В. Щуров, Ю. Г. Кудряшов, К. И. Сонин
(РЭШ)
700
600
500
400
300
200
100
0
-0.5
f (t) (реальная)
нулевое приближение (300)
первое приближение (300 + 100t)
второе приближение (300 + 100t + 30t2 )
0
0.5
1
1.5
2
2.5
3
Рис. 3: Второе приближение (квадратичная функция)
Сказанное выше заставляет предположить, что нам нужно дописать в выражение для f (t)
еще одно слагаемое — вида ct3 , где c — некоторое число. Добавление этого слагаемого не
изменит значение функции в нуле и значение её первой и второй производной, но сделает
третью производную ненулевой; подбирая подходящим образом c, мы можем сделать третью
производную такой, какой нам нужно.
Задача 1. Доказать, что c = f ′′′ (0)/6.
В таблице 1 записаны результаты наших изысканий.
Известные данные
f (0)
f (0), f ′ (0)
f (0), f ′ (0), f ′′ (0)
f (0), f ′ (0), f ′′ (0), f ′′′ (0)
Приближение
f (t) ≈ f (0)
f (t) ≈ f (0) + f ′ (0)t
f (t) ≈ f (0) + f ′ (0)t +
f (t) ≈ f (0) + f ′ (0)t +
f ′′ (0) 2
2 t
f ′′ (0) 2
2 t
+
f ′′′ (0) 3
6 t
Таблица 1: Первые тейлоровские приближения
Наконец, если мы знаем первые n производных, мы можем, продолжая процесс, описанный выше, выписать приближение в виде многочлена степени n. Получающиеся у нас
приближения называются тейлоровскими многочленами.
Как будет выглядеть тейлоровский многочлен степени n? Ввиду важности, мы запишем
соответствующую формулу в общем виде (именно она и называется формулой Тейлора)
отдельно, но сначала нам понадобится ввести одно полезное определение:
Определение 1. Факториалом натурального числа n (обозначается n! — восклицательный
знак в данном случае является знаком математической операции) называется произведение
всех натуральных чисел, не превосходящих n:
n! = 1 × 2 × 3 × · · · × n
ВШЭ, 2011-12, «Алгебра и анализ»
ВШЭ, 2011-12, «Алгебра и анализ», И. А. Хованская, И. В. Щуров, Ю. Г. Кудряшов, К. И. Сонин
(РЭШ)
Например, 2! = 1 × 2 = 2, 3! = 1 × 2 × 3 = 6, 4! = 1 × 2 × 3 × 4 = 24 и т.д.
Теперь мы готовы записать формулу Тейлора:
f (t) ≈ f (0) + f ′ (0)t +
f ′′ (0) 2 f ′′′ (0) 3
f (n) (0) n
t +
t + ··· +
t
2
3!
n!
(1)
Здесь через f (n) обозначается n-я производная функции f (t) (т.е. f с n штрихами).
Определение 2. Тейлоровский многочлен (тейлоровское приближение) функции f (t) степени n в нуле — это многочлен, записанный в правой части формулы (1). Мы будем обозначать его через fn (t).
Задача 2. Доказать, что любая производная тейлоровского многочлена fn (t) в нуле вплоть
до n-й совпадает с соответствующей производной функции f (t) в нуле.
От многочленов к рядам
Давайте оглянемся и посмотрим на пройденный путь. Мы рассматривали некую совершенно неизвестную функцию f (t) — положение машины на дороге в момент времени t. Вся
информация об этой функции, которой мы обладали, относилась к начальному моменту
времени t = 0 (положение машины в начальный момент времени, скорость, ускорение и
т.д.) Основываясь на этой информации, мы построили новую функцию (тейлоровский многочлен fn (t)), которая вблизи начального момента времени ведет себя «практически так
же», как наша «настоящая» f (t). Построенное нами приближение замечательно тем, что
оно, в отличие от исходной функции, может быть выписано в явном (и очень простом) виде.
При этом если t не очень велико, значение fn (t) близко к значению f (t) (это и означает, что
функции ведут себя «похоже»). Таким образом, исследуя fn (t), мы можем делать выводы
о поведении f (t). Например, приблизительно вычислять значения f (t).
Напомним, что тейлоровский многочлен первого порядка (линейное приближение) задает уравнение касательной к графику функции. Замена функции на её линейное приближение называется линеаризацией — как мы обсуждали раньше, это один из главных
математических инструментов, позволяющих сводить сложные практические задачи к решаемым математическим. Переход от функции к соответствующему многочлену Тейлора
можно считать обобщением процедуры линеаризации. При этом мы используем больше
информации об исходной функции, и получаем в результате более сложный, но всё еще
хорошо поддающийся анализу математический объект, который лучше приближает исходную функцию, чем линейная. Чем больше порядок тейлоровского многочлена, тем больше
производных задействовано, тем лучше приближение.
Допустим, мы знаем все производные функции f (t) в нуле. Тогда мы можем выписать
тейлоровский многочлен fn (t) для любого числа n, причем чем больше n, тем лучше мы
приблизим исходную функцию. Возникает естественное желание выписать «тейлоровский
многочлен» бесконечной степени — т.е. записать в формуле (1) бесконечное число слагаемых. Такой объект действительно можно рассмотреть — он называется рядом Тейлора:
f (n) (0) n
f ′′ (0) 2 f ′′′ (0) 3
t +
t + ··· +
t + ···
fb(t) = f (0) + f ′ (0)t +
2
3!
n!
ВШЭ, 2011-12, «Алгебра и анализ»
(2)
ВШЭ, 2011-12, «Алгебра и анализ», И. А. Хованская, И. В. Щуров, Ю. Г. Кудряшов, К. И. Сонин
(РЭШ)
Еще в школе вы сталкивались с простейшим примером ряда — бесконечной геометрической прогрессией; мы также обсуждали ряды, когда говорили о пределах. Напомним, какой
смысл имеет этот ряд.
Зафиксируем какое-нибудь значение t и рассмотрим последовательность чисел f0 (t),
f1 (t), f2 (t),. . . ,fn (t),. . . . Если эта последовательность имеет предел (т.е. с ростом n элементы последовательности приближаются к какому-то числу), то этот предел и называется
значением ряда fb(t). Если предела нет — говорят, что ряд не сходится в точке t, и значение
fb(t) не определено.
Раз каждый следующий член ряда Тейлора улучшает степень приближения, кажется
разумным ожидать, что весь ряд Тейлора приближает функцию f (t) идеально — то есть
попросту совпадает с ней. Правда ли это?
Прежде чем отвечать на этот вопрос, разберем несколько примеров.
Примеры
Экспонента
Рассмотрим ряд Тейлора для экспоненты. В качестве независимой переменной мы теперь
будем использовать x вместо t. Итак, f (x) = ex . Значение функции в нуле равно 1: f (0) =
e0 = 1. Мы помним, что производная экспоненты равна самой экспоненте: f ′ (x) = ex .
Таким образом, вторая производная в нуле тоже равна 1: f ′ (0) = 1. Нетрудно видеть, что и
все остальные производные в нуле равны 1. Используя формулу (2), мы можем мгновенно
выписать ряд Тейлора:
1
1
1
(3)
fb(x) = 1 + x + x2 + x3 + · · · + xn + · · ·
2
3!
n!
На рисунке 4 приведен график экспоненты и её первых пяти тейлоровских приближений.
Мы видим, что с увеличением порядка приближения, график многочлена Тейлора проходит
всё ближе и ближе к графику экспоненты. Оказывается, ряд (3) сходится к экспоненте во
всех точках: эта формула — одно из определений экспоненты. Она позволяет вычислить
экспоненту в любой точке с любой (сколь угодно большой) точностью. Собственно, наши
компьютеры используют формулы именно такого типа при вычислений значений функций.
Попутно мы заново получили одну из формул для числа e:
1
1
1
+ + ··· +
+ ···
2 3!
n!
Поскольку факториал очень быстро возрастает, этот ряд сходится очень быстро — например, чтобы получить 6 цифр числа e после запятой, достаточно взять 10 членов ряда.
e = e1 = 1 + 1 +
ВШЭ, 2011-12, «Алгебра и анализ»
ВШЭ, 2011-12, «Алгебра и анализ», И. А. Хованская, И. В. Щуров, Ю. Г. Кудряшов, К. И. Сонин
(РЭШ)
20
ex
f0
f1
f2
f3
f4
f5
15
10
5
0
-1
-0.5
0
0.5
1
1.5
2
2.5
3
Рис. 4: Экспонента и её тейлоровские приближения
Тригонометрические функции
Вычислять производные синуса f (x) = sin x, конечно, чуть сложнее, чем экспоненты — но
тоже не слишком сложно. Напомним, что sin 0 = 0 и cos 0 = 1. Имеем:
f (x) = sin x
′
f (0) = 0
f (x) = cos x
f ′ (0) = 1
f ′′ (x) = − sin x
f ′′ (0) = 0
f ′′′ (x) = − cos x
f ′′′ (0) = −1
f ′′′′ (x) = sin x
f ′′′′ (0) = 0
четверая производная sin x равна sin x, и таким образом процесс «зацилкивается» — дальше
значения производной будут циклически повторяться.
Нетрудно видеть, что ряд Тейлора для синуса будет похож на ряд для экспоненты, но не
будет содержать членов с четными степенями, а знаки членов с нечетными степенями будут
чередоваться. Запишем первые члены ряда Тейлора. (Забегая вперед, мы сразу напишем
равенство: как и в случае с экспонентой, ряд Тейлора синуса также сходится к нему на всей
области определения.)
1 5
1 7
1
x −
x + ···
sin x = x − x3 +
6
120
5040
Ряд для косинуса вычисляется аналогично. Если f (x) = cos x, имеем:
f (x) = cos x
′
f (0) = 1
f (x) = − sin x
f ′ (0) = 0
f ′′ (x) = − cos x
f ′′ (0) = −1
f ′′′ (x) = sin x
f ′′′ (0) = 0
f ′′′′ (x) = cos x
f ′′′′ (0) = 1
ВШЭ, 2011-12, «Алгебра и анализ»
ВШЭ, 2011-12, «Алгебра и анализ», И. А. Хованская, И. В. Щуров, Ю. Г. Кудряшов, К. И. Сонин
(РЭШ)
3
2
1
sin x
f1
f3
f5
f7
0
-1
-2
-3
-4
-2
0
2
4
Рис. 5: Синус и его тейлоровские приближения
Таким образом, ряд для косинуса будет содержать только члены четных степеней — и
снова с чередующимися знаками:
1
1
1 6
cos x = 1 − x2 + x4 −
x + ···
2
24
720
Ряд Тейлора косинуса также сходится к косинусу во всех точках.
Возвращаясь к вопросу о том, всегда ли ряд Тейлора сходится к соответствующей функции: нет, не всегда. Например, существуют функции, не являющиеся тождественным нулем,
у которых все производные равны нулю (и следовательно ряд Тейлора — нулевой). Очевидно, ряд Тейлора в этом случае не сходится к соответствующей функции. Однако большинство функций, которые записываются формулами (даже очень сложными и громоздкими),
сходятся к своим рядам Тейлора — по крайней мере, на каком-то интервале. Примерами
таких функций являются рассмотренные выше, но есть и многие другие. Такие функции
называются аналитическими — они составляют очень важный в математике класс.
ВШЭ, 2011-12, «Алгебра и анализ»
ВШЭ, 2011-12, «Алгебра и анализ», И. А. Хованская, И. В. Щуров, Ю. Г. Кудряшов, К. И. Сонин
(РЭШ)
3
2
1
cos x
f0
f2
f4
f6
0
-1
-2
-3
-4
-2
0
2
4
Рис. 6: Косинус и его тейлоровские приближения
ВШЭ, 2011-12, «Алгебра и анализ»
Download