уравнение Эйлера для задачи Лагранжа

advertisement
Вариационное исчисление и методы оптимизации
Специальность – Математика
Курс – 3, семестр - 5
Часть 1. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ
Лекция № 10. Условие Лежандра
Получаемые в предшествующих лекциях необходимые условия экстремума в равной степени
относятся как к минимумам, так и к максимумам функционалов. В настоящей лекции мы
попытаемся получить такое соотношение, которое позволит отличить точки минимума от точек
максимума. Для задач минимизации функций таковым является условие неотрицательности
второй производной функции в точке стационарности. Непосредственным аналогом этого
соотношения для задачи Лагранжа служит условие неотрицательности второй вариации
функционала на экстремали. Указанное неравенство может быть преобразовано к более удобной
форме, которое соответствует условию Лежандра. Получаемые результаты иллюстрируются
примерами.
10.1. Необходимое условие второго порядка минимума функций
Рассматривается задача минимизации функции одной переменной f  f ( x) . Как известно,
необходимым условием ее минимума в некоторой точке х является равенство нулю ее
производной в этой точке, т.е. условие стационарности
f ( x)  0.
(10.1)
Вопрос: Какими свойствами может обладать функция
в точке, где ее производная обращается в нуль?
Соотношение (10.1) может оказаться необходимым условием максимума рассматриваемой
функции, а также характеризовать ее точки перегиба. Для того чтобы отличить минимум
от максимума можно воспользоваться условием экстремума второго порядка, которое
связано с использованием второй производной рассматриваемой функции.
Теорема 10.1. Для того чтобы в точке х достаточно гладкая функция f достигала
минимум, необходимо, чтобы выполнялось условие
f ( x)  0.
(10.2)
Доказательство. Пусть в точке х функция f имеет минимум. Тогда справедливо
неравенство
f ( y )  f ( x)  0 y.
Определив здесь y  x   , получаем
f ( x   )  f ( x)  0  .
Разлагая первое слагаемое здесь в ряд Тейлора, будем иметь
1
f ( x)  f ( x) 2    2   0  ,
2
где
1
  2   0 при   0.
(10.3)
2
Учитывая условие (10.1), приводим предшествующее неравенство к следующему виду:
1
f ( x) 2    2   0  .
2
Отсюда следует
1
1
f ( x)  2   2   0  .
2

Переходя здесь к пределу при   0 с учетом условия (10.3), приходим к неравенству
(10.2). 
Вывод: После нахождения точки стационарности следует проверить
знак второй производной рассматриваемой функции в этой точке.
Замечание 10.1. Естественно, для задачи нахождения максимума функции соответствующая
вторая производная должна быть не положительна.
Для иллюстрации полученных результатов вернемся к исследованию примеров,
большинство их которых рассматривалось ранее в лекции № 2.
Пример 10.1. Рассматривается задача минимизации функции f1 ( x)  x 2 . Из условия
(10.1) находим единственную точку стационарности x  0. При этом вторая производная
равна f  ( x)  2. Таким образом, условие (10.2) выполнено, а значит, найденное значение
1
x  0 действительно может минимизировать рассматриваемую функцию. И
действительно, в этой точке достигается минимум рассматриваемой функции (см. Рис.
2.1). 
f ( x)  0, f ( x)  0
f1
х=0
Рис. 10.1. В точке минимума вторая производная неотрицательна.
Пример 10.2. Рассматривается задача минимизации функции f 2 ( x)   x 2 . Из условия
(10.1) находим единственную точку стационарности x  0. При этом вторая производная
равна f  ( x)  2. Таким образом, условие (10.2) не выполнено, а значит, найденное
2
значение x  0 не может минимизировать рассматриваемую функцию. И действительно, в
этой точке достигается максимум рассматриваемой функции (см. Рис. 2.2). Тем самым
применение теоремы 10.2 действительно позволяет «отсеять» заведомо не подходящие
точки стационарности. 
х=0
f2
f ( x)  0, f ( x)  0
Рис. 10.2. В точке максимума вторая производная отрицательна.
f3 ( x )  x . Необходимое условие
Пример 10.3. Рассматривается функция
экстремума (10.1) здесь также имеет единственное решение x  0. Находим вторую
производную f  ( x)  0. Таким образом, условие (10.2) выполнено. Однако найденная
3
3
точка не минимизирует данную функцию (см. Рис. 10.3). Тем самым мы имеем
необходимым условием экстремума: если вторая производная функции в
стационарности отрицательна, то это наверняка не точка минимума, но в
неотрицательности второй производной в точке стационарности, последняя
оказаться точкой минимума, но не обязана быть ей. 
дело с
точке
случае
может
f3
х=0
f3( x )  0, f3( x )  0
Рис. 10.3. Единственная точка стационарности не минимизирует функцию.
Вывод: Соотношение (10.2) является необходимым условием минимума функции:
при его выполнении в этой точке может достигаться минимум функции,
но если данное условие нарушено, то минимум в ней заведомо не достигается.
4
3
2
Пример 10.4. Дана функция f4 ( x)  3x  8 x  6 x  24 x. Соотношение (10.1) приводит
3
2
к кубическому уравнению x  2 x  x  2  0. Оно имеет три решения:
x1  1, x2  1, x3  2.
При этом вторая производная функции равна


f 4 ( x )  12 3 x  4 x  1 .
2
Таким образом, находим
f4 ( x1 )  72, f4 ( x2 )  2, f 4 ( x3 )  36.
Следовательно, точка x2 заведомо не минимизирует рассматриваемую функцию, а x1 и x3
могут быть ее точками минимума. В действительности, первая из них является точкой
абсолютного минимума, а вторая – локального минимума функции (см. Рис. 10.2). Тем
самым теорема 10.2 фактически дает необходимое условие локального минимума. 
f ( x1 )  0, f ( x2 )  0, f ( x3 )  0
f4
х1
х2
f4 ( xk )  0
х3
х1 – абсолютный минимум
х2 – локальный максимум
х3 – локальный минимум
Рис. 2.4. Проверка условия (10.2) для функции f 4 .
Вывод: Соотношение (10.2) является необходимым условием локального минимума:
при его выполнении в этой точке может достигаться локальный минимум функции,
но если это условие нарушено, то локальный минимум в ней заведомо не достигается.
Естественно задать следующим вопросом:
Вопрос: Почему неравенство (10.2) не может отличить
локальный минимум функции от абсолютного?
Как видно из доказательства теоремы 10.1, в процессе вывода неравенства (10.2)
осуществлялся предельный переход, когда параметр  стремился к нулю. Таким образом,
исследование функции здесь носило локальный характер. Вследствие этого все
проделанные выкладки остаются в силе при рассмотрении не только абсолютного, но и
локального минимума функции.
Распространим полученные результаты на вариационную задачу Лагранжа.
10.2. Условие Лежандра
Обратимся вновь к исследованию задачи Лагранжа. Задается функционал
x2
I  I (v)   F [ x, v( x),v( x)]dx,
(10.4)
x1
где F – известная функция своих аргументов, которая предполагается достаточно гладкой, а
v  v( x) – неизвестная функция, удовлетворяющая граничным условиям
v( x1 )  v1 , v( x2 )  v2 ,
(10.5)
а v1 и v2 – заданные числа. Ставится задача Лагранжа, рассмотренная ранее в лекции № 3.
Задача 10.1. Найти функцию v, минимизирующую функционал (10.4) при выполнении
граничных условий (10.5).
Предположим, что функция и является решением этой задачи. Как и раньше
определим функцию одной переменной
f  f ( )  I (u   h),
где  – число, а h – достаточно гладкая функция, определенная на отрезке [ x1 , x2 ] и
удовлетворяющая однородным граничным условиям
h( x1 )  0, h( x2 )  0.
(10.6)
Тогда функция v  u   h удовлетворяет граничным условиям (10.3).
Как и раньше, функционал I достигает своего минимума в точке u тогда и только тогда,
когда число 0 является точкой минимума функции f. Следовательно, согласно теореме
10.1 первая производная от этой функции в нуле обращается в нуль, а вторая неотрицательна. Ранее мы установили равенство
x2
d F ( x, u , u )  hdx,
f (0)    Fu ( x, u , u )  dx
u

x1
откуда следовало уравнение Эйлера
d F ( x, u, u)  0.
Fu ( x, u, u)  dx
u
(10.7)
Решая это уравнение совместно с краевыми условиями
u( x1 )  v1 , u( x2 )  v2 ,
(10.8)
можно найти соответствующие экстремали. Как мы уже знаем, они не обязательно
минимизируют данный функционал. Однако в нашем распоряжении еще имеется
дополнительное условие (10.2).
Определение 10.1. Второй вариацией  2 I (u ) функционала I в точке и называется
вторая производная функции f в нуле.
Из теоремы 10.1 следует
Теорема 10.2. Для того чтобы экстремаль и была решением задачи Лагранжа 10.1
необходимо, чтобы выполнялось неравенство
 2 I (u )  0.
(10.9)
Замечание 10.2. Соотношение (10.9) является естественным обобщением условия (10.2) на
задачи минимизации функционалов.
Теорема 10.2 и неравенство (10.9) являются обобщениями теоремы 10.1 и неравенства
(10.2) на задачу Лагранжа. Для их практического использования найдем вторую вариацию
функционала.
Лемма 10.1. Вторая вариация функционала I в точке и определяется по формуле
1 2 
d


 I (u )     Fuu ( x, u, u )  Fuu ( x, u, u )  h 2  Fuu ( x, u, u )h2  dx.
2 x1  
dx


x
2
Доказательство. Определим величину
x2
f ( )   F ( x, u   h,u    h)dx.
x1
Пользуясь разложением в ряд Тейлора, находим значение
f ( )  f (0)  f (0) 
1
f (0) 2   ( 2 ),
2
где  ( ) /   0 при   0. С другой стороны имеем
2
2
(10.10)
F ( x, u   h, u    h ')  F ( x, u, u )  Fu ( x, u, u )h  Fu ' ( x, u, u )h 
1
1
Fuu ( x, u, u)h 2 2  Fuu ( x, u, u )hh 2  Fuu ( x, u , u )h2 2  1 ( 2 ),
2
2
2
2
где 1 ( ) /   0 при   0. Сравнивая последние два равенства, приходим к формуле

x2
 I (u )    Fuu ( x, u , u)h2  2 Fuu ( x, u , u)hh  Fuu ( x, u, u)h2  dx.
2
(10.11)
x1
Справедливо равенство
x2
x2
2  Fuu ( x, u, u)hhdx   Fuu ( x, u, u)dh  Fuu ( x, u, u)h
2
x1
2 x2
x1
x1
x2
d
Fuu ( x, u, u) h 2 dx.
dx
x1

Учитывая граничные условия (10.6), преобразуем равенство (10.11) к виду (10.10). 
Для преобразования условия (10.9) установим следующее утверждение, называемой
леммой Лежандра.
Лемма 10.2. Для того чтобы для любой функции h интеграл
x2
  P( x)h
2
 Q( x) h2  dx
(10.12)
x1
был неотрицательным, необходимо, чтобы выполнялось неравенство
Q( x)  0, x  ( x1, x2 ).
(10.13)
Доказательство. Предположим напротив, что существует такая точка x*  ( x1 , x2 ), что
справедливо равенство
Q( x* )  2 2
для некоторой ненулевой константы . Тогда в силу непрерывности функции Q
существует такой отрезок [ y, y   ] , содержащий точку x* и являющийся подмножеством
( x1 , x2 ) , что справедливо неравенство (см. Рис. 2.5)
Q( x)   2 , x  [ y, y   ].
Q
у
х*
у+
х
-
-2
Рис. 2.5. Функция Q.
Определим функцию h следующим образом (см. Рис 2.6):
 2 x y
, x  [ y, y   ],
sin  
h( x )  
 


0,
x  [ y, y   ].

1
h
x
у
у+
Рис. 2.6. Функция h.
Тогда справедливо равенство

x y

, x  [ y, y   ],
 sin  2
h( x)   
 


0,
x  [ y, y   ].

Находим соответствующей значение интеграла (10.12):
x2
  P( x)h
2
 Q( x) h2  dx 
x1
y 


y
 4 x y
2 2 x y 
 2 2
sin     P   2 sin  2   Q  dx  M    ,



 

где
M  max P( x) .
x[ x1 , x2 ]
Подбираем число  столь малым, чтобы выполнялось условие


M
.
Тогда справедливо неравенство
M 
 2 2
 0,

а значит,
x2
  P( x)h
2
 Q( x) h2  dx  0.
x1
Таким образом, предположим существование некоторой точки x*  ( x1 , x2 ), в которой
функция Q отрицательна, мы непременно подберем такую функцию h, для которой
интеграл (10.12) будет отрицательным. Следовательно, неравенство (10.13) действительно
имеет место. 
Теперь несложно установить следующее утверждение.
Теорема 10.3. Для того чтобы экстремаль и была решением задачи Лагранжа 10.1
необходимо, чтобы выполнялось условие Лежандра
Fuu  x, u( x), u( x)   0, x  ( x1, x2 ).
(10.14)
Доказательство. Согласно теореме 10.2 справедливо неравенство (10.9), причем
вторая вариация функционала определена по формуле (10.10). Определим в условиях
леммы Лежандра
P
1
d


F
(
x
,
u
,
u
)

Fuu ( x, u , u )  , Q  Fuu ( x, u , u ),
uu

2
dx

установим, что неравенство (10.13) принимает вид (10.14). 
Замечание 10.3. Естественно, если рассматривается задача максимизации функционала, то
условие Лежандра принимает вид Fu u   0.
Замечание 10.4. Отметим определенную аналогию между схемами вывода уравнения Эйлера
и условия Лежандра. И в том, и в другом случае мы сводим анализ задачи минимизации
функционала к задаче минимизации функции одной переменной. В одном случае основой
необходимого условия экстремума первого порядка служит равенство нулю первой вариации
функционала, а в другом необходимое условие экстремума второго порядка опирается на
неотрицательность второй вариации функционала. Далее осуществляется вывод формул для
первой и второй вариаций применительно к рассматриваемой задаче Лагранжа. Эти формулы в
первом случае содержат под интегралом значения варьируемой функции и ее производной, а во
втором – квадраты этой функции и ее производной, а также произведение этих величин. Для
преобразования полученных выражений осуществляется интегрирование по частям «мешающих»
членов с учетом того обстоятельства, что варьируемая функция обращается в нуль на границе
рассматриваемого отрезка. В итоге в первом случае получается равенство нулю интеграла,
включающего в себя только варьируемую функцию, но не ее производную. Во втором случае
получается условие неотрицательности интеграла, зависящего от квадратов варьируемой функции
и ее производной, но не их произведения. Следующим шагом является применение основной
леммы вариационного исчисления и леммы Лежандра, позволяющие перейти от интегральных
соотношений к поточечным. Таковыми и являются конечные результаты – уравнение Эйлера и
условие Лежандра, являющиеся необходимыми условиями экстремума соответственно, первого и
второго порядков.
Итак, найдя решение соответствующей краевой задачи для уравнения Эйлера, можно
воспользоваться условием Лежандра.
Вывод: Если найденная экстремаль не удовлетворяет условию Лежандра,
то она заведомо не является решением задачи Лагранжа,
а если удовлетворяет, то может быть таковым.
Замечание 10.5. Естественно, условие Лежандра, будучи следствием соотношения (10.2),
наследует все свойства последнего, т.е. является необходимым условием локального минимума
функционала.
Замечание 10.6. Утверждения теоремы 10.2, т.е. неотрицательность второй вариации
функционала в точке его локального минимума можно обобщить и на другие рассмотренные ранее
задачи вариационного исчисления, в частности, на случай функционалов, зависящих от
нескольких функций, от функций многих переменных на случай, когда функционал зависит от
старших производных искомых функций. При этом могут быть получены соответствующие
обобщения условия Лежандра.
Замечание 10.7. В вариационном исчислении помимо уравнения Эйлера и условия Лежандра
рассматривают также другие необходимые условия экстремума, например, условие Вейерштрасса
и условие Якоби. Кроме того, используют и достаточные условия экстремума. Однако эти вопросы
лежат за пределами настоящего курса.
Проиллюстрируем полученные результаты примерами.
10.3. Примеры
В лекции № 3 рассматривались некоторые примеры задач Лагранжа. Проверим
справедливость для них условия Лежандра.
Пример 10.5. Требуется минимизировать функционал

I (v)   v( x)2  v( x) 2  2v( x) sin x  2v( x) cos x  dx
0
на множестве функций, удовлетворяющих граничным условиям
v(0)  0, v( )  0.
Ранее для этой задачи была найдена экстремаль u  sin x (см. Пример 3.1). Проверяем
справедливость для нее условия Лежандра. Находим вторую производную Fuu  2.
Поскольку найденное значение положительно, заключаем, что найденная экстремаль
может быть оптимальной. И мы знаем, что она действительно является решением
рассматриваемой задачи Лагранжа. 
Пример 10.6. Рассматривается задача минимизации функционала
x2
I (v)   1  v( x) 2 dx
x1
на множестве функций, удовлетворяющих условиям
v( x1 )  y1 , v( x2 )  y2 .
Ранее для этой задачи была найдена экстремаль (см. Пример 3.2)
x  x2
u ( x) 
 y1  y2   y2 .
x1  x2
Проверяем справедливость для нее условия Лежандра. Находим производные
Fu 
1  u 
2
Fuu 
1  u
u
1  u
2
,
u 2
1  u2  1  u2 3/ 2

 .
2
Учитывая положительность этого значения, заключаем, что найденная экстремаль может
минимизировать данный функционал. И мы знаем, что она действительно является
решением рассматриваемой задачи Лагранжа. 
Пример 10.7. Рассматривается задача минимизации функционала


I (v)   v( x) 2  v( x) 2  2v( x) sin x  2v( x) cos x  dx
0
на множестве функций, удовлетворяющих условиям
v( x1 )  y1 , v( x2 )  y2 .
Здесь вновь экстремалью будет функция u  sin x . При этом вторая производная равна
Fuu  2. Тем самым условие Лежандра нарушается, а значит, указанная функция не
является решением задачи Лагранжа. 
Выводы
На основании полученных результатов можно сделать следующие выводы:
 Для решения задачи Лагранжа следует, в первую очередь, выписать уравнение
Эйлера и найти решение соответствующей краевой задачи.
 Если найденная экстремаль не удовлетворяет условию Лежандра, то она
заведомо не является решением задачи.
 Если найденная экстремаль удовлетворяет условию Лежандра, то она может
быть решением задачи, но не обязана быть им.
 Условие Лежандра не в состоянии отличить локальный максимум функционала
от абсолютного.
Задания на самостоятельную работу
В лекции № 3 было дано задание, связанное с решением уравнения Эйлера для задачи Лагранжа. В
данном случае для этих же примеров необходимо проверить справедливость условия Лежандра.
Требуется найти функцию v  v ( x ), минимизирующую функционал
x2
I  I (v)   F  x, v( x), v( x)  dx
x1
на множестве всех функций удовлетворяющих условиям
v( x1 )  v1 , v( x2 )  v2 .
В следующей таблице задаются значения параметров задачи для различных вариантов:
вариант
F ( x,u,v )
x1
x2
v1
v2
1
2
3
4
5
6
v2  u 2
0
0
0
0
0
0
 /2
1
 /4
1
 /2
1
1
 /6
1
0
0
0
0
0
0
1
1
-1
1
1
1
0
1
1
0
0
0
1
1
v  12 xu
2
v 2  4u 2
v 2  4 xu
u 2  v2
u 2  x 2v
7
8
v 2  18 xu
9
10
2u 2  x 4 v
v  9u
2
u v
2
2
2
0
0
0
0

Требуется выполнить следующие действия:
1. Получить уравнение Эйлера.
2. Решив соответствующую краевую задачу, найти функцию, которая может оказаться
решением данной задачи Лагранжа.
3. Проверить справедливость условия Лежандра для найденной экстремали.
4. Найти значение функционала, соответствующее найденной экстремали.
5. Подобрать произвольную функцию, проходящую через заданные точки и найти
соответствующее ей значение функционала.
6. Проанализировать полученные результаты.
Литература
1. Алексеев В.М., Тихомиров В.М., Фомин С.В. Оптимальное управление. – М., Наука, 1979. –
С. 373-344.
2. Ахиезер Н.И. Лекции по вариационному исчислению. – М., ГИТТЛ, 1956. – С. 84-88.
3. Гельфанд И.М., Фомин С.В. Вариационное исчисление. – М., Физматгиз, 1961. – С. 14-28.
4. Гурса Э. Курс математического анализа. Том 3. Часть 2. Интегральные уравнения.
Вариационное исчисление. – М.-Л., Гостехиздат, 1934. – С. 234-236.
5. Лаврентьев М.А., Люстерник Л.А. Основы вариационного исчисления. Том 2. – М., ОНТИ,
1935. – С. 116-118.
6. Лутманов С.В. Курс лекций по методам оптимизации. – Ижевск, 2001. – С. 131-134.
7. Михлин С.Г. Курс математической физики. – М., Наука. – 1968. – С. 56-57, 69-72.
8. Эльсгольц Л.Э. Дифференциальные уравнения и вариационное исчисление. – М., Наука, 1969. –
С. 362-364.
Направления дальнейших исследований
До сих пор мы рассматривали либо экстремальные задачи на безусловный экстремум, либо задачи с
ограничениями типа равенств. Однако на практике часто возникают задачи с ограничениями в виде
неравенств. Их исследованию посвящена вторая часть курса, в которой излагаются основные методы
теории оптимального управления.
Download