Принцип наименьшего действия

advertisement
 12. ПРИНЦИП НАИМЕНЬШЕГО ДЕЙСТВИЯ
Из курса теоретической механики известно, что уравнения механики
могут быть получены исходя из так называемого принципа наименьшего
действия. Напомним, в чем заключается этот принцип, на примере
движения одной частицы. Пусть в момент t 1 частица находилась в точке M 1 ,
а в момент t 2 попала в точку M 2 . Точки M 1 и M 2 можно соединить самыми
различными траекториями (будем только предполагать их гладкими, т.е.
непрерывными и имеющими непрерывные производные). Задание какойлибо траектории предполагает, что задаются как функции времени
обобщенные координаты частицы на этой траектории: q i  q i ( t ). (В
простейшем случае движения одной частицы под заданием q i ( t ) можно
подразумевать задание трех декартовых координат частицы на выбранной
траектории: x  f1 ( t ), y  f 2 ( t ), z  f 3 ( t ).) Для выбранной траектории,
разумеется, должно выполняться условие, что в момент t 1 частица находится
1
в точке M 1 с координатами q i , а в момент t 2  в точке M 2 с координатами
q i2 . Сопоставим теперь по определенному закону каждой мыслимой
траектории свое определенное число. Когда каждой функции f из какого-то
класса ставится в соответствие по определенному закону определенное число
S математики говорят, что задан функционал Sf .
Простейшим примером функционала для интегрируемых на отрезке a , b
функций f (x) может служить интеграл Sf    f ( x )dx. Пример сложнее:
b
a
Sf    f ( x ) dx , где   заданная, вполне определенная функция для
b
a
всех f (x). Понятие функционала можно обобщить, ставя в соответствие
определенное число нескольким функциям.
Например, функционалом
S1. 2...  n 
будет
являться
выражение
S1 , 2 ..., n    1 ( x ),...n ( x ) dx . Таким образом, ставя в соответствие
b
a
каждой мыслимой траектории частицы между точками M 1 и M 2
определенное число, мы имеем дело с функционалом от трех функций,
задающих траекторию движения частицы в зависимости от времени. В
случае системы, состоящей из нескольких частиц, можно говорить о
траектории ее движения в некотором многомерном пространстве
размерности N , где N  число степеней системы. (В случае n частиц:
N  3n ).
Принцип наименьшего действия, открытый в механике, состоит в том, что
для всякой механической системы можно указать функционал от траектории
системы, называемый действием:
S   L q i ( t ), {q1}, t dt
(98)


t
Здесь L  функция от обобщенных координат системы q i  их скоростей

t2
1

{ q i } и времени, называемая функцией Лагранжа, и зависящая от
динамических характеристик рассматриваемой системы. Причем истинная
траектория системы между двумя заданными точками M 1 и M 2 отвечает
экстремуму (по соглашению-минимуму) действия.
Условия экстремума действия S приводят, как известно, к уравнениям
Лагранжа:
d L L

.

dt  q q i
i
(99)
Величина
Pi 
L
(100)

 qi
называется i -компонентой обобщенного импульса, соответствующего
обобщенной координате q i , т.е. уравнения Лагранжа (99) можно записать в
виде
dPi L

dt q i
(101)
При надлежащем выборе функции Лагранжа системы уравнения (101)
сводятся к обычным уравнениям механики Ньютона. От функции Лагранжа,
зависящей от обобщенных координат и их скоростей, можно, как известно,
перейти к функции Гамильтона, зависящей от обобщенных координат и
импульсов:

Hq i , Pi , t    Pi q i  L
(102)
i
В случае, когда функция Лагранжа не зависит явно от времени, функция
Гамильтона постоянна и совпадает с энергией системы.
Попробуем теперь применить принцип наименьшего действия для
получения
законов
релятивистской
динамики
и
уравнений
электромагнитного поля.
1. Принцип наименьшего действия для свободного движения
релятивистской частицы
Отметим прежде всего, что действие S должно не зависеть от выбора
системы отсчета, т.е. представлять релятивистский скаляр. Действительно,
траектория частицы и ее объективно существующая в пространстве
Минковского мировая линия, отвечающая минимуму действия, не может
зависеть от того, из какой системы отсчета она наблюдается. При этом
уравнения, задающие ее в разных системах отсчета и представляющие, по
существу, проекции ее на координатные плоскости, естественно, должны
быть различными.
Каким же образом можно получить релятивистский скаляр S,
представляющий собой интеграл, взятый по траектории частицы?
Единственный релятивистский скаляр, который существует при бесконечно
малом смещении частицы в пространстве Минковского, -- это интервал ds
между событиями, отвечающими соответственно начальной и конечной
точкам нахождения частицы, (пропорциональный промежутку собственного

c 2 dt 2  (d r ) 2  cd . Поэтому действие
времени частицы d ): ds 
должно
быть пропорциональным интегралу
 ds ,
M2
M1
S
взятому по мировой
линии, соединяющей события M 1 и M 2 в пространстве Минковского. В
этом случае коэффициент пропорциональности должен быть отрицательной
величиной. Это следует из того, что частица, покоящаяся в инерциальной
системе координат, движется по мировой линии, поправленной по оси
времени (см. рис. ). При этом интервал между событиями M 1 и M 2 , взятый
по этой мировой линии, больше, интервал, взятый по любой другой мировой
линии, соединяющей точки M 1 и M 2 . Поэтому, чтобы минимум действия
S отвечал состоянию покоящейся частицы, действие должно быть
M
пропорционально интегралу
M ds, взятому с обратным знаком, т.е.
2
1
равняться величине S   M ds с некоторым коэффициентом   0.
M2
1
Физический смысл коэффициента  можно установить из принципа
соответствия , т.е. из требования, чтобы при малых скоростях движения
законы релятивистской механики переходили бы в законы нерелятивистской
механики Ньютона. Записав

v2
S   M ds  c  1  2 dt ,
t
c
t2
M2
1
1
получаем согласно (98) выражение для функции Лагранжа

v2
L  c 1  2 ,
c
,
которое, согласно (100), дает выражение для импульса частицы
L 
Pi   
v i c
vi
1
2
v
c2
,
 
или P 
c

v
.
v2
1 2
c
При v / c  1 это выражение должно переходить в нерелятивистское
 v

 mv, где m  масса покоя частицы.
значение импульса, т.е. P 
c
Отсюда следует   mc и окончательное выражение для действия и
функции Лагранжа свободной частицы:
v2
S   mc  ds   mc  1  2 dt ;
M
t
c
v2
2
L  mc 1  2 ;
c
M2
t2
2
1
(103)
1
(104)
Выражение (104) позволяет вычислить функцию Гамильтона.
Обобщенный импульс частицы согласно (100) равен уже знакомому нам

значению p :

P


mv
 p.
2
v
1 2
c
(105),
а функция Гамильтона, совпадающая с энергией частицы:

mv 2
v2
mc 2
2
H    Pv  L 
 mc 1  2 
(106).
(106)
c
v2
v2
1 2
1 2
c
c
2
 2
2 2
Используя соотношение 2  p  m c , непосредственно следующее из
c
(105) и (106), можно выразить функцию Гамильтона (как этого требует
механика) через импульс частицы:

H    c p2  m 2c2 .
(107)
Следует обратить внимание на размерности величин. Функция Лагранжа,
согласно (104), имеет размерность энергии, а размерность действия равна
произведению размерности энергии на время или совпадающей с ней
размерностью произведения импульса и длины.
Недостаток приведенного выше вывода в том, что из него непосредственно
 
c 
не следует, что величины  ; p 
составляет
4-вектор
пространства
Минковского. Его можно устранить, проводя варьирование действия S
непосредственно по мировым линиям в пространстве Минковского, не
выделяя специально интегрирование по временной координате (как это
делалось в приведенном выводе).
Варьирование действия по мировым линиям в четырехмерном пространстве-времени
S (из условия равенства которой нулю мы получаем экстремум S и,
Вариация действия
следовательно, согласно принципу наименьшего действия, уравнения движения) может быть произведена
непосредственно по мировым линиям в четырехмерном пространстве-времени
S   M (ds) .
M2
1
Чтобы
не
ограничиваться
ds  g ik ( x )dx dx ,
i
k
только
специальными
i
dx , dx
(где
k
системами,
запишем
в
общем
виде:
-- есть дифференциалы координат, взятые по мировой
линии частицы).
При такой записи интервала последующее рассмотрение пригодно как для
неинерциальных систем отсчета, так и в случае, когда частица находится в гравитационном поле. Вариация
g ik dx k (dx i ) 1 g ik m dx i dx k
 ds равна (ds )  ( g ik ( x )dx dx ) 

x
.
ds
2 x m
ds
dx i
dx i 1 i
 u.
Возникшие в этом равенстве величины
являются компонентами 4-вектора скорости :
ds
ds c
i
i
Используя условие (dx )  d(x ), можно представить первый член в правой части равенства в
k
i
k
i
виде: d(g ik u x )  d(g ik u )x .
Интегрирование первого члена дает нуль в силу того, что на концах M 1 и M 2 траектории
i
«закреплены» : x
 x i M  0.
M
i
1
k
2
 
1 g mk m k  i
k
u dx x .
 d(g ik u ) 

c M
2 x i

(В последнем члене мы поменяли индексы суммирования i  m , чтобы выделить общий множитель
для фигурной скобки). Из условия S  0, как это следует из правил вариационного исчисления,
вытекает равенство нулю выражения, стоящего в фигурной скобке. Поделив его на ds , получаем
du i 1 g mk m k

u u  0.
(108)
ds 2 x i
Для галилеевых систем
g mk  const и из полученного уравнения следует сохранение
i
ковариантного вектора 4-скорости частицы u i (и, следовательно, контравариантного u ). Произведение
i
i
u i на массу покоя частицы дает 4-вектор импульса p  m u , компоненты которого

mc
mv 
 

совпадают со значениями  , p  .
;


2
2
1  v2c2 
 1 v / c
c 
Таким образом,
S  
M2
1
В случае неинерциальной системы отсчета (или наличия гравитационного поля) движение частицы
будет уже происходить уже не по прямой мировой линии, а по так называемой геодезической
траектории. Уравнение (108) носит название уравнения геодезической линии.
2. Движение частицы в векторном поле
Рассмотрим, каково должно быть движение частицы, если она находится
 в
i
0
некотором векторном поле, характеризуемом
4-вектором A (A , A) ,

который зависит от пространственных координат и времени. Под A будем
подразумевать пространственный
вектор с компонентами в галилеевой

системе отсчета A(A x , A y , A z ), а компоненту A 0 обозначим . Наряду с
i
контравариантным вектором A можно использовать соответствующий ему

ковариантный вектор A i  (  A).
Будем исходить из принципа наименьшего действия, а для выполнения
условия релятивистской инвариантности получаемых уравнений движения
потребуем, чтобы добавка к действию свободной частицы, возникающая изза того, что частица находится в заданном внешнем поле, являлась
релятивистским скаляром. Такой скаляр, представляющий интеграл, взятый
по траектории частицы, можно единственным образом составить в
i
i
виде  A i dx , где dx  смещение вдоль траектории. Таким образом,
действие для частицы, находящейся в силовом векторном поле, можно
представить в виде суммы двух слагаемых: действия для свободной частицы
и действия, вызванного взаимодействием частицы с векторным полем (103).
i
При этом интеграл  A i dx должен быть взят с некоторым коэффициентом,
который мы запишем в виде e / c, где e  некоторая константа,
характеризующая силу взаимодействия частицы с полем и являющаяся,
естественно, релятивистским скаляром. (Мы не предполагаем заранее, что
константа e представляет электрический заряд частицы). Результирующее
действие имеет вид
v2
e
S  Sчаст  Sвз  mc  1  2 dt   A i dx i
(109)
t
c
cC
dx i
i
dt , получим, согласно (103), выражение
Записав A i dx в виде A i
dt
t2
2
1
для функции Лагранжа частицы в векторном поле:
v2 e

L   mc 1  2  (c  vA).
c
c
2
(110)

Обобщенный
импульс
частицы
(P )
дифференцированием по компонентам скорости :
получается
отсюда
  e
P  p  A,
(111)
c


2
2
где p  mv / 1  v / c  импульс частицы, а функция Гамильтона
согласно (102) будет равна
 
H  Pv  L 
mc 2
 e.
1  v2 / c2
(112)

Ее следует выразить через обобщенный импульс P. Это можно сделать,
2 2

2
2
2 4
воспользовавшись равенством (mc  )  p c  m c , в котором импульс p


выражается через обобщенный импульс согласно (111): p  P 
образом, получаем:
2
 e  
2 2
H  c  P  A   m c  e.
c 


В нерелятивистском пределе ( p  mc ):
2
 e  
P  A
c 
2

 e .
H  mc 
2m
e
A. Таким
c
(113)
(114)
Уравнения движения частицы в векторном поле A i определяется согласно
общему правилу (101):


dP
  r L,
dt
или:


dp e dA 

 r L .
dt c dt
(115)

dA
При вычислении производной
следует помнить, что она берется
dt



 
dA
A( t  t , r   r )  A( t, r )
 lim
, где
вдоль траектории частицы, т.е.
t 0
dt

t



r и ( r  r )  различные точки траектории. Таким образом,



 A
    1 A   
dA
 lim t  ( r )A  
 ( v)A .
dt t 0  t

t

t


При вычислении  r L следует помнить формулу векторного анализа для
градиента
произведения:

 
  скалярного

  

(ab)  a, rotb  (a)b  b, rota  (b)a.

Поскольку радиус-вектор r и скорость частицы в функции Лагранжа

рассматриваются как независимые переменные, для величины  r L имеем



e 
 
 r L  e  v, rotA  ( v)A .
c


dA
Подставляя выражения
и  r L в уравнение (115), получаем:
dt



dp  
1 A  e 
  v, rotA .
 e   
dt
c t  c












Обозначая


rotA  H;


1 A 
  
 E,
c t
(116)
(117)
получаем уравнение движения:

 e  
dp
 eE  v, H ;
dt
c
а из соотношений
 (116) и (117) получаем
divH  divrotA  0
 






1 A 
1
1 H
rotE  rot  
rotA  

c

t
c

t
c t


(118)
(119)
(120)
e в
Это первая пара уравнений Максвелла. Таким образом,
константу


(109) можно истолковать как заряд частицы, а векторы E и H (116), (117)-как напряженности соответственно электрического и магнитного полей.
Мы видим, следовательно, что сила Лоренца и первая пара уравнений
Максвелла получается теоретически из принципа наименьшего действия и
требования релятивистской инвариантности при использовании лишь одного
предположения, что заряженная частица находится в поле, описываемом 4i
вектором A .
Отметим важное обстоятельство: из принципа
 наименьшего действия (в
силу полученного из него уравнения divH  0 ) следует отсутствие
магнитных монополей, то есть частицы, двигающиеся по классическим
законам, не могут иметь магнитного заряда.
Замечание

Тождество div rotA  0 справдливо при условии существования непрерывных производных от

A
компонент вектора
. При наличии у вектора сингулярностей это тождество может не выполняться.

Рассмотрим в качестве примера вектор A компоненты которого в сферической системе координат
A   0,
соответственно равны : A r  0,
g 1  cos  g 
A  
 tg .
r sin 
r 2
Этот вектор всюду дифференцируем, кроме точек, лежащих на отрицательной оси z(  ), где он

сингулярен. Единственная отличная от нуля компонента rotA в сферической системе координат H r
равна:
Hr 
1 
A  sin   g2 ,
r sin  
r
то есть всюду, кроме отрицательной полуоси
заряда
g.
z,
совпадает с магнитным полем точечного магнитного
Физически такой «квазимонополь» можно осуществить, представив бесконечно тонкий и
бесконечно длинный соленоид, один конец которого находится в начале координат, а другой удален на
z . Если ток, текущий по соленоиду, будет создавать
g
H 0  a 2  (где a  радиус соленоида), то магнитное
4
бесконечность в отрицательном направлении оси
внутри соленоида магнитное поле с потоком
поле вне соленоида будет совпадать с полем монополя, расположенным в начале координат, а внутренность
соленоида – соответствовать «нити», на которой сингулярен вектор-потенциал
A .
Ранее мы установили, что вектор-потенциал электромагнитного поля
определен неоднозначно и допускает замену
A i  A i/  A i 
f
, где
x i
f (x)  произвольная функция координат и времени (см. (52)). Выражение
для части действия, определяющего взаимодействия заряженной частицы с 4вектором поля A i , позволяет понять причину этой неоднозначности. В
результате интегрирования по траектории частицы ( C ) градиента
f i
C x i dx получается разность значений этой функции
на концах интегрирования: f M 2   f M1 . Эта разность одинакова для
всех виртуальных траекторий, проведенных из точки M 1 в M 2 . Поэтому при
произвольной функции
варьировании действия по различным траекториям она выпадает и не может
влиять на уравнение реальной траектории, определяемой минимумом
действия.
Причиной, по которой имеет место калибровочная инвариантность,
является то, что заряд e является сохраняющейся, характерной для
рассматриваемой частицы величиной, играющей роль постоянной в
выражении действия (109). Связь калибровочной инвариантности с законом
сохранения заряда можно дополнительно продемонстрировать, рассматривая
Sвз для системы зарядов в векторном поле. В этом случае
1
Sвз    ea  A i x a dx ia ,
с a c
где a  индекс частицы. Переходя в этом выражении к непрерывному
a
распределению токов с учетом
dx i
e a dx a  ( x )
dtdv  ji d 4 x , получаем Sвз в виде интеграла по
dt
4
четырехмерному объему d x  dv  dt :
1
Sвз     A i ji d 4 x .
(121)
c
f
A i  A i/  i
При замене
возникающий дополнительно член в
x
f i
j можно представить в виде
подынтегральном выражении (121)
x i
i
f i  i
ji
j  i fj   f i .
x i
x
x
(122)
Второй член в правой части (122) обращается в нуль благодаря закону
сохранения заряда:
ji
 0 , а остающийся первый член может быть по
x i
теореме Гаусса сведен к интегралу по поверхности, охватывающей
рассматриваемый четырехмерный объем. Поэтому этот член не будет влиять
i
на вариацию траекторий частиц (или тока j ) внутри четырехмерного
объема. Итак, видно, что калибровочная инвариантность явно связана с
законом сохранения заряда. При этом мы неявно предполагаем, что заряд
системы аддитивно складывается из зарядов частиц.
Тензор электромагнитного поля
Fik 


A

Ai
k
x i
x k
представляет
величину, в которой неопределенная произвольная калибровочная функция
f выпадает (если она дифференцируема и допускает перестановку порядка
дифференцирования):
 
f   
f 
 2f
 2f
Fik  i  A k  k   k  A i  i   Fik  k i  i k  Fik .
x 
x  x 
x 
x x x x


E
H
Поэтому физические величины напряженности полей
и
, которые,
являясь компонентами тензора Fik , определяют силу, действующую на
/
заряженную частицу, не зависят от произвола выбора калибровочной
функции.
 13. ПОЛЕ КАК МЕХАНИЧЕСКАЯ СИСТЕМА
С БЕСКОНЕЧНЫМ ЧИСЛОМ СТЕПЕНЕЙ СВОБОДЫ
Принцип наименьшего действия и требование релятивистской
инвариантности позволяют теоретически получить и вторую пару уравнений
Максвелла. Но для этого поле надо представить как механическую систему.
Рассмотрим вначале одну из компонент электромагнитного поля, ,
обозначив
ее ( x ) , где под ( x ) подразумевается совокупность
пространственных координат и момента времени (x)  (x, y, z, t ) .
Разобьем все трехмерное пространство, в котором заключено поле в
выбранной системе координат, на маленькие ячейки и будем рассматривать

значение поля в центре каждой выбранной ячейки ( rn ) в качестве

обобщенной координаты q n ( t )  ( rn , t ), а производную поля в этой ячейке

 
( rn t )  q n ( t ). Таким
по времени в качестве обобщенной скорости:
t
образом, поле во всем пространстве мы можем представить как
механическую систему с бесконечным числом степеней свободы, а
изменение поля как изменение обобщенных координат (своего рода
«движение» частиц с этими обобщенными координатами).
Попробуем применить теперь лагранжев формализм к такой системе.
Предположим существование «близкодействия», заключающегося в том, что
на движение обобщенной координаты q n влияют обобщенные координаты
лишь из соседних ячеек. Это означает, что функцию Лагранжа всей системы

можно представить в виде суммы по всем ячейкам ( rn ) функции

 
 rn , t ,  rn , t   rn , t ,  rn , t  ,
зависящей
от

t

x

y





обобщенной координаты q n ( t )  ( rn , t ) и ее производных по времени и

L  rn , t ,
пространственным координатам, т.е.
  
 
L

(
r
,
t
),
( rn , t ) ,
Lполя  


n
i


x


r
(123)
n
где для краткости мы обозначили через

зависимость функции L от
x i
всех производных ( x ) по времени и пространству. Заметим, что с точки
зрения релятивистски-инвариантного описания поля, которое мы хотим
построить, зависимость функции L от пространственных производных
необходимо, так как при таком описании они должны входить
«равноправно» с производной о времени.
При переходе к пределу разбиения пространства на бесконечно малые
ячейки, функция L должна представляться интегралом



L поля    L  ( x ), i ( x ) d 3 x ,
x


(124)
взятым по всему 3-мерному пространству, а действие для поля, согласно (98),



Sполя   Ldt     ( x ), i , ( x ) d 4 x
t
x


t2
(125)
1
должно представляться интегралом по 4-мерному пространству.
Как уже подчеркивалось раньше, при использовании принципа
наименьшего действия для определения траектории частиц действие должно
представлять собой релятивистский скаляр. То же самое должно быть
справедливо и для действия поля (125), поскольку поле, отвечающее
минимуму действия, осуществляется реально в пространстве Минковского
независимо от выбранной системы отсчета. (Это не противоречит тому, что
это поле может быть различным в разных системах отсчета, подобно тому,
как могут различаться проекции реального трехмерного тела на
координатные плоскости в разных системах координат).
Функция L, как это видно из (124), является пространственной плотностью
функции Лагранжа для поля. Ее называют лагранжианом поля.
Поскольку четырехмерный объем (d x ) в (125) является релятивистским
инвариантом, релятивистская инвариантность действия S поля приводит к
важнейшему следствию – требованию релятивистской инвариантности
лагранжиана L .
Предыдущие рассуждения можно обобщить на случай нескольких полей и,
в частности, на случай, когда у поля существует несколько компонент (как
i
это имеет место для векторного поля A ). В этом случае лагранжиан следует
считать функцией от всех участвующих полей k ( x ) и их первых
4
производных по пространственным координатам и времени


Lполя = L  1 ( x ), 2 ( x )...r ( x ),
1 2 r 
,
...

x i x i x i 
 k
(x) :
x i
(126)
Действие для поля при этом будет иметь вид:
Sполя     L поля d 4 x
(127)
Подобно тому, как уравнения движения частиц получаются путем
варьирования действия S по обобщенным координатам частиц q i , так и
уравнения для поля (или полей) должны получаться варьированием действия
по обобщенным координатам поля, т.е. величинам i ( x ). При этом
необходимо варьировать по i ( x ) не только действия для самого поля, но
член действия, соответствующий взаимодействию поля с частицами.
 14. ДЕЙСТВИЕ ДЛЯ ЭЛЕКТРОМАГНИТНОГО ПОЛЯ
Как мы видим, из требования релятивистской инвариантности следует, что
лагранжиан поля должен представлять релятивистский скаляр в пространстве
Минковского. Это требование накладывает сильное ограничение на выбор
лагранжиана.
В случае электромагнитного
поля существуют два релятивистских
скаляра – инварианты поля I1 и I 2 :


I1  Fik Fik  2(H 2  E 2 )

~ ik
I 2  F Fik  4(HE)
Точнее говоря, инвариант I 2 является псевдоскаляром: он не меняется при
поворотах в пространстве Минковского, но меняет знак при зеркальном
отражении пространственных осей или обращении времени. Требуя
релятивистскую инвариантность теории, мы не можем заранее исключить из
рассмотрения инвариант I 2 . Существует и третий релятивистский скаляр
электромагнитного поля. Это квадрат вектора A : I 3  A  A A i .
i
2
i
В отличие от I1 и
I 2 , инвариант I 3 изменяется при калибровочном
f
преобразовании A i  A i  i , и если бы он входил в лагранжиан поля, то
x
вся теория
 была
 бы не калибровочно-инвариантной, и помимо физических
полей E и H , определяющих силы, действующие на заряженную частицу,
определенный физический смысл приобретал бы сам вектор-потенциал A i .
Калибровочная инвариантность благодаря закону сохранения заряда
оставалась бы только в члене действия, отвечающем взаимодействию поля с
заряженными частицами. Поэтому, если исходить из предположения,
что


H,
лагранжиан поля составлен только из «физических» полей E и
инвариант I 3 можно вначале не рассматривать. Позже мы, однако,
рассмотрим вопрос о том, к каким изменениям в теории привело бы
включение в лагранжиан поля инварианта I 3 .
Будучи релятивистским скаляром, лагранжиан поля может быть составлен
только из инвариантов I1 и I 2 , а также из их различных произведений и
степеней. Таким образом, лагранжиан магнитного поля может иметь вид:
2
2
Lполя= 1I1   2 I 2   3 I1   4 I1I 2   5 I 2  ....
(128)
где 1 ,  2 ... есть некоторые коэффициенты.
В более общем случае лагранжиан поля мог бы быть вообще некоторой
сложной функцией Lполя= L (I1 , I 2 ). Здесь, однако, мы можем в первом
приближении воспользоваться указанием, которое дает эксперимент. Из
опыта известно, что уравнения Максвелла линейны по полю. Исходя из этого
мы должны оставить в лагранжиане (128) только квадратичные по полю
члены с I1 и I 2 , так как только варьирование их может привести к линейным
уравнениям поля.
(Вместе с тем, мы должны иметь в виду, что точность опытных данных всегда ограничена и поэтому
нелинейные эффекты, если они малы, могли быть и не замечены на опыте. В действительности, из
квантовой теории поля следует существование малых нелинейных поправок к уравнению Максвелла,
которые могут проявиться в очень сильных электромагнитных полях. Эти поправки должны как раз и
описываться высшими членами лагранжиана.)
Покажем теперь, что инвариант I 2 не может дать вклада в уравнения поля.
Для этого найдем его вариацию по полю. Заметим, что ввиду асимметрии
~ ik
тензора F инвариант I 2 можно представить в виде
~
~  A A 
~ A
I 2  Fik Fik  Fik  ik  ki   2Fik ki
x
 x x 
A A
 Am A l  A i
 2eiklm 
 m  k  4eiklm ml ki .
l
x  x
x x
 x
Вариация I 2 поэтому равна
I 2  8e iklm
A l  A i 
~ ik  A i 



4
F  k  .


x m  x k 
 x 
Ее можно представить в виде
~
  ~ ik
F ik 
I 2  4 k F A i   A i k  .
x 
 x
Поскольку полученная ранее первая пара уравнений Максвелла может
~
Fik
быть записана в виде
 0, второй член в фигурной скобке обращается в
k
x
нуль. Что же касается первого члена, то при вычислении вариации действия
интеграл от него по четырехмерному объему по теореме Гаусса сводится к
интегралу по поверхности, охватывающей этот объем. Поверхностный же
интеграл зануляется, так как A i  0 на поверхности t  t 1 и t  t 2 по
условию варьирования, а на бесконечно удаленной в пространстве
поверхности из-за убывания поля (в предположении, что заряды заключены в
ограниченном объеме).
Итак, инвариант I 2 не вносит вклада при вариации действия и в
выражении (128) его можно опустить. Благодаря этому обстоятельству
получающиеся уравнения поля обладают зеркальной симметрией. В
противном случае лагранжиан
(128) изменялся бы при отражении
пространственных осей координат (так как при таком отражении I1 не
меняется, а I 2 меняет знак) и уравнения поля оказывались бы
несимметричными относительно пространственных отражений.
Точно так же, как легко видеть, они были бы несимметричны относительно
обращения времени. Сохранялась бы только симметрия относительно
комбинированного преобразования: отражения пространственных осей с
одновременным обращением времени.
Таким образом, в лагранжиане (128) можно оставить только первый член.
Рассмотрим теперь вопрос о коэффициенте 1 , с которым инвариант I1
входит в действие S, и прежде всего – вопрос о его размерности.
Заметим, что в члене взаимодействия (109) определяется только
произведение размерностей заряда e и вектор-потенциала A  , а не
каждого из них по отдельности. Учитывая, что размерность действия
S   T (где  -- размерность энергии, а T  размерность времени,
для произведения размерностей e A получим e  A   . Поскольку
размерность A  еще не определена, удобно выбрать ее так, чтобы
коэффициент 1 был безразмерным. Для этого, при учете, что размерность
I   A
L 
1
2
2
(где L  размерность длины ) должно выполняться условие
S   T  A L T. ,
L 
2
3
2
т.е.
A  L    e A
2
e
Отсюда следует, что, выбрав размерности A  
L
e    , можно
L
2
и
использовать в качестве коэффициента 1 безразмерное число. Знак 1
можно выбрать из следующих соображений. Инвариант I1 содержит квадрат

 
напряженности E
2
с отрицательным знаком и, следовательно, согласно
 2
 1 A 
 входит в него с тем же знаком.
(117), величина 
c




Если бы знак 1 был положительным, то действие S за счет члена
 2
1  A 
 неограниченно уменьшалось бы с ростом частоты переменного
 2 
c  t 
поля и не могло принимать максимальное значение для статических полей.
Это означало бы, что статические поля в противоречии с опытом вообще не
могут осуществляться. Поэтому 1 должно быть отрицательным.
Чтобы получить уравнения Максвелла в гауссовой системе единиц,
следует принять  1  
1
.
16
(В системе единиц Хевисайда, в которой
уравнения Максвелла не содержат множителей 4, в качестве величины
1
1 нужно взять 1   ).
4
Общее действие для системы, состоящей из заряженных частиц и
создаваемого ими электромагнитного поля должно иметь вид:
S  S част  Sвз  Sполя ,
(129)
где Sвз  часть действия, отвечающая взаимодействию заряженных
частиц с электрическим полем (121), а Sполя  действие для
самого
электрического поля, которое согласно сказанному выше можно записать в
виде
Sполя  
1
ik
4
   F Fik d x .
16
(130)
Если движение частиц задано (т.е. задано распределение зарядов и их
токов), то уравнения для поля согласно общим принципам механики должны
получаться из условия экстремума действия S при варьировании по
обобщенным координатам поля A i , т.е.условия S  0 . При этом часть
действия, отвечающая частицам, не варьируется, так как движение их
считается заданным.
Вариация Sвз (130) равна:
1
Sвз      ji A i d 4 x.
c
Вычислим теперь вариацию Sполя  
(131)
1
ik
4
  F Fik d x.
16
Величину I1  F Fik можно представить в виде:
ik
A
 A A 
I1  Fik  ik  ki   2Fik ki ,
x 
x
 x
и ее вариация равна:
A

 A 
I1  2Fik  ki  Fik  ki .
x
 x 

Преобразуем первый член в фигурной скобке полученного выражения:
F  A
A i
 A l   A i
il km   A m 

g
g






 m  k .
l
x k
x k
  x   x   x
Заменяя в первом члене индексы суммирования m  i , l  k , а во
втором l  i , m  k , получим:
A
A   A 
 A
 A 
Fik  ki  g mk g li  ml  ml  ki   Fik  ki .
x
x   x 
 x
 x 
ik  A 
Таким образом, I1  4F  ki . Представив это выражение в виде:
 x 
Fik 
 
ik
(132)
I1  4 k F A i   A1 k ,

x

x


ik
i
 g ilg km Flm 
мы можем преобразовать интеграл по четырехмерному пространству от
первого члена (132), входящего в вариацию Sполя , в интеграл по
охватывающей его трехмерной поверхности, на которой величина F A i
обращается в нуль. В результате из равенства
ik
ik
 1 i 1 F 
Sвз  Sполя       j 
A i d 4 x  0
k 
4 x 
 c
(133)
получаем для электромагнитного поля уже известную нам вторую пару
уравнений Максвелла:
Fik
4 i


j.
x k
c
(134)
Итак, принцип наименьшего действия и требование релятивистской
инвариантности позволяют теоретически не только получить уравнения
Максвелла, но и предсказать, какие поправки к ним могут возникнуть в
сильных полях (коэффициенты при высших степенях инвариантов (128)
могут быть вычислены на основе квантовой теории электромагнитного поля
– квантовой электродинамики). Единственное предположение, которое при
этом делалось, а именно то, что электромагнитное поле описывается 4вектором A i , в действительности также может быть обосновано в квантовой
теории поля исходя из закона сохранения электрического заряда.
В нашем курсе я не имею возможности это доказать, однако постараюсь хотя бы пояснить, на чем оно
основано. Характерная особенность электродинамики заключается в том, что источником
электромагнитного поля являются сохраняющиеся заряды и их токи. Между законами сохранения
физических величин и симметриями, которыми обладает физическая система, существует глубокая связь.
Каждой симметрии соответствует свой закон сохранения, и, наоборот, зная закон сохранения какой-либо
физической величины, мы можем указать симметрию, которой он соответствует. Под симметрией системы
мы понимаем наличие таких преобразований физических величин, характеризующих систему, при которых
не меняется энергия системы (точнее, ее функция Гамильтона).
Параметры, определяющие преобразование системы, могут быть одинаковы во всем пространстве
Минковского. В этом случае симметрию называют глобальной. Если же указанные параметры зависят от
пространственно – временной точки и являются произвольными функциями ее, то симметрия называется
локальной.
С точки зрения СТО физически более привлекательной представляется локальная симметрия, так как
для нее не требуется преобразования величин одновременно во всем пространстве Минковского (в том
числе и в его пространственно--несвязанных точках). Если, однако, предположить, что симметрия,
соответствующая сохранению заряда, локальная, то при преобразовании симметрии изменяется на
производную произвольной величины импульс заряженной частицы.
Такое недопустимое изменение физической величины (4-импульса частицы) можно исключить,
предположив, что заряд частицы является источником векторного поля, калибровочное преобразование
которого с произвольной функцией (..) компенсирует возникающую неопределенность в импульсе
частицы.
Несколько упрощенно это можно пояснить, записав согласно (111) :
e
p i  Pi  A i Если в этом соотношении p i меняется на производную произвольной функции f :
c
f
Pi  Pi  Pi  i , то величина p i не изменится, если A i одновременно изменить на величину
x
c f
c f
/
. Произвол же в определении векторного калибровочного
,
то есть A i  A i  A i 
e x i
e x i
A k A i
поля A i устраняется в комбинации

 Fik , из которой произвольная функция f (x)
x i x k


исключается. Поэтому величины
Fik , то есть напряженности E и H , и являются вполне
определенными физическими величинами, определяющими силы, действующие на заряд. Именно из таких
величин, не зависящих от калибровки, и надо строить инварианты, входящие в действие для поля.
Так обстоит дело в электродинамике, где взаимодействие определяется одним сохраняющимся
(электрическим) зарядом. В случае сильного и слабого взаимодействия существуют несколько различных
сохраняющихся зарядов и предположение о локальном характере симметрий, приводящих к их сохранению,
ведет, как следствие, к необходимости существования нескольких калибровочных полей. Условия
калибровки в этом случае получаются более сложными , чем в электродинамике.
Таким образом, предположив, что симметрия, приводящая к закону сохранения зарядов, -- локальная, мы
с неизбежностью приходим к выводу, что такие заряды должны быть источниками калибровочных
векторных полей, уравнения для которых мы можем найти, построив релятивистски-инвариантное
действие для величин, не зависящих от калибровки.
На этом пути, обобщающем электродинамику, удалось открыть единство электромагнитных и слабых
взаимодействий, создав единую теорию электрослабых взаимодействий, а также создать современную
теорию сильных взаимодействий – квантовую хромодинамику.
В электрослабом взаимодействии в качестве калибровочных векторных полей помимо
электромагнитного поля участвуют поля так называемых векторных бозонов
W , Z0 , а
в сильных
взаимодействиях – восемь векторных калибровоных полей – глюонов. Обе теории получили блестящее
экспериментальное подтверждение.
 15.
МАССА ФОТОНА
Как уже отмечалось, релятивистская инвариантность допускает включение
2
i
в лагранжиан электромагнитного поля и третьего инварианта: A  A A i .
Включение этого члена нарушает калибровочную инвариантность теории,
которая, благодаря закону сохранения заряда, сохраняется при этом только
для члена, отвечающего взаимодействию зарядов с электромагнитным полем.
Рассмотрим вопрос о том, к каким изменениям в уравнениях
электромагнитного поля привело бы включение указанного члена.
Соответствующую добавку к действию поля запишем в виде
.
Sполя
2
i
4

   A A i d x.
8
(135)
Коэффициент, стоящий перед интегралом, как будет показано ниже,
2
, введя ( 8 )
должен быть положительным Поэтому мы обозначили его
8
  , можно
2
для удобства. Учитывая, что размерность A  равна
L 
1
. Вариация
определить размерность коэффициента  в (135):   
L
2
/
i
4
дополнительного члена равна Sполя 
   A A i d x, а уравнения для
4
/.
поля, получаемые из условия  Sвз  Sполя  S поля  0 принимают вид
Fik
4 i
2
i


A


j.
(136)
x k
c


Дифференцируя это уравнение с учетом того, что выполняется закон
ji
Fik
 0, а величина
 0 (в силу антисимметрии
сохранения заряда
x i
x i x k
Fik  Fik ) получаем:
i
2 A

 0,
(137)
x i
При   0 из уравнения (137) автоматически следует выполнение
A i
 0. Приведем уравнения (136) к уравнению для
условия Лоренца
x i
потенциалов A i . Для этого удобно опустить в нем индексы, заменив при
k
этом дифференцирование по контравариантной координате ( x )
дифференцированием по ковариантной x k  :
Fik
4
 2 A i  
ji
x k
c

A k
  A k A i 
Преобразуя
Fik 
 0, а
 i  k  с учетом того, что
x k  x
x 
x k
x k


 k   B , где B -- оператор д’Аламбера, получим
x k x
4 i
2
j
(B   ) A i  
(138)
c
 рассмотрим какую-либо
Для выяснения физического смысла
компоненту свободного поля в отсутствие зарядов  ji  0. Уравнение
2
(B   )   0
(139)
имеет решение
в виде плоской волны:


  Be  it  ikr
(140)
Подставляя (140) в (139), имеем
2

 2 
2 
 it  ik r
 0,
  k  2   Be
c


откуда следует, что частота волны  равна

  c k 2  2 .
(141)
Групповая скорость
 этой волны :
ck
   
v  
 k 
k 2  2
(142)
будет меньше скорости света только при условии   0. Это доказывает
сделанное выше утверждение о том, что коэффициент в выражении (135)
должен быть положительным.
Из элементарного курса физики известно, что в природе имеет место
корпускулярно-волновой дуализм, заключающийся
в том, что всякой волне с

частотой  и волновым вектором k соответствуют частицы с энергией  и

импульсом p , равными
2


  ; p  k .
Поэтому, умножая обе частицы равенства (141..) на постоянную Планка
 , получаем для энергии частицы, соответствующей электромагнитной
волне – фотону – выражение

  c p 2   2 2 .
(143)
Член  2 2 в этом выражении должен быть (согласно релятивистской
2 2
формуле для энергии частицы) истолкован как величина mф c (где mф есть
масса фотона).
Поэтому введение дополнительного действия S поля (135) соответствует
предположению о наличии у фотона ненулевой массы покоя, а величина 
при этом оказывается равной
/

mфc
.

(144)
Для того чтобы увидеть, каким образом наличие у фотона ненулевой
массы покоя изменило бы законы электромагнитного поля, рассмотрим
уравнение (138) для потенциала  в случае постоянного электромагнитного
поля, создаваемого неподвижными зарядами с плотностью . В этом случае
уравнение (138) принимает вид
  2   4.
(145)
Можно проверить, что решением уравнения (145) для потенциала,
создаваемого точечным зарядом e , будет
e
  e  r ,
r
(146)
отличающийся от обычного кулоновского потенциала множителем
exp  r , «обрезающим» кулоновское взаимодействие на больших
расстояниях  r  1. Надо сказать, что при тщательной экспериментальной
проверке закона Кулона ранее предполагалось, что отклонение от него может
быть в степенной зависимости силы взаимодействия двух зарядов от
расстояния:
F
e1 e 2
r 2
  0,
и делались ограничения сверху на величину .
Формула (146) указывает, что отклонение от закона Кулона в случае
ненулевой массы фотона имеет экспоненциальный характер и должно
проявляться на больших расстояниях.
Аналогичное экспоненциальное убывание должно проявляться на больших
расстояниях и для магнитного поля, скажем, магнитного поля Земли или
Юпитера. С началом эры космических исследований открылись возможности
проверки закона убывания магнитных полей, создаваемых космическими
телами на больших расстояниях и, тем самым, получения сильных
экспериментальных ограничений на величину возможной массы фотона.
(Отметим, что идея таких опытов в свое время была высказана одним из
создателей квантовой механики – Э.Шредингером.)
Можно оценить, какие ограничения на массу Фотона были получены из
проделанных космических экспериментов. Пусть закон убывания магнитного
поля отклоняется от степенного меньше чем на 10 на расстояниях
r  105 км. , то есть r  0,1. Тогда для массы фотона, согласно (144),
получается ограничение m ф  0,1

 3  1049 г , то есть масса фотона по
cr
крайней мере на 21—22 порядка меньше массы электрона m e  0,9  10 г  .
При таком ограничении на массу фотона скорость электромагнитных волн
(142) будет отличаться от скорости света лишь в десятом знаке и то при
7
длинах волн, больших 10 км.
27
Как уже отмечалось, член в лагранжиане поля
S3/ ,
связанный с массой фотона, нарушает
калибровочную инвариантность теории и, казалось бы, несовместим с тем, что симметрия,
приводящая к закону сохранения заряда, имеет локальный характер. Действительно, при наличии
точной локальной симметрии массы покоя частиц, соответствующих калибровочным полям,
должны быть равными нулю. Однако Хиггсом был указан механизм так называемого спонтанного
нарушения локальной симметрии, при котором, например, калибровочные промежуточные бозоны
w  , z0
приобретают массу благодаря взаимодействию с полями особых скалярных частиц
(бозонов Хиггса), конденсат которых существует в физическом вакууме. Математически это
связано с тем, что уравнения, обладающие какой-либо симметрией, могут иметь несимметричные
решения (подобно тому, как буриданов осел, находящийся посередине между двумя одинаковыми
охапками сена, должен спонтанно выбрать одну из них). В связи с этим получение дальнейших
экспериментальных ограничений на массу фотона имеет фундаментальное значение.
Download