Паршаков А.Н. Курс лекций по физике. Оптика, основы

advertisement
1
Кафедра прикладной физики
Пермского национального
исследовательского политехнического
университета
Курс лекций по физике
Составлен Паршаковым А.Н. в соответствии с образовательным стандартом третьего поколения. Рассмотрены разделы: оптика (волновая и
квантовая), основы квантовой физики, ядерная физика и элементарные
частицы. Подбор материала соответствует высокому уровню подготовки
(три семестра). При необходимости данный курс может быть использован
для базового и среднего уровней подготовки, если в соответствии с программой данных уровней удалить часть материала.
Пермь 2012
2
Содержание
7. Оптика
7.1. Интерференция света
7.1.1. Световая волна
7.1.2. Отражение и преломление света на границе двух диэлектриков
7.1.3. Интерференция света. Опыт Юнга
7.1.4. Временнáя и пространственная когерентность
7.1.5. Интерференция в тонких пленках
7.1.6. Интерферометр Майкельсона
7.1.7. Многолучевая интерференция
7.2. Дифракция света
7.2.1. Принцип Гюйгенса-Френеля
7.2.2. Метод зон Френеля
7.2.3. Дифракция Френеля от простейших преград
7.2.4. Дифракция Фраунгофера на щели.
7.2.5. Дифракционная решетка
7.2.6. Дифракционная решетка как спектральный прибор
7.2.7. Дифракция на пространственных решетках
7.2.8. Голография
7.3. Поляризация света
7.3.1. Виды поляризованного света. Закон Малюса
7.3.2. Поляризация при отражении и преломлении. Закон Брюстера
7.3.3. Поляризация при двойном лучепреломлении
7.3.4. Интерференция при двойном лучепреломлении
7.3.5. Искусственная оптическая анизотропия. Вращение плоскости
поляризации
7.4. Взаимодействие электромагнитного излучения с веществом
7.4.1. Дисперсия света
7.4.2. Групповая скорость
7.4.3. Классическая теория дисперсии
7.4.4. Поглощение и рассеяние света
8. Квантовая физика
8.1. Квантовые свойства электромагнитного излучения
8.1.1. Характеристики и законы теплового излучения. Формула Планка
8.1.2. Световые кванты. Фотоэффект
8.1.3. Опыт Боте. Давление света
8.1.4. Эффект Комптона
8.2. Строение атома
8.2.1. Модели атома. Атомные спектры
3
8.2.2. Боровские постулаты и атом водорода
8.3. Основные принципы квантовой механики
8.3.1. Гипотеза де Бройля. Волновые свойства вещества
8.3.2. Принцип неопределенности и его следствия
8.3.3. Волновая функция. Уравнение Шредингера
8.3.4. Принцип суперпозиции. Операторы
8.3.5. Движение свободной частицы
8.3.6. Квантовая частица в бесконечно глубокой потенциальной яме
8.3.7. Прохождение частицы через потенциальный барьер
8.4. Квантовомеханическое описание атомов
8.4.1. Гармонический осциллятор
8.4.2. Атом водорода
8.4.3. Пространственное квантование
8.4.4. Опыт Штерна и Герлаха. Спин электрона. Мультиплетность
спектров
8.4.5. Квантовые числа. Кратность вырождения энергетических уровней
8.4.6. Многоэлектронные атомы. Эффект Зеемана
8.4.7. Принцип Паули. Периодическая система элементов
Менделеева
8.5. Оптические квантовые генераторы
8.5.1. Индуцированное излучение
8.5.2. Принцип усиления света с помощью вынужденного
излучения
8.5.3. Лазеры
8.5.4. Лазеры для системы ПРО
8.6. Квантовая статистика
8.6.1. Принцип неразличимости квантовых частиц
8.6.2. Квантовая теория свободных электронов в металле
8.6.3. Квантовые распределения. Фермионы. Бозоны
8.7. Квантовая проводимость твердых тел
8.7.1. Электроны в периодическом поле кристаллической решетки
8.7.2. Энергетические зоны в кристаллах
8.7.3. Электропроводность металлов
8.7.4. Собственная проводимость полупроводников
8.7.4. Примесная проводимость полупроводников
9. Ядерная физика и элементарные частицы
9.1. Основы физики атомного ядра
9.1.1. Состав и характеристики атомного ядра
4
9.1.2. Ядерные силы
9.1.3. Радиоактивность. Закон радиоактивного распада
9.1.4. Виды радиоактивного распада
9.1.5. Масса и энергия связи ядра
9.1.6. Ядерные реакции
9.1.7. Реакции деления
9.1.8. Термоядерные реакции
9.2. Элементарные частицы
9.2.1. Виды взаимодействия и классы элементарных частиц
9.2.2. Частицы и античастицы.
9.2.3. Законы сохранения в физике элементарных частиц
9.2.4. Кварки
Почему наш мир таков, каким мы его видим?
5
7. Оптика
В течение долгого времени существовало два взгляда на природу света:
1. Свет – это поток частиц (корпускул). Эта точка зрения была развита в работах Ньютона, Декарта и др.
2. Свет – это процесс распространения продольных деформаций в некоторой
материальной среде (мировой эфир). Данной модели придерживались Гюйгенс, Френель, Араго и др. О волновой природе света однозначно свидетельствовали явления интерференции, дифракции, поляризации. В то же время
никакие попытки обнаружения «мирового эфира» не привели к успеху.
Позднее в работах Максвелла было показано, что свет это электромагнитная
волна, для распространения которой не требуется никакой среды. Однако и
эта теория не объясняла излучения нагретых тел, фотоэффект и др.
Современная физика рассматривает свет как сложное явление: в одних
случаях он ведет себя как электромагнитная волна, в других – как поток особых частиц (фотонов). В этом проявляется дуализм (двойственность) света.
Более того, в начале XX века было доказано, что дуализм проявляется не
только при распространении света, но имеет универсальное значение и для
вещества.
Мы рассмотрим сначала круг явлений, характеризующих волновую
природу света.
7.1. Интерференция света
7.1.1. Световая волна
Световая волна является поперечной электромагнитной волной, в которой происходят колебания векторов напряженности электрического поля E и
магнитного - H . Как показывает опыт, физиологическое, фотохимическое и
другие действия света вызываются колебаниями вектора E - светового вектора, изменение которого в плоской монохроматической волне описывается
уравнением
E  A cos  t  kx    .
(7.1)
Здесь t  kx   - фаза волны, k  2 /    / v - волновое число,  - длина
волны,   2 - частота, v - фазовая скорость волны, x - расстояние, отсчитываемое вдоль направления распространения волны, A (или Em ) - амплитуда волны.
Отношение скорости света в вакууме c к фазовой скорости v в данной
среде называется абсолютным показателем преломления этой среды n  c / v
(иногда n называют просто показателем преломления). Ранее в разделе электромагнетизма нами было показано, что для немагнитных сред v  c /  , по-
6
этому для показателя преломления имеем n   . Эта формула связывает оптические свойства вещества с его электрическими свойствами. На первый
взгляд может показаться, что она не верна. Например, для воды   81 , а
n  1,33  81 . Однако надо иметь в виду, что значение   81 получено из
электростатических измерений. В быстропеременных электрических полях
значение  получается иным, причем оно зависит от частоты колебаний поля. Этим объясняется дисперсия света, т.е. зависимость показателя преломления от частоты света. Значения показателя преломления характеризуют оптическую плотность среды. Среда с бóльшим n называется оптически более
плотной, чем среда с меньшим n .
Длины волн видимой части спектра заключены в пределах
0  (0,40  0,76) мкм.
Эти значения относятся к световым волнам в вакууме. Нетрудно показать,
что в веществе длина волны уменьшается в n раз. Частоты видимой части
спектра одинаковы как для вакуума, так и для вещества и составляют
   0,39  0,75 1015 Гц.
Ни глаз, ни какой-либо иной приемник световой энергии не способен уследить за столь частыми изменениями, вследствие чего они регистрируют усредненный по времени поток. Поэтому одной из главных характеристик световой волны является ее интенсивность I - модуль среднего по времени значения плотности потока энергии (вектора Пойнтинга)
1
I   EH   n E 2  nA2 ,
(7.2)
2
где n - показатель преломления среды,   0 / 0 , ( 0 , 0 - электрическая и
магнитная постоянные).
По классическим представлениям излучение обычного источника (светящегося тела) слагается из волн, испускаемых многими атомами. Отдельные
атомы излучают так называемые цуги волн длительностью порядка 10-8с и
протяженностью около 3 м. Излучив отдельный цуг волн, атом излучает через некоторое время следующий цуг и так далее. Причем фаза нового цуга
никак не связана с фазой предыдущего цуга. Более того, монохроматическая
волна, описываемая выражением (7.1), представляет собой абстракцию. Любая реальная световая волна образуется наложением колебаний, заключенных в более или менее узком, но конечном интервале частот  . Поэтому
при наложении таких волн друг на друга фазовые соотношения между световыми колебаниями изменяются случайным образом. Такие волны называют-
7
ся некогерентными, что существенно определяет результат их наложения
друг на друга.
7.1.2. Отражение и преломление света на границе двух диэлектриков
При прохождении света через различные среды изменяется его скорость  v = c / n  и длина волны (   0 / n ), но частота волны остается неизменной (она задается источником света). Поэтому для определения изменения фазы световой волны при ее распространении через различные среды
удобно рассматривать не обычный геометрический путь волны S , а т.н. оптическую длину пути L  nS . В соответствии с (7.1) изменение фазы на пути
S  x в фиксированный момент времени t определяется как
2
2
2
  k x 
S
nS 
L.

0
0
Разность оптических длин (путей), проходимых двумя волнами в разных средах до точки встречи, называется оптической разностью хода
  L2  L1  n2 S2  n1S1 .
Именно эта величина определяет дополнительную разность фаз  двух волн,
прошедших разные пути с оптической разностью хода 
2
2
(7.3)


 n2 S2  n1S1  .
0
0
При падении световой волны на границу раздела двух сред выполняются законы отражения      и преломления ( sin  / sin   n2 / n1 ).
Найдем соотношения между амплитудами и фазами падающей, отраженной и преломленной волн. Для простоты ограничимся случаем нормального падения волны на границу раздела диэлектриков. Пусть колебания вектора E в падающей волне совершаются вдоль направления, которое мы примем за ось x . Из соображений симметрии следует, что колебания векторов
E  и E также происходят вдоль x . Тогда из условия непрерывности тангенциальной составляющей напряженности электрического поля получаем
Ex  Ex  Ex .
Учтем теперь закон сохранения энергии. Так как в соответствии с (7.2)
мгновенное значение плотности потока энергии пропорционально nE 2 , то из
равенства суммы энергии отраженной и преломленной волн энергии падающей волны получаем
n1Ex2  n1Ex2  n2 Ex2 .
Из последних двух равенств нетрудно найти
8
Ex 
n1  n2
Ex ,
n1  n2
(7.4)
Ex 
2n1
Ex .
n1  n2
(7.5)
Из формулы (7.5) следует, что проекции векторов E и E имеют всегда
одинаковые знаки. Отсюда заключаем, что колебания в падающей и преломленной волнах происходят на границе раздела в одинаковой фазе – при прохождении света через границу раздела фаза не испытывает скачка.
Из формулы (7.4) вытекает, что при n2  n1 знак Ex совпадает со знаком
E x , т.е. колебания в падающей и отраженной волнах на границе раздела про-
исходят в одинаковой фазе – фаза волны при отражении не меняется. Если
же n2  n1 , то колебания в падающей и отраженной волнах на границе раздела происходят в противофазах – фаза волны при отражении скачком меняется
на  . Полученный результат справедлив и для наклонного падения волны на
границу раздела сред. Об этом изменении фазы волны следует помнить при
расчете оптической длины пути луча.
Соотношения (7.4) и (7.5) получены для мгновенных значений проекций световых векторов. Аналогичные соотношения имеют место и для амплитуд
n n
2n1
Em 
Em , Em  1 2 Em ,
n1  n2
n1  n2
что позволяет найти коэффициент отражения  и коэффициент пропускания  световой волны (для случая нормального падения волны на границу
раздела). По определению
2
I  n1Em2  n12  1 
 


I n1Em2  n12  1 
( n12  n2 / n1 - относительный показатель преломления второй среды по отно-
шению к первой). Заметим, что коэффициент отражения не зависит от направления движения световой волны.
Коэффициент пропускания
2
 2 
I  n2 Em2
 
 n12 
 .
2
I
n

1
n1Em
 12

Показатель преломления стекол близок к 1,5, поэтому   0,04 , т.е. каждая поверхность стеклянной пластинки отражает при нормальном падении
около 4% упавшей на нее световой энергии.
9
7.1.3. Интерференция света. Опыт Юнга
Под интерференцией понимают перераспределение светового потока в
пространстве, в результате которого в одних местах возникают максимумы, а
в других – минимумы интенсивности. Интерференция характерна для волн
любой природы. Наблюдать же интерференцию световых волн можно лишь
при определенных условиях. Пусть в некоторую точку пространства приходят световые волны, напряженности полей которых равны E1 и E2 . По принципу суперпозиции напряженность результирующего поля равна их векторной сумме E  E1  E2 . Экспериментально наблюдаемая интенсивность света
пропорциональна среднему значению квадрата напряженности E 2 за время, определяемое инерционностью приемника излучения
I
E2 
E  E 
1
2
2
 E12  E22  2 E1E2 .
Это выражение помимо суммы интенсивностей каждой из волн содержит еще одно слагаемое, пропорциональное скалярному произведению
2 E1E2 , называемому интерференционным членом. Если складываемые
волны поляризованы во взаимно перпендикулярных плоскостях, то это слагаемое в любой точке пространства равно нулю и ни о какой интерференции
не может быть и речи. В дальнейшем будем считать, что оба вектора E1 и E2
колеблются вдоль одной прямой. Тогда можно отвлечься от векторного характера этих величин и интерференционный член записывать как 2 E1E2 .
Если в точке наблюдения складываемые колебания имеют вид
E1  A1 cos  t  1  , E2  A2 cos  t  2 
(значения 1 и  2 зависят от положения точки наблюдения), то при сложении этих колебаний получается гармоническое колебание той же частоты
E  A cos  t    .
Здесь   2  1 - разность фаз складываемых колебаний, A - амплитуда,
квадрат которой определяется равенством
A2  A12  A22  2 A1 A2 cos  .
Если колебания не согласованы друг с другом, или как говорят, некогерентны, то разность фаз  изменяется со временем и cos   0 . В этом случае A2  A12  A22 , или I  I1  I 2 , т.е. при наложении некогерентных волн интенсивность результирующего колебания равна просто сумме интенсивностей, создаваемых каждой из волн в отдельности. Именно это мы и наблюда-
10
ем из повседневного опыта. Дело в том, что естественные источники света не
когерентны.
Если же разность фаз  не изменяется со временем (но может быть
различной в разных точках пространства), то такие волны называют когерентными. При их суперпозиции интенсивность результирующего колебания
I  I1  I 2  2 I1I 2 cos  .
(7.6)
Тогда в точках пространства, где cos   0 , интенсивность I  I1  I 2 , а там,
где cos   0 интенсивность I  I1  I 2 . Таким образом, при наложении когерентных световых волн происходит перераспределение светового потока в
пространстве: в одних точках пространства возникает усиление и появляются
максимумы интенсивности, в других точках появляются минимумы. Это и
есть интерференция световых волн. Особенно отчетливо (контрастно) это
проявляется когда I1  I 2  I 0 . Тогда I max  4I 0 и I min  0 . Для некогерентных
волн при этих же условиях всюду получается одинаковая интенсивность
I  2I0 .
Итак, интерференцию световых волн можно наблюдать, только если
волны когерентны и поляризованы в одной плоскости. Реально когерентные
световые волны можно получить от обычного источника света, разделяя его
волну тем или иным способом на части. Если заставить эти волны пройти
разные оптические пути, а затем наложить друг на друга, то мы будем наблюдать интерференционную картину, например, систему чередующихся
светлых и темных полос. Иногда такое разделение волн происходит совершенно естественно, например, на тонких прозрачных пластинках.
Если от места разделения волн до точки их схождения волны проходят
разные оптические пути, то их разность фаз  , как уже указывалось ранее
2
2
(см. формулу (7.2)), составит  

 n2 S2  n1S1  . Для получения мак0
0
симума интенсивности в соответствии с (7.6) необходимо, чтобы сos  1 .
Отсюда следует, что, если оптическая разность хода складываемых волн равна целому числу длин волн в вакууме
  m0  m  0,1,2... ,
то в данной точке пространства выполняется условие интерференционного
максимума. Если же cos   1 , или
    m  1/ 2  0  m  0,1,2... ,
то в данной точке пространства выполняется условие интерференционного
минимума.
11
S1

S
l1
x
l2

l
d
P

O
I
S2
  l2  l1
Э
Рис. 7.1
На рис. 7.1 представлена схема классического опыта Юнга для демонстрации интерференции света. В ней яркий пучок солнечного света освещал
узкую щель S . Прошедший через нее свет падает на две узкие щели S1 и S 2 .
Эти щели действуют как вторичные когерентные источники, и исходящие от
них цилиндрические волны дают на экране Э систему интерференционных
полос. Найдем их положение. Так как угол отклонения лучей   1 , то разность хода волн до точки P на экране   d   , где d - расстояние между щелями S1 и S 2 . А так как   x / l ( l - расстояние от источников до экрана), то
  xd / l . Отсюда нетрудно найти положение (координаты) xmax светлых полос, для которых   m :
xmax  ml / d  m  0,1,2...
и координаты xmin темных полос
xmin 
 m  1/ 2 l / d  m  0,1,2... .
В точке x  0 (центр интерференционной картины) расположен максимум, соответствующий нулевой разности хода. Для него порядок интерференции m  0 . При переходе к соседнему максимуму порядок интерференции
изменяется на единицу, а координата x - на величину x , которую называют
шириной интерференционной картины. Для нее имеем
x  l / d или x   /  ,
где  - угол, под которым видны оба источника из центра интерференционной картины (   d / l ). Для получения различимой интерференционной картины необходимо выполнение условия l  d . Тогда, измерив x, l , d , можно
найти длину световой волны. Именно так были определены длины волн для
световых лучей разного цвета.
Если интенсивности интерферирующих волн одинаковы ( I1  I 2  I 0 ),
то согласно (7.6) результирующая интенсивность на экране в точках, для которых разность фаз равна  , определяется как
12
I  2I 0 1  cos    4I 0 cos2   / 2  ,
и так как  пропорциональна разности хода   xd / l , то интенсивность из d 
меняется вдоль экрана как квадрат косинуса I  4 I 0 cos 2 
x  (по крайней
l



мере, для центральной части экрана).
Существуют и другие интерференционные схемы, отличающиеся от
схемы Юнга способом формирования когерентных световых волн и бóльшей
светосильностью.
Зеркала Френеля. Здесь когерентные световые волны получаются при
отражении от двух зеркал, плоскости которых образуют между собой небольшой угол  (рис. 7.2). Свет от ярко освещенной щели S , параллельной
линии пересечения зеркал, после отражения от них попадает на экран Э. И
там, где световые пучки перекрываются (область интерференции), возникает
интерференционная картина в виде полос, параллельных щели S . При этом
отраженные от зеркал пучки света распространяются так, как будто они исходят от мнимых источников S  и S  , являющихся изображением щели S .
Расстояние от линии пересечения зеркал до щели равно a , до экрана - b .
Ширину интерференционных полос можно найти из формулы x  l / d ,
полагая l  a  b и d  2a
  b
x 
1   .
2  a 
S

S
Э
область
интерференции
a
2
2
a
b
S 
Рис. 7.2
Бипризма Френеля. В этой схеме для разделения исходной световой
волны используют двойную призму Бп (бипризму) с малым преломляющим
углом  (рис. 7.3). Поскольку преломляющий угол бипризмы очень мал (порядка нескольких угловых минут), то, можно показать, что все лучи откло-
13
няются бипризмой на практически одинаковый угол    n  1  . В результате образуются две когерентные волны, как бы исходящие из мнимых источников S  и S  , лежащих в одной плоскости со щелью S . Данная схема полностью идентична рассмотренной ранее схеме с зеркалами Френеля.
Э
область
интерференции
Бп
S
2

S
S 
2
a
L
b
Рис. 7.3
7.1.4. Временнáя и пространственная когерентность
Одним из условий наблюдения устойчивой картины интерференции
является когерентность. Напомним, что когерентностью называется согласованное протекание колебательных процессов, как во времени, так и в пространстве. В связи с этим различают временнýю и пространственную когерентность. Временнáя когерентность связана с разбросом длин волн или модуля волнового вектора k . Пространственная же когерентность связана с
разбросом направлений вектора k . Количественно временнáя когерентность
характеризуется длиной когерентности lког , а пространственная – шириной
когерентности hког . Рассмотрим эти понятия на примере получения интерференционной картины в опыте Юнга.
Длина когерентности. В опыте Юнга интерференционная картина по
мере удаления от ее середины размывается и полосы исчезают. Связано это с
x тем, что строго монохроматический свет – это идеализация. Реальный свет, как бы ни старались его моA
нохроматизировать, остается в той или иной степени
S1
немонохроматическим, т.е. заполняет некоторый коO нечный интервал длин волн от  до    . Посмотрим к чему это приводит. Пусть S1 и S 2 (рис. 7.4) –
S2
когерентные источники, являющиеся действительными или мнимыми изображениями источника S .
Рис. 7.4
Допустим сначала, что излучение источника S со-
14
стоит из двух близких спектральных линий с длинами волн  и     
одинаковой интенсивности. Если начальные фазы источников S1 и S 2 одинаковы, то в центр картины (точка O ) лучи с длинами волн  и  придут в
одинаковых фазах и для обеих волн выполнится условие максимума. В другой точке экрана A , в которой разность хода   m ( m - целое число или
порядок интерференции), для длины волны  также будет максимум. Если
при этом    m  1/ 2   , то в ту же точку A интерферирующие лучи с другой длиной волны  придут уже в противоположных фазах, и для длины
волны  наблюдается минимум. При этом условии в окрестности точки A
светлые полосы с длиной волны      наложатся на темные полосы с
длиной волны  . И в итоге интерференционные полосы в указанной окрестности просто исчезнут. Условие исчезновения полос, таким образом, есть
m   m  1/ 2   , или
m



.
2      2
(7.7)
Пусть теперь свет от источника S непрерывно и равномерно заполняет
спектральный интервал ( ,    ). В этом случае интервал  можно разбить на множество пар бесконечно узких спектральных линий, находящихся
на расстоянии  / 2 по шкале длин волн. К каждой такой паре применима
формула (7.7), если в ней сделать замену    / 2 . Поэтому исчезновение
интерференционных полос произойдет для порядка интерференции
m   /  . Отношение  к  называют степенью монохроматичности света и именно эта величина определяет максимально возможный (т.е. зрительно наблюдаемый) порядок интерференции. Максимальная разность хода лучей, при которой еще возможна интерференция, - длина когерентности
2
.

Для белого света    , т.е. максимальный порядок интерференции
m  1 . Казалось бы, что в белом свете интерференционные полосы не должны
наблюдаться. Это действительно так, если использовать такие приемники
света как, например, фотоэлементы, обладающие примерно одинаковой чувствительностью в различных участках спектра. Но глаз – селективный приемник, т.е. его чувствительность к различным длинам волн разная. Именно
поэтому в белом свете глаз может видеть около десятка интерференционных
полос. Излучение лазеров имеет длину когерентности порядка сотен метров
(и даже нескольких километров).
lког  m 
15
Длина когерентности связана с так называемым временем когерентности ког - промежутком времени, в течение которого случайные изменения
фазы световой волны в данной точке достигают значения порядка  . За это
время волна распространяется на расстояние порядка lког  cког .
Итак, для получения интерференционной картины необходимо, чтобы
оптическая разность хода складываемых колебаний была меньше длины когерентности   lког   2 /  . Это требование касается любой интерференционной схемы.
Ширина когерентности. Исчезновение интерференционной картины
связано не только с нарушением временнóй когерентности. Любой реальный
источник света имеет конечный угловой размер  , под которым он виден из
места нахождения щелей, образующих интерферирующие волны. Чтобы выяснить роль этих угловых размеров, рассмотрим на примере опыта Юнга
другой крайний случай: излучение монохроматическое, но исходная щель S ,
после которой формируется интерферирующие волны, не узкая.
M 
O

O
O
S
/2
S1
x
d
/2
M
S2
x
l
M
Рис. 7.5
Пусть монохроматический свет от источника (щели S ) падает на две
узкие щели S1 и S 2 , за которыми находится экран (рис. 7.5). Волна, пришедшая от участка щели S вблизи точки O , создает нулевой максимум M в середине экрана. Нулевой максимум M  , созданный волной, пришедшей от
участка O , будет смещен от середины экрана на расстояние x . Нулевой же
максимум M  , созданный волной, пришедшей от участка O , смещен от середины экрана в противоположную сторону на расстояние x  x . Нулевые
максимумы от остальных участков щели S располагаются между максимумами M  и M  . Если смещения x и x будут приблизительно равны ширине
интерференционных полос x , полученных от бесконечно узкой щели S , то
максимумы от одних участков практически наложатся на минимумы от других, и никакой интерференционной картины не будет. Отсюда следует, что
интерференционная картина будет различимой при условии x  x . Из рис.
16
7.3 находим x  l / 2 , а значение x было найдено нами ранее x  l / d .
Таким образом, наибольшее расстояние между щелями, при котором еще
можно наблюдать интерференцию от источника с угловым размером  составляет d   /  (мы опустили множитель 2).
Итак, при расширении щели S интерференционная картина постепенно
размывается и при некоторой ширине щели практически исчезает вследствие
того, что вторичные источники – щели S1 и S 2 становятся некогерентными.
Это позволяет говорить о ширине когерентности hког световой волны, падающей на щели S1 и S 2 . Величина hког представляет собой расстояние, при
смещении на которое вдоль волновой поверхности, отдельные участки волны
в достаточной степени когерентны между собой. Можно сказать и иначе –
при смещении на данное расстояние вдоль волновой поверхности случайные
изменения фазы не превосходят  . Значение hког находится как
hког   /  ,
(7.8)
где  - угловая ширина источника относительно интересующего нас места
волновой поверхности (в опыте Юнга – относительно места расположения
двух щелей).
Если в качестве источника использовать непосредственно Солнце (его
угловой размер   0,01рад и   0,5 мкм), то ширина когерентности, согласно (7.8), hког  0,05 мм. Для получения интерференционной картины от двух
щелей с помощью такого излучения расстояние между двумя щелями должно
быть меньше 0,05 мм, что сделать практически невозможно. Именно поэтому
в опыте Юнга в качестве источника света использовалась узкая щель.
Общие выводы. Для получения устойчивой интерференционной картины с использованием обычных (не лазерных) источников света необходимо исходную световую волну расщепить подходящим способом на две части,
которые затем в области перекрытия и дадут систему полос, но только при
соблюдении условий:
1) оптическая разность хода  складываемых колебаний должна быть меньше длины когерентности lког
2) расстояние между характерными лучами в месте расщепления исходной
световой волны (в опыте Юнга - расстояние между щелями) должно быть
меньше ширины когерентности hког .
Выполнение этих условий гарантирует получение достаточно контрастной интерференционной картины.
17
7.1.5. Интерференция в тонких пленках
Данный вид интерференции является одним из наиболее часто наблюдаемых способов, в котором когерентные волны получаются путем расщепления первичной волны при отражении от двух границ прозрачных диэлектриков.
Плоскопараллельные пластинки. Пусть на прозрачную плоскопараллельную пластинку падает плоская монохроматическая волна, направление
распространения которой показано падающим лучом на рис. 7.6. В результате отражений от обеих поверхностей пластинки
1
2
D

исходная волна расщепится на две (показано лу
чами 1 и 2). Амплитуды этих волн мало отличаC
A
ются друг от друга – это важно для получения
b
достаточно контрастной картины интерференции.
n

Оптическая разность хода волн 1 и 2:
  n  AB  BC   AD , где n - показатель преломB
ления пластинки. Кроме того, из рис. 7.6 видно,
Рис. 7.6
что AB  BC  2b / cos  и AD  2btg  sin  , где
b - толщина пластинки. С учетом этих соотношений имеем   2nb cos  .
Следует также учесть, что при отражении от верхней поверхности пластинки
происходит скачок фазы на  , что эквивалентно дополнительной разности
хода  / 2 . Если же еще учесть закон преломления sin   n sin  , то окончательно находим   2b n2  sin 2    / 2 (здесь можно было написать и
 / 2 , но это не существенно).
Для обеспечения когерентности отраженных волн толщина пластинки
должна быть порядка нескольких длин волн. В этом случае максимумы отражения будут наблюдаться при условии
F

Рис. 7.7
2b n2  sin 2    / 2  m ,
(7.9)
где m - целое число (порядок интерференции).
Итак, при падении плоской световой волны на плоскопараллельную тонкую пластинку интенсивность отраженного света зависит от угла падения. Изменяя этот угол, мы будем наблюдать
чередование максимумов и минимумов
отраженного света. Это можно использовать для получения интерференцион-
18
ной картины в виде привычной системы полос. Для этого достаточно использовать в качестве падающего рассеянный монохроматический свет (он содержит волны, падающие на пластинку под разными углами), а на пути отраженного света поставить линзу и в ее фокальной плоскости экран (рис.
7.7). Максимумы на экране будут располагаться в местах, соответствующих
условию (7.9). Так как полосы будут образованы лучами, падающими на пластинку под одинаковыми углами, то они называются полосами равного наклона и имеют вид концентрических колец. При падении немонохроматического света полосы будут окрашены. Кроме того, так как экран помещают в
фокальной плоскости линзы, т.е. так, как его располагают для получения
изображения бесконечно удаленных предметов, то говорят, что полосы равного наклона локализованы в бесконечности. Роль линзы и экрана может играть хрусталик и сетчатка глаза при его аккомодации на бесконечность.
Клиновидные пластинки. Пусть стеклянная пластинка имеет форму
клина с малым углом раствора   1. При падении плоской световой волны
отраженные от поверхностей клина волны будут распространяться не в одном направлении (рис. 7.8), а под некоторым углом. Это приводит к тому, что
интерференционная картина будет локализована вблизи поверхности клина. Так как разность хода лучей, отраженных от различных
участков клина, неодинакова, то в области локализации появятся светлые и темные полосы,

параллельные ребру клина. Каждая из таких
полос возникает в результате отражений от
участков клина с одинаковой толщиной, поРис. 7.8
этому их называют полосами равной толщины. Локализованные вблизи поверхности клина интерференционные полосы
можно наблюдать непосредственно глазом, фокусируя его на поверхность
клина, либо с помощью линзы, сфокусированной также на поверхности клина.
Кольца Ньютона. Это кольцевые полосы равной толщины, наблюдаемые при отражении света от поверхностей зазора между стеклянной пластинкой и соприкасающейся с ней плосковыпуклой линзой (рис. 7.9). Волна,
отраженная от верхней плоской поверхности линзы для обычных источников
(не лазеров), некогерентна с волнами, отраженными от поверхностей тонкого
зазора, и участия в образовании интерференционной картины не принимает.
Поэтому следует учитывать только волны, отраженные от поверхностей воздушного зазора. В этом случае при нормальном падении света в отраженных
19
лучах будут наблюдаться светлые и темные кольца с центром в точке соприкосновения линзы с пластинкой.
Условия усиления или ослабления света
определяются оптической разностью хода лучей 1 и 2, которая, в свою очередь, зависит от
толщины зазора h (рис. 7.9). Из геометричеR
ских соображений следует

r2  r2
h  R  R  r  R  R 1  2  
,
2
R
2
R
r


h
где r - радиус какого-либо кольца (при этом
мы явно воспользовались тем, что r  R ).
Если мы говорим о темном кольце, то для его
Рис. 7.9
образования должно быть выполнено условие
 
1
2h    k   ,  k  0,1,2... ,
2 
2
где дополнительное слагаемое  / 2 в левой части обусловлено «потерей»
полуволны при отражении от пластинки. Из последних соотношений находим радиус k - го темного кольца
2
rk  k R ,
2
 k  0,1,2... .
Аналогичный расчет дает для радиуса k - го светлого кольца в отраженном свете значение
1

rk   k   R .
2

Нетрудно сообразить, что в проходящем свете темные и светлые кольца поменяются местами. Другие варианты формирования колец Ньютона
рассмотрены в [1].1
Просветление оптики. При прохождении света через каждую преломляющую поверхность линзы отражается примерно 4% падающего света. Это
довольно немного. Но в сложных объективах, состоящих из большого числа
линз, суммарная потеря светового потока оказывается весьма ощутимой (например, в призменном бинокле она составляет свыше 50%!). С целью
уменьшения этих потерь и применяется просветление оптики, суть которого
заключается в том, что поверхности стеклянных линз покрывают тонкой
пленкой из прозрачного диэлектрика. Определим параметры пленки, которые
1
Паршаков А.Н. Принципы и практика решения задач по общей физике.
Часть 3. Оптика. Квантовая физика. Пермь. Изд-во ПНИПУ, 2011.
20
обеспечивают минимальную отражательную способность стекла в направлении нормали к пленке.
Найдем вначале показатель преломления пленки,

E

E
2
1
E
при котором амплитуды волн, отраженных от обеих поверхностей пленки при нормальном падении света, были
h

n
бы одинаковыми (рис. 7.10). Для этого обратимся к формуле (7.4)
n n
n
E  E 1 2 ,
n1  n2
и запишем ее для волны, отраженной от границы воздуха
1  n
( n  1 ) с пленкой ( n  n ): E1  E
, и для волны, от1  n
раженной от границы пленка – стекло (его показатель преломления n ):
n  n
E2  E
.
n  n
Пренебрегая многократными отражениями света, будем считать, что
амплитуды волн, падающих на обе границы одинаковы. Тогда из равенства
E1  E2 следует
1  n n  n

 n  n  1,22 .
1  n n  n
Таких твердых веществ со столь малым показателем преломления не
существует. Данная трудность может быть преодолена путем применения
двухслойных покрытий. Сначала просветляемая поверхность стекла покрывается пленкой, показатель преломления которой значительно больше показателя преломления стекла, а затем пленкой с меньшим показателем преломления.
Определим теперь толщину однородной пленки, при которой отраженные лучи будут находиться в противофазе, что и обеспечит гашение колебаний. Это произойдет, если оптическая разность хода двух отраженных волн
на выходе из пленки будет равна полуцелому числу длин волн в вакууме
1

2hn   m     m  0,1,2,3... .
2

Здесь мы учли, что обе волны отражаются от оптически более плотной среды
и, значит, обе испытывают скачок фазы на  («потеря» полволны). Отсюда
находим
 m  1 / 2  .
h
2 n
Наименьшая толщина пленки будет при m  0 и составит
Рис. 7.10
21
hmin 

.
4 n
Это соотношение показывает, что толщина пленки зависит от длины
волны падающего света. Поэтому обычно просветление оптики проводят для
средней (желто-зеленой) области видимого спектра, с которой поступает
наибольшая энергия. Для краев же спектра белого света коэффициент отражения заметно отличается от нуля, поэтому объективы в отраженном свете
кажутся пурпурными, что соответствует смешению красного и фиолетового
оттенков цветов. Кроме того, у обычного света длина когерентности невелика, поэтому пленка должна иметь толщину порядка нескольких длин волн.
7.1.6. Интерферометр Майкельсона
Этот интерферометр сыграл фундаментальную роль в развитии науки и
техники. С его помощью впервые была измерена длина световой волны, проведено изучение тонкой структуры спектральных линий, выполнено первое
прямое сравнение эталонного метра с определенной длиной волны света.
Упрощенная схема интерфеЗ1
рометра Майкельсона приведена на
рис. 7.11. Монохроматический свет
1
Т
от источника S падает на раздели1
тельную пластинку P , которая соЗ2
стоит из двух одинаковых склеен2
2
ных плоскопараллельных стеклянP
ных пластинок. Одна из склеиваеS
мых поверхностей покрыта полуРис. 7.11
прозрачным тонким слоем серебра
или алюминия. Пластинка P разделяет падающий на нее световой пучок на
два взаимно перпендикулярных пучка 1 и 2 одинаковой интенсивности, которые после отражения от зеркал З1 и З2, расположенных в разных «плечах»
интерферометра, затем снова встречаются и создают интерференционную
картину в фокальной плоскости объектива зрительной трубы T .
Зеркало З1 неподвижно, а зеркало З2 можно перемещать и изменять его
наклон. Вид интерференционной картины зависит от юстировки зеркал и от
расходимости пучка света, падающего на пластинку P . Если пучок слегка
расходящийся, а плоскости З2 и З1 строго перпендикулярны, то получаются
полосы равного наклона, имеющие вид концентрических колец. Если же пучок от источника S параллельный, а плоскости З2 и З1 составляют угол, слегка отличающийся от 900, то в поле зрения трубы будут наблюдаться полосы
равной толщины.
22
Особое значение имеет знаменитый опыт Майкельсона-Морли, доказавший отсутствие «мирового эфира», т.е. среды, которая могла бы служить
абсолютной системой отсчета. В соответствии с этим Эйнштейн распространил механический принцип относительности Галилея на все без исключения
физические явления. Кроме того Эйнштейном было постулировано, что скорость света в вакууме одинакова во всех инерциальных системах отсчета и не
зависит от движения источников и приемников света.
7.1.7. Многолучевая интерференция
До сих пор мы рассматривали интерференцию двух волн – так называемую двухлучевую интерференцию. Исследуем теперь случай, когда интерферирует много световых лучей.
Пусть в данную точку экрана приходит N когерентных лучей одинаковой интенсивности, причем фаза каждого следующего луча сдвинута относительно фазы предыдущего на одну и ту же величину  . В этом случае результирующее колебание (поле вектора E ) можно представить как
N
E   a cos t   n  1   ,
n1
где a - амплитуда каждого колебания,  - частота.
Вычисление подобных сумм можно провести двумя путями. Воспользуемся вначале векторным способом представления гармонического колебания. Напомним, что такое колебание отображается вектором длиной a , вращающимся с угловой скоростью  против чаN векторов длиной a
совой стрелки. Направление вектора образует
с осью x угол, равный начальной фазе колебания  .
В нашем случае векторную диаграмму
N
можно отобразить в виде ломаной линии, соC
стоящей из звеньев одинаковой длины, причем каждое звено образует угол  с предыду
щим звеном (рис.7.12). Очевидно, результат

сложения имеет вид E  A cos  t    , где A 
A

амплитуда результирующего колебания,  O
a
Рис. 7.12
его фазовый сдвиг относительно первой компоненты a cos t . Из рис. 7.12 следует
A
2  N 
N
 OC  sin   OC  sin
 OC  sin
.
2
2
2
23
Кроме того
a

 OC  sin . Из этих соотношений находим результирующую
2
2
амплитуду
N

(7.10)
/ sin .
2
2
Величина фазового сдвига  , как видно из рис.7.12, определяется как

  

          , где 2  2  N  . Отсюда находим    N  1 . Таким
2
 2 2  2

образом, результирующее колебание запишется в виде
N



E  a sin
/ sin cos t   N  1  .
2
2
2

Заметим, что этот же результат можно получить, представив косинусы
в соответствии с формулой Эйлера ( exp  ix   cos x  i sin x ) в виде комплексA  a sin
ных экспонент и вычислив сумму ряда как сумму геометрической прогрессии
N


E   a exp i t   n  1    a  eit 1  ei  ...  e 

n 1
 aeit
iN 
1 e
 aeit
i
1 e
iN 
iN 

2
e (e 2
i
i

2
e (e 2
i N 1 
iN 
e 2 )
i
e2 )


.
Выражения, стоящие в скобках в числителе и знаменателе, как нетрудно убеN

диться, равны соответственно 2sin
и 2sin . Поэтому
2
2

N

 N  1    .
 
E  a(sin
/ sin )exp i t 

2
2
2





Если теперь взять вещественную часть от E , то получаем прежний результат.
Для нас главным в проведенном анализе является выражение для амплитуды (7.10), так как ее квадрат определяет интенсивность результирующего колебания. Таким образом, интенсивность, возникающая при интерференции N когерентных лучей, определяется выражением
sin 2  N  / 2 
I    I0
,
sin 2   / 2 
где I 0 - интенсивность, создаваемая каждым из лучей в отдельности.
(7.11)
При значениях   2m  m  0,1,2... выражение (7.11) становится не-
определенным. Раскрывая его по правилу Лопиталя, получаем, что при
24
  2m результирующая интенсивность оказывается равной I  I 0  N 2 . Такой результат можно было предвидеть заранее. Действительно, в точки, для
которых   2m , все колебания приходят в одинаковой фазе. Следовательно, результирующая амплитуда оказывается в N раз больше амплитуды от-
дельного колебания, а интенсивность больше в N 2 раз.
Точки экрана, в которых   2m , называются главными максимумами, а m - их порядком. Из выражения (7.12) следует, что в промежутке между
двумя соседними главными максимумами располагается N  1 минимум интенсивности, между которыми располагаются N  2 вторичных максимумов.
Однако их интенсивность гораздо меньше интенсивности главных максимумов.
I / I0

0
2
Рис. 7.13
На рис. 7.13 изображен график функции I    для N  10 . Для сравнения пунктиром показан график интенсивности для N  2 . Видно, что с увеличением числа интерферирующих лучей главные максимумы делаются все
более узкими и резкими. Вторичные максимумы настолько слабы, что практически интерференционная картина имеет
вид узких ярких линий на темном фоне.
Практически многолучевая интерференция реализуется в интерферометре
F
Фабри-Перо, который широко используется в спектроскопии высокого разрешения, метрологии и в качестве открытого
резонатора лазеров. Интерферометр Фабри-Перо делают в виде плоскопараллельРис. 7.14
ной стеклянной или кварцевой пластины,
25
на обе поверхности которой нанесены отражающие слои, либо в виде двух
пластин, у которых покрытые отражающим слоем поверхности устанавливаются строго параллельно друг другу и разделены воздушным промежутком.
Многократное отражение света от двух параллельных плоскостей приводит к
образованию интерференционных полос равного наклона, локализованных в
бесконечности или в фокальной плоскости объектива (рис. 7.14). Полосы
имеют вид резких светлых концентрических колец с центром в фокусе объектива F .
7.2. Дифракция света
7.2.1. Принцип Гюйгенса-Френеля
Дифракцией называется совокупность явлений, наблюдаемых при распространении света в среде с резкими неоднородностями и связанных с отклонениями от законов геометрической оптики. Между интерференцией и
дифракцией нет существенного физического различия. Оба явления связаны
с перераспределением светового потока в пространстве в результате суперпозиции волн. В то же время по историческим причинам перераспределение
светового потока в результате суперпозиции волн, возбуждаемых конечным
числом когерентных источников, принято называть интерференцией. Если
же когерентные источники расположены непрерывно, то это перераспределение называют дифракцией.
Различают два вида дифракции. Если источник света и точка наблюдения расположены от препятствия, на котором происходит дифракция, настолько далеко, что лучи образуют параллельные пучки, то это дифракция в
параллельных лучах или дифракция Фраунгофера. В противном случае говорят о дифракции Френеля. Характер дифракции зависит от безразмерного параметра
h2
,
l
где h - некоторый характерный размер отверстия или щели, на котором происходит дифракция, l - расстояние от препятствия до экрана,  - длина волны.
Если этот параметр много меньше единицы, то мы имеем дело с дифракцией
Фраунгофера, если он порядка единицы, то это дифракция Френеля. Если же
этот параметр много больше единицы, то оказывается применимым приближение геометрической оптики.
Вообще говоря, для описания дифракционных явлений не требуется
вводить никаких новых принципов. Данная задача сводится к нахождению
решения уравнений Максвелла при определенных граничных условиях. Однако такой подход представляет большие математические трудности. Поэтоp
26
му во многих случаях, имеющих большой практический интерес, оказывается вполне достаточным приближенный метод решения задачи о распределении светового потока, основанный на принципе Гюйгенса-Френеля. Согласно
этому принципу каждый элемент dS волновой
n
поверхности S (рис. 7.15) служит источником

вторичной сферической волны, амплитуда коr
торой пропорциональна величине элемента dS
dS
P и убывает с расстоянием r от источника до
точки наблюдения по закону 1 / r . Таким обраS
зом, колебание в любой точке P , вызванное
элементом dS , можно записать в виде
a
Рис. 7.15
dE  0 K   cos  t  kr  dS .
r
Здесь множитель a0 определяется амплитудой светового колебания в месте
нахождения элемента dS , k  2 /  - волновое число,  - частота колебания.
Коэффициент K    зависит от угла  между нормалью к элементу dS и направлением от элемента dS на точку P . При   0 этот коэффициент максимален, при    / 2 обращается в нуль. Многие практически важные дифракционные задачи можно решить, не уточняя конкретного вида зависимости K    .
Результирующее колебание в точке наблюдения P представляет собой
суперпозицию колебаний dE от всех элементов dS , расположенных на поверхности S
a
(7.12)
E   0 K    cos  t  kr  dS .
r
S
Это выражение и дает математическую формулировку принципа ГюйгенсаФренеля. В то же время вычисления по формуле (7.12) в общем случае представляют собой весьма трудную задачу. Однако в случаях, обладающих определенной симметрией, нахождение амплитуды результирующего колебания может быть сведено к алгебраическому или графическому сложению
(последнее особенно наглядно).
7.2.2. Метод зон Френеля
В качестве примера применения принципа Гюйгенса-Френеля рассчитаем воздействие сферического фронта волны от точечного источника света
S на некоторую точку P . Для этой цели Френель разработал особый метод –
метод зон Френеля. Суть его в следующем. Так как волновая поверхность от
точечного источника света является сферической и симметрична относитель-
27
но прямой SP , поэтому целесообразно разбить ее мысленно на кольцевые
зоны с центром на прямой SP (рис. 7.16). Данные зоны выберем так, чтобы
разность расстояний от краев каждой
зоны до точки P была равна  / 2 . Эти
b  2 / 2
b   / 2 кольцевые полоски называются зонами
Френеля.
SO  a
Найдем внешний радиус m - ой зоO
P
ны Френеля rm . Из треугольника ASB на
1 зона
S
2 зона
3 зона
рис. 7.17 находим rm 2  a 2   a  ha  .
2
OP  b
Так как обычно ha  a , то
rm 2
.
rm  2aha  ha 
2a
Совершенно аналогично из треугольника ABP на рис. 7.17 находим
Рис. 7.16
2
2
rm
A
a
C
S
hb
rm
2
2
m  
m
rm 2


 b 

b


h

2
bh

h

b
b
b
 
2  
2
2b


(при этом мы пренебрегли величинами m и
b  m / 2 hb по сравнению с расстоянием до экрана b .
O
B
Рис. 7.17
ha
b
P
Кроме того, сумма величин ha и hb , как следует из рис.7.17, должна быть равна m / 2 :
ha  hb  m / 2 .
Подставляя сюда найденные значения ha и
hb , находим внешний радиус m - ой зоны
Френеля
rm 
ab
m .
ab
(7.13)
(при падении на отверстие плоской волны ( a   ) rm  bm ).
Площади зон Френеля (при достаточно малых m ) Sm  rm2  rm21 , что
с учетом (7.13) составляет S  ab /  a  b  , т.е. не зависят от номера зоны.
Найдем теперь амплитуду A суммарного колебания от всего фронта
сферической волны. Фазы колебаний (по определению зон Френеля) от соседних зон отличаются на  , поэтому нам придется просуммировать ряд
(7.14)
A  A1  A2  A3  A4  ... ,
где Am - амплитуда колебаний от m -ой зоны Френеля. И хотя площади зон
Френеля практически одинаковы, но амплитуды монотонно и слабо убывают
из-за увеличения расстояния до точки P и увеличения угла между нормалью
28
к зоне и направлением на точку P , поэтому ряд (7.14) является сходящимся.
Представим его в виде
A A
A  A
A 
A  1   1  A2  3    3  A4  5   ...
2  2
2   2
2 
В силу монотонности убывания амплитуд можно считать приближенно
Am   Am1  Am1  / 2 и тогда каждая скобка обращается в нуль, поэтому
A  A1 / 2 .
(7.15)
Данный результат означает, что амплитуда колебаний от всего фронта
сферической волны равна половине амплитуды от первой зоны Френеля!
Оценим ее радиус. Пусть a  b  1м и   0,5 мкм. Тогда из (7.13) имеем
r1  0,5 мм. Это означает что воздействие точечного источника света на некоторую точку пространства осуществляется в пределах очень узкого конуса.
Это дает нам основание считать, что свет распространяется практически
прямолинейно.
A1
A123
A
A12
а)
б)
в)
г)
Рис. 7.18
Результат (7.15) можно получить очень просто и наглядно графическим
методом сложения амплитуд. Для этого разобьем фронт волны на бесконечно
узкие кольцевые зоны с амплитудой колебаний dA . Вследствие увеличения
расстояния до точки P и угла между нормалью и направлением на точку P
амплитуда колебаний от каждой последующей кольцевой полоски будет
убывать по модулю и отставать по фазе от колебаний, создаваемых предыдущей полоской. Изобразив отставание по фазе поворотом каждого вектора
dA против часовой стрелки на небольшой угол, получим цепочку векторов,
векторная сумма которых и есть амплитуда колебаний в точке P . На рис.
7.18,а показан результат действия 1-й зоны Френеля (вектор A1 ). Продолжая
построение, получаем для амплитуды колебаний от первых двух зон Френеля
вектор A12 (рис. 7.18,б), трех зон – вектор A123 (рис. 7.18,в) и т.д. Если бы амплитуды dA были одинаковы, то отображенная здесь спираль (спираль Френеля) превратилась бы в окружность. Очевидно, действие всего сферического
29
фронта волны отображается вектором A (рис. 7.18,г), составляющим половину от A1 . Интенсивность же колебаний от всего фронта волны в четыре
раза меньше интенсивности колебаний от первой зоны Френеля.
Если на пути световой волны поставит преграду, открывающую только
нечетные зоны Френеля, то векторы-амплитуды от этих зон, имея одинаковое
направление, дадут при сложении вектор, превосходящий во много раз по
модулю векторы A (от всей волновой поверхности) и A1 (от первой зоны
Френеля). Такую систему называют зонной пластинкой (точнее амплитудной
зонной пластинкой). Ее можно изготовить, начертив на листе бумаги темные
кольца, а затем сфотографировать их в уменьшенном масштабе. Внутренние
радиусы колец должны быть пропорциональны квадратным корням из последовательных нечетных чисел, а внешние – из четных. Тогда получится
пластинка, центр которой светлый. Можно изготовить аналогичную пластинку с темным центром. Ширина всех колец должна быть велика по сравнению
с длиной волны. Тогда при надлежащих размерах колец пластинка со светлым центром будет удалять из волнового фронта все четные, а пластинка с
темным центром – все нечетные зоны Френеля.
Более того, интенсивность света в точке наблюдения можно еще увеличить в четыре раза, если изменить на  фазы вторичных волн, исходящих
от всех зон Френеля с четными (или нечетными) номерами – так называемая
фазовая зонная пластинка. Ее можно изготовить путем травления поверхность стеклянной пластинки, если глубина зон травления будет удовлетворять условию h(n  1)   2m  1  m  0,1,2...
Усиление интенсивности света зонной пластинкой аналогично фокусирующему действию обычной линзы. Более того, расстояния от пластинки до
источника - a и «изображения» - b , как нетрудно показать, связаны тем же
соотношением, что и соответствующие величины для линзы.
Более подробно о зонных пластинках см. в [1].
7.2.3. Дифракция Френеля от простейших преград
Дифракция от круглого отверстия. Пусть на пути сферической световой волны находится непрозрачный экран с круглым отверстием малого радиуса R (рис. 7.19,а). Если расстояния от источника света S до отверстия a и
от точки наблюдения P до отверстия b удовлетворяют соотношению
ab
m ,
ab
где m - целое число, то отверстие оставит открытыми ровно m первых зон
Френеля, построенных для точки P .
R
30
r
R
a
S
преграда
а)
b
I
r
I
P
экран
m-нечетное
б)
m-четное
в)
Рис. 7.19
Следовательно, число открытых зон Френеля определяется как
R2  1 1 
m
  .
 a b
Тогда амплитуда колебаний в точке P будет равна A  A1  A2  A3  ...  Am ,
где знак плюс перед Am соответствует нечетному m , а знак минус – четному
m . Данный ряд, как это было проделано ранее, нетрудно привести к виду
 A1 / 2  Am / 2, m  нечетное,
A
 A1 / 2  Am / 2, m  четное.
Для малых m амплитуда Am мало отличается от A1 . Следовательно,
при нечетном числе зон Френеля амплитуда в точке P будет приближенно
равна A1 , а при четном числе зон Френеля – нулю. Таким образом, преграда с
отверстием, открывающим небольшое нечетное число зон, не только не ослабляет освещенность в точке P , но, напротив, приводит к увеличению амплитуды почти в два раза, а интенсивности – в четыре раза! Разумеется, ни о
каком нарушении закона сохранения энергии не идет и речи. Значит, где-то
интенсивность будет ослаблена. Радиальное распределение интенсивности по
экрану представлено на рис. 7.19 б,в. Дифракционная картина от небольшого
круглого отверстия имеет вид чередующихся светлых и темных концентрических колец, причем центр картины может быть как светлым, так и темным.
Если отверстие открывает большое число зон Френеля, то чередование темных и светлых колец наблюдается лишь в очень узкой области на границе
геометрической тени; внутри этой области освещенность оказывается практически одинаковой.
Дифракция от круглого диска. Поставим теперь на пути сферической
волны небольшой непрозрачный круглый диск радиуса R (рис. 7.20,а).
31
r
S
a
R
b
I
P
а)
б)
Рис. 7.20
Так как диск закрывает только m первых зон Френеля, то амплитуда
колебаний в точке P будет равна
A  Am1  Am2  Am3  ...  Am1 / 2 .
При небольшом числе закрытых зон Френеля амплитуда Am1 мало отличается от A1 . Поэтому интенсивность в точке P будет почти такая же, как
и при отсутствии преграды! Радиальное распределение интенсивности по экрану представлено на рис. 7.20,б. Дифракционная картина от непрозрачного
круглого диска имеет вид чередующихся светлых и темных колец, причем в
центре картины всегда светлое пятно. Если диск закрывает много зон Френеля, то чередование светлых и темных колец наблюдается только в узкой области на границе геометрической тени. Светлое пятнышко в центре тени, отбрасываемой диском, было названо «пятном Пуассона».
Дифракция от края полуплоскости. Рассмотрим для простоты падение
плоской световой волны на непрозрачную полуплоскость с прямолинейным
краем (рис. 7.21,а).
Теперь симметрия задачи предписывает разбивать открытую часть
волновой поверхности на зоны в виде прямолинейных полосок, параллельных краю непрозрачной полуплоскости. Очевидно, дифракционная картина
на экране должна иметь вид темных и светлых прямолинейных полос. Полный расчет этой картины был проведен Френелем и выражен в виде так называемых интегралов Френеля. Распределение интенсивности вдоль экрана
представлено на рис. 7.21,б. На границе геометрической тени интенсивность
составляет только четверть от интенсивности I 0 при отсутствии непрозрачной полуплоскости. Это нетрудно понять, если учесть, что амплитуда колебаний в точке O в силу симметрии равна ровно половине амплитуды от всего фронта волны. Чередование интенсивности наблюдается только в узкой
32
области вблизи границы геометрической тени; при достаточном удалении от
нее влево интенсивность падает до нуля, при удалении вправо – выходит на
постоянный уровень I 0 .
m-зона Френеля
I
I0
x
0
I0 / 4
x
0
P
Рис. 7.21
7.2.4. Дифракция Фраунгофера на щели.
Фраунгофер предложил иной способ наблюдения дифракции, получивший значительно большее практическое применение в оптике, поскольку
приводит к более простым закономерностям. В этом способе на дифракционный объект (отверстие, щель и др.) направляют параллельный пучок света
(плоскую волну) и дифракционную картину наблюдают на достаточно большом расстоянии, т.е. практически в параллельных лучах. Это и есть дифракция Фраунгофера или дифракция в параллельных лучах. Практически дифракцию Фраунгофера наблюдают с помощью схемы, представленной на
рис. 7.22. Точечный источник света S
располагают в фокусе F линза L1 . Из
Э
L
L
1
N
2
F
f
Рис. 7.22
линзы выходит параллельный пучок
лучей, на пути которого находится некоторая преграда N с тем или иным
отверстием. Диафрагированные лучи
проходят линзу L2 и падают на экран
Э , расположенный в фокальной плоскости линзы L2 , т.е. на фокусном рас-
стоянии f . Таким образом, в каждую точку экрана падают только те лучи,
которые до линзы L2 были параллельны друг другу.
33
Рассмотрим для иллюстрации задачу о распределении интенсивности
плоской световой волны при дифракции Фраунгофера от узкой щели шириной b (рис. 7.23). Поместим за щелью собирающую линзу, а в ее фокальной
плоскости – экран. Разобьем мыслен
но открытую часть волновой поверхdS
ности на параллельные краям щели
b
бесконечно узкие одинаковые по ши

рине зоны-полоски площадью dS (если эти зоны-полоски имеют конечную
ширину и такую, что разность рас
стояний от их краев до точки P равна
 / 2 , то они называются зонами Френеля). Вторичные волны, посылаемые
этими зонами в направлении, опредеP
F
ляемом углом  , создадут на экране
Рис. 7.23
колебания с одинаковой амплитудой
dA , так как линза собирает в фокальной плоскости плоские (а не сферические) волны.
A0
A
2A0

dA
а)
б)
A1 
2 A0
3
A0
в)
г)
Рис. 7.24
Проведем суммирование вторичных волн с помощью векторной диаграммы. Каждое колебание, приходящее от зоны-полоски имеет одинаковую
34
амплитуду dA , но эти колебания от соседних зон имеют одинаковый небольшой сдвиг фазы  , обусловленный разностью расстояний от краев зоны
до точки P и зависящий от угла дифракции  . Таким образом, нам необходимо сложить графически цепочку векторов dA , одинаковых по модулю и
повернутых относительно друг друга на один и тот же угол  .
При   0 (т.е. в центре экрана) разность фаз всех соседних векторов
  0 (напомним, что линза – система таутохронная). В этом случае векторная диаграмма имеет вид, показанный на рис. 7.24,а. Амплитуда результирующего колебания A0 равна сумме амплитуд dA складываемых колебаний
– это нулевой максимум. Если угол  таков, что разность хода лучей, приходящих от краев щели,   b sin    / 2 , то полный сдвиг фазы первого и последнего колебаний, приходящих от краев щели, равен  (колебания находятся в противофазе). Соответственно векторы dA располагаются вдоль полуокружности длиной A0 (сумма их моделей не может измениться!). Это отображено на рис. 7.24,б. Следовательно, результирующая амплитуда равна
2 A0 /  , что меньше амплитуды при   0 . Увеличим еще угол  до значения, при котором разность фаз колебаний от краев щели станет равной 2 . В
этом случае разность хода   b sin    и векторы dA расположатся вдоль
окружности (рис. 7.24,в). Результирующая амплитуда станет равной нулю –
первый минимум. Затем при дальнейшем увеличении угла  , при котором
b sin   3 / 2 , колебания от краев щели станут отличаться по фазе на 3 .
При этом сумма векторов dA обойдет полтора раза окружность диаметра
A1   2 / 3 A0 (рис. 7.24,г). Диаметр этой окружности и есть амплитуда первого максимума, следующего за нулевым (центральным).
Если интенсивность центрального максимума принять за I 0 , то интенсивность первого максимума I1   2 / 3  I 0  0,045I 0 . Аналогично можно
2
найти и относительную интенсивность остальных максимумов. В итоге получается следующее соотношение:
2
 2   2 
I 0 : I1 : I 2 : I 3 :...  1:   :  
 3   5 
 1: 0,045 : 0,016 : 0,008 :...
2
2
 2 
:   :... 
 7 
35
I
I0
3

b
2

b


b
0

b
2
b
3
b
sin 
Рис. 7.25
Соответствующая картина распределения интенсивности света в зависимости от sin  представлена на рис. 7.25. Обратим внимание на то, что
центральный максимум значительно превосходит по интенсивности остальные максимумы и в нем сосредоточивается основная доля светового потока,
проходящего через щель.
Кроме того, мы нашли угловое положение, как максимумов, так и минимумов интенсивности. Условие
b sin   k   k  1,2,3...
(7.16)
определяет угловое положение минимумов (при k  0 всегда наблюдается
максимум), а условие
1

b sin     k     k  1,2,3...
2

определяет положение максимумов при дифракции Фраунгофера на щели
шириной b . Данные условия нетрудно получить и, не обращаясь к векторной
диаграмме сложения колебаний, если щель разбить на зоны Френеля. Их
число, как следует из рис. 7.23, равно  /   / 2   b sin  /   / 2  . Если это
число четное  2k  , то в направлении угла  наблюдается минимум, если же
число зон Френеля нечетное (2k  1/ 2) то в направлении угла  наблюдается максимум. Знаки «  » следуют из симметрии дифракционной картины относительно нормали к щели: при знаке плюс угол   0 , а при знаке минус
угол   0 .
Обратимся к условию минимумов (7.16). Так как sin   1 , то существует максимальный порядок минимума kmax  b /  , т.е. число минимумов ограничено. И если b   , то минимумы вообще не возникают. В этом случае
36
распределение интенсивности света, падающего на экран, представлено на
рис. 7.26,а. Если же щель достаточно широка  b    , то центральная часть
экрана будет освещена практически равномерно, а в области геометрической
тени вблизи края щели формируется система узких дифракционных полос с
падением освещенности до нуля при удалении от краев щели (рис. 7.26,б).
I
I
x
а)
x
б)
Рис. 7.26
7.2.5. Дифракционная решетка
Одним из важнейших спектральных приборов является дифракционная
решетка – стеклянная или металлическая пластинка, на которую нанесено
много равноотстоящих штрихов шириной b с периодом d (постоянная решетки). Дифракционную (точнее дифракционно-интерференционную) картину наблюдают по методу Фраунгофера, т.е. в параллельных лучах, а практически – в фокальной плоскости линзы (рис. 7.27,а). Эта картина имеет вид
резко выраженных темных и светлых полос, параллельных краям решетки.


d
d
b


  d sin 

P
F
б)
а)
Рис. 7.27
Пусть плоская монохроматическая световая волна падает на решетку
нормально. Каждая из щелей в отдельности давала бы в фокальной плоскости
объектива дифракционную картину, показанную на рис. 7.25. И такие картины от всех щелей в отсутствие когерентности точно накладывались бы друг
на друга, независимо от их положения. Интенсивности при этом складывались бы, и мы получили бы при наличии N щелей дифракционную картину
как от одной щели, но усиленную в N раз. При освещении же решетки коге-
37
рентным светом, световые волны от всех щелей интерферируют друг с другом, и дифракционная картина резко изменяется.
В середину дифракционной картина когерентные колебания от всех
щелей приходят в фазе. Это значит, что если амплитуда от одной щели равна
A1 , а число щелей в решетке N , то результирующая амплитуда A  A1N и
соответствующая ей интенсивность I  I1N 2 . Такой же результат получается
и при углах дифракции k , для которых оптическая разность хода  колебаний от соседних щелей (см. рис. 7.27,б) равна целому числу длин волн
(7.17)
d sin k  k, k  0,1,2...
В направлениях, определяемых этим уравнением, возникают максимумы, интенсивность которых в N 2 раз превосходит интенсивность от каждой
щели в том же направлении. Их называют главными максимумами k -го порядка, а уравнение (7.17) – условием главных максимумов. Именно главные
максимумы и представляют особый практический интерес. Как мы увидим
далее, они получаются тем более узкими и резкими, чем больше число штрихов решетки. Количество наблюдаемых главных максимумов kmax определяется отношением периода решетки к длине волны. Так как sin   1 , то из
формулы (7.17) сразу следует kmax  d /  .
Рассчитаем теперь направление минимумов дифракции. Если в направлении какого-либо угла  выполняется условие минимума для каждой щели
(7.16), то, естественно, в данном направлении выполняется условие минимума и для всей решетки. Эти минимумы называются главными минимумами и
их положение определяется формулой
b sin   k   k  1,2,3... .
Кроме главных минимумов существуют и т.н. добавочные минимумы.
Данные минимумы возникают в тех направлениях, для которых колебания от
отдельных щелей в сумме взаимно погашаются. Это произойдет, если сумма
разности фаз между векторами колебаний от соседних щелей  будет равна
2k  ( k  - некоторое целое число):    2k  . Из рис. 7.27,б следует
2
2

d sin  . Поэтому условие добавочных минимумов можно запи

сать в виде
2
k

d
sin


2

k

d
sin


.

N
В этой формуле k  принимает все целые значения, кроме 0, N ,2 N ... ,
т.е. кроме тех, при которых оно перейдет в (7.17). Нетрудно сообразить, что

38
k  должно быть равным k   kN  m, m  1,2,3...N  1. И окончательно условие
добавочных минимумов принимает вид
m

(7.18)
d sin     k   , k  0,1,2..., m  1,2,3...N  1 .
N

Между добавочными минимумами располагаются, в свою очередь, добавочные максимумы, интенсивность которых при достаточно большом числе штрихов решетки пренебрежимо мала (< 5% от интенсивности главных
максимумов).
Дифракционные решетки бывают прозрачные и отражательные. Прозрачные решетки изготавливаются из стеклянных или кварцевых пластинок,
на поверхность которых с помощью специальной машины наносятся алмазным резцом ряд параллельных штрихов. Отражательные решетки наносятся
алмазным резцом на поверхность металлического зеркала. Свет падает на отражательную решетку наклонно под углом  . При этом решетка с периодом
d действует так, как при нормальном падении света действовала бы прозрачная решетка с периодом d cos  . Это позволяет наблюдать спектр при отражении света, например, от грампластинки или CD диска.
7.2.6. Дифракционная решетка как спектральный прибор
Из формулы (7.17), определяющей направления k на главные фраунгоферовы максимумы, видно, что эти направления зависят от длины волны
(за исключением максимума нулевого порядка k  0 ). Поэтому решетка в
каждом порядке k  0 разложит падающий на нее свет в спектр различных
порядков. Причем наибольшее отклонение в каждом порядке испытывает
красная часть спектра.
Основным характеристиками любого спектрального прибора являются
угловая дисперсия и разрешающая способность.
Угловая дисперсия D характеризует степень пространственного (углового) разделения волн с различными длинами  . По определению
d
D
.
d
Дифференцируя формулу (7.17) при данном k , получаем d cos k d   kd  ,
откуда
d
k
.
D

d  d cos k
Видно, что для заданного порядка k спектра угловая дисперсия тем
больше, чем меньше период решетки и растет с увеличением порядка спектра.
39
Разрешающая способность R характеризует пространственное разделение линий с близкими значениями длин волн. По определению

,
R

где  - наименьшая разность длин волн спектральных линий, при которой
эти линии воспринимаются еще раздельно, т.е. как говорят, разрешаются.
Согласно критерию Рэлея, спектральные линии с разными длинами
волн, но одинаковой интенсивности, считаются разрешенными, если главный
максимум одной спектральной линии совпадает с первым минимумом другой
линии (рис. 7.28). В этом случае между двумя максимумами возникает провал, составляющий около 20%

от интенсивности в максиму  
мах, что позволяет эти линии
воспринимать еще раздельно.
Угловое положение максимума
k - го порядка для длины волны
   определяется формулой
 (7.17). Угловое же положение
первого добавочного минимума
k
для длины волны  определяетРис. 7.28
ся формулой (7.18) при m  1 .
Приравнивая их углы отклонения, получаем k        k  1/ N   . Откуда
следует

 kN .

Для повышения разрешающей способности спектральных приборов
можно либо увеличивать число N когерентных пучков, либо повышать порядок интерференции k . Первое используется в дифракционных решетках
(число N доходит до 200000), второе – в интерференционных спектральных
приборах (например, в интерферометре Фабри-Перо порядок интерференции
k 106 и более).
7.2.7. Дифракция на пространственных решетках
До сих пор мы рассматривали дифракцию на одномерных решетках, в
которых периодичность наблюдается вдоль одного направления. Оказывается, что можно наблюдать дифракцию на двух- и трехмерных решетках. Естественной трехмерной (пространственной) решеткой является любой монокристалл, состоящий из упорядоченно расположенных частиц (атомов). Такую систему можно рассматривать как набор из плоских дифракционных
R
40
решеток. Однако их период (~10-10 м) слишком мал для того, чтобы можно
было наблюдать дифракцию в видимом свете, т.е. кристаллы в видимом свете
являются оптически однородными средами. Для рентгеновского же излучения кристаллы представляют естественную дифракционную решетку.
Вульфом и Брэггом было показано, что расчет дифракционной картины
от кристаллической решетки можно осуществить следующим способом.
Суммарное действие атомов, лежащих в одной кристаллической плоскости,
можно представить в виде плоской волны, отразившейся от данной плоскости по обычному закону отражения. В кристалле можно провести множество
систем атомных плоскостей в различных направлениях, однако эффективными являются только те, в которых атомы расположены наиболее плотно. Образовавшиеся вторичные волны когерентны и при интерференции все погашаются, кроме тех направлений, для которых разность хода между соседними волнами является кратной  (рис. 7.29). Показатель преломления всех
веществ для рентгеновского излучения почти
единица, поэтому разность хода двух волн, отра
зившихся зеркально от соседних кристаллических плоскостей с межплоскостным расстоянием

d
d , равна, как видно из рис. 7.29,   2d sin  , где
 - угол скольжения. При этом направления, в
d sin 
которых возникают фраунгоферовы дифракционные максимумы, определяются формулой
Рис. 7.29
Вульфа-Брэгга
2d sin   m  m  0,1,2... .
Дифракцию рентгеновских лучей можно наблюдать и на поликристаллических структурах. Дифракция рентгеновского излучения от кристаллов
применяется для исследования спектрального состава рентгеновского излучения – рентгеновская спектроскопия и для изучения структуры кристаллов
– рентгеноструктурный анализ.
7.2.8. Голография
В переводе с греческого термин голография означает «полная запись» и
представляет собой способ фиксирования на фотопластинке структуры световой волны, отраженной предметом. В отличие от обычной фотографии
здесь удается фиксировать не только амплитуду световой волны от различных участков предмета, но и фазы этих волн, что позволяет получить объемное изображение предмета.
Впервые идея голографии была предложена Д. Габором еще в 1947 г,
однако потребовалось еще 15 лет, чтобы стало возможным практическое
41
осуществление голографии. Связано это с тем, что для получения голографического изображения требуются источники света, обладающие высокой степенью пространственной и временнóй когерентности. Такими источниками
являются лазеры, которые еще не были известны во время Габора. Сама идея
голографии заключается в следующем.
При освещении или просвечивании предмета от него распространяется
рассеянная или прошедшая волна. Отделившись от предмета, волна сохраняет в дальнейшем независимое существование и несет полную информацию о
форме и прочих свойствах предмета, какая может быть получена путем освещения его световыми лучами. Попадая в глаз или объектив фотоаппарата,
эта волна образует на сетчатке или фотопластинке изображение предмета.
Если любым способом создать такую же волну, то, очевидно, она сможет вызвать в точности такие же эффекты, что и исходная волна, рассеянная предметом.
Существуют две наиболее распространенные схемы записи голографического изображения (голограммы).
зеркало
зеркало
линза
линза
делитель
лазер
лазер
линза
зеркало
объект
фотопластинка
объект
фотопластинка
а)
Рис. 7.30
б)
В схеме Лейта-Упатниекса (рис. 7.30,а) луч лазера делится специальным устройством (делителем) на два луча. Затем эти лучи с помощью линз
расширяются и после отражения от зеркал направляются на объект и фотопластинку. Обе волны (объектная и опорная), падая на фотопластинку, формируют интерференционную картину, которая фиксируется обычным способом. Схема Денисюка отличается тем, что в ней не используется делитель и
луч лазера, расширенный линзой, направляется зеркалом только на фотопластинку (рис. 7.30,б). Часть луча, прошедшая через нее, освещает объект. От-
42
раженный от объекта свет, формирует объектную волну, причем опорная и
объектная волны падают на фотопластинку с разных сторон (т.н. схема на
встречных пучках).
Интерференционная картина на голограмме не имеет ни малейшего
сходства с предметом. И, тем не менее, расположение, форма и интенсивность дифракционных пятен голограммы полностью определяются геометрической формой и физическими свойствами отражающей поверхности. Голограмма в закодированной форме содержит полную информацию об амплитудах и фазах рассеянной волны, которая достаточна для ее восстановления и
получения изображения.
В схеме Лейта-Упатниекса формируется пропускающая голограмма,
требующая для своего восстановления того же лазера и при том же его расположении, что было при записи голограммы (исключается только объект). В
схеме Денисюка записывается отражающая голограмма. Благодаря этому
изображение голограммы видно в обычном белом свете Солнца или лампы.
Кроме того, используя последовательно для записи голограммы излучение
красного, зеленого и синего лазеров, можно получить в итоге цветную голограмму, которую практически невозможно отличить от самого объекта.
Изображение предмета, даваемое голограммой, является объемным и в
некотором смысле обладает свойствами самого предмета. Например, изображение зеркала приводит к отражению от него света, изображение непрозрачного предмета формирует за ним тень и др. Кусочек голограммы дает ту же
информацию, что и вся голограмма, только менее четко и ярко, что открывает широчайшие перспективы в плане хранения информации.
7.3. Поляризация света
7.3.1. Виды поляризованного света. Закон Малюса
Излучение светящегося тела слагается из волн, испускаемых его атомами. Отдельные атомы излучают т.н. цуги волн длительностью порядка 10-8
с и протяженностью около 3 м. Погаснув, атом снова вспыхивает, забыв о
своей прежней ориентации. Более того, одновременно
вспыхивает много атомов. Плоскость колебаний каждого
цуга ориентирована случайным образом. Таким образом,
луч
в естественном свете (т.е. свете, испускаемом обычными
источниками) совершаются колебания в самых различных направлениях, перпендикулярных лучу (рис. 7.31). И
Рис. 7.31
не смотря на то, что световые волны поперечны, они
обычно не обнаруживают асимметрии относительно луча.
В то же время существуют волны, в которых направление колебаний
светового вектора E упорядочено определенным образом. Такой свет назы-
43
вают поляризованным. Если колебания вектора E происходят только в одной
плоскости (плоскость поляризации), то это плоско - (или линейно) поляризованный свет. Плоско поляризованный свет можно получить из естественного
с помощью поляризаторов, которые свободно пропускают колебания, параллельные плоскости пропускания поляризатора (плоскость поляризатора) и
полностью или частично задерживают колебания, перпендикулярные этой
плоскости. Поляризатор, задерживающий перпендикулярные к его плоскости
колебания только частично, называют несовершенным.
Если вектор E поворачивается вокруг луча, периодически изменяясь
по модулю, то это эллиптически поляризованный свет. При этом если смотреть вдоль луча, конец вектора E описывает эллипс (если эллипс вырождается в окружность, то это свет, поляризованный по кругу). Эллиптическая поляризация является наиболее общим типом поляризации, переходящим при определенных условиях в линейную и круговую поляризации. В зависимости от
направления вращения вектора E различают правую и левую эллиптическую
поляризацию. Если смотреть навстречу распространению волны и вектор E
при этом поворачивается по часовой стрелке, то это правая поляризация, в
противном случае – левая.
поляризованный
свет
естественный
свет
поляризованный
свет
Рис. 7.32
Одна из главных идей, помогающих понять распространение поляризованного света, заключается в следующем. Волну с эллиптической поляризацией всегда можно разложить на две распространяющиеся в одном направлении когерентные плоско-поляризованные волны с взаимно перпендикулярными плоскостями поляризации. Естественный же свет можно представить как наложение двух некогерентных плоско-поляризованных волн с взаимно перпендикулярными плоскостями поляризации (рис. 7.32). Справедливо
и обратное утверждение. Данное представление значительно упрощает анализ многих вопросов.
Пусть в направлении оси Z распространяется световая волна с произвольной поляризацией. Данную волну можно представить в виде двух ли-
44
нейно поляризованных волн, плоскости колебаний которых взаимно перпендикулярны
E  E0 cos  t  kz  , E  E0 cos  t  kz    .
Здесь значок относится к некоторой выделенной плоскости, проходящей
через луч, а значок  - к перпендикулярной ей плоскости, E0 и E0 - амплитуды колебаний в рассматриваемых взаимно перпендикулярных плоскостях,
 - сдвиг фазы колебаний. Если   f (t ) , то волны некогерентные и при их
сложении получаем естественный свет. Если   const , то в общем случае мы
имеем дело с эллиптически поляризованной волной. Значения E0 и E0 связаны с интенсивностью волны

I  n E 2  E 2
  12 n  E
0
2

 E0 2 ,
где n - показатель преломления среды,   0 / 0 .
Помимо плоско-поляризованного и естественного света существует и
частично-поляризованный свет, который можно представить в виде наложения двух разных по интенсивности некогерентных плоско-поляризованных
волн с взаимно перпендикулярными плоскостям поляризации. Если пропустить частично поляризованный свет через поляризатор, то при вращении поляризатора вокруг направления луча интенсивность прошедшего света изменяется в пределах от I макс до I мин , причем переход от одного значения к другому совершается дважды за период. Данный свет можно также рассматривать как смесь естественного и поляризованного света (рис. 7.33).
I макс
I мин
естественный
свет
Частично
поляризованный свет
поляризованный
свет
Рис. 7.33
Частично поляризованный свет характеризуют степенью поляризации
I
I
I
P  макс мин  пол .
I макс  I мин
I0
45
Здесь I пол - интенсивность поляризованной составляющей, I 0 - полная интенсивность частично-поляризованного света, которую можно представить как
I 0  I макс  I мин . Для плоско-поляризованного света I пол  I 0 , значит, степень
поляризации P  1, для естественного света I пол  0 и тогда P  0 . Для эллиптически поляризованного света понятие «степень поляризации» не применимо.
Поляризаторы можно использовать и в качестве анализаторов – для
определения характера и степени поляризации света. Пусть на анализатор
падает линейно поляризованный свет, вектор E0 которого составляет угол 
с плоскостью пропускания P (рис. 7.34, направление светового пучка перпендикулярно плоскости рисунка). Анализатор
пропускает только ту составляющую вектора E0 , которая па-
P
E

O
E0
раллельна плоскости пропускания P , т.е. из анализатора выйдет свет с напряженностью E  E0 cos  . Интенсивность пропорциональна квадрату модуля светового вектора, поэтому интенсивность прошедшего света
I  I 0 cos2  ,
где I 0 - интенсивность падающего плоскополяризованного свеРис. 7.34
та. Это соотношение выражает собой закон Малюса. Если же
на поляризатор падает естественный свет с интенсивностью I 0 , то из поляризатора выходит свет с интенсивностью I  I 0 / 2 (это сразу следует из того,
что естественный свет представляет собой наложение двух некогерентных
плоскополяризованных волн одинаковой интенсивности с взаимно перпендикулярными плоскостями поляризации).
7.3.2. Поляризация при отражении и преломлении. Закон Брюстера
Посмотрим теперь, что происходит при падении естественного (неполяризованного) света на границу раздела двух прозрачных диэлектриков. Так
как естественный свет можно представить как наложение двух некогерентных плоскополяризованных волн с взаимно перпендикулярными плоскостями поляризации, то естественно сначала рассмотреть падение плоскополяризованного света.
При падении линейно-поляризованного света с амплитудой колебаний
E на границу раздела двух прозрачных диэлектриков с показателями преломления n1 и n2 возникают две волны: отраженная с амплитудой E  и преломленная с амплитудой E . Для них существуют так называемые формулы
Френеля
46
E
E n1 cos   n2 cos 

,
E n1 cos   n2 cos 
E
E
E
2n1 cos 

,
E n1 cos   n2 cos 
E

n2 cos   n1 cos 
,
n2 cos   n1 cos 

2n1 cos 
.
n2 cos   n1 cos 
Эти соотношения вытекают из граничных условий, накладываемых на
векторы напряженности электрического поля E и магнитного H . В них значок  относится к составляющей, перпендикулярной плоскости падения, а
значок - к составляющей, параллельной плоскости падения,  - угол падения,  - угол преломления. При     0 (нормальное падение) формулы
Френеля переходят в формулы (7.4) и (7.5), рассмотренные нами в разделе
интерференция света, и исчезает разница между волнами, поляризованными
в плоскости падения и перпендикулярной к ней. С использованием закона
преломления sin  / sin   n2 / n1 формулы Френеля приобретают вид
sin     
E

,
E
sin     
E 2cos  sin 

,
E sin     
E
E
E
E

tg     
,
tg     

2cos  sin 
.
sin      cos     
Данные соотношения позволяют определить коэффициент отражения
линейно-поляризованного света, плоскость поляризации которого перпендикулярна плоскости падения -  и параллельна ей - 
2
I   E 
tg 2     
I   E  sin     
.
 

,      2
 
I   E  sin 2     
I  E 
tg     
Из этих формул видно, что при падении под углом  Бр , для которого
2
2
выполняется условие
tgБр  n2 / n1
(7.19)
(при этом Бр     / 2 ), коэффициент отражения   0 , т.е. отраженный
свет будет полностью линейно-поляризованным в плоскости, перпендикулярной плоскости падения. Соотношение (7.19) называют законом Брюстера, а угол  Бр - углом Брюстера или углом полE
E
 Бр

E 
Рис.7.35
ной поляризации.
Если на границу раздела прозрачных диэлектриков падает естественный свет, то отраженный и преломленный лучи оказываются частично поляризованными. В отраженном свете
47
преобладают колебания, перпендикулярные плоскости падения, а в преломленном – параллельные плоскости падения. Степень поляризации зависит от
угла падения. При падении под углом Брюстера отраженный свет будет полностью поляризованным, а преломленный – частично поляризованным с
максимальной степенью поляризации. Это отражено на рис. 7.35.
Заметим, что при отражении света от металла получается эллиптически
поляризованный свет.
7.3.3. Поляризация при двойном лучепреломлении
При прохождении света через прозрачные оптически неизотропные кристаллы наблюдается двойное лучепреломление. Внутри кристалла
свет делится на две линейно-поляризованные волны, распространяющиеся в
общем случае с разными скоростями и в разных направлениях. Одна волна
обыкновенная ( o ) поляризована перпендикулярно плоскости падения и имеет показатель преломления no . Для нее выполняется закон преломления.
Другая волна – необыкновенная ( e ) поляризована в плоскости падения, имеет показатель преломления ne и для нее может не выполняться закон преломления. Направление, вдоль которого обе волны распространяются с одинаковыми скоростями, - оптическая ось кристалла. Такое поведение характерно для так называемых одноосных кристаллов. В двухосных кристаллах
обе волны необыкновенные.
В некоторых кристаллах один из лучей поглощается сильнее другого.
Это явление называется «дихроизмом». Сильным дихроизмом в видимых лучах обладают кристаллы турмалина. В них обыкновенный луч практически
полностью поглощается на длине 1 мм. В кристаллах сульфата йодистого хинина один из лучей поглощается на пути примерно в 0,1 мм. Это используется для изготовления поляризационного устройства, называемого поляроидом
– целлулоидная пленка, в которую введено большое количество одинаково
ориентированных кристалликов йодистого хинина.
Двойное лучепреломление связано с анизотропией кристаллов. В кристаллах некубической системы диэлектрическая проницаемость  оказывается зависящей от направления. В одноосных кристаллах  в направлении оптической оси и в направлениях, перпендикулярных к ней, имеет различные
значения -  и   . Это различие напрямую приводит к тому, что скорость
световых лучей в кристалле ( v = c /  ) начинает зависеть от их направления.
Представим, что в точке O внутри кристалла находится точечный источник света, который формирует две волны – обыкновенную ( o ) и необыкновенную ( e ). В обыкновенном луче колебания светового вектора проис-
48
ходят в направлении, перпендикулярном главному сечению кристалла (на
рис. 7.36 эти колебания отображены точками на соответствующем луче). Для
всех этих колебаний  имеет одно и то же
значение   , поэтому при любом направле
нии обыкновенного луча (указаны три на1
2
правления 1, 2 и 3) скорость световой волны
3

будет одна и та же, равная vo  c /  . От-
сюда следует, что волновая поверхность для
обыкновенных лучей является сферической.
e
o
Колебания в необыкновенном луче
совершаются в главном сечении. Поэтому
для разных лучей направления колебаний
Оптическая ось
вектора E (на рис. 7.36 эти направления
кристалла
отображены двусторонними стрелками) обРис. 7.36
разуют с оптической осью разные угла  .
Для луча 1 угол    / 2 , вследствие чего скорость имеет значение
O
vo  c /  , для луча 2 угол   0 и скорость ve  c /  . Для луча 3 скорость имеет промежуточное значение. Таким образом, волновая поверхность
для необыкновенных лучей представляет собой эллипсоид вращения. В местах пересечения с оптической осью кристалла этот эллипсоид и сфера, построенная для обыкновенных лучей, соприкасаются.
Одноосные кристаллы характеризуются показателем преломления
обыкновенного луча no  c / vo и показателем преломления необыкновенного
луча, перпендикулярного оптической оси ne  c / ve . Последнюю величину
называют просто показателем преломления необыкновенного луча.
Ход обыкновенного и необыкновенного лучей внутри кристалла можно
определить с помощью принципа Гюйгенса. Согласно этому принципу направление распространения световых лучей перпендикулярно поверхности,
огибающей фронты вторичных волн, образующихся после входа в кристалл.
49
Оптическая
ось
o e
o
Оптическая
ось
e
e
o
e
o
Оптическая
ось
а)
б)
e
o
e
o
в)
Рис. 7.37
На рис. 7.37 изображены три случая нормального падения света на поверхность кристалла, отличающиеся направлением оптической оси. В случае
«а» лучи o и e распространяются вдоль оптической оси и поэтому идут, не
разделяясь с одинаковой скоростью. В случае «б» оптическая ось кристалла
параллельна преломляющей поверхности. Тогда при нормальном падении
света обыкновенный и необыкновенный лучи идут по одному и тому же направлению, но с разной скоростью, вследствие чего между ними возникает
все возрастающая разность фаз. Если же оптическая ось образует с поверхностью кристалла угол   0,  / 2 , то даже при нормальном падении света возникает пространственное разделение обыкновенного и необыкновенного лучей (рис. 7.37,в). В этом случае обыкновенный луч подчиняется закону преломления, а необыкновенный – не подчиняется (угол преломления не равен
нулю, хотя угол падения равен нулю!).
Двойное лучепреломление используется для получения плоскополяризованного света с высокой степенью поляризации в различных поляризационных призмах (Николя, Фуко, Волластона и др.).
7.3.4. Интерференция при двойном лучепреломлении
То обстоятельство, что при прохождении света через кристаллы рождаются две волны, предполагает возможность их интерференции. Однако,
как мы помним, для наблюдения интерференции необходимо выполнение
ряда условий. Во-первых, волны должны распространяться практически в
одном направлении. Во-вторых, они должны быть когерентны и, в-третьих,
должны быть поляризованы в одной плоскости.
Для того чтобы волны имели одно направление достаточно направить
естественный свет нормально на кристаллическую пластинку, вырезанную
параллельно оптической оси. При этом условии нет пространственного разделения обыкновенной и необыкновенной волн, но на пути h возникает разность фаз
50
h  no  ne 
.
(7.20)

Теперь, что касается когерентности. Естественный свет – результат излучения различных независимых атомов источника света, испускающих отдельные некоррелированные друг с другом цуги волн. Именно эти цуги участвуют в образовании обыкновенной и необыкновенной волн в кристалле.
Вклад каждого отдельного цуга в эти две волны, вообще говоря, не одинаков.
Этот вклад больше в ту волну, плоскость поляризации которой составляет
меньший угол с плоскостью поляризации данного цуга. Другими словами,
обыкновенная и необыкновенная волны в основном порождаются разными
цугами, входящими в состав естественного света. Поэтому обыкновенная и
необыкновенная волны, распространяющиеся в одноосном кристалле и выходящие из него (при падении естественного света), некогерентны. Однако
эти волны можно сделать когерентными, если на пути естественного света
установить поляризатор перед кристаллической пластинкой, причем так,
чтобы плоскость его пропускания составляла некоторый, не равный нулю
угол с оптической осью кристалла. В этом случае колебания каждого цуга
разделяются между обыкновенной и необыкновенной волнами, и они становятся уже когерентными.
В то же время всего рассмотренного выше еще недостаточно для наблюдения интерференции из-за того, что обыкновенная и необыкновенная
волны поляризованы во взаимно перпендикулярных плоскостях. Для сведения этих плоскостей в одну достаточно поставить на пути вышедшего из
кристаллической пластинки света еще один поляризатор. Он сведет два взаимно ортогональных колебания к одной плоскости и создаст все условия для
наблюдения интерференции. Ее результат окажется в зависимости от оптической разности хода складываемых волн и угла между плоскостями пропускания обоих поляризаторов.
В итоге для наблюдения интерференции поляризованных волн, вышедших из кристаллической пластинки, используется схема, представленная
на рис. 7.38. На нем обозначено: S - обычный источник света, P - поляризатор, K - кристаллическая пластинка, P - анализатор (второй поляризатор).
Если источник S - лазер, то поляризатор P не нужен. Угол между плоскостью пропускания поляризатора (плоскость колебаний прошедшего через него света) и оптической осью пластинки OO обычно составляет 450 (это необходимо для наблюдения наиболее отчетливой картины интерференции).
  2
51
O
P
P
K
S
E
I
0
45
I
O
Рис. 7.38
В зависимости от толщины h кристаллической пластинки, вырезанной
параллельно оптической оси, характер поляризации прошедшего через нее
света будет отличаться друг от друга. Рассмотрим только два частных случая,
имеющих наибольший практический интерес.
Пластинка в четверть волны. Ее толщина удовлетворяет условию
h no  ne  m / 4, m  1,3,5...
Эта пластинка согласно (7.20) вносит дополнительную разность фаз
   / 2 между проходящими через нее обыкновенной и необыкновенной
волнами, поляризованными во взаимно перпендикулярных плоскостях. Эти
плоскости определяют в пластинке два направления, называемые главными
направлениями пластинки – одно параллельно оптической оси, другое ей
перпендикулярно. При таких значения  свет, прошедший через пластинку,
будет эллиптически поляризованным.
Если линейно поляризованный свет падает на пластинку так, что угол
между его плоскостью поляризации и оптической осью пластинки равен 450,
то амплитуды обыкновенной и необыкновенной волн будут одинаковы, и на
выходе из пластинки будет свет, поляризованный по кругу. Пластинку в четверть волны можно использовать и для обратного превращения кругополяризованного света в линейно поляризованный. Плоскость поляризации выходящего света будет составлять угол 450 с оптической осью пластинки.
Пластинка в полволны. Ее толщина удовлетворяет условию
h no  ne  m / 2, m  1,3,5...
Эта пластинка согласно (7.20) вносит дополнительную разность фаз
   между проходящими через нее обыкновенной и необыкновенной волнами. В этом случае свет, вышедший из пластинки, остается линейно поляризованным, однако направление колебаний вектора E повернется на угол 2
симметрично главному сечению пластинки OO (рис. 7.39). При   450
52
такая пластинка «поворачивает» плоскость поляризации падающего на нее линейно поляризованного све-
O
E
Eo
Ee
O
Рис. 7.39
E
Eo
та на 900 .
Отметим без доказательства, что если угол между плоскостями пропускания поляризаторов P и P
равен нулю, то из системы выходит свет с интенсивностью I   I cos2   / 2  , где  - разность фаз обыкно-
венного и необыкновенного лучей, прошедших кристаллическую пластинку, I - интенсивность падающего на кристаллическую
пластинку поляризованного света. Если угол между плоскостями пропускания P и P равен  / 2 (скрещенные поляризаторы), то из системы выходит
свет с интенсивностью I   I sin 2   / 2  (заметим, что интенсивности I  и I 
в сумме дают интенсивность падающего света I ).
Если свет монохроматический и толщина кристаллической пластинки
всюду одинакова, на выходе будет равномерная освещенность без характерных для интерференционной картины чередующихся темных и светлых полос. Здесь интерференция проявляет себя в перераспределении световой
энергии между взаимно ортогональными плоскостями. Действительно, если,
например, при параллельных плоскостях пропускания поляризаторов мы
имеем максимум освещенности, то достаточно повернуть поляризатор P на
900, и мы получим «дополнительную» освещенность: поле зрения окажется
темным.
Интенсивность выходящего из поляризатора P света можно менять,
изменяя разность фаз  . В соответствие с (7.20) это можно достигнуть либо
меняя  - это приводит к эффектному изменению окраски, либо, меняя толщину пластинки. Если использовать пластинку переменной толщины, то
можно наблюдать интерференцию и в привычном виде чередующихся светлых и темных полос.
7.3.5. Искусственная оптическая анизотропия.
Вращение плоскости поляризации
Оптическую анизотропию можно вызвать и искусственным путем. Например, при сжатии (растяжении) стеклянной пластинки она приобретает
свойства одноосного кристалла с оптической осью, параллельной направлению нагрузки. Мерой анизотропии служит разность показателей преломления обыкновенного и необыкновенного лучей no  ne . Например, при одностороннем сжатии (растяжении)
no  ne  k  ,
53
где  - механическое напряжение, коэффициент k зависит от свойств вещества. Если такую деформированную пластинку поместить между двумя поляризаторами, то по виду интерференционных линий можно судить о механических напряжениях (явление фотоупругости).
Для анизотропии, вызванной внешним электрическим полем с напряженностью E в жидких и аморфных телах, разность показателей преломления
no  ne  BE 2 ,
где B - постоянная Керра, имеющая особенно большое значение для нитробензола. Само явление двойного лучепреломления под воздействием внешнего электрического поля называется эффектом Керра. Данный эффект объясняется тем, что при включении электрического поля происходит поляризация молекул и их выстраивание по полю. Это и создает анизотропию вещества с преимущественным направлением – оптической осью вдоль электрического поля.
Наиболее важной особенностью эффекта Керра, обуславливающей его
широкое применение, является весьма малая инерционность (до 10-12 с). Это,
в частности, позволяет осуществить практически безинерционный оптический затвор, с помощью которого изучают быстропротекающие процессы.
Такой затвор представляет по существу «лупу времени». Кроме того, данный
эффект используют для создания сверхкоротких световых импульсов, что позволяет определить, например, скорость света на базе лабораторного стола.
Этот эффект используют для управления режимом работы лазеров с целью
получения сверхкоротких импульсов огромной мощности и во многих других весьма тонких физических экспериментах.
Изменение оптических свойств кристаллов под действием внешнего
электрического поля называют эффектом Поккельса. В отличие от эффекта
Керра, квадратичного по E , эффект Поккельса зависит линейно от E . Его
практическая безинерционность позволяет использовать данный эффект для
создания быстродействующих оптических затворов и высокочастотных модуляторов света.
При пропускании линейно-поляризованного света через оптически активные вещества происходит поворот плоскости поляризации на угол
  l ,
где l - толщина оптически активного слоя,  - постоянная вращения. При
изменении направления движения света угол поворота изменяет знак. Такими веществами являются кристаллические тела (кварц и др.), чистые жидкости (скипидар, никотин и др.) и растворы оптически активных веществ в не-
54
активных растворителях (водные растворы сахара, винной кислоты и др.).
Для растворов оптически активных веществ     c , где    - удельная постоянная вращения, c - концентрация оптически активного вещества.
Способность поворачивать плоскость поляризации обладают и оптически неактивные вещества, находящиеся во внешнем магнитном поле с напряженностью H (эффект Фарадея). При этом угол поворота плоскости поляризации
  VlH ,
где V - постоянная Верде. Направление вращения зависит только от направления магнитного поля и не зависит от направления света.
7.4. Взаимодействие электромагнитного излучения с веществом
7.4.1. Дисперсия света
Под дисперсией света понимают явления, обусловленные зависимостью показателя преломления вещества от длины волны (или частоты)
n  f    , где  - длина волны в вакууме. Один из первых опытов по обнаружению этой зависимости был опыт Ньютона с треугольной стеклянной призмой.
Производную dn / d называют дисперсией вещества. Для прозрачных
бесцветных веществ зависимость n    в видимой части спектра имеет вид,
показанный на рис. 7.40,а, для которой dn / d  0 - так называемая нормальная дисперсия. Если вещество поглощает часть лучей, то в области поглощения и вблизи нее ход дисперсии обнаруживает аномалию. На некоторых участках спектра дисперсия вещества dn / d становится положительной – это
т.н. аномальная дисперсия (рис. 7.40,б).
n
n
нормальная
дисперсия
аномальная
дисперсия

а)

б)
Рис. 7.40
Среды, обладающие дисперсией, называются диспергирующими, в них
скорость волн v зависит от длины волны  или частоты  . Заметим, что вакуум дисперсией не обладает, в нем все световые волны независимо от их
частоты имеют одинаковую скорость c .
55
Прежде чем говорить о природе дисперсии, попытаемся понять, почему
вообще возникает показатель преломления, или почему в среде свет движется медленнее, чем в вакууме. Рассмотрим прохождение световой волны, например, через стеклянную пластинку
dx

(рис. 7.41). Выделим внутри пластинки
dE 
dE 
бесконечно тонкий слой толщиной dx .
Электрическое поле падающей волны E
E
x с некоторой частотой  раскачивает
электроны данного слоя. Ускоренно
движущиеся заряды начинают излучать
свое поле dE , часть которого dE расdx
пространяется против оси x и участвует
Рис. 7.41
в формировании отраженной волны,
другая часть dE участвует в формировании преломленной волны. Фазы колебаний dE и dE отличаются от фазы колебаний E (вспомним про вынужденные колебания). Следующий слой dx формирует свою добавку к dE и
dE и т.д. В итоге из пластинки выходит волна, сдвинутая по фазе относительно исходной волны на некоторую величину  , зависящую от частоты
исходной волны  . Этот сдвиг фазы колебаний эквивалентен тому, что эффективная скорость света в среде v становится меньше скорости света в вакууме c . Так возникает показатель преломления n  c / v .
7.4.2. Групповая скорость
В связи с тем, что скорость электромагнитной волны в веществе начинает зависеть от частоты, возникают два вопроса: как выглядит эта волна в
веществе и что понимать под ее скоростью?
В комплексной форме монохроматическая волна вида
E  E0 exp i  kx  t 
(7.21)
представляет собой бесконечную во времени и пространстве последовательность «горбов» и «впадин», перемещающихся вдоль оси x . Выражение (7.21)
является решением волнового уравнения
1 2E 2E

,
(7.22)
v 2 t 2 x 2
где v - фазовая скорость волны. Между параметрами , k и v существует
связь
  kv .
(7.23)
Выражение (7.23) называется дисперсионным соотношением или законом дисперсии и его можно воспринимать как определение фазовой скорости
волны. Если величины  и k пропорциональны друг другу, то фазовая ско-
56
рость от них не зависит и определяется только свойствами среды. Волны,
удовлетворяющие простому дисперсионному соотношению  / k  const , называются недиспергирующими волнами и подчиняются волновому уравнению (7.22). В общем случае закон дисперсии (7.23) может быть более сложным, т.е. частота  является нелинейной функцией волнового числа k . Нелинейная зависимость частоты волны от волнового числа (дисперсия) имеет
большое значение при распространении негармонических волн. Связано это с
тем, что гармоническое колебание определенной частоты и амплитуды не
может нести никакой информации о передаваемом сигнале, так как каждый
последующий цикл колебаний является точной копией предыдущего. Чтобы
передать определенную информацию с такой волной, ее нужно промодулировать, т.е. изменить какой-либо параметр волны в соответствии с изменением
смыслового сигнала. В бегущей волне такими изменяющимися параметрами
могут быть амплитуда, частота и фаза. Соответственно различают амплитудную, частотную и фазовую модуляцию. Во всех этих случаях волны распространяются в виде так называемых волновых пакетов, образованных из
гармоник с близкими частотами, каждая из которых распространяется со своей фазовой скоростью. В связи с этим возникает естественный вопрос, а с какой же скоростью распространяется волновой пакет? Для того чтобы это понять, рассмотрим простейший случай распространения в одном направлении
двух бегущих монохроматических волн с близкими значениями частоты  ,
волнового числа k и одинаковой амплитуды a
E1 ( x, t )  a cos t  kx ,
E2 ( x, t )  a cos     t   k   k  x  ,
причем   ,  k  k . В соответствии с принципом суперпозиции результирующее колебание E ( x, t ) запишем в виде
   k 
E ( x, t )  E1  E2  2a cos  t 
x   cos t  kx  .
2 
 2
При достаточно малых  и  k последнее выражение можно интерпретировать как бегущую волну cos t  kx  с переменной амплитудой
   k 
A  2a cos 
t
x .
2 
 2
Если для монохроматической волны амплитуда постоянна, то теперь
она изменяется как во времени, так и в пространстве, т.е. максимум амплитуды перемещается в пространстве с некоторой скоростью. Разумно принять за
скорость движения волнового пакета скорость перемещения максимальной
амплитуды, т.е. скорость перемещения постоянного значения фазы амплиту-
57
ды. Это и есть так называемая групповая скорость u . Для ее определения зафиксируем постоянное значение фазы амплитуды ( / 2)t  ( k / 2) x  const
и найдем его дифференциал d  t   / 2  x   k / 2   0 . Отсюда получаем
dx

u 
или в пределе (   0,  k  0 )
dt
k
d (k )
u
.
dk
Введенное таким образом значение групповой скорости определяет не
только скорость распространения информации, но и скорость распространения энергии в немонохроматической волне с произвольным законом дисперсии. Нетрудно показать, что групповая скорость u связана с фазовой скоростью v соотношением Рэлея
dv
dv
u  v
либо u  v + k
.
d
dk
Значения u и v совпадают только в том случае, если фазовая скорость
не зависит от длины волны (или волнового числа). Это имеет место, например, при распространении света в вакууме. Для электромагнитных волн в вакууме (пустом пространстве) всегда выполняется соотношение   ck , где
c  3 108 м/с – скорость света в вакууме. Тогда v  u  c независимо от длины
волны. Заметим, что подобное соотношение выполняется только для электромагнитных волн в вакууме, для волноводов это уже не выполняется!
7.4.3. Классическая теория дисперсии
Попытаемся теперь найти явную зависимость показателя преломления
от частоты электромагнитной волны. Для этого используем связь показателя
преломления вещества с его диэлектрической проницаемостью, характеризующей отклик системы зарядов на внешнее электрическое поле. Точная теория атома, основанная на законах квантовой механики, утверждает, что в
процессах с участием света электроны в атоме ведут себя как гармонические
осцилляторы с массой m и собственной частотой 0k . При прохождении через среду гармонической электромагнитной волны с частотой  (в пренебрежении ее магнитной составляющей) на каждый электрон действует сила
F  t   eE0 cos t . Тогда без учета затухания уравнение колебаний электрона


примет вид m x  02k x  eE cos t . Его установившееся решение
x t   
eE0 cos t

2
m ok
 2



eE  t 
2
m ok
 2

.
58
При колебаниях электронов атома возникает поляризация и каждая молекула приобретает дипольный момент p   e  xk  t  , где сумма берется по
k
всем электронам молекулы, имеющим свои собственные частоты ok . Умножив дипольный момент молекулы на их число в единице объема n0 , получаем дипольный момент единицы объема вещества или поляризованность
e2 E  t 
,
P  n0 
2
m ok
 2


которая связана с диэлектрической восприимчивостью æ соотношением
P  æ0 E . Осталось только учесть связь диэлектрической восприимчивости с
диэлектрической проницаемостью   1  æ и то, что квадрат показателя преломления равен  . В итоге получаем
e2 E  t 
n0
2
  n 1 
.
(7.24)
2
0
m ok
 2


Это и есть формула дисперсии (дисперсионная формула). Разрыв функции n   при   ok не имеет физического смысла и является следствием
пренебрежения затуханием колебаний электронов. Если же его учесть, то зависимость n   и соответственно n    принимает вид, отображенный на
рис. 7.42 (участок 2-3 соответствует аномальной дисперсии, участок 3-4 –
нормальная дисперсия).
n
n
3
4
1
1

а)

2
б)
Рис. 7.42
Проведем теперь анализ дисперсионной формулы (7.24).
1. Для большинства газов 0k соответствует ультрафиолетовому свету, т.е.
частоты 0k много больше частоты видимого света. При этих частотах сумма
в (7.24) мала по сравнению с единицей, тогда n  1 . Это же справедливо и для
многих других прозрачных сред.
59
2. Для стекла в видимой части спектра уже нельзя пренебрегать значением 
по сравнению с 0k и тогда значение n будет расти с увеличением частоты
(или уменьшением длины волны).
3. При облучении стекла рентгеновскими лучами (   0k ) получается, что
n  1 . Аналогичный результат получается и при облучении газа свободных
электронов радиоволнами (или светом). В верхних слоях атмосферы ультрафиолет Солнца выбивает электроны из атомов, образуя газ свободных электронов. Для них 0  0 , соответственно n  1 и скорость электромагнитной
волны становится больше скорости света в вакууме. Ничего страшного здесь
нет. Показатель преломления при некоторой частоте может быть как больше
единицы, так и меньше единицы. Это просто означает, что сдвиг фазы выходящей волны либо больше нуля, либо меньше нуля. Кроме того, то, что фазовая скорость v оказалась больше c еще ничего не означает. Групповая скорость, которая определяет скорость передачи информации и энергии, как показывают расчеты, все равно меньше c .
Из выражения (7.24) вытекает еще одно неожиданное следствие. При
0  0 (например, в той же плазме) для достаточно малых частот  значение
n оказывается мнимым! Выясним, что это означает. Для этого обратимся к
уравнению (7.21), где k  2 /  ,  - длина волны в среде. Если длина волны в
вакууме  0 , то   0 / n . Представим мнимое значение n в виде n  in . То-
гда значение волнового числа можно записать как k  2n / 0  k0  in . Подставляя это выражение в (7.21), для его действительной части получаем
E  E0 exp  nk0 x  cos t .
Видно, что в рассматриваемом случае мы имеем стоячую волну, амплитуда которой экспоненциально затухает с расстоянием. Фактически это
означает, что электромагнитное излучение сравнительно низких частот не
может пройти через плазму и происходит его полное отражение в пограничном слое. Причем это затухание не обязательно связано с поглощением электромагнитной волны.
7.4.4. Поглощение и рассеяние света
При прохождении световой волны через вещество часть энергии волны
затрачивается на раскачку электронов. Частично эта энергия вновь возвращается в излучение, частично поглощается веществом. Опыт показывает, что
при прохождении параллельного светового пучка через однородное вещество
относительное уменьшение интенсивности света dI / I пропорционально
толщине выделенного бесконечно тонкого слоя dx , т.е. dI  Idx , где  коэффициент поглощения. Знак минус поставлен из-за того, что dI  0 . Ин-
60
тегрируя это соотношение по толщине поглощающего слоя, получаем закон
Бугера
I  I 0 exp  l  ,
где I 0 - интенсивность света, падающего на слой вещества толщиной l .
Коэффициент поглощения зависит от длины волны и вещества. Для газов, паров металлов при достаточно низких давлениях (т.е. для невзаимодействующих атомов) коэффициент поглощения имеет резкие максимумы, соответствующие резонансным частотам колебаний электронов внутри атомов.
Молекулярные же частоты в многоатомных молекулах попадают в инфракрасную область спектра.
Газы при высоких давлениях, жидкости и твердые тела имеют широкие
(сплошные) спектры поглощения. Для стекла   1/м. Металлы практически
не прозрачны для света (  106 1/м).
Рассеяние света заключается в перераспределении светового потока по
направлениям. Каждый электрон в веществе является источником вторичных
волн, распространяющихся во всех направлениях. Однако эти волны являются когерентными и взаимная интерференция в однородной среде приводит к
тому, что волны гасят друг друга во всех направлениях, кроме первичного.
Поэтому в однородной среде перераспределения волн, т.е. рассеяния не происходит.
При прохождении света в неоднородной среде возникает дифракция на
неоднородностях, которая приводит к распределению интенсивности света
по всем направлениям. Рассеяние света наблюдается в мутных средах: дымы,
туман, взвеси, эмульсии, некоторые твердые тела – перламутр, молочные
стекла и др. Кроме того, рассеянный свет оказывается и частично поляризованным. Если размеры неоднородностей малы (  0,1  ), то интенсивность
рассеянного света пропорциональна четвертой степени частоты
I 4 1/  4 .
Это так называемый закон Рэлея. Существует рассеяние света и на
флуктуациях плотности газов и жидкостей - молекулярное рассеяние света,
обуславливающее голубой цвет неба и красный цвет зари. Особенно сильны
флуктуации плотности вблизи критического состояния вещества.
8. Квантовая физика
8.1. Квантовые свойства электромагнитного излучения
8.1.1. Характеристики и законы теплового излучения.
Формула Планка
Самым распространенным видом электромагнитного излучения является тепловое излучение за счет внутренней энергии нагретых тел. Это излу-
61
чение является единственным видом излучения, которое может находиться в
равновесии с излучающими телами. Все остальные виды излучения являются
неравновесными. Возможность установления равновесия между излучением
и веществом обусловлена тем, что интенсивность теплового излучения возрастает при повышении температуры. Если по какой-либо причине равновесие будет нарушено, например, тело излучает энергии больше, чем поглощает, то это приведет к понижению температуры. Это в свою очередь приведет
к уменьшению излучаемой телом энергии, и тогда температура тела будет
понижаться до тех пор, пока количество излучаемой телом энергии не станет
равным количеству поглощаемой энергии. Если равновесие будет нарушено
в другую сторону, т.е. тело излучает энергии меньше, чем поглощает, то температура тела будет возрастать до установления равновесия.
Характеристики теплового излучения. Интенсивность теплового излучения характеризуется величиной плотности потока энергии, т.е. энергией,
излучаемой единицей площади поверхности тела за единицу времени, - энергетическая светимость R (Вт/м2). Она является функцией температуры. Так
как излучение содержит волны различных частот, то для характеристики
энергии, приходящейся на бесконечно малый интервал частот d , вводится
понятие спектральной плотности энергетической светимости (испускательная способность) r (Дж/м2):
dR  r d ,
(8.1)
где dR - величина потока энергии, испускаемой единицей поверхности тела
в интервале частот (,  d ) . Как и энергетическая светимость, спектральная плотность сильно зависит от температуры тела. Соотношение (8.1) позволяет найти энергетическую светимость по ее спектральной плотности

R   dR   r d .
0
Естественно спектральную плотность r можно выражать и как функцию длины волны излучения r (Вт/м3): r d  r d  .
Откуда с учетом связи длины волны и частоты (   2 c /  ) получаем
2
r  r
,
2 c
(8.2)
где c - скорость света в вакууме. Соотношение (8.2) позволяет перейти от r
к r и наоборот. При теоретических исследованиях для характеристики спектрального состава теплового излучения обычно применяется величина r , а
при экспериментальных - r .
62
Для характеристики поглощения телом энергии вводится поглощательная способность
d 
,
a 
d 
где d  - поток энергии, падающей на тело в интервале частот (,  d ) ,
d  - поглощенный поток энергии.
Среди всех тел выделяют так называемое абсолютно черное тело, которое по определению полностью поглощает падающее на него излучение всех
частот при любых температурах. Для него a  1 . Величина спектральной
плотности излучения абсолютно черного тела обозначается как r * . Если величина a  const  1, то такое тело называется серым.
Идеализированная модель абсолютно черного тела полезна тем, что
обладает наиболее простыми закономерностями спектрального состава равновесного теплового излучения (его называют черным излучением). Это излучение является, прежде всего, изотропным, т.е. одинаковым по всем направлениям. Кроме того, излучение абсолютно черного тела не зависит от
направления, т.е. как говорят, подчиняется закону Ламберта. Абсолютно
черных тел, как и других идеализированных объектов, в природе не существует.
r*
T3  T2  T1
T3
T2
0
Рис. 8.1
 max

T1
Рис. 8.2
Однако можно создать устройство, очень близкое по своим свойствам к
абсолютно черному телу. Это замкнутая полость с маленьким отверстием
(рис. 8.1). Если внутреннюю стенку такой полости покрыть сажей, то излучение, проникшее внутрь через малое отверстие, после многократных отражений полностью поглощается. Это конечно не означает, что из такой полости
ничего не выходит. Если стенки полости поддерживать при некоторой температуре T , то из отверстия будет выходить излучение, весьма близкое по
спектральному составу к излучению абсолютно черного тела той же температуры. Разлагая это излучение каким-либо способом в спектр и измеряя ин-
63
тенсивности его различных участков, можно экспериментально найти вид
функции r * для разных температур. На рис. 8.2 приведены результаты таких
опытов. Площадь под любой кривой равна энергетической светимости абсолютно черного тела при соответствующей температуре. Из этого рисунка
следует, во-первых, что энергетическая светимость абсолютно черного тела
сильно растет с температурой и, во-вторых, максимум спектральной плотности излучения с ростом температуры сдвигается в сторону более коротких
длин волн.
Рассмотрим теперь эвакуированную полость, стенки которой поддерживаются при постоянной температуре T . В равновесном состоянии энергия
излучения распределяется в объеме полости с некоторой объемной плотностью W (T ) (Дж/м3). Спектральное распределение этой энергии можно охарактеризовать функцией w(,T ) ( Дж  с/м3 ), определяемой условием аналогичным (8.1)
dW  w(,T )d ,
где dW - объемная плотность энергии, приходящейся на интервал частот
(,  d ) . Тогда функцию w(,T ) можно назвать спектральным распределением объемной плотности энергии теплового излучения.
Из термодинамических соображений следует, что равновесная плотность энергии излучения W (T ) зависит только от температуры и не зависит
от свойств стенки полости. Очевидно, равновесная плотность энергии излучения W (T ) должна быть связана с энергетической светимостью абсолютно
черного тела R* . Рассмотрим полость с абсолютно черными стенками. При
равновесии через каждую точку пространства внутри полости будет проходить в любом направлении изотропный поток излучения. Если бы излучение
распространялось в одном направлении, то плотность потока энергии j
(Вт/м2) в рассматриваемой точке, как известно, была бы равна произведению
объемной плотности энергии W на скорость электромагнитной волны c :
j  Wc . В силу изотропности излучения в пределах
Z
d
телесного угла d будет течь поток энергии, плотность которого dj  cWd  / 4 ,
dS
 dr
X
Рис. 8.3
Y
где d   dS / r 2  sin d d  (рис. 8.3). Тогда любой
элемент поверхности полости с площадью S посылает в пределах телесного угла d в направлении, образующем с нормалью угол  , поток энергии d Э , равный
64
cW
S cos  sin d d 
4
(здесь S cos - «эффективная площадь» элемента полости S в направлении
угла  к нормали). Интегрируя по углу  от нуля до  / 2 и по углу  от нуля до 2 , находим
d  Э  dj  S cos  
cW
 Э   d  Э 
S
4
/2

0
2
c
cos  sin d   d   W S .
4
0
С другой стороны поток энергии, испускаемый площадкой S должен
быть равным R*S . Отсюда следует R*  cW / 4 . Так как это равенство должно выполняться для каждой спектральной составляющей излучения, то:
c
r *  w( , T ) .
(8.3)
4
Эта формула связывает спектральную плотность энергетической светимости абсолютно черного тела с равновесным спектральным распределением объемной плотности энергии теплового излучения в полости.
Закон Кирхгофа. Пусть внутри замкнутой оболочки, поддерживаемой
при температуре T , помещены несколько тел. Опыт показывает, что такая
система через некоторое время придет в состояние теплового равновесия –
все тела независимо от их начальной температуры примут одну и ту же температуру, равную температуре оболочки. В таком состоянии тело, обладающее большей испускательной способностью r , должно и больше поглощать,
т.е. обладать большей поглощательной способностью a . Отсюда следует
 r   r   r 
         ... ,
 a 1  a 2  a 3
где индексы 1, 2, 3 и т.д. относятся к разным телам. Это соотношение выражает установленный Кирхгофом закон, который гласит: отношение испускательной и поглощательной способностей не зависит от природы тела и является для всех тел универсальной функцией частоты и температуры
f  , T  . Если одно из тел системы является абсолютно черным, то для него
a  1 и тогда универсальная функция Кирхгофа f  , T   r .
Закон Стефана – Больцмана. Стефан, анализируя экспериментальные
данные, пришел к выводу, что энергетическая светимость любого тела пропорциональна четвертой степени температуры. Однако, как теоретически показал Больцман, это относится только к излучению абсолютно черного тела,
для которого
R  T 4 .
65
Это соотношение называется законом Стефана-Больцмана. Константу
 называют постоянной Стефана-Больцмана. Ее экспериментальное значе-


ние   5,67 108 Вт/ м2  К 4 . Для тел, не являющихся абсолютно черными,
вводится поправочный коэффициент – степень черноты  , зависящий в общем случае, как от частоты, так и от температуры, и тогда отмеченный закон
записывают в виде R  T 4 .
Критерий и законы Вина. Вин теоретически показал, что функция r
должна иметь вид r  3 F   / T  , где F - некоторая функция отношения
частоты к температуре. Это соотношение носит название критерий Вина.
Несмотря на неопределенность функции F   / T  , критерий Вина позволяет
найти соотношение, связывающее длину волны  max , на которую приходится
максимум спектральной плотности энергетической светимости (см. рис. 8.2),
с температурой абсолютно черного тела. С помощью соотношения (8.2) перейдем от функции r к функции r : r  r    T   5 . И для определения
максимума функции r найдем от нее производную
dr / d    T    T   5  T   6 ,
где знаком штрих обозначена производная по аргументу x  T . При
   max   выражение в квадратных скобках обращается в нуль и его можно трактовать как некоторое уравнение относительно переменной x   maxT .
Решение этого уравнения относительно неизвестного  maxT дает для него
некоторое число, которое можно обозначить как b . Таким образом, приходим к соотношению
 maxT  b ,
которое носит название закона смещения Вина. Экспериментальное значение
константы b  2,9 103 м  К .
С использованием закона смещения Вина нетрудно найти, что макси-
 
мум функции r пропорционален пятой степени температуры r
max
T5
(иногда это соотношений называют вторым законом Вина).
Формула Рэлея-Джинса. Эта формула устанавливает вид функции
спектрального распределения объемной плотности энергии теплового излучения w(,T ) (или r ). Ее можно определить как произведение числа электромагнитных колебаний в единичном объеме в единичном интервале частот
на среднюю энергию одного колебания.
66
Для расчета числа электромагнитных колебаний обратимся к эвакуированной полости, стенки которой поддерживаются при постоянной температуре T . Поскольку равновесное излучение в полости не зависит от ее формы
и материала стенок, то можно считать, что полость имеет форму куба со стороной l и идеально отражающими стенками. Такое излучение будет представлять собой систему гармонических стоячих волн, длина волны которых
много меньше размеров полости   l .
Стоячие электромагнитные волны подобны аналогичным волнам в
струне. Из теории стоячих волн нам известно, что для постоянства амплитуды колебаний на длине l должно укладываться целое число полуволн:
l  n / 2, (n  1,2,3...) . Перепишем это условие через волновое число
k  2 /  (не путать с обозначением постоянной Больцмана!). С учетом того,
что волновое число это вектор, для его проекций получаем следующие соотношения:
kx 

n1, k y 

n2 , k z 

n3 (n1, n2 , n3  1,2,3...).
l
l
l
Интервал изменения волновых чисел  k вдоль любого направления равен  k x   k y   k z   / l . Будем полагать размеры полости настолько большими, что в любом малом интервале dk x оказывалось множество типов колебаний с различными k x . Обозначим число этих колебаний через dN (k x ) .
Очевидно оно будет равно
dk
l
dN (k x )  x  dk x .
 kx 
Полное число стоячих волн, у которых проекции волновых векторов
находятся в пределах от k x до k x  dk x , от k y до k y  dk y и от k z до k z  dk z ,
будет равно
dN (k ) 
l3

3
dk x dk y dk z 
V

3
d 3k ,
где V  l - объем полости, d k  dk x dk y dk z - бесконечно малый объем в k 3
3
пространстве.
Для числа колебаний, у которых модуль волнового вектора находится в
пределах от k до k  dk возьмем в k - пространстве тонкий шаровой слой
радиусом k и толщиной dk в положительном октанте пространства волно1
вых чисел. Его объем dVk  4 k 2dk . И тогда число колебаний в интервале
8
dk становится равным
67
V 1
4 k 2dk .
3
 8
С учетом связи k   / v ( v - фазовая скорость волны) получаем число
волн, частоты которых находятся в интервале от  до   d :
dN k 
 2d
dN  V 2 3 .
2 v
Число же стоячих волн в единичном объеме будет равно
dN  2d
dn 
 2 3.
V
2 v
Для электромагнитного излучения v  c ( c - скорость света в вакууме).
Кроме того, нужно учесть, что вдоль заданного направления могут распространяться две волны, поляризованные во взаимно перпендикулярных плоскостях. И окончательно число стоячих волн в единичном объеме электромагнитного поля в интервале частот ,   d  составит
dn 
 2 d
.
 2c 3
(8.4)
Такая же формула получается и для полости любой формы. Это естественный результат – число стоячих волн с длиной волны много меньшей размеров полости, не зависит ни от формы полости, ни от вида граничных условий. Отношение dn / d  равно числу электромагнитных колебаний в единичном объеме в единичном интервале частот. И для определения вида
функции w(,T ) осталось только умножить dn / d  на среднюю энергию
dn
 . В соответствии
d
с классическим законом равнораспределения энергии Рэлей и Джинс предположили, что   kT (одна половинка kT приходится на кинетическую энеродного электромагнитного колебания  : w( , T ) 
гию, другая – на потенциальную, k - постоянная Больцмана). Тогда из (8.4)
получаем
w( , T ) 
2
kT .
 2c 3
Соответственно с учетом формулы (8.3) выражение для спектральной
плотности энергетической светимости абсолютно черного тела приобретает
вид
r * 
2
kT .
4 2c 2
(8.5)
68
Этот результат известен под названием формулы Рэлея-Джинса, хотя
он независимо и практически одновременно был получен также Планком из
столь же общих, но несколько других соображений. Планк применил теорему
о равнораспределении энергии только к веществу, а не к излучению, считая
вещество состоящим из большого числа гармонических осцилляторов со
средней энергией   kT .
Формула Рэлея-Джинса удовлетворительно согласуется с экспериментальными данными лишь при малых частотах и резко расходится с опытом
при больших частотах (малых длинах волн). Более того, интегрирование (8.5)
по всем частотам от нуля до бесконечности дает бесконечно большое значение энергии излучения (интеграл расходится при больших частотах). Это означает, что по теории Рэлея-Джинса тепловое равновесие между излучением
и веществом невозможно (или возможно только при нулевой температуре).
Опыт же показывает, что равновесие между излучением и веществом устанавливается при конечных значениях энергии излучения.
Полученный Рэлеем и Джинсом результат по образному выражению
Пауля Эренфеста получил название ультрафиолетовой катастрофы, т.е. абсолютно черное тело должно мгновенно испустить всю свою энергию в виде
импульса коротковолнового излучения. Причина ультрафиолетовой катастрофы заключается в том, что в теории Рэлея-Джинса излучение в полости
имеет бесконечное, а вещество – конечное число степеней свободы. Поэтому
в предположении равномерного распределения энергии по степеням свободы
при тепловом равновесии вся энергия должна была бы сосредоточиться в излучении.
Формула Планка. С точки зрения законов классической физики вывод
формулы Рэлея-Джинса являлся безупречным, но, тем не менее, приводил к
неверному результату, резко расходящемуся с опытом. И связано это, как установил Макс Планк, с предположением, что   kT .
В 1900 году Планку удалось найти вид функции r * , в точности соответствующий опытным данным. Пытаясь найти выход из сложившегося положения, Планк понял, что единственная возможность правильного объяснения законов теплового излучения состоит в предположении, что электромагнитное излучение должно испускаться дискретными порциями энергии
(квантами), величина которых пропорциональна частоте излучения:
  .
Если излучение испускается порциями  , то его энергия  n должна
быть кратной этой величине  n  n  (n  0,1,2,...) . Коэффициент пропор-
69
циональности получил впоследствии название постоянной Планка и его
значение, полученное из различных опытных данных, составляет
 1,054 1034 Дж  с . Кроме постоянной часто используется величина
h  2 , являющаяся коэффициентом пропорциональности между энергией
 и частотой  :   h . В механике есть величина, имеющая такую же размерность, ее называют действием. Поэтому постоянную Планка иногда называют квантом действия.
Для получения правильного выражения для средней энергии колебаний
электромагнитного излучения обратимся к распределению Больцмана. Согласно этому распределению вероятность Pn того, что энергия колебаний
частоты  имеет значение  n  n  (n  0,1,2,...) , определяется выражением
Pn 
exp   n / kT 
Nn

,
N  exp  n / kT 
n
где N n - число осцилляторов, находящихся в состоянии с энергией  n , N полное число осцилляторов. Тогда среднее значение энергии колебаний
можно определить как

   Pn n 
n
n 0
 exp  n  / kT 

 exp  n
 / kT 
.
n 0
Введем переменную x   / kT и допустим, что x может изменяться
непрерывно. Тогда выражение для  можно записать иначе

 n exp(nx)
   n0
 exp(nx)
 

d
ln  exp(nx) .
dx n0
(8.6)
n 0
Под знаком логарифма стоит сумма членов бесконечной геометрической
сходящейся прогрессии. Значение этой суммы равно 1/ 1  exp( x) . Подставив это значение в (8.6) и выполнив дифференцирование, получаем выражение для средней энергии излучения частоты  :

.
(8.7)
 
 
exp 
 1
 kT 
70
Если бы энергия изменялась непрерывно, а это было бы при  0
(именно так и обстоит дело в классической физике), то легко убедиться, что
выражение (8.7) соответствовало бы классической теореме о равнораспределении энергии   kT . Умножив  на число колебаний в интервале частот
d (формула (8.4)), получаем выражение для спектральной плотности энергии единичного объема:
2

,
w( , T )  2 3
 c exp   / kT   1
и соответственно спектральную плотность энергетической светимости абсолютно черного тела
3
1
r *  2 2
.
4 c exp   / kT   1
Это выражение называется формулой Планка и оно точно согласуется с
экспериментальными данными во всем диапазоне частот от нуля до бесконечности и при любых температурах.
Найдем теперь выражение для энергетической светимости абсолютно
черного тела (расчет именно этой величины поставил крест на формуле Рэлея-Джинса!).


3
d
.
2 2
exp

/
kT

1
4

c


0
R   r d  
*
*
0
За счет наличия экспоненты в знаменателе этот интеграл уже не расходится.
Введя безразмерную переменную x   / kT , для R* получаем
 kT 
R  2 2 
4 c  
4
*
x3dx
 ex  1 .
0
Значение этого интеграла равно  4 /15 . Подставляя это значение в последнее
выражение, приходим к закону Стефана-Больцмана
R*   T 4 ,
где  
 2k 4
- постоянная Стефана-Больцмана. После подстановки всех
60c 2 3
констант, получаем   5,67 108 Вт/(м2  К4 ) , что прекрасно согласуется с
экспериментальным значением. Кроме того, из формулы Планка можно получить и закон смещения Вина.
8.1.2. Световые кванты. Фотоэффект
При выводе своей формулы для равновесного теплового излучения
Планк ввел немыслимую для классической физики гипотезу о том, что излу-
71
чение и поглощение света веществом происходит не непрерывно, а конечными порциями, квантами. Причем Планк полагал, что квантовые свойства света проявляются только при взаимодействии света с веществом. Распространение же света в пространстве происходит непрерывно и подчиняется классическим уравнениям Максвелла для электромагнитного поля.
Более радикальная и законченная форма была предложена Эйнштейном, который пришел к представлению о том, что и распространение света в
пространстве происходит отдельными порциями; причем энергия каждой такой порции определяется формулой Планка    . Такие порции (частицы)
позднее получили название квантов света или фотонов. Своеобразие формулы    проявляется в том, что по классическим представлениям энергия
должна быть связана не с частотой, а с амплитудой колебания. В актах взаимодействия с веществом фотоны могут поглощаться, испускаться и рассеиваться. При этом должны выполняться законы сохранения энергии и импульса.
Кв
К
I
А
Iнас
V
П
  
Рис. 8.4
G
Uз
U
0
Рис. 8.5
Одним из явлений, подтверждающих гипотезу фотонов, является фотоэлектрический эффект, обнаруженный в 1887 г. Г.Герцем. Основополагающие исследования фотоэффекта, проведенные А.Г.Столетовым и другими
физиками, показали, что при освещении поверхности вещества происходит
вырывание электронов (фотоэлектронов). По этой причине данный эффект
был назван внешним фотоэффектом. Принципиальная схема усовершенствованного прибора Столетова приведена на рис. 8.4. Свет, проникающий через
кварцевое окошко Кв (оно пропускает и ультрафиолетовые лучи), освещает
катод К, находящийся в эвакуированном баллоне. Испускаемые катодом
электроны под действием электрического поля движутся к аноду А. В результате появляется фототок, измеряемый гальванометром G . Установка позволяла изменять полярность и величину напряжения U между анодом и катодом с помощью потенциометра П.
Если при неизменных интенсивности и частоте падающего света изменять напряжение U , то зависимость фототока I от U (вольтамперная харак-
72
теристика) отображается кривой, представленной на рис. 8.5. Видно, что при
некотором напряжении фототок достигает насыщения. Это происходит тогда,
когда все электроны, вырванные светом с поверхности катода, достигают
анода. Дальнейшее повышение напряжения не меняет силу тока: она определяется только количеством электронов, испускаемых катодом в единицу времени.
Пологий ход кривой I (U ) свидетельствует о том, что вырываемые из
катода электроны имеют разные скорости, и даже при U  0 есть электроны,
которые «самостоятельно» достигают анода. Для обращения тока в нуль требуется задерживающее напряжение U З , которое определяется условием
mvm 2 / 2  eU З , где vm - максимальная скорость фотоэлектронов. Таким обра-
зом, измерив U З , можно определить максимальное значение скорости фотоэлектронов.
Проведенные экспериментальные исследования позволили сформулировать законы внешнего фотоэффекта:
- максимальная начальная скорость фотоэлектронов зависит от частоты
света и не зависит от его интенсивности;
- для каждого вещества существует так называемая «красная граница»
фотоэффекта, т.е. минимальная частота света  0 , при которой еще возможен
фотоэффект. Величина  0 зависит от химической природы вещества и состояния его поверхности;
- фототок насыщения пропорционален освещенности катода (число вырываемых фотоэлектронов в единицу времени пропорционально интенсивности света);
- фотоэффект практически безынерционен. Именно на такой безынерционности основаны практически все научно-технические применения фотоэффекта.
Эти зависимости никак не укладываются в рамки классических представлений с волновой точки зрения. Если рассматривать взаимодействие свободного электрона в металле с электромагнитной волной, то приобретаемая
им энергия (или скорость) должна возрастать с интенсивностью падающего
света, а никак не с частотой. Если же электрон связанный, то зависимость
энергии электрона от частоты падающего света должна носить более сложный резонансный характер.
В 1905 г. А.Эйнштейн показал, что все закономерности фотоэффекта
легко объясняются, если предположить, что свет поглощается такими же
порциями (квантами)  , какими он, по мысли Планка, испускается. Таким
образом, электрон накапливает энергию не постепенно, а получает ее сразу в
73
результате единичного акта неупругого столкновения. Это сразу объясняет
безынерционность фотоэффекта.
По идее Эйнштейна, энергия, полученная электроном от кванта света
 , расходуется, прежде всего, на совершение работы выхода. Если электрон освобождается светом не у самой поверхности, то часть энергии E может быть потеряна вследствие случайных столкновений в веществе. Остаток
энергии кванта превращается в кинетическую энергию электрона, покинувшего вещество, которая будет максимальной, если положить E  0 . В этом
случае выполняется закон сохранения энергии
1
(8.8)
  mvm 2  A .
2
Это уравнение называется уравнением Эйнштейна для внешнего фотоэффекта в одноэлектронной и однофотонной модели и утверждает, что максимальная скорость фотоэлектронов зависит только от частоты падающего
излучения, а не от его интенсивности (при прочих равных условиях). Кроме
того, в случае, когда работа выхода превышает энергию кванта  , электроны не могут покинуть металл. Следовательно, существует минимальная частота, при которой еще возможен фотоэффект. Ее значение определяется
формулой  0  A /  2  . Соответственно для длины волны света получаем
условие   0  2 c / A .
При не слишком больших плотностях падающего на металл излучения
электрон получает энергию от одного фотона. Поэтому такой процесс и был
назван однофотонным. С появлением лазеров стало возможным наблюдать
нелинейные особенности фотоэффекта. Если интенсивность света достаточно
велика, то электрон, прежде чем покинуть металл, успевает столкнуться не с
одним, а с несколькими фотонами (многофотонный процесс). В этом случае
вместо (8.8) следует написать
1
N   mvm 2  A .
2
Соответственно красная граница фотоэффекта смещается в сторону более длинных волн (увеличивается в N раз). Длинноволновая граница многофотонного фотоэффекта надежно зафиксирована при N  2,3,4,5 для различных металлов ( Na, Ag , Au и др.), а также для полупроводников.
8.1.3. Опыт Боте. Давление света
Теоретическое объяснение законов теплового излучения и внешнего
фотоэффекта оказалось возможным благодаря идее о том, что свет испускается и поглощается квантами с энергией  . Наиболее же непосредственным
74
подтверждением идеи Эйнштейна о том, что и при распространении в пространстве свет ведет себя как поток квантов (фотонов) явился опыт Боте.
Тонкая металлическая фольга Ф (рис.
РИ
8.6) освещалась слабым рентгеновским излучением (РИ), под действием которого она сама
становилась источником рентгеновских лучей
Сч
Сч
Ф
(это явление называется рентгеновской флуоресценцией). Вторичное рентгеновское излучение фиксировалось двумя газоразрядными
М
М
счетчиками Сч, связанными с особыми мехаЛ
низмами М, которые делали отметку на движущейся ленте Л.
Если бы, как это следует из волновых
Рис. 8.6
представлений, вторичное излучение равномерно распространялось во все стороны, то оба счетчика должны были бы
срабатывать одновременно и отметки на ленте находились одна против другой. В опыте же Боте наблюдалось совершенно беспорядочное расположение
меток. Это можно объяснить только тем, что вследствие малой интенсивности первичного пучка фольга испускает малое количество квантов и в отдельных актах испускания вторичного рентгеновского излучения возникают
частицы, летящие то в одном, то в другом направлении. Как уже отмечалось
ранее, такие частицы получили название фотонов.
Идея фотонов не являлась простым возвратом к ньютоновской корпускулярной теории света. Это видно уже из того, что фотонам свойственна интерференция и дифракция. Они обладают не только корпускулярными, но и
волновыми свойствами. В этом проявляется так называемый корпускулярноволновой дуализм (двойственность). И хотя наше воображение не в состоянии создать образ, обладающий одновременно свойствами и частицы и волны, тем не менее, с этим приходится мириться. Так устроен мир!
Если фотон обладает энергией, то в соответствие с теорией относительности он должен обладать и импульсом. Для установления этой связи
обратимся к основным соотношениям теории относительности для свободно
движущейся частицы:
E 2  p 2c 2  m 2 c 4 ,
p  (E / c 2 )v.
(8.9)
Здесь E - энергия, p - импульс, m - масса, v - скорость частицы. Из этих соотношений нетрудно выразить значение энергии и импульса через массу частицы и ее скорость
75
E  mc 2 / 1  v2 / c 2 ,
p  mv/ 1  v2 / c 2 .
Так как фотон движется со скоростью v = c , то из (8.9) находим, что
энергия фотона  связана с его импульсом p соотношением   pc (точно
такая же связь существует для энергии и импульса электромагнитной волны).
Кроме того, из соотношений (8.9) следует, что если фотон (или любая другая
частица) движется со скоростью v = c , то его масса равна нулю, и наоборот.
Т.е. для фотона нет системы отсчета, где он покоится, покой ему «только
снится».
Соотношение   pc позволяет выразить импульс фотона через частоту
 и соответственно через волновое число k  2 /    / c ( - длина волны)


p 
 k.
c
c
Так как фотон летит в направлении распространения электромагнитной волны, то направление импульса p и волнового вектора k совпадают. Следовательно p  k .
Непосредственным подтверждением наличия импульса у фотона является, например, давление света. Пусть по направлению нормали к стенке на
единичную площадь в единицу времени падает n фотонов. Из них часть   n
отражается, а (1   )n поглощается (   1 - коэффициент отражения). От каждого отраженного фотона стенка получает импульс, равный удвоенному импульсу фотона 2h / c , а от поглощенного фотона - h / c . Таким образом,
полный импульс, полученный стенкой от всех фотонов, равен
2h
h
p
 n  (1   )n .
c
c
С учетом того, что давление P – это импульс, полученный стенкой за единицу времени, для давления получаем
nh
P
(1   ) .
c
Произведение nh дает энергию, падающую на стенку за единицу времени. А это есть интенсивность света I . Таким образом, давление света на
стенку равно
I
P  (1   ) .
c
В электромагнитной теории света получается точно такое же выражение для давления света. Измерить давление света впервые удалось П.Н. Лебедеву.
76
8.1.4. Эффект Комптона
В 1923 г. А.Комптон, исследуя рассеяние рентгеновских лучей различными веществами, обнаружил, что в рассеянных лучах вместе с излучением
первоначальной длины волны  содержится также излучение большей длины волны    . Разность длин волн      зависела только от угла рассеяния по отношению к направлению исходного пучка рентгеновских лучей
и не зависела от природы рассеивающего вещества.
Д
Схема опыта Комптона приведена на рис. 8.7.
Ртр
Выделяемый диафрагмами Д узкий пучок рентгеРВ


новских лучей от рентгеновской трубки Ртр направ
лялся на рассеивающее вещество РВ. Спектральный

состав прошедшего через вещество излучения исследовался с помощью рентгеновского спектрографа.
Рис. 8.7
При рассеянии веществами, находящимися в
начале таблицы Менделеева ( Li, Be, B... ) практически все рассеянное излучение имеет смещенную длину волны. С ростом атомного номера рассеивающего вещества все большая часть излучения рассеивается без изменения
длины волны. Изменение длины волны при рассеянии веществом никак не
укладывается в рамки классической физики. По известным законам взаимодействия электромагнитного излучения с веществом никакого изменения
длины волны вообще не должно быть.
Для объяснения закономерностей эффекта Комптона обратимся к квантовой природе света, и будем
k
рассматривать рассеяние как упругое столкновение

k рентгеновских фотонов с практически свободными
покоящимися электронами. Пусть на неподвижный
p
свободный электрон налетает фотон с энергией  и
Рис. 8.8
импульсом k (рис.8.8). Энергия электрона до столк-
новения равна mc 2 (m - масса электрона). После столкновения электрон приобретает импульс p и энергию c p 2  m2c 2 . Энергия и импульс фотона
также изменяются и становятся равными  и k  . Запишем теперь законы
сохранения энергии и импульса для этой системы:
  mc 2    c p 2  m2c 2 ,
k  p  k .
Поделим первое из этих равенств на c и учтем, что  / c  k . Тогда получаем
77
(k  k )  mc  p 2  m2c 2 .
(8.10)
Кроме того, из рис. 8.8 следует
p 2   k    k    2  k  k   cos .
2
2
(8.11)
После возведения в квадрат равенства (8.10) с учетом (8.11) приходим к
уравнению
2 (k  k )mc  2 2kk (1  cos ) .
Откуда
1 1
  1  cos 
.
k k
mc
Наконец, учтя, что 2 / k   , получаем окончательно
      C 1  cos  ,
где C  2 / mc - комптоновская длина волны частицы с массой m , на которой происходит рассеяние рентгеновского излучения. В нашем случае это
комптоновская длина волны электрона.
При рассеянии фотонов на сильно связанных с атомами электронах обмен энергией и импульсом происходит с атомом как единой частицей. И так
как масса атома много больше массы электрона комптоновское смещение
мало и   практически совпадает с исходной длиной волны. С ростом атомного номера рассеивающего вещества увеличивается относительное число
электронов с сильной связью, что и обуславливает наблюдаемое на опыте ослабление смещенных линий в рассеянном излучении.
8.2. Строение атома
8.2.1. Модели атома. Атомные спектры
До сих пор мы занимались в основном вопросами взаимодействия излучения с веществом. Понятно, что эти проблемы должны быть тесно увязаны со строением атомов и молекул. Ведь само излучение и рождается в их
недрах.
Согласно классическим представлениям атом может испускать монохроматическую волну (т.е. отдельную спектральную линию), если электрон в
излучающем атоме является гармоническим осциллятором. В 1903 г. Дж.
Томсон предложил модель атома, согласно которой атом представляет собой
равномерно заряженный положительным зарядом шарик, внутри которого
колеблется электрон (сам атом в целом электрически нейтрален). Однако в
дальнейшем выяснилась несостоятельность этой модели. Связано это, прежде всего с тем, что при колебаниях электрон за счет электромагнитного излучения должен излучать не монохроматическую волну и, в конце концов, колебания должны исчезнуть. Более удачная модель атома была предложена Э.
78
Резерфордом в 1911 г. Основываясь на опытах по рассеянию  - частиц тонкими слоями вещества, Резерфорд пришел к ядерной модели атома. Согласно
этой модели атом представляет собой систему зарядов, в центре которой находится тяжелое ядро с зарядом Ze ( Z - порядковый номер элемента по таблице Менделеева) и размерами, превышающими 10-13см. Вокруг ядра распределены по всему объему атома Z электронов. Размер атома порядка 10-8 см.
И почти вся масса атома сосредоточена в ядре.
Однако и ядерная модель оказалась в противоречии с законами классической механики и электродинамики. В соответствии с классической теоремой Ирншоу о невозможности устойчивого равновесия в системе неподвижных зарядов, Резерфорд отказался от статической модели атома и предположил, что электроны движутся по замкнутым траекториям вокруг ядра. При
таком движении электроны, обладая ускорением, обязаны излучать электромагнитные волны. Это конечно положительный момент, но с другой стороны
процесс излучения должен сопровождаться потерей энергии, так что в конечном итоге электрон должен упасть на ядро и атом прекращает свое существование. Этого не происходит в природе – реальный атом длительное время имеет определенные размеры и частоты излучения. Кроме того, излучаемая атомом энергия неизмеримо меньше той, которая выделилась бы при падении электрона на ядро.
Ключом к открытию строения атомов явилось изучение атомных спектров. Прежде всего, было замечено, что излучение невзаимодействующих
атомов состоит из отдельных спектральных линий. В соответствие с этим
спектр испускания атомов называется линейчатым. Отдельные линии в спектрах атомов расположены не беспорядочно, а объединяются в группы или
серии линий. Отчетливее всего это проявляется в спектрах простейшего атома – атома водорода. Частоты линий излучения атома водорода могут быть
точно представлены обобщенной формулой Бальмера
1 
 1
  R 2  2  ,
m 
n
где R  2,07 1016 с-1- постоянная Ридберга, n и m - целые числа, не равные
нулю. При n  1(m  2,3,4...) наблюдается так называемая серия Лаймана,
располагающаяся в ультрафиолетовой части спектра, при n  2 (m  3,4,5...) серия Бальмера в видимой части спектра, при n  3 (m  4,5,6...) - серия Пашена в инфракрасной части спектра и т.д.
8.2.2. Боровские постулаты и атом водорода
Первая последовательная теория, объясняющая закономерности в
атомных спектрах, была построена Н.Бором в 1913 г. ценой введения пред-
79
положений, в корне противоречащих классическим представлениям. Основные идеи Бора были высказаны им в следующих постулатах.
1. Электроны могут двигаться вокруг ядра только по определенным
(разрешенным) орбитам без излучения энергии (так как энергия движения
сохраняется, то эти орбиты называются стационарными).
2. Испускание света происходит при переходе электрона из стационарного состояния с бóльшей энергией En в стационарное состояние с меньшей
энергией Em . При каждом таком переходе излучается квант энергии  . Его
величина равна разности энергий стационарных состояний, между которыми
совершается квантовый переход:
(8.12)
  En  Em .
При поглощении света атом переходит из состояния с меньшей энергией в
состояние с бóльшей энергией.
В принципе идеи Бора понять не сложно. Из факта существования узких спектральных линий поглощения и излучения, с одной стороны, и из гипотезы световых квантов Эйнштейна – с другой, следует скорее тот вывод,
что атом может находиться только в определенных, дискретных стационарных состояниях с энергией E0 , E1, E2 ,... . Таким образом, атом может поглощать лишь излучения таких частот, что  равно как раз той порции энергии, которая нужна для перевода атома из одного стационарного состояния в
другое, более высокое. Поэтому линии поглощения определяются уравнениями
E1  E0  h1, E2  E0  h 2 ,... ,
где E0 - энергия самого низкого состояния, которое характерно для атомов в
отсутствии каких-либо внешних влияний. Если по какой-либо причине атом
возбуждается, т.е. переходит в состояние с энергией En  E0 , то он может
вернуть эту энергию в виде излучения. Следовательно, он может испустить
любые световые кванты, энергия которых в точности равна разности энергий
каких-то стационарных состояний. Поэтому линии излучения определяются
уравнением En  Em  h nm .
Прямым подтверждением теории служит следующий факт. Коль скоро
гипотеза Бора соответствует действительности, то возбужденный атом может
возвращаться в основное состояние различными путями, отдавая каждый раз
избыток энергии излучаемым квантам. Например, атом в третьем возбужденном состоянии может либо непосредственно вернуться в основное состояние
(при этом испущенный световой квант будет обладать частотой  30 , так как
разница в энергиях равна E3  E0 ), либо, например, перейти сначала в первое
80
h 32
h 31
h 30 h 10
4
возбужденное состояние E1 (испустив квант энергии
3
h 31 ), а уже затем – в основное (что соответствует часто-
2
те  10 ) и т.д. (рис.8.9). Поскольку в совокупности испу-
1
щенная энергия во всех случаях, несомненно, остается
одной и той же, а именно равной E3  E0 , частоты излу-
h 20
чения должны подчиняться следующим соотношениям:
 30   31 10   32  20   32  21 10 .
Данное соотношение хорошо известно как комбиРис. 8.9
национный принцип Ритца. Этот принцип должен выполняться при всех обстоятельствах, а так как он непосредственно следует из квантовых представлений, то им можно воспользоваться для экспериментальной проверки теории. Правда, исторически все
сложилось как раз наоборот – комбинационный принцип был предложен
Ритцем на основе анализа накопившихся к тому времени спектроскопических
данных еще за восемь лет до создания боровской теории.
Бор знал об экспериментальной формуле Бальмера и понял, что для ее
объяснения ему придется предложить еще одно условие:
3. Из всех возможных с точки зрения классической механики круговых
орбит движения электрона реализуются только те, для которых момент импульса электрона кратен постоянной Планка :
L  mvr  n (n  1,2,3...) .
(8.13)
0
Это утверждение отражает условие квантования орбит. Единственным
аргументом в его пользу было то, что оно позволяло достичь согласия с наблюдаемыми спектрами.
Посмотрим теперь, к каким выводам приводит последовательное применение боровских постулатов к водородоподобному атому. Для этого рассмотрим электрон, движущийся по круговой орбите радиуса r в кулоновском поле тяжелого атомного ядра с зарядом Ze (при Z  1 такая система соответствует атому водорода). Уравнение движения электрона имеет вид
v2
Ze2
m k 2 ,
(8.14)
r
r
где k  1/ 4 0 . Исключая из уравнений (8.13) и (8.14) скорость электрона v ,
получаем выражение для радиусов допустимых орбит:
4 0 2 2
rn 
n (n  1,2,3...) .
Zme2
81
Значение n называют главным квантовым числом. Радиус первой орбиты водородного атома называют боровским радиусом и его принято обозначать как r0 (а не r1 ). Его значение равно
4 0 2
r0 
 0,5  1010 м.
2
me
Заметим, что классическая физика вообще не дает значения размеров
атома. На каждой орбите (в каждом состоянии) электрон обладает энергией
mv2
Ze2
Ze2
.
E


2
4 0r
8 0r
Подставляя сюда значение rn , находим разрешенные значения энергии
En  
Z 2me4
32 2 02
2

1
n2
(n  1,2,3...) .
(8.15)
Уровень E1 соответствует энергии основного (невозбужденного) состояния с наименьшей энергией. Его значение для атома водорода равно
me4
E1  
 13,6 эВ.
3220 2 2
Если электрону сообщить такую энергию, то он покидает пределы атома, поэтому это значение называется энергией ионизации. Значения E2 , E3... соответствуют возбужденным состояниям.
При комнатных температурах атомы водорода находятся в основном
состоянии. При повышении температуры или в газовом разряде электроны
переходят в возбужденное состояние со «временем жизни»  108 с. Затем
при переходе в основное состояние излучается квант света. Так возникают
спектры испускания. Если через водород пропускать другой свет, то атомы
отбирают только те линии, которые соответствуют разности энергий какихлибо состояний – так возникают спектры поглощения.
Посмотрим теперь как формула (8.15) позволяет объяснить закономерности спектрального состава излучения атома водорода. При переходе атома
из состояния с номером m в состояние с номером n  m излучается фотон,
частота которого в соответствии с формулами (8.12) и (8.15) равна
me4  1
1 

 2 .
2 2 3 2
32  0  n
m 
Таким образом, мы пришли к обобщенной формуле Бальмера, причем
для постоянной Ридберга получили значение
me4
.
R
32 2 0 2 3
82
При подстановке в это выражение значений всех констант получается величина, превосходно согласующаяся с экспериментальным значением постоянной Ридберга.
На рис. 8.10 отображена схема формирования различных серий излучения атома водорода.
E, эВ
E 0
0,85
1,5
серия
E4
E3
Пашена
3,4
серия
E2
Бальмера
 13,6
серия
E1
Лаймана
Рис. 8.10
Теория Бора была крупным шагом в развитии представлений о строении атома. Прежде всего, она гарантировала устойчивость атома водорода,
так как нет состояний с более низкой энергией. Она превосходно объясняла
все закономерности спектров испускания и поглощения атома водорода. Теория Бора с полной отчетливостью показала неприменимость классической
физики к внутриатомным явлениям и подчеркнула особую роль квантовых
законов. В то же время после первых успехов этой теории все яснее давали
себя знать ее недостатки. Особенно тягостной была неудача всех попыток
построения теории атома гелия – одного из простейших атомов, следующего
за атомом водорода.
Самой слабой стороной теории Бора была ее внутренняя логическая
противоречивость: она не была ни последовательно классической, ни последовательно квантовой; эта теория могла быть только переходным этапом на
пути создания последовательной теории строения атомов.
8.3. Основные принципы квантовой механики
8.3.1. Гипотеза де Бройля. Волновые свойства вещества
В 1923 году стало почти ясно, что теория Бора и старая теория квантов
лишь промежуточное звено между классическими представлениями и какими-то новыми взглядами, позволяющими глубже проникнуть в исследование
квантовых явлений. Открытый к этому времени эффект Комптона и изучение
фотоэффекта рентгеновских лучей лишний раз подтвердили представления
Эйнштейна о световых квантах. Следовательно, с еще большей остротой
83
встала дилемма: что такое свет – волны или частицы? Соотношение Эйнштейна между частотой и энергией, введенное им в теории фотонов, ясно показало, что этот дуализм излучения неразрывно связан с самим существованием квантов. Но тогда почти сам собой возникает вопрос: поскольку свойства электрона в стационарном состоянии атома описываются с помощью
постоянной Планка, нельзя ли предположить, что и электрон также двойственен, как и свет? И в 1924 году Луи де Бройль выдвинул гипотезу, что дуализм не является особенностью одних лишь оптических явлений, а присущ
также и частицам вещества. По его идее частицы вещества также должны
проявлять волновые свойства, т.е. движение электрона или другой микрочастицы связано с некоторым волновым процессом, длина волны которого
должна быть равна
2

,
p
а частота   E /  , где E - энергия, p - импульс частицы.
Согласно гипотезе де Бройля, свободной частице с энергией E и импульсом p , движущейся вдоль направления x , соответствует плоская гармоническая волна
 i  Et  px  
 ( x, t )  A exp  
,


где E  , p  k  2 /  ( k - волновое число). Так как энергия E в прин-
ципе определена всегда с точностью до произвольной постоянной (физическим смыслом обладает изменение E ), то частота   E / является принципиально ненаблюдаемой величиной (в отличие от дебройлевской длины
волны).
Рассмотрим теперь некоторые свойства волн де Бройля. Эти волны, как
и любые другие, могут отражаться, преломляться, испытывать интерференцию и дифракцию. Эти волны обладают как фазовой, так и групповой скоростью. Для определения фазовой скорости найдем дифференциал фазы этих
волн и положим его равным нулю (напомним, что фазовая скорость определяется как скорость перемещения в пространстве постоянного значения фазы
волны):
dx E
d ( Et  px)  0  vфаз 
 .
dt p
И поскольку E  mc 2 / 1  v2 / c 2 , а p  mv/ 1 - v2 / c 2 ( m -масса частицы), то
для фазовой скорости волны де Бройля частицы, движущейся со скоростью
v , получаем
84
c2
vфаз  .
v
То, что фазовая скорость оказалась больше скорости света в вакууме,
не противоречит теории относительности. Ограничения, накладываемые этой
теорией, справедливы лишь для процессов, связанных с переносом массы
или энергии. Фазовая же скорость волны не характеризует ни один из этих
процессов.
Так как фазовая скорость зависит от частоты (даже в нерелятивистском
случае vфаз  E / p  E / 2mE 
 / 2m , m - масса частицы), то дебройлев-
ские волны обладают дисперсией даже в вакууме. В соответствие с современной физической интерпретацией фазовая скорость дебройлевских волн
имеет чисто символическое значение, поскольку эта интерпретация относит
ее к числу принципиально ненаблюдаемых величин.
Найдем теперь групповую скорость. По определению
d d    dE
.
vгр 


dk d  k  dp
С учетом релятивистской связи энергии частицы E и ее импульса p
E 2  p 2c 2  m2c 4 находим 2EdE  2 pc 2dp . Откуда
dE pc 2
vгр 

v
dp
E
(при этом мы учли соотношение p  ( E / c 2 ) v . Таким образом, групповая скорость волны де Бройля равна скорости движения частицы и является уже наблюдаемой величиной (в отличие от vфаз - из-за неоднозначности энергии E ).
Этот факт в свое время сыграл важную роль в развитии принципиальных основ квантовой физики, и в первую очередь в физической интерпретации волн
де Бройля. Вначале из-за совпадения скорости частицы и групповой скорости
волн де Бройля была сделана попытка рассматривать частицы как волновые
пакеты весьма малой протяженности и таким образом решить парадокс дуализма свойств частиц. Однако эта соблазнительная интерпретация оказалась
ошибочной, так как все составляющие пакет гармонические волны из-за дисперсии распространяются с разными скоростями. Это приводит к тому, что
даже в вакууме волновой пакет «расплывается». Для микрочастиц пакет расплывается практически мгновенно, в то время как сама частица является стабильным образованием. Таким образом, представление частицы в виде волнового пакета оказалось несостоятельным.
85
Если электроны ускоряются электрическим полем с напряжением U , то
в нерелятивистском случае p  2meU , и тогда их дебройлевская длина волны при U  150 В составит
2
 0,1 нм.
2meU
Такой же порядок величины имеет постоянная кристаллической решетки.
Поэтому аналогично дифракции рентгеновских лучей кристаллическая
структура металлов может быть подходящей решеткой для наблюдения дифракции дебройлевских волн.
Экспериментальное подтверждение идеи де
Электронная пушка
Бройля было проведено Дэвиссоном и Джермером в
К гальванометру
опытах по отражению электронов от кристаллов ни 
келя. Узкий пучок моноэнергетических электронов
(рис.8.11) направлялся на поверхность монокристалNi
ла никеля. Отраженные электроны улавливались циРис. 8.11
линдрическим электродом, присоединенным к гальванометру. В опытах изменялась скорость электронов и угол  . И оказалось, что максимальное рассеяние наблюдалось при
некотором угле  0 и определенной скорости v0 . Все это было очень похоже

на дифракцию рентгеновских лучей. Максимальное отражение рентгеновского излучения должно наблюдаться в направлении, подчиняющемся формуле
Вульфа-Брэггов 2d sin   k , где d – расстояние между атомными плоскостями, которое было известно из рентгенографических исследований. Рассчитанное по формуле Вульфа-Брэггов (при известных значениях  и d )
значение  равнялось 1,65  10-10м. Вычисленное значение  по формуле де
Бройля равно 1,67  10-10м! Совпадение было настолько полным, что опыты
Дэвиссона и Джермера следует признать блестящим подтверждением гипотезы де Бройля (поразительный факт – Дэвиссон наблюдал подобное явление
за три года до появления работы де Бройля, но он не смог правильно истолковать полученные экспериментальные данные).
В дальнейшем были проведены опыты по дифракции электронов на
тонкой металлической фольге (Томсон, Тартаковский), которые ясно свидетельствовали, что дифракция микрочастиц абсолютно тождественна дифракции рентгеновского излучения. Было предположение, что волновые свойства
частицы проявляют только в достаточно интенсивных пучках (т.е. как коллективный эффект), но опыты по дифракции на одиночных электронах показали, что волновые свойства присущи отдельной микрочастице. Каждая микрочастица сочетает в себе свойства и частицы и волны. В то же время они не
86
ведут себя ни как волны, ни как частицы. Отличие частицы от волны заключается в том, что она всегда обнаруживается как неделимое целое. Никто никогда не наблюдал, например, пол-электрона. В то же время волну можно
разделить на части и воспринимать затем каждую часть в отдельности, например, при интерференции света.
Своеобразие свойств микрочастиц отчетливо обнаруживается в следующем мысленном эксперименте по дифракции электронов на двух щелях
(позднее этот опыт был проведен в реальных условиях).
На преграду с двумя узкими щелями
(рис.8.12) направляется параллельный пучок моноэнергетических электронов. За
1
2
преградой размещается для регистрации
3
места попадания электронов фотопластинка (Фпл). При открытой только первой
1
2
щели распределение попадания электроФпл
нов на фотопластинку имеет вид кривой 1.
При открытой второй щели распределение
Рис. 8.12
имеет вид 2. Если же открыть обе щели
одновременно, то распределение попадания электронов не является простой
суммой кривых 1 и 2, а отображается кривой 3. Эта картина отнюдь не эквивалентна наложению первых двух картин. Она аналогична картине, получающейся при интерференции двух когерентных световых волн. Характер
картины свидетельствует о том, что на движение каждого электрона влияют
сразу оба отверстия. То есть электрон, каким- то непостижимым образом
«знает», открыто одно отверстие или оба! Отсюда автоматически следует вывод о том, что к нему неприменимо понятие траектории (мы не можем сказать, через какую щель прошел электрон).
8.3.2. Принцип неопределенности и его следствия
То обстоятельство, что в квантовой механике не существует понятия
траектории, составляет содержание так называемого «принципа неопределенности», сформулированного в 1927 г. Гейзенбергом. Если пытаться измерить одновременно координату и импульс микрочастицы, то чем с большей
точностью известно положение частицы, тем больше неопределенность в
значении импульса. С математической точки зрения данное положение
обычно записывают в следующем виде:
xp x   , yp y   , zp z   ,
87
где x - неопределенность координаты x , p x - неопределенность импульса
в направлении оси x (аналогично для других направлений). Подобное же соотношение существует и для энергии:
Et   ,
которое означает, что чем короче время существования какого-то состояния
или время, отведенное для его наблюдения, тем с меньшей определенностью
можно говорить об энергии этого состояния. Если состояние стационарно, то
оно может существовать бесконечно долго. Иногда соотношение неопределенности для энергии трактуют таким образом, что для измерения энергии с
точностью E необходимо время t   / E .
Соотношение неопределенностей не связано с несовершенством измерительных приборов, а глубоко обусловлено самой природой вещей. Если бы
оказалось возможным преодолеть это ограничение, то рухнуло бы все здание
квантовой механики.
Отметим некоторые выводы, вытекающие из соотношения неопределенностей.
1.Измерения в квантовой области принципиально отличаются от классических измерений. Конечно, и те и другие измерения сопровождаются некоторой ошибкой. Однако в классической физике всегда предполагалось, что
путем улучшения методики и техники измерений ошибки в принципе могут
быть сделаны сколь угодно малыми. В квантовой же механике существует
принципиальный предел точности измерений, который лежит в природе вещей и не может быть преодолен никаким ухищрениями. Соотношения неопределенностей Гейзенберга и устанавливают один из таких пределов. Взаимодействие между макроскопическим прибором и микрочастицей во время
измерения принципиально нельзя сделать сколь угодно малым. Если измеряется, например, координата частицы, то измерение неизбежно приводит к
принципиально неустранимому неконтролируемому искажению первоначального состояния частицы, а, следовательно, и к неопределенности импульса при последующем измерении. То же самое происходит, если поменять
местами порядок измерения координаты и импульса частицы.
2. Невозможно осуществить состояние, в котором частица находится в
полном покое.
3. В квантовой механике теряет смысл деление полной энергии на кинетическую и потенциальную. Одна из них зависит от импульсов, а другая от
координат. Эти же переменные не могут иметь одновременно определенные
значения. Энергия E должна определяться и измеряться лишь как полная
энергия без деления на кинетическую и потенциальную.
88
Соотношение неопределенности является одним из фундаментальных
положений квантовой механики. Оно, например, позволяет объяснить, почему электрон не падает на ядро, более того, оценить даже размеры простейшего атома и его минимальную энергию. Примем для оценки неопределенность
положения электрона в атоме водорода порядка размеров атома и неопределенность импульса порядка самого импульса: r  r и p  p . Тогда в силу
соотношения неопределенности имеем rp   . В гауссовой системе единиц
энергия электрона в атоме водорода равна
2
mv2 e2 p 2 e2
e2
E
 
 
 .
2
r 2m r 2mr 2 r
Найдем размеры атома при минимальной энергии. Для этого продифференцируем энергию по расстоянию и положим производную равной нулю:
2
e2
 3  2  0.
mr
r
Откуда сразу находим выражение для боровского радиуса
2
,
r0 
me 2
и для минимальной энергии электрона в атоме водорода
2
 2 me 2 2
me 4
2 me
Emin 
(
) e
 2 .
2m  2
2
2
Причем мы получили абсолютно точные значения (случайность!).
Докажем теперь, что электрон не может находиться внутри атомного
ядра. Если электрон может находиться в области порядка размеров ядра (
x  10 15 м ), то неопределенность импульса будет порядка

p 
 197 МэВ / с .
x
Оценим теперь его кинетическую энергию. На всякий случай воспользуемся
релятивистской формулой для кинетической энергии
E  c 2 p 2  m2c 4  mc 2  267МэВ
(мы не ошиблись, применив релятивистскую формулу, поскольку полученное значение более чем в 500 раз превосходит энергию покоя электрона). Мы
не знаем в природе сил, величина которых обеспечила бы связь электронов,
обладающих столь большой энергией, с нуклонами ядра (электростатическая
потенциальная энергия электрона на поверхности ядра составляет лишь 10
МэВ).
89
Представление о классическом движении электрона по орбитам также
противоречит соотношению неопределенностей. Чтобы такое представление
имело смысл, необходимо выполнение соотношения r  r0 , где
r0   2 / me 2 - радиус первой боровской орбиты, а r - его неопределенность.
Соответствующая неопределенность в радиальном импульсе будет:

 me 2
,
p 
 
r
r0

что равно самому импульсу электрона p  me 2 /  . Это и означает, что бессмысленно говорить о движении электрона по орбитам внутри атома.
Посмотрим теперь на колебания атомов в твердых телах с точки зрения
принципа неопределенности. Обычно такие колебания связаны с тепловым
движением атомов. Чем выше температура, тем сильнее колебания и тем
больше амплитуда этих колебаний. При понижении температуры уменьшается и амплитуда этих колебаний. И при нулевой температуре с точки зрения
классической физики амплитуда должна быть равна нулю. А что же происходит на самом деле? Уменьшение амплитуды колебаний приводит к уменьшению области локализации частицы, и соответственно, в силу принципа неопределенности начинает расти импульс и энергия частицы. То есть попытка
остановить частицу безуспешна! И даже при абсолютном нуле температуры
атомы в твердом теле совершают колебания – их называют нулевыми колебаниями. Оценим энергию этих колебаний, принимая атом за гармонический
осциллятор. Энергия гармонического осциллятора массой m и частотой 
связана с амплитудой колебаний A соотношением:
m 2 A 2
E
.
2
Данное соотношение в сочетании с принципом неопределенности дает
своеобразную связь амплитуды колебаний и энергии частицы. Чем меньше
энергия, тем меньше амплитуда (область локализации частицы), тем больше
минимальный импульс частицы, а это, соответственно, приводит к росту
энергии. Минимальная энергия, которой может обладать частица
p0
2
 2 m 2
E0 


2m mA 2
mE0
2
(при этом мы воспользовались соотношением p0 A   ).
Из последнего соотношения получаем E0   (точный расчет дает
E0   / 2 ). Полученный результат говорит о том, что энергия колебаний
максимальна у легких атомов, у которых большая частота  .
90
Самое яркое проявление нулевых колебаний – жидкость, которая не
замерзает при T  0K . Ясно, что жидкость не замерзает, если кинетической
энергии колебаний атомов достаточно для того, чтобы разрушить кристаллическую решетку. При этом совершено неважно происхождение кинетической
энергии – связана ли она с тепловым движением атомов или с нулевыми
квантовыми колебаниями. Наиболее вероятные кандидаты в незамерзающие
жидкости – водород и гелий (максимальная энергия нулевых колебаний). Но
гелий – инертный газ, с очень слабым взаимодействием между атомами. И
кинетической энергии нулевых колебаний достаточно для расплавления кристаллической решетки. Вот почему гелий не замерзает даже при нулевой
температуре при нормальном давлении (при давлении 25 атмосфер гелий всетаки замерзает!).
Иногда соотношение неопределенности получает следующее толкование: «на самом деле» частица имеет точное значение координаты и импульса,
однако вмешательство прибора «портит» их значения. Такое истолкование
является совершенно неверным, т.к. противоречит наблюдаемой на опыте
дифракции микрочастиц.
8.3.3. Волновая функция. Уравнение Шредингера
Основу математического аппарата квантовой механики составляет тот
факт, что каждое состояние системы микрочастиц может быть описано некоторой функцией координат и времени  ( x, y, z, t ) . Ее называют волновой
функцией (пси-функцией). В общем случае эта функция является комплексной. Физический смысл ее заключается в том, что квадрат ее модуля определяет вероятность обнаружить частицу в пределах объема dV : dP  A dV ,
2
где A – некоторый коэффициент пропорциональности, который находится из
2
условия A  dV  A  *dV  1(знак * означает комплексное сопряжение).
V
V
Это позволяет переопределить пси-функцию таким образом, чтобы было выполнено условие нормировки для самой волновой функции:
2
  dV  1. Из
V
смысла пси-функции следует, что квантовая механика имеет статистический
характер. С помощью волновой функции можно только предсказать, с какой
вероятностью частица может быть обнаружена в данном месте пространства.
Сама волновая функция является решением дифференциального уравнения,
которое впервые получил Шредингер в 1926г. Уравнение Шредингера является основным уравнением квантовой механики и не может быть выведено из
других соотношений. Его следует рассматривать как исходное основное
предположение, справедливость которого доказывается тем, что вытекающие
91
из него следствия точно согласуются с опытными фактами. Само уравнение
выглядит следующим образом:

где  
2

,
  U  i
2m
t
2
2
2
- оператор Лапласа, m – масса частицы, U ( x, y, z, t ) 

x 2 y 2 z 2
функция, градиент которой, взятый со знаком минус, определяет силу, действующую на частицу. Если функция U не зависит от времени, то она имеет
смысл потенциальной энергии.
Если силовое поле, в котором движется частица, стационарно, то U не
зависит явно от времени и в этом случае решение уравнения Шредингера
можно представить в виде произведения двух множителей, один из которых
зависит только от времени, другой – от координат:
iEt
 ( x, y, z, t )   ( x, y, z ) exp( ) ,

где E – полная энергия частицы (в случае стационарных полей остается постоянной). После подстановки этого выражения в исходное уравнение ШреiEt
дингера и сокращения на exp( ) , получаем уравнение Шредингера для

стационарных состояний
2

  U  E .
2m
В дальнейшем будем иметь дело в основном с этим уравнением. Иначе
это уравнение можно переписать в следующем виде
2m
  2 ( E  U )  0 ,

где под U будем понимать потенциальную энергию частицы. Из физического
смысла пси-функции следует, что она должна быть однозначной, непрерывной и конечной – т.е. отвечать стандартным условиям. Иногда встречаются
ситуации, когда имеет смысл не квадрат модуля волновой функции, а отношение квадратов модулей волновых функций, взятых в разных точках пространства. Это отношение дает относительную вероятность обнаружения
частицы в разных точках пространства.
Известно, что уравнение Шредингера для стационарных состояний
имеет решения не при всех значениях параметра E , а только при некоторых,
называющихся собственными значениями энергии. Тогда соответствующие
им функции  ( x, y, z ) - называются собственными функциями.
92
2.4. Принцип суперпозиции. Операторы
Итак, непосредственный физический смысл связывается не с самой
функций  , а с квадратом ее модуля  * . Почему же в квантовой механике
рассматривается волновая функция  , а не непосредственно наблюдаемая
величина  * ? Это необходимо для истолкования волновых свойств вещества – интерференции и дифракции, которые отражают объективные, реально
наблюдаемые волновые свойства материи. Здесь дело обстоит точно так же,
как и во всякой волновой теории. Эта теория принимает справедливость
принципа суперпозиции самих волновых полей, а не их интенсивностей,
пропорциональных квадрату полей, что позволяет включить в теорию явления интерференции и дифракции. Так и в квантовой механике принимается в
качестве одного из основных постулатов принцип суперпозиции волновых
функций. Оправданием такого принципа является согласие с опытом вытекающих из данного принципа следствий. Суть данного принципа заключается в следующем. Если  1 и  2 – какие-либо два решения уравнения Шредингера, то и всякая линейная их комбинация 1 1   2 2 с постоянными и в
общем случае комплексными коэффициентами  1 и  2 также является решением уравнения Шредингера. Во-вторых, если волновые функции  1 и  2
описывают какие-либо два состояния системы, то и линейная их комбинация
1 1   2 2 также описывает какое-то состояние этой же системы.
Для придания законченной формы связи символов квантовой механики
с реально наблюдаемыми величинами применяют так называемый операторный метод.
Под оператором понимают правило, посредством которого одной
функции -  сопоставляется другая функция – f . Символически это записывают в виде:
f  Qˆ  ,
где Q̂ - символическое обозначение оператора. Примеры операторов:
2
2
2
- оператор Лапласа (лапласиан),


x 2 y 2 z 2
     
i
 j  k - оператор «набла» и др.
x
y
z
В простейшем случае оператор представляет собой умножение исходной функции  на некоторую другую Q
  2 
f  Q .
Обратимся к уравнению Шредингера
93
2

  U  E .
2m
Перепишем его в виде
 2

 2m   U   E .


С использованием понятия оператора уравнение Шредингера можно
представить следующим образом:
Hˆ   E ,
2
где Hˆ  
  U называют оператором Гамильтона (гамильтониан) – это
2m
оператор энергии, E – собственное значение оператора Гамильтона – энергия системы.
Операторы можно сопоставить и другим физическим величинам – операторы координат, импульса, момента импульса и др.
Для любой динамической переменной q можно записать соотношение
аналогичное уравнению Шредингера:
Qˆ   q ,
где Q̂ - оператор, сопоставляемый переменной q , q – собственное значение
данной переменной.
Для понимания правил построения операторов рассмотрим задачу определения среднего значения координаты какой-либо частицы. Предположим, что производится многократное измерение координаты x в одинаковых
макроскопических условиях. Тогда состояние частицы в этих опытах можно
характеризовать волновой функцией  (x) . Среднее значение координаты,
которое будет найдено в результате измерений, можно представить в виде
 x   x *dx ,
так как  *dx дает вероятность того, что частица может быть обнаружена в
интервале от x до x  dx . При этом предполагается выполнение условия
нормировки
 *dx  1.
Если волновая функция не нормирована, то
x dx
.



dx


x

Запишем выражение для x иначе
94
 x   * xˆdx ,
где x̂ - оператор координаты, равный просто x. Совершенно аналогично вычисляется среднее значение любой функции координат:
 f ( x)   * fˆdx ,

где fˆ рассматривается как оператор.
Квантовая механика обобщает полученные результаты на любые физические величины, являющиеся функциями координат и импульсов:
 F ( x, p)   * ( x) Fˆ ( xˆ, pˆ ) ( x)dx ,
где Fˆ ( xˆ, pˆ ) - cоответствующий функции F ( x, p) оператор, x̂ - оператор координаты, p̂ - оператор импульса.
Оператором координаты, как мы уже знаем, является сама координата
xˆ  x .
Приведем без вывода выражение для оператора импульса



pˆ x  i , pˆ y  i , pˆ z  i .
x
y
z
Собственные значения оператора импульса можно найти из уравнения
pˆ x  p x
или

 p x .
x
Оператор момента импульса (точнее проекции момента импульса на
ось z) определяется выражением:

Z
Lˆ z  i
,

 r
здесь  - азимутальный угол сферической системы
Y координат, характеризующий вращение вокруг оси Z

(рис.8.13). Собственные значения L̂z находятся из
X
Рис. 8.13
уравнения
Lˆ z  Lz
 i
или

 Lz .

К этому уравнению мы еще вернемся дальше.
 i
95
Обсудим теперь некоторые общие свойства операторов, применяемых
в квантовой механике. Все операторы являются линейными
fˆ (   )  fˆ  fˆ .
1
2
1
2
Это отражает принцип суперпозиции. Кроме того
fˆ (a )  afˆ ,
где а - произвольная постоянная.
Если рассматривается одновременное действие двух операторов, то в
общем случае результат их действия зависит от порядка их применения: либо
fˆgˆ , либо gˆfˆ . И если результат этих действий одинаков, то такие операторы называются коммутирующими. С физической точки зрения это отражает
тот факт, что собственные значения этих операторов f и g могут одновременно иметь определенное значение (одновременно измеримы) и наоборот.

Рассмотрим для примера операторы импульса pˆ x  i и координаты xˆ  x
x
. Применим их к волновой функции в разной последовательности:


( pˆ x xˆ  xˆpˆ x )  i ( x )  ix
 i
x
x
т.е. pˆ x xˆ  xˆpˆ x  i. А это означает, что одновременное знание p x и x невозможно – в этом состоит соотношение неопределенности Гейзенберга.
8.3.5. Движение свободной частицы
Рассмотрим для простоты одномерное движение вдоль оси X свободной частицы. Примем для нее значение потенциальной энергии U  0 . По
идее де Бройля такой частице можно сопоставить некоторую бегущую плоскую волну
 ( x, t )  a exp i(t  kx) ,
где a – некоторый постоянный (в общем случае комплексный) множитель,
который можно назвать амплитудой волновой функции,  – частота, k –
волновое число. Эти параметры связаны с энергией E и импульсом p следующим образом
2
E
p
, k
= .



В общем случае неодномерного движения последнее соотношение


можно представить в векторном виде p  k . Мы привыкли описывать пло-

ские волны выражением типа sin(t  kx) или cos(t  kx) . С учетом формулы Эйлера: exp(ix)  cos x  i sin x их всегда можно представлять в экспоненциальном виде.
96
Легко проверить, что выражение для плоской волны является решением уравнения Шредингера при U  0 :
 2  2

.

i

2m x 2
t
Для этого найдем производные:

E
 2
 i  i 
 k 2 ,
2
t

x
и подставим их в уравнение Шредингера. Тогда получаем:

2
E

( )k 2  i(i )  i(i  ) .
2m

Сократим на  и вспомним, что p  k . Отсюда получаем известное соотp2
 E , что свидетельствует о
2m
том, что плоская волна на самом деле является решением уравнения Шредингера.
Для частицы, движущейся против оси X , получаем
 i

  a exp i(t  kx)  a exp  ( Et  px) .
 

Конечно, полученные выражения для волновой функции не имеют никакой наглядной интерпретации. Смысл полученных решений заключается в
следующем: квадрат модуля волновой функции  * дает плотность вероятности обнаружить частицу в данном месте пространства. Найдем эту величину для свободной частицы
ношение, связывающее энергию и импульс:
 *  a exp i(t  kx)a * expi(t  kx)  a 2  f ( x, y, z ) .
Что же мы получили? Вероятность обнаружить частицу везде одинакова! Но в этом нет ничего странного. Для свободно движущейся частицы значение импульса p вполне определено ( p  0 ) и в силу принципа неопределенности Гейзенберга (px  ) получаем, что x стремится к бесконечности. То есть мы не можем сказать, где находится частица в данный момент
времени. Для того чтобы определить положение частицы необходимо подействовать на нее каким-либо прибором для измерения координаты. А это означает, что частица уже не является свободной. Необходимо помнить, что
эти выражения описывают состояние не только с определенным значением
импульса, но и определенным значением энергии. Причем E  0 и энергетический спектр является непрерывным.
97
3.4. Квантовая частица в бесконечно глубокой потенциальной яме
Рассмотрим стационарные состояния микU
рочастицы в бесконечно глубокой потенциальной
яме. Пусть частица может двигаться только вдоль
U=0
U
U
оси X. Потенциальная энергия такой частицы равна нулю при 0  x  l и обращается в бесконечX
0
ность вне этого интервала (рис.8.14). Найдем собl
Рис. 8.14
ственные функции и собственные значения энергии частицы в такой яме.
Уравнение Шредингера для стационарных состояний в данном случае
будет иметь вид:
d 2 2m
 2 ( E  U )  0 .
dx 2
Так как за пределы такой ямы частица попасть не может, то вероятность обнаружить частицу вне ямы равна нулю и соответственно волновая функция
так же равна нулю. Из условия непрерывности следует, что  должна быть
равна нулю и на границах ямы. Таким образом, требуется решить дифференциальное уравнение
d 2 2m
 2 E  0
dx 2
при граничных условиях  (0)   (l )  0 . Введем обозначение:
2m
E,
2
где параметр k имеет смысл волнового числа волны де Бройля для данной
частицы. Решение дифференциального уравнения будем искать в виде:
 ( x)  a sin( kx   ) ,
k2 
где a – амплитуда волновой функции,  – некоторая постоянная. Из граничного условия  (0)  0 сразу следует  =0, а из условия  (l )  0 следует,
что a sin( kl)  0 . Так как амплитуда не равна нулю, то последнее соотношение будет выполнено при условии
kl  n , n  1,2,3...
Итак, набор собственных волновых функций имеет вид:
 ( x)  a sin( nx / l ) .
Для нахождения амплитуды волновой функции необходимо учесть условие нормировки
98
l

2
( x)dx  1.
0
Откуда сразу следует a  2 / l . Таким образом, получаем окончательно выражение для собственных функций:
2
2
sin( nx / l ), n  1,2,3...
l
На рис.8.15 приведены графики плотности вероятности
обнаружения частицы в различных местах ямы. Из них
следует, например, что в состоянии с n  2 частица не
может быть обнаружена в середине ямы. Такое поведение частицы никак не совместимо с представлениями о
траектории (по «классике» все положения частицы в потенциальной яме с плоским дном должны быть равновероятны!).
С учетом связи волнового числа и энергии получаем собственные значения энергии частицы:
 n ( x) 
n=1
n=2
l
0
X
Рис. 8.15
E
n=3
E3
En 
 2 2
n2
(n=1,2,3…)
2ml
т.е. спектр энергии частицы в бесконечно глубокой яме
n=2
E2 оказался дискретным (рис.8.16). Дискретность энергии
является следствием ограниченности движения частицы
n=1
E1 и малости ее массы. Квантовое число n характеризует не
только номер состояния, но и значения энергии, поэтому
0
оно называется главным квантовым числом. Состояние с
Рис. 8.16
n  1 называется основным (невозбужденным), остальные – возбужденными.
8.3.7. Прохождение частицы через потенциальный барьер
Рассмотрим теперь одномерное движение частицы, на пути которой
находится так называемый потенциальный барьер (рис.8.17) . Что это такое?
U
В простейшем варианте это некоторая горка, которую должна преодолеть частица, движущаяся
по горизонтальной плоскости в поле тяжести. Что
V
X было бы в классической механике? Если полная
Рис. 8.17
энергия частицы E больше максимума потенциальной энергии U 0 , то частица проскакивает эту
2
горку и движется дальше (в области барьера только будет меньше скорость).
Если энергия меньше высоты горки, то частица должна отразиться от барьера
99
и никогда не окажется справа от него (в области E  U 0 кинетическая энергия частицы должна стать отрицательной). А как обстоит дело в квантовой
механике? При E  U 0 существует вероятность того, что частица отразится
от барьера и полетит обратно! При E  U 0 существует ненулевая вероятность
того, что частица преодолеет барьер и полетит дальше! Связано это с тем, что
в квантовой механике это неравенство для кинетической и потенциальной
энергии частицы не имеет смысла, так как невозможно знать их точно одновременно. Потенциальная энергия – функция координат, а кинетическая –
функция импульса. А координату и импульс нельзя измерить точно одновременно в силу принципа неопределенности. Поэтому заключение об отрицательности кинетической энергии частицы внутри барьера также становится
бессмысленным.
Итак, рассмотрим задачу: частица, двиU
жущаяся вдоль оси X , налетает на прямоугольный барьер, причем E  U 0 (рис.8.18).
U0
I
II
Запишем для этого случая уравнение Шредингера в стационарной форме:
III
d 2 2m

( E  U )  0 ,
dx 2  2
Рис. 8.18
где функция U(x) имеет вид, представленный
на рисунке. Тогда для областей I и III уравнение Шредингера запишется в
виде:
d 2 2m

E  0
dx 2  2
и для области II:
d 2 2m

(U 0  E )  0 .
dx 2  2
Введем обозначения:
2m
2m
 2  2 (U 0  E ) .
k2  2 E ,


С учетом этих обозначений приходим к системе линейных дифференциальных уравнений с постоянными коэффициентами:
0
l
X
d 2
 k 2  0
для областей I, III
2
dx
d 2
  2  0 .
для области II
2
dx
Решение данной системы уравнений, очевидно, следует искать в виде:
100
 1  A1 exp(ikx)  B1 exp(ikx) для области I,
 2  A2 exp( x)  B2 exp(x) для области II,
 3  A3 exp(ikx)  B3 exp(ikx) для области III.
Первое слагаемое в  1 дает волну, бегущую вдоль оси x, т.е. падающую на барьер (точнее здесь представлена только ее координатная часть).
Второе слагаемое – волна, бегущая против оси x, это волна, отраженная от
барьера. Первое слагаемое в  3 – волна, прошедшая сквозь барьер, второе –
волна справа от барьера, но бегущая против оси x. Так как ей взяться неоткуда, то следует положить B3  0 . Внутри потенциального барьера волновая
функция экспоненциально затухает по мере проникновения вглубь барьера.
Если  1 нормировать таким образом, чтобы A1  1 , то D  А3
2
будет
определять вероятность прохождения частицы через барьер – назовем его коэффициентом прохождения. Тогда R  B1 следует назвать коэффициентом
2
отражения. Очевидно D  R  1 . Откуда взять A3 , который определяет коэффициент прохождения D ? Во-первых, волновая функция должна быть непрерывной, это означает, что выполняются условия:
 1 (0)   2 (0) ,  2 (l )   3 (l ) .
Кроме того, можно показать, что волновая функция должна быть гладкой, это означает равенство первых производных по координате
 1 (0)   2 (0) ,  2 (l )   3 (l ) .
Используя эти условия, для всех неизвестных коэффициентов A и B
получаем систему линейных алгебраических уравнений:
1  B1  A2  B2
A2 exp( l )  B2 exp(l )  A3 exp(il )
i  iB1  A2  B2
A2 exp( l )  B2 exp(l )  iA3 exp(il )
Нас будет интересовать только прохождение частицы через потенциальный барьер, поэтому ограничимся только коэффициентом прохождения
D . Для него можно получить при l  1 приближенное выражение
 2

D  exp 
2m(U 0  E )l  .
 

Вероятность просачивания частицы через барьер сильно зависит от его
ширины. Для потенциального барьера произвольной формы (рис.3.3) полученное выражение для D следует заменить на
101
 2b

D  exp   2m(U  E )dx  .
 a

Величины a и b являются крайними точками интервала значений x , внутри которого выполняется условие U ( x)  E (рис. 8.19). При преодолении
U
E
X
0
a
b
Рис. 8.19
потенциального барьера частица как бы проходит
через «туннель» внутри него. Поэтому данное явление и назвали туннельным эффектом. Его про-
явления:
1.  - распад радиоактивных ядер.
2. Автоэлектронная эмиссия – испускание электронов с поверхности
твердых тел и жидкостей под действием сильного электрического поля.
3. Эффект Джозефсона – протекание сверхпроводящего тока через тонкий слой изолятора, разделяющий два сверхпроводника.
4. Туннельный диод.
5. Спонтанное деление атомных ядер и т.д.
И, как это ни парадоксально, протекание электрического тока через металл (т.е. движение электронов через кристаллическую решетку) в принципе
невозможно без туннельного эффекта (об этом речь пойдет позднее).
8.4. Квантово-механическое описание атомов
8.4.1. Гармонический осциллятор
В механике под гармоническим осциллятором понимают частицу, совершающую гармонические колебания под действием квазиупругой силы
F  kx . Потенциальная энергия такой частицы имеет вид U  1 / 2kx2 , где k жесткость пружины, x -смещение от положения равновесия. В дальнейшем
более удобным оказывается представление потенциальной энергии в виде
U  1 / 2m 2 x 2 , где m - масса частицы,  - частота осциллятора. К задаче о
гармоническом осцилляторе можно свести, например, задачу о колебаниях
атомов твердого тела около положения равновесия.
Уравнение Шредингера для такого гармонического осциллятора будет
иметь вид:
d 2 2m
m 2 x 2

(
E

)  0 .
(8.16)
2
dx 2  2
Найдем собственные функции  и собственные значения энергии E .
Точное решение данного уравнения выражается через так называемые полиномы Эрмита. Мы же попытаемся сделать иначе. При больших x значением
энергии E можно пренебречь, и тогда уравнение (8.16) примет вид:
102
d 2
 const  x 2 .
2
dx
Легко проверить, что этому уравнению удовлетворяет функция вида
  exp(x 2 ) .
(8.17)
Поэтому попробуем искать решение уравнения (8.16) в виде (8.17). После дифференцирования  и подстановки в (8.16) получаем:
2mE m 2 2 2
 (2  4 x )  ( 2  2 x ) .


Для того чтобы данное соотношение было тождеством при любых x ,
необходимо выполнить равенства:
2mE
m 2 2
2
2  2
4 
,
.
2

Из них находим значение параметра  и энергии осциллятора E :
m


E
,
.
2
2
Таким образом, одной из собственных функций гармонического осциллятора является:
m 2
 0 ( x)  exp(
x ).
2
Легко убедиться, что  0 является далеко не единственным решением
2
2
уравнения Шредингера. Функция  1 ( x)  x 0 ( x)  x exp(mx 2 / 2) также
3
 . Это означает, что квантовый осцилля2
тор, находящийся в потенциальной яме, может находиться в различных состояниях, характеризуемых набором волновых функций  n (x) . С этим мы
является решением, но при E 
уже знакомы! Причем, каждой волновой функции соответствует свое значение энергии E . В общем случае энергия гармонического осциллятора принимает дискретные (квантованные) значения:
En  (n  1/ 2), n  0,1,2...
Состояние с n  0 – основное (невозбужденное) с минимальной энергией E0 , остальные состояния - возбужденные. Расстояние между соседними
уровнями энергии
E   .
При переходах осциллятора из одного состояния в другое происходит
либо испускание, либо поглощение фотона. В квантовой теории доказывается, что квантовое число n осциллятора при поглощении или излучении фотона может меняться только на  1 , т.е. n  1- правило отбора. Это означа-
103
ет, что вероятность переходов на не соседние уровни равна нулю, и тогда
энергия фотона всегда    . Все это находится в полном соответствии с
гипотезой Планка. Как и в случае с прямоугольной потенциальной ямой
квантование энергии здесь связано с финитностью движения частицы в силовом поле.
8.4.2. Атом водорода
Рассмотрим водородоподобную систему: ядро с зарядом  Ze и электрон (при Z  1 получаем атом водорода, Z – порядковый номер элемента по
таблице Менделеева).
В этом случае энергия взаимодействия электрона с ядром в системе СИ
имеет вид:
U (r )  kZe2 / r ( k  1 / 4 0 ).
Тогда уравнение Шредингера запишем как
2m
Ze 2
   2 (E  k
)  0 .
r

Волновая функция в общем случае зависит уже от трех пространственных координат. Естественно рассматривать сферическую систему координат
- r , ,  (рис.8.13). Рассмотрим частный случай, когда волновая функция
электрона в атоме сферически симметрична, т.е. зависит только от расстояния до ядра – r . Такой случай не предусматривался старой теорией Бора. В
ней всякое движение электрона вокруг ядра происходило по плоским орбитам и естественно не могло быть сферически симметричным. Но так как в
квантовой механике нет представлений о движении по орбитам, то нет и препятствий для реализации сферически симметричных состояний.
Оператор Лапласа в сферической системе координат имеет вид:
1 

1
 2  2 (r 2 )  2 ( ,  ) ,
r r
r r
где ( ,  ) представляет «угловую» часть  2 , зависящую как от углов, так и
2
от производных по ним. Перепишем теперь уравнение Шредингера
1  2 
1
2m
Ze 2
(r
)  2   2 ( E  k
)  0 .
r
r
r 2 r
r

Попытаемся найти собственные функции и собственные значения энергии без «лишней крови». Так как электрон не может находиться в ядре, то
существует состояние, в котором электрон находится наиболее близко к ядру
и это состояние обладает наименьшей энергией. Во-вторых, это состояние
должно быть сферически симметричным (самое простое состояние), т.е. не
должно зависеть от углов. В этом случае уравнение Шредингера приобретает
вид:
104
1  2  (r )
2m
Ze 2
(8.18)
(r
)   2 (E  k
) (r ) .
r
r
r 2 r

В качестве решения попробуем для начала взять просто экспоненту
 (r )  exp(r / r0 ) , где r0 – некоторая константа, смысл которой выясним
позднее.
После подстановки предполагаемого решения в уравнение (8.18) и сокращения на экспоненту приходим к уравнению
1 r 2 2r
2m
Ze 2
(  )   2 (E  k
).
r
r 2 r0 2 r0

Приравнивая члены при одинаковых степенях r , включая нулевую, получаем:
2
Z 2 k 2 me 4
E


и
.
r0 
2 2
kmZe2
Таким образом, экспонента на самом деле является решением при правильном выборе r0 и E .
W r 
r
r0
Знак минус в выражении для энергии показывает,
что это энергия притяжения электрона к ядру. Иначе
электрон просто улетит от ядра, а это уже не атом.
После подстановки значений m, k , e,  для Z  1 находим E  Ei  -13,6 эВ ( Ei -энергия ионизации, т.е.
Рис.8.20
минимальная энергия, необходимая для удаления
электрона из атома водорода). Ну, а теперь попытаемся понять смысл постоянной r0 . Для этого найдем вероятность обнаружить
электрон в интервале dr :
dP   dV =  4r 2 dr  W (r )dr ,
2
2
где W (r )  4r 2 exp(2r / r0 ) - плотность вероятности
E
E =0
обнаружить электрон на расстоянии r от ядра. График
функции W (r ) представлен на рис.8.20. Легко проверить, что максимум плотности вероятности приходится
E2
как раз на значение r  r0   2 / kme2 = 5  10-11м. Таким
образом, r0 является наиболее вероятным положением
E1
Рис. 8.21
электрона в невозбужденном атоме водорода – боровский радиус.
Следующие состояния электрона находятся аналогично, и для них получается E2  E1 / 4, E3  E1 / 9 и
105
так далее. В общем случае энергия электрона в водородоподобном атоме определяется выражением:
me 4 Z 2 k 2
(n=1,2,3… - главное квантовое число)
2 2 n 2
Схема уровней энергии электрона в атоме водорода представлена на
рис.8.21.
8.4.3. Пространственное квантование
При решении задачи о частице в потенциальной яме мы имели дело с
одной координатой. Это привело к появлению одного квантового числа. В
атоме водорода электрон движется в трехмерном пространстве, т.е. имеет три
степени свободы. Следует ожидать, что это приведет к трем квантовым числам.
Одно мы уже знаем – это главное квантовое число n . Два других квантовых числа связаны с квантованием момента импульса частицы и его проекции.
Попытаемся вначале найти проекцию момента импульса Lz . Ранее быEn  
ло показано, что собственные значения Lz удовлетворяют уравнению:
Lˆ z  Lz

 Lz .

Легко сообразить, что   exp() , где  - некоторая константа. Под-
или
 i
ставляя это выражение в уравнение для момента импульса, получаем

 i
exp()  Lz exp() .

iL
После сокращения на экспоненту, находим   z . Таким образом волновая

функция должна иметь вид:
iL
  constexp( z  ) .

Так как волновая функция должна быть однозначной, то необходимо выполнить условие  ( )   (  2 ) . Или:
iLz
iL
 )  exp( z (  2 )) .


L
А это будет выполнено, если z  m , где m – некоторое целое число,

равное 0,1,2....
Таким образом, для проекции момента импульса на некоторое направление получаем выражение:
exp(
106
Lz  m ,
m  0,1,2,3....
т.е. проекция момента импульса на выделенное в пространстве направление
принимает квантованные значения, кратные постоянной Планка, m – называется магнитным квантовым числом. Кроме того, очевидно, что если квантуется проекция L , то квантуется и само значение L . Доказательство квантования момента импульса достаточно затруднительно, поэтому приведем
только окончательный результат:
Ll  l (l  1) , l  0,1,2...
l - называется орбитальным (азимутальным) квантовым числом. Очевидно,
что максимальное значение m  l и, как следствие, Lz  L . Отсюда следует
своеобразный вывод: вектор момента импульса не может совпадать ни с одним выделенным в пространстве направлением, т.е. «вектор» момента импульса не имеет определенного направления и, следовательно, не может отображаться, как в классической механике, направленным отрезком прямой.
Поясним это. Пусть l  2. Тогда:
Z
L  2(2  1)  6 , m  0,1,2 , Lz  0,,2
Вектор момента импульса может занимать любое
положение в пространстве вдоль образующей кону2ћ
са и не может быть направлен по оси z (рис.8.22).
ћ
Этот рисунок нельзя понимать буквально. Он правильно передает только два факта: возможные зна-ћ
чения проекции и возможные значения модуля мо- 2ћ
мента импульса. Из квантования момента импульса
следует, что постоянную Планка можно рассматриРис. 8.22
вать как естественную единицу измерения проекции
момента импульса.
8.4.4. Опыт Штерна и Герлаха. Спин электрона. Мультиплетность
спектров
Экспериментальное подтверждение квантования момента импульса
было осуществлено Штерном и Герлахом. Момент импульса электрона, связанный с механическим движением электрона, неизбежно приводит к наличию у атомов магнитного момента. Поэтому, если квантуется момент импульса, то неизбежно должен квантоваться и магнитный момент. В опытах
Штерна и Герлаха пучок атомов пропускался через сильно неоднородное
магнитное поле полюсных наконечников электромагнита специальной формы (рис.8.23). В этом случае на пучок атомов должна действовать отклоняющая сила, пропорциональная магнитному моменту и соответственно механическому моменту импульса.
107
При хаотическом распределении магнитных моментов в пучке атомов предполагалось, что узкий пу10-5 мм рт. ст.
чок атомов после прохождения между полюсами магнитов образует на экране (Фпл) сплошной растянутый
S
N
след. Опыт дал неожиданные результаты. Вместо
D
сплошного растянутого следа получались резкие отD
дельные линии, расположенные симметрично относиAg
тельно следа пучка, полученного в отсутствие поля.
Рис. 8.23
Это можно было объяснить только квантованием момента импульса. В первоначальных опытах применялись пучки атомов серебра. В магнитном поле пучок расщеплялся на две составляющие. То же получалось и для атомов водорода. Для атомов других химических элементов
получалась и более сложная картина расщепления, однако число расщепленных пучков получалось не только нечетным, что предсказывалось квантовой
теорией, но и четным – что противоречило ей. Кроме того, в опытах Штерна
и Герлаха атомы водорода находились в основном состоянии с n  1 , т.е. не
обладали орбитальными моментами. То же самое относится и к опытам с
атомами серебра. Атом серебра имеет единственный наружный электрон.
Атомный остов ввиду его симметрии не обладает ни орбитальным, ни магнитным моментами. Весь магнитный момент атома серебра создается только
одним наружным электроном. И если атом находится в нормальном состоянии, его орбитальный момент в целом тоже равен нулю. Тогда естественно
возникает вопрос - пространственное квантование какого момента импульса
обнаружилось в этих опытах? Для объяснения этого результата и других Гаудсмит и Уленбек выдвинули предположение, что электрон имеет собственный механический и связанный с ним магнитный момент. Этот собственный
момент импульса назвали спином электрона. Это некоторое собственное
свойство, подобное массе, заряду. Вначале предполагали, что спин связан с
вращением электрона вокруг собственной оси, но затем это предположение
пришлось по ряду причин отвергнуть.
Спин рассчитывается по формуле:
Фпл
Ls  s( s  1) ,
где s называется спиновое квантовое число и равно ½. Проекция спина на
выделенное направление:
Lsz  ms , ms  1/ 2 .
Принято говорить, что спин электрона имеет только два направления –
по полю и против поля. В дальнейшем выяснилось, что спином обладают и
другие элементарные частицы (нуклоны, фотоны и др.).
108
Точные экспериментальные исследования спектров щелочных металлов показали, что каждая линия этих спектров является двойной (дублет).
Структура спектра, отражающая расщепление линий на компоненты, называется тонкой структурой. Сложные линии, состоящие из нескольких компонент, называются мультиплеты (дублеты, триплеты, квартеты, квинтеты…).
Одиночные линии – синглеты.
Наличие спина легко объясняет тонкую структуру
v
спектров. Классический вариант момента импульса при
m
движении по окружности: L  rmv . Кроме того, электрон
Pm
как движущийся по замкнутой кривой заряд (рис.8.24)
L
J
e
обладает магнитным моментом: p m  JS  r 2 (Т – пеT
Рис. 8.24
риод обращения электрона по орбите радиуса r со скоростью v ). Учитывая, что T  2 r / v , получаем выражение для орбитального
магнитного момента pm  evr / 2 . Выражение pm / L называется гиромагнит-
e
(знак минус показывает, что
2m
направления векторов p m и L противоположны).
По идее Гаудсмита и Уленбека электрон должен обладать также собственным механическим моментом импульса - Ls и магнитным моментом -  s .
ным отношением. Для электрона pm / L = 
Причем отношение  s / Ls оказалось в два раза больше, чем по классическим
представлениям:  s / Ls  e / m .
Предположение о спине электрона было подтверждено большим количеством опытных фактов и считается совершенно доказанным. Кроме того,
спин электрона и все его свойства автоматически вытекают из уравнения Дирака, которое является релятивистским вариантом уравнения Шредингера.
Таким образом, спин электрона является одновременно и квантовым и релятивистским свойством.
Величина собственного момента импульса определяется спиновым
квантовым числом s  1/ 2
 3
Ls   s( s  1) 
.
2
Проекция спина на заданное направление также принимает квантованные
значения
Lsz  ms    / 2 .
Найдем магнитный момент электрона:
109
s  
e
e
e
Ls  
s( s  1)  
3.
m
m
2m
e
обозначают как  Б (магнетон Бора)
2m
e
Б 
 0,93  10 -23Дж/T.
2m
Проекция собственного магнитного момента электрона на заданное направление
e
e 
 sz   Lsz   ( )    Б .
m
m 2
Рассмотрим, например, натрий. Позднее мы докажем, что суммарный
момент импульса всех электронов натрия, кроме валентного, равен нулю.
Это означает, что момент импульса атома натрия равен моменту импульса
валентного электрона. Полный момент импульса складывается из орбитального и собственного:
Величину
L j   j ( j  1) ,
где j – квантовое число, которое может принимать значения:
j  l  s, l  s
l - азимутальное квантовое число, s – спиновое квантовое число. При l  0
квантовое число j принимает только одно значение j  s  1/ 2 . При l  0
возможны два значения j  l  1 / 2, j  l  1 / 2 , которые соответствуют двум
возможным ориентациям моментов импульса – «параллельной» и «антипараллельной». Т.е. в зависимости от ориентации спина механический момент
импульса может принимать несколько значений. А т.к. с этим связан магнитный момент, то возможны и различные значения магнитных моментов. Энергия магнитного взаимодействия (его еще называют спин-орбитальное) зависит от взаимной ориентации орбитального и собственного момента импульса. Значит, состояния с различными значениями квантового числа j должны
обладать и различной энергией.
8.4.5. Квантовые числа. Кратность вырождения энергетических
уровней
Вернемся к атому водорода. Собственные функции уравнения Шредингера содержат три целочисленных параметра n, l , m :    nlm (r , ,  ). Параметр n , называемый главным квантовым числом, совпадает с номером уровня энергии. Параметры l и m представляют азимутальное и магнитное квантовые числа, определяющие модуль момента импульса и его проекцию на
некоторое направление z. При заданном n квантовое число l для электрона в
110
водородоподобном атоме ограничено и может принимать n различных значений:
l  0,1,2,...n  1.
В свою очередь, при данном l квантовое число m может принимать 2l  1различных значений:
m  l ,l  1,...0,1,...l  1, l .
Энергия электрона в атоме водорода зависит только от главного квантового числа. Следовательно, каждому значению E n (кроме E1 ) соответствует несколько собственных функций  nlm , отличающихся значениями квантовых чисел l и m . Это означает, что атом водорода может иметь одно и то же
значение энергии, находясь в нескольких различных состояниях. Состояния с
одинаковой энергией называются вырожденными, а число различных состояний с каким-либо значением энергии – кратность вырождения соответствующего энергетического уровня. Легко сообразить, что кратность вырождения Z n можно рассчитать по формуле:
n 1
Z n   (2l  1)  n 2 .
l 0
Если же учесть спиновое квантовое число, то кратность вырождения
будет равна
Z n  2n 2 .
Состояние электрона принято обозначать следующим образом:
l  0 - s -электрон ( s -состояние),
l  1 - p -электрон ( p -состояние),
l  2 - d -электрон ( d -состояние),
l  3 - f - электрон ( f -состояние), затем идут g, h - состояния и т. д. Значе-
ние главного квантового числа указывается перед условным обозначением
квантового числа l . Например, электрон в состоянии с n  3, l  1 обозначают
символом 3 p . Таким образом, возможны следующие состояния электрона в
атоме водорода:
1s
2 s,2 p
3s,3 p,3d
4s,4 p,4d ,4 f и так далее.
Ранее схему уровней энергии атома водорода мы отображали так, как
показано на рис.8.21. Однако гораздо удобнее применять другую схему
(рис.8.25), которая частично отражает характер вырождения различных
111
уровней энергии. Кроме того, данная схема позволит отразить и возможные
переходы электрона между различными состояниями.
E , эВ
s
p
d
f
l 0
l 1
l 2
l 3
...
n =4
n =3
серия Бальмера
n =2
серия Лаймана
n =1
-13,6
Рис. 8.25
Испускание и поглощение света происходит при переходах электрона с
одного уровня на другой. При этих переходах происходит либо испускание
фотона, либо его поглощение. Фотон обладает собственным моментом импульса (спином), равным постоянной Планка. Поэтому закон сохранения момента импульса требует, чтобы момент импульса электрона при каждом акте
испускания или поглощения фотона изменялся на  . А это означает, что при
каждом переходе электрона с одного уровня энергии на другой азимутальное
квантовое число должно изменяться на единицу. Отсюда следует так называемое правило отбора:
l  1.
На рис.8.25 показаны переходы, соответствующие спектрам поглощения и разрешенные этим правилом. Серия Лаймана (ультрафиолет) возникает
при переходах: np  1s(n  2,3,4...) . Серия Бальмера (видимая) возникает
при переходах: ns  2 p, nd  2 p(n  3,4,5...). Такому же правилу подчиняются и следующие серии (Пашена, Брэкета и т.д.).
Состояние 1s - основное (невозбужденное). В этом состоянии атом
обладает наименьшей энергией. Для перехода в возбужденное состояние ему
112
необходимо сообщить энергию – либо за счет теплового соударения с соседями (после этого при обратном переходе нагретые тела светятся), либо за
счет столкновения атома с достаточно быстрым электроном (газовый разряд),
либо за счет поглощения атомом фотона. При этом спектр поглощения водородного атома должен состоять из линий, соответствующих переходам:
1s  np(n  2,3,4...) . Этот результат полностью соответствует опыту.
8.4.6. Многоэлектронные атомы. Эффект Зеемана
В многоэлектронных атомах состояние каждого электрона определяется теми же квантовыми числами, что и в атоме водорода. Влияние на данный
электрон остальных электронов проявляется в том, что поле, в котором движется электрон, не является обратным квадрату расстояния. Это обуславливает зависимость энергии не только от главного квантового числа n , но и от
орбитального (азимутального) квантового числа l (говорят, что снимается
вырождение по l ).
Механический и магнитный моменты атома слагаются из орбитального
M l и спинового M s моментов отдельных электронов. При этом наиболее
часто реализуется т.н. LS связь, при которой моменты M l взаимодействуют
между собой сильнее, чем с M s , которые в свою очередь сильнее связаны
друг с другом, чем с M l . Результирующий орбитальный момент импульса
M L определяется как
ML 
L  L  1 ,
где L - орбитальное квантовое число атома. Например, для двухэлектронного
атома L может иметь значения
L  l1  l2 , l1  l2  1, ... l1  l2 ,
где l1 , l2 - возможные квантовые числа каждого электрона. Проекция результирующего орбитального момента импульса на некоторое направление z определяется как
M Lz  mL  mL   L,  L  1,...L  .
Результирующий спиновой момент атома и его проекция определяются
аналогичными выражениями с заменой L на S и mL на mS .
Полный момент импульса атома (сумма орбитального и спинового моментов) определяются как
MJ 
J  J  1 ,
где квантовое число J может иметь одно из следующих значений
J  L  S , L  S  1,... L  S .
113
Таким образом, состояние атома и его энергия определяются числами
L, S и J . И вместо того, чтобы писать: L равно тому-то, S равно тому-то, а
J равно тому-то, пользуются символической записью, имеющей вид
2 S 1
LJ ,
где под L понимается одна из букв S , P, D, F ... в зависимости от значения
числа L . S - состоянием называется состояние с L  0 , P - состоянием - состояние с L  1, D - состоянием – состояние с L  2 и т.д. Например, символ
S0 обозначает состояние с числами L  0, S  0 и J  0 .
Наличие у атома магнитного момента приводит к тому, что во внешнем
магнитном поле атом может иметь различную энергию. Расщепление энергетических уровней, как и спектральных линий, вызванное действием на атомы
магнитного поля называют эффектом Зеемана. Расщепление линий невелико – порядка несколько сотых нанометра в поле порядка 1 Тл.
Зеемановское расщепление связано с тем, что атом, обладающий магнитным моментом  J , приобретает в магнитном поле дополнительную энергию
(8.19)
E   JB B ,
1
где  JB - проекция магнитного момента на направление поля.
Наиболее простые закономерности имеет зеемановское расщепление
спектральных линий, не имеющих тонкой структуры (синглетов). Эти линии
возникают при переходах между уровнями, соответствующих значению
S  0 . Для них формула (8.19) приобретает вид
E   Б BmJ , mJ  0, 1,...  l ,
причем, для магнитного квантового числа mJ имеется правило отбора
mJ
1
1
P1
0
1
0
1
S0
0  0
Без поля
0 0  0
С полем
Рис. 8.26
0 
Б B

mJ  0, 1 .
На рис. 8.26 показано расщепление уровней и спектральных линий
для перехода между состояниями с
L  1 и L  0 ( P  S переход). В отсутствии магнитного поля наблюдается одна линия с частотой 0 . При
включении поля, кроме линии 0 ,
появляются еще две с частотами
0  0 и 0  0 , где
e B
e

B , m - масса электрона,  Б - магнетон Бора.
2m
2m
114
8.4.7. Принцип Паули. Периодическая система элементов
Менделеева
Состояние электрона в атоме определяется четырьмя квантовыми числами:
главное n  1,2,3... - определяет энергию электрона (главным образом),
орбитальное l  0,1,2...n  1 - определяет модуль момента импульса,
магнитное ml  0,1,2,... l - определяет проекцию момента импульса,
спиновое
ms  1 / 2 - определяет проекцию спина на заданное направле-
ние.
Энергия состояния зависит в основном от чисел n и l . Кроме того, существует слабая зависимость энергии от чисел ml и ms (спин-орбитальное
взаимодействие). Но, как правило, состояния с бóльшим значением n обладают независимо от l бóльшей энергией.
В нормальном (невозбужденном) состоянии электроны должны располагаться на самых низких доступных для них энергетических уровнях. Поэтому, казалось бы, в любом атоме в нормальном состоянии все электроны
должны находиться в состоянии 1s (n  1, l  0) . Однако опыт показывает, что
это не так. Объяснение наблюдаемых закономерностей излучения атомов
было найдено Паули, который сформулировал принцип запрета: в одном и
том же атоме (любой квантовой системе) не может быть двух электронов,
обладающих одинаковой совокупностью четырех квантовых чисел. Или, другими словами, в одном и том же состоянии не могут находиться одновременно два электрона.
Ранее было показано, что каждому значению главного квантового числа n соответствует n 2 состояний, отличающихся значениями l и m . Кроме
того, нужно учесть, что в одном состоянии могут находиться два электрона с
разными спинами. Поэтому в состоянии с данным квантовым числом n в
атоме могут находиться Z n  2n 2 электронов. Итак, в состоянии с n  1 могут
находиться только два электрона, n  2 - 8 электронов, n  3 - 18 электронов и т.д.
Совокупность электронов, имеющих одинаковое значение главного
квантового числа n , образует так называемый слой.
Значение n
1 2 3 4 5 6 …
Обозначение слоя
K L M N O P …
Для полностью заполненного слоя суммарный момент импульса всегда
равен нулю.
115
Принцип Паули позволяет объяснить расположение элементов в таблице Менделеева.
Первый элемент – водород. Каждый последующий атом будем получать, увеличивая заряд ядра на единицу и добавляя один электрон, который
будем помещать согласно принципу Паули в соответствующую оболочку с
наименьшей энергией.
Структура водорода обсуждалась ранее. Единственный электрон находится в состоянии с n  1 , т.н. 1s электрон с произвольной ориентацией спина. Энергия ионизации (энергия связи) для водорода составляет 13,6 эВ.
Следующий элемент – гелий. Рассмотрим вначале ион Не+, состоящий
из ядра (2 протона и 2 нейтрона) плюс 1 электрон – водородоподобный атом.
Для него работает формула:
Z2
En  13,6 2 эВ.
n
Его ионизационный потенциал (Z=2) равен
22
Ei  13,6  54,4 эВ.
1
Опыт дает такое же значение. Поместим теперь в окрестности Не+ второй электрон. Вначале
(рис.8.27) он «видит» заряд +1, затем, попав в Коболочку половину времени он будет «видеть» заряд Z=+1, а другую половину времени – заряд Z=+2.
Возьмем среднее значение Zэфф=1,5. Для энергии
ионизации получаем:
Рис. 8.27
Ei  13,6Z эфф / n 2 =30 эВ.
2
Однако из-за отталкивания электронов между собой должно быть несколько
меньше 30 эВ. Опыт дает: Ei =24,6 эВ. Это самый большой потенциал ионизации среди всех элементов. Из-за высокого ионизационного потенциала и
отсутствия места в К-оболочке для 3-го электрона гелий химически крайне
инертен. Химические силы не в состоянии обеспечить энергию 24,6 эВ, чтобы образовать Не+. Если же попытаться добавить третий электрон, то он
должен оказаться уже в L-оболочке с n=2. А это слишком далеко от ядра и
Zэфф=0 ! Поэтому гелий не образует молекул ни с одним элементом – благородный газ. Электронная конфигурация – 1s2 (два 1s электрона со спинами
противоположного направления). На атоме гелия заканчивается заполнение
К-оболочки.
Затем идет литий (Z=3). В нейтральном атоме Li третий электрон должен располагаться в L-оболочке с n=2 . Для него Zэфф=1. Его ионизационный
116
потенциал равен примерно 13,6  12/22=3,4В (эксперимент дает 5,4В). Но, второй ионизационный потенциал (т.е. удаление второго электрона, для которого Zэфф=2,5 и n=1) равен 76В! Именно поэтому литий в соединениях обнаруживает валентность +1 (т.е. теряет один электрон) и никогда не обнаруживает валентность +2. Электронная конфигурация 1s22s.
Достройка L-оболочки идет до Ne. У него заполнены К и L оболочки
полностью. Ионизационный потенциал у Ne очень высок, но ниже, чем у гелия – тоже инертный газ.
Затем, начиная с Na, вплоть до Ar заполняется М-оболочка - в ней 18
вакансий. Чтобы получить калий, нужно добавить заряд +1 и еще один электрон – 19-ый. По идее его нужно поместить в недостроенную М-оболочку, но
он помещается уже в N-оболочке. Дело в том, что состояние с недостроенной
М-оболочкой из-за взаимодействия электронов между собой обладает меньшей энергией, чем достройка М-оболочки до конца, т.к. энергия электронов
зависит не только от главного квантового числа, но и от других.
Подобная картина соблюдается и в дальнейшем. Таким образом, периодичность химических свойств элементов связана с повторяемостью электронных конфигураций во внешних электронных оболочках.
8.5. Оптические квантовые генераторы
8.5.1. Индуцированное излучение
Мы знаем два вида переходов атомов между энергетическими уровнями (рис.8.28):
1) Спонтанные (самопроизвольные) переходы с более высоких уровней на
более низкие
2) Вынужденные переходы с более низких уровней на более высокие под
действием излучения.
1)
E2
E2
2)
 = E2 - E1

Испускание фотона
Поглощение фотона
E1
E1
Рис. 8.28
Вероятность испускательных переходов первого типа зависит от внутренних свойств атомов и не зависит от интенсивности падающего излучения.
Эти переходы происходят спонтанно (самопроизвольно) и называются спонтанными переходами.
Вероятность переходов второго типа («поглощательных») зависит как
от свойств атомов, так и от интенсивности падающего излучения.
117
Этих двух видов переходов, как показал Эйнштейн, недостаточно для
объяснения существования равновесия между излучением и веществом (излучает «сколько хочет», поглощает «сколько дадут»).
Для возможности установления равновесия между излучением и поглощением фотонов веществом необходимо, чтобы энергия излучения была
пропорциональна энергии поглощения (как и при тепловом излучении). А это
означает, что должны быть т.н. «испускательные» переходы, вероятность которых возрастала бы с увеличением интенсивности падающего излучения.
Возникающее при этом излучение называется индуцированное (вынужденное). Причем, вероятность переходов, сопровождающихся излучением,
должна быть равна вероятности переходов, сопровождающихся поглощением.
Индуцированное излучение обладает рядом замечательных свойств.
Направление его распространения в точности совпадает с направлением распространения вынуждающего излучения, вызвавшего переход. То же самое
относится к частоте, фазе и поляризации вынужденного и вынуждающего излучений, т.е. индуцированное и падающее излучения строго когерентны. Эта
особенность лежит в основе действия лазеров - усилителей и генераторов
света. По существу индуцированное излучение оптических квантовых генераторов представляет собой макроскопический квантовый эффект.
8.5.2. Принцип усиления света с помощью вынужденного
излучения
Если частота падающего на вещество света совпадает с одной из частот
  ( En  Em ) /  атомов вещества при n  m , то могут происходить два процесса:
1) вынужденный переход m  n - поглощение света,
2) вынужденный переход n  m - усиление интенсивности падающего
пучка,
т.е. происходит либо поглощение, либо усиление света. Результат зависит от
того, какой из этих процессов преобладает.
Пусть система находится в термодинамическом равновесии. В этом
случае распределение атомов по энергии можно описать законом Больцмана:
E
N n  C exp( n ) ,
kT
где N n - число атомов, имеющих при температуре Т энергию E n .
Число переходов n  m пропорционально населенности этих уровней,
т.е. числу атомов на данном уровне. Поэтому в системе, находящей в термодинамическом равновесии, поглощение падающего света преобладает над
вынужденным излучением.
118
Для получения усиления падающего излучения необходимо сделать
так, чтобы в состоянии с большей энергией было больше атомов, чем в состоянии с меньшей энергией, т.е. осуществить инверсную населенность
уровней.
Такая система обладает рядом интересных свойств. Рассмотрим, например, отношение чисел атомов, обладающих разной энергией N n / N m . В
силу распределения Больцмана имеем:
Nn
 exp ( En  Em ) / kT .
Nm
При инверсной населенности уровней это отношение больше единицы.
И так как En  E m , то это формально означает, что T  0 . Такое состояние
называют состоянием с отрицательной температурой.
Изменение интенсивности света с расстоянием l при прохождении через поглощающую среду с коэффициентом поглощения k описывается законом Бугера:
I  I 0 exp(kl) .
При инверсной населенности энергетических уровней вынужденное
излучение может превысить поглощение света, значит I  I 0 и, как следствие, k  0 . Такая совокупность атомов с инверсной населенностью называется средой с отрицательным коэффициентом поглощения.
8.5.3. Лазеры
Процесс перевода среды в инверсное состояние называют накачкой
усиливающей среды. Наиболее естественной представляется накачка, при которой атомы переводятся с нижнего уровня E1 на верхний возбужденный
уровень E 2 облучением светом с частотой   ( E2  E1 ) /  . Если усиливающая среда является газообразной, то это можно также осуществить при газовом разряде (электрическая накачка). Но это только на первый взгляд. На самом деле за счет спонтанного излучения атомов, находящихся на возбужденном уровне, а также за счет столкновения атомов с электронами, атомы «сваливаются» через время порядка 10-8с на нижний уровень и система не удерживается в инверсном состоянии. Таким образом, для получения инверсной
населенности использование двухуровневой системы не подходит. Более эффективно использование т.н. трехуровневой системы с наличием метастабильного уровня.
Впервые на возможность создания сред, в которых свет будет усиливаться за счет индуцированного излучения, указал в 1939г. советский физик
В. Фабрикант. В 1953 году Н.Г.Басовым, А.М.Прохоровым, Таунсом и Вебе-
119
ром были созданы первые молекулярные генераторы, работающие в области
сантиметровых волн – мазеры (аббревиатура английской фразы Microwave
Amplification by Stimulated Emission of Radiation). В 1960 году Мейманом был
создан генератор, работающий в оптическом диапазоне – лазер (Light Amplification by Stimulated Emission of Radiation). Лазеры называют также оптическими квантовыми генераторами.
В лазере Меймана рабочим телом был
Импульсная лампа
Рубин
( ксенон)
цилиндр из розового рубина диаметром порядка 1см и длиной около 5см (рис.8.29).
Торцы рубинового стержня были тщательно
отполированы и представляли строго паИсточник
раллельные друг другу и перпендикулярные
Серебро
питания
оси стержня зеркала (один из торцов проРис. 8.29
пускал около 8% света). Накачка лазера
осуществлялась импульсной ксеноновой лампой достаточно большой мощности.
Рубин представляет собой окись алю3
миния (Al2O3), в которой некоторые из атомов
алюминия замещены на атомы хрома. При по2
глощении света (  =560нм) ионы Cr+++
накачка
излучение
(рис.8.30) переходят в возбужденное состояние (3). Обратный переход в основное состоя1
ние (1) происходит в два этапа. Вначале возРис. 8.30
бужденные ионы отдают часть своей энергии
кристаллической решетке (без излучения) и переходят в метастабильное состояние (2), в котором находятся около 10-3с, что в 105 раз превосходит время жизни в обычном возбужденном состоянии.
Затем ион переходит в основное состояние, излучая фотон ( 
=694,3нм). Излученный при этом фотон может вызвать вынужденное испускание дополнительных фотонов, которые в свою очередь вызовут вынужденное излучение другого фотона и т.д. В результате образуется каскад фотонов.
Фотоны, возникающие при вынужденном излучении, летят в том же направлении, что и падающие, и при многократном отражении от зеркал их путь в
кристалле будет очень большим. При правильной юстировке зеркал рождаются мощные импульсы с частотой порядка нескольких импульсов в минуту.
В настоящее время разработано большое число самых различных лазеров, использующих как различные рабочие среды, так и различные принципы
работы.
Излучение лазеров отличается рядом замечательных особенностей:
120
1) строгая монохроматичность,
2) высокая временная и пространственная когерентность,
3) большая интенсивность,
4) малая угловая ширина пучка.
Лазеры нашли самое широкое применение в настоящее время в различных
областях науки и техники. Перечисление их займет слишком много места,
поэтому рассмотрим только их возможные типы для целей противоракетной
обороны (ПРО) по материалам зарубежной печати.
8.5.4. Лазеры для системы ПРО
Химические. В них генерация излучения происходит в процессе химической реакции между двумя газами (H,F), (D,F). Работают в непрерывном режиме. Выходная мощность порядка 106Вт. Для сравнения: пучок порядка
104Вт способен за считанные секунды прожечь стальную пластину толщиной
около 6мм.
Эксимерные. Под действием электрического разряда неустойчивое состояние из двух молекул (эксимер) диссоциирует, испуская излучение (фторкриптоновые лазеры). Эксимерный лазер генерирует излучение в виде коротких импульсов порядка 1мкс с энергией около 104Дж (Лос-Аламосская национальная лаборатория, США).
Лазеры на свободных электронах. Принцип их действия заключается в
том, что пучок электронов направляют мимо ряда «раскачивающихся» магнитов, которые заставляют электроны колебаться и испускать излучение.
Меняя расстояние между магнитами или энергию электронов, можно получать излучение теоретически любой длины волны. Это имеет принципиальное значение при распространении излучения в атмосфере, в которой есть
так называемые «окна прозрачности». На длине волны 1мкм пиковая мощность порядка 106Вт.
Самый экзотичный – рентгеновский. Состоит из ядерного заряда, окруженного цилиндрической системой тонких металлических волокон. Рентгеновское излучение, возникающее при ядерном взрыве, заставляет металлические волокна за короткое время испустить вторичный пучок рентгеновских
лучей. При этом, естественно, устройство разрушается. Из-за сильного поглощения рентгеновских лучей атмосферой данное устройство следует располагать выше 80 км, возможно по способу «выстреливания» в космос.
8.6. Квантовая статистика
8.6.1. Принцип неразличимости квантовых частиц
В отличие от макроскопических тел, элементарные частицы (электроны, протоны, нейтроны и др.) обладают совершенно одинаковыми свойствами. В связи с этим возникает вопрос, как отличить одну частицу от другой
121
такой же частицы. Рассмотрим, например, систему, состоящую из двух электронов. В классической физике, так как каждый электрон движется по своей
определенной траектории, принципиально возможно проследить за движением каждого из них. И если эти электроны поменяются местами, то мы получаем новое состояние, которое во всех отношениях обладает теми же свойствами, что и исходное состояние, но отличается нумерацией электронов. Т.е. в
классической физике одинаковые частицы принципиально различимы.
Совсем иначе дело обстоит в квантовой механике. Состояние системы
из двух электронов описывается двухчастичной волновой функцией, являющейся функцией времени и координат обоих электронов. Обнаружив в какоето время в данной точке пространства один из электронов, принципиально
невозможно сказать, какой из электронов оказался в данном месте – в квантовой механике нет понятия траектории, по которой можно было бы проследить движение электрона. А это означает, что если две одинаковые частицы
поменять местами, то результат такого обмена нельзя обнаружить экспериментально. Поэтому в квантовой механике принимается, что при перестановке двух одинаковых частиц не возникает нового состояния. Одинаковые частицы принципиально неразличимы! Можно говорить о состоянии системы
одинаковых частиц только в целом, а не о состоянии каждой частицы в отдельности. Это положение формулируется в виде принципа тождественности
одинаковых частиц: в системе одинаковых частиц реализуются только такие
состояния, которые не меняются при перестановке местами двух любых частиц.
Вернемся к системе из двух одинаковых частиц. Волновую функцию
такой системы, если отвлечься от времени, можно записать в виде:  (q1 , q2 ) .
В случае бесспиновых частиц под q понимается совокупность трех пространственных координат каждой частицы. Если же частицы обладают и
спином, то к тройке пространственных координат следует добавить еще спиновые координаты, которые могут принимать дискретный ряд значений, например, значение проекции спина. Переставим теперь местами эти частицы.
Тогда волновая функция такого состояния будет иметь вид:  (q2 , q1 ) . Эту
операцию можно рассматривать как результат действия на функцию
 (q1 , q2 ) линейного оператора P̂ , называемого оператором перестановки:
 (q2 , q1 )  Pˆ  (q1 , q2 ) .
После вторичной перестановки получаем исходную функцию  (q1 , q2 ) :
 (q1, q2 )  Pˆ (q2 , q1 )  Pˆ 2 (q1, q2 ) .
122
Откуда находим, что P  1. А это означает, что допустимы волновые функции двух типов:
 s (q1 , q2 )   s (q2 , q1 ) ,
 a (q1 , q2 )   a (q2 , q1 ) .
В первом случае волновая функция при перестановке частиц не изменяется и называется симметричной, во втором случае функция называется
антисимметричной и при перестановке одинаковых частиц изменяет знак.
Полученные результаты обобщаются и на системы, состоящие из произвольного числа одинаковых частиц. В этом случае, как показывает опыт,
симметрия или антисимметрия волновой функции имеет место при перестановке двух любых одинаковых частиц.
Частицы, описываемые симметричными волновыми функциями, называются бозе-частицами или бозонами, и подчиняются статистике БозеЭйнштейна. К бозонам относятся все частицы с нулевым или целым спином
(наиболее яркие представители – фотоны). Частицы, описываемые антисимметричными волновыми функциями, называются ферми-частицами или фермионами, и подчиняются статистике Ферми-Дирака. К фермионам относятся
все элементарные частицы с полуцелым спином (электроны, протоны, нейтроны, нейтрино и др.). Указанная связь между спином и статистикой справедлива и для сложных частиц, построенных из элементарных, т.е. для атомных ядер, атомов и молекул. Принадлежность сложной частицы к бозонам
или фермионам определяется ее спином.
Например, атом водорода состоит из двух ферми-частиц: протона и
электрона, спин каждого из которых равен ½. Суммарный спин атома водорода в нормальном состоянии может быть равен либо 0 (спины электрона и
протона антипараллельны), либо 1 (спины параллельны). В обоих случаях
атом водорода в нормальном состоянии будет бозоном.
Второй пример. Ядро атома гелия 4Не состоит из двух протонов и двух
нейтронов. Спин этого ядра равен нулю, т.е. оно является бозоном. Бозоном
будет и сам атом 4Не в нормальном состоянии. А вот ядро 3Не состоит уже
из нечетного числа частиц со спином ½ - двух протонов и нейтрона. Спин
этого ядра нечетный и поэтому оно является фермионом. Ядра и атомы 4Не
подчиняются статистике Бозе-Эйнштейна, а ядра и атомы 3Не – статистике
Ферми-Дирака (это проявляется, например, в том, что 4Не вблизи абсолютного нуля температуры обладает сверхтекучестью, а 3Не – не обладает).
Применим принципы симметрии и антисимметрии к системе двух одинаковых не взаимодействующих между собой частиц. Уравнение Шредингера для такой системы в стационарном состоянии можно записать в виде:
123
Hˆ   ( Hˆ 1  Hˆ 2 )  E ,
где операторы Гамильтона Ĥ 1 и Ĥ 2 имеют совершенно одинаковый вид, но
зависят от координат разных частиц. Решение данного уравнения (это уравнение является уравнением с разделяющимися переменными) можно представить в виде произведения двух функций:    (1)  (2) , где  и   являются волновыми функциями, описывающими состояние каждой отдельной
частицы, а символами 1 и 2 условно обозначены координаты первой и второй
частицы. В силу тождественности частиц функция   (1) (2) также будет
решением уравнения Шредингера. Однако ни одна из этих функций не удовлетворяет принципу симметрии или антисимметрии. Но из них можно составить линейные комбинации, среди которых будет симметричная функция:
 s   (1)  (2)   (2)  (1)
и антисимметричная
 a   (1)  (2)   (2)  (1) .
(8.20)
Состояние, описываемое функцией  s , может реализоваться в случае системы двух одинаковых бозонов, а состояние  a - в случае системы двух одинаковых фермионов.
В случае невзаимодействующих одинаковых частиц имеет смысл говорить о состоянии не только системы в целом, но и о состоянии одной частицы. Например, можно сказать, что одна какая-то частица находится в состоянии  , а другая – в состоянии   . При этом фермионы ведут себя совершенно иначе, чем бозоны.
В системе одинаковых фермионов не может быть двух частиц, находящихся в одном и том же состоянии. Это отчетливо видно из соотношения
(8.20), так как в случае     волновая функция системы обращается в
нуль, что физически не соответствует никакому состоянию. Это положение
называется принципом запрета Паули, которым мы уже пользовались ранее.
Что касается бозонов, то на их состоянии принцип симметрии волновых функций не накладывает никаких ограничений, подобных принципу запрета Паули. В одном и том же состоянии может находиться любое число
одинаковых бозонов.
8.6.2. Квантовая теория свободных электронов в металле
Рассмотрим поведение так называемых свободных электронов в металле
без учета влияния кристаллической решетки металла. Может возникнуть вопрос – как это «без учета влияния кристаллической решетки»? И этот вопрос
будет совершенно правомерен. Опираясь на наши «обычные» представления,
124
легко сделать вывод о том, что обладающий небольшой энергией электрон
должен с огромным трудом протискиваться через кристалл. Расстояние между атомами порядка нескольких ангстрем (ангстрем равен 10-10м). Эффективный диаметр атомов при рассеянии на них электронов порядка одного ангстрема. Поэтому следует ожидать, что средний свободный пробег электрона
между столкновениями будет порядка нескольких ангстрем (это почти ноль!)
и электрон почти тотчас же должен влететь в какой-нибудь атом.
И, тем не менее, природа устроена так, что когда решетка кристалла идеальна, электрону ничего не стоит пройти через кристалл совершенно свободно, почти как в вакууме. Это чисто квантовый эффект. И только наличие неидеальностей в решетке (примеси, отсутствие какого-либо атома, колебания
решетки и т.д.) приводит к тому, что металлы обладают сопротивлением. А
пока рассмотрим квантовое поведение свободных электронов в металле.
Возьмем кубик металла со стороной L . Его объем V  L3 . Запустим вначале в кубик только один электрон. Так как мы используем приближение
свободных электронов, то потенциальную энергию можно взять равной нулю
( U  0 ).
Рассмотрим стационарное уравнение Шредингера:
2m
  2 ( E  U )  0 .

В декартовой системе координат при U  0 оно примет вид:
 2  2  2
2m
( 2  2  2 )  2 E  0 .
x
y
z

 k 2 . Параметр k имеет смысл волнового
 
вектора, связанного с импульсом соотношением k  p . Тогда решение
Введем обозначение 2mE /
2
уравнения Шредингера можно записать в виде:
  C expi(k x x  k y y  k z z ),
где i - мнимая единица, C – некоторая константа, определяемая из условий
нормировки.
Так как мы не рассматриваем поведение электрона вне кубика, то потребуем выполнения для волновой функции условий периодичности (формально
это означает, что мы рассматриваем бесконечное множество составленных
вплотную друг к другу кубиков):
 ( x)   ( x  L),  ( y)   ( y  L),  ( z)   ( z  L) .
Эти условия будут выполнены только в том случае, если волновое число
k принимает следующие значения:
125
2
2
2
n1 , k y 
n2 , k z 
n3 ,
L
L
L
где n1 , n2 , n3 целые числа 0,1,2,3…не равные нулю одновременно.
kx 
Чтобы это проверить, воспользуемся формулой Эйлера и условиями периодичности:
exp(ikx x)  expikx ( x  L)  exp(ik x L)  1  k x L  2n .
Таким образом, мы доказали, что значения волнового вектора и соответственно энергии квантуются. И для энергии получаем выражение:
 2  2 
2
2
2
E
  (n1  n2  n3 )  Ek .
2m  L 
Состояние электрона в металле (и вообще в любом кристаллическом

теле) будем определять значением волнового вектора k и спином. Так как
значение волнового вектора определяется набором n1 , n2 , n3 , то, задавая
2
набор n1 , n2 , n3 , мы тем самым определяем состояние электрона.
Как видно из проведенного анализа, уровни энергии в данном случае
являются вырожденными (напомним – имеется несколько различных состояний, соответствующих одному значению энергии).
n3
Для наглядного обозначения состояний электрона введем воображаемое пространство, по осям которого будем откладывать значения чисел n1 , n2 , n3 
(рис.8.31). Тогда, если забыть про спин, каждое соn2
стояние отобразится точкой в этом пространстве.
Плотность размещения точек в этом пространстве
n1
Рис. 8.31
равна единице (т.к. в каждом единичном кубике находится только одна точка и n  1). Поверхность равn3
E = const
ных значений энергии – сфера с радиусом
n0  n1  n2  n3 (рис.8.32).
2
n0
n2
n1
2
2
Найдем число разрешенных состояний, располагающихся внутри этой сферы (число состояний, энергия которых не превышает E ). Обозначим его  E . Так
как плотность размещения точек равна единице, то это
число равно просто объему этой сферы, умноженному
на два (в каждом состоянии могут находиться по два электрона, обладающих
спинами разного направления):
Рис. 8.32
4
8
8  2m 
 E  2 n0 3   (n12  n2 2  n3 2 ) 3 / 2    2 
3
3
3  
3/ 2
3
 L  3/ 2
  E .
 2 
126
Учитывая, что L3 равно объему кубика V , получаем окончательно:
8 2m 
E  
E 3 / 2V .
3
3 (2)
3/ 2
Запустим теперь в кубик много электронов (порядка числа атомов). В
силу принципа запрета Паули электроны разбегутся по разным состояниям.
Эти состояния окажутся затем либо заняты электронами, либо свободными.
Т.е. каждому электрону в этом пространстве квантовых чисел отводится своя
маленькая «комнатка», которую он может и не занимать.
Посмотрим, что будет при абсолютном нуле температуры. Вследствие
принципа Паули все электроны будут занимать каждый свое место на самых
нижних уровнях энергии (т.е. заполнят все нижние «комнатки»). Поэтому все
состояния с энергией меньшей некоторого значения будут заполнены электронами, а состояния с энергией большей этого значения будут свободны.
Это значение энергии обозначается E F (0) и называется уровнем Ферми при
абсолютном нуле температуры. Иначе можно сказать, что E F (0) - это максимальное значение энергии электронов при абсолютном нуле температуры.
Его значение можно найти из условия, что число заполненных состояний при
нулевой температуре должно быть равно числу всех электронов в металле:
8 2m
nV   E  
E F (0) 3 / 2 V .
3
3 (2)
3/ 2
Откуда получаем:
2
E F (0) 
(3 2 n) 2 / 3
2m
здесь n – концентрация электронов в металле.
Оценим значение E F (0) . Возьмем для концентрации электронов среднее
значение 5  1022 1/см3. Тогда E F (0) будет около 5 эВ. Много это или мало?
Чтобы сообщить классическому электронному газу такую энергию, его необходимо нагреть до температуры порядка 104 К (с учетом пропорциональности
энергии и температуры). Средняя тепловая энергия при комнатной температуре составляет значение около 1/40 эВ. Такая энергия может возбудить
только электроны, находящиеся на самых верхних уровнях вблизи уровня
Ферми. А их очень мало. Основная масса электронов, находящихся на более
глубоких уровнях, не способна поглощать энергию и изменять свое состояние.
8.6.3. Квантовые распределения. Фермионы. Бозоны
При абсолютном нуле температуры в каждом состоянии с энергией E 
E F (0) находится один электрон, в состояниях с E  E F (0) электронов нет.
127
Для характеристики вероятности заполнения электронами различных состояний при T  0 введем функцию распределения электронов по состояниям:
dN
,
f (E) 
d
где dN - число электронов, находящихся в интервале состояний от  до
  d , d - число состояний с энергией, заключенной в интервале от E до
E  dE . Число состояний d можно представить в виде: d  g ( E )dE , где
g (E ) называется плотностью состояний и равно числу состояний, приходящихся на единичный интервал энергии. Для плотности состояний g (E )
должно выполняться очевидное условие:

 f ( E ) g ( E )dE  nV ,
0
которое представляет собой по существу условие нормировки функции f (E )
1
Из определения f (E ) следует, что она представляет вероятность того,
что состояние с энергией E занято электроном.
f (E)
При абсолютном нуле температуры эта
функция имеет вид: f (E ) =1 при E  E F (0) и f (E )
=0 при E  E F (0) (рис.8.33).
T = 0,К
0
EF (0)
Рис. 8.33
E
При повышении температуры f (E ) деформируется – электроны вблизи E F (0) начинают занимать
более высокие уровни энергии, внутренние же
электроны не могут изменять состояние (рис.8.34).
f (E)
Вид функции распределения при ненулевой
1
температуре играет большую роль в квантовой
теории электронов, однако определение вида
функции распределения достаточно громоздко, по0
EF (0)
E этому его без вывода
1
Рис. 8.34
f (E) 
,
exp( E   ) / kT   1
где f (E ) - функция распределения Ферми-Дирака,  - химический потенциал. Его часто обозначают, как E F (T ) и называют просто уровень Ферми. При
Т=0 E F  E F (0) . В связи с новым обозначением распределение ФермиДирака часто записывают в виде:
f (E) 
1
.
exp( E  E F ) / kT   1
128
Легко проверить, что при нулевой температуре распределение ФермиДирака имеет вид ступенчатой функции.
Частицы, подчиняющиеся распределению Ферми-Дирака, называются
фермионы (электроны, нейтрино, нуклоны и т.д.). Это частицы с полуцелым
спином. Для фермионов характерно то, что они никогда не занимают состояние, в котором уже кто-то есть. Или говорят, что фермионы не накапливаются в одном состоянии. Функции распределения Ферми-Дирака можно придать еще один смысл: это среднее число электронов, находящихся в состоянии с энергией E .
С ростом температуры, как уже отмечалось, происходит размытие края
кривой функции распределения, но в любом случае при E  E F f ( E )  1 / 2 .
Т.е. можно сказать, что уровень Ферми – это уровень энергии, вероятность
заполнения которого равна ½.
При больших значениях энергии, когда E  E F >> kT экспонента в распределении Ферми-Дирака много больше единицы и тогда распределение
Ферми-Дирака переходит в классическое распределение Больцмана:
f ( E )  exp  ( E  EF ) / kT   const  exp( E / kT ) .
Поведение электронного газа существенно зависит от соотношения
между температурой тела и температурой Ферми, равной E F / k . Различают
два предельных случая:
1. kT  E F . В этом случае газ электронов называется вырожденным.
2. kT  E F . Такой газ называется невырожденным.
В металлах температура Ферми составляет величину порядка 104 К. Поэтому даже при температурах близких к плавлению электронный газ является
вырожденным. В полупроводниках плотность свободных электронов гораздо
ниже, чем в металлах, соответственно ниже значение температуры Ферми.
Поэтому уже при комнатных температурах электронный газ во многих полупроводниках является невырожденным и подчиняется распределению
Больцмана.
Как уже говорилось ранее, существует и другой тип квантовых частиц
– бозоны. Их наиболее яркие представители – фотоны и фононы. Фотон, как
мы знаем, - это квант электромагнитного излучения с энергией  . Фононы
– это кванты энергии колебаний кристаллической решетки твердого тела с


энергией i . Кроме энергии фононы обладают также импульсом p  k , где
k волновое число соответствующего колебания.
Фонон во многих отношениях ведет себя так, как если бы он был час
тицей с энергией  и импульсом k . Однако, в отличие от обычных частиц
129
(электроны, фотоны…) фонон не может возникнуть в вакууме. Фонон это колебание атомов и для его возникновения и существования нужна некоторая
среда. Поэтому он и называется «квазичастица».
Бозоны подчиняются распределению Бозе-Эйнштейна
1
,
ni 
 Ei   
exp 
 1
 kT 
где ni - среднее число частиц, находящихся в состоянии с энергией Ei  i
 - химический потенциал (  <0), определяемый из условия:  ni  N ,
где N - полное число частиц в системе. Для фотонов и фононов   0 . На фононы, как и фотоны, принцип Паули не распространяется. Фононы и фотоны
подчиняются одной и той же статистике. Но есть и существенное различие:
фотоны – истинные частицы, фононы - квазичастицы. Для них характерно то,
что вероятность рождения в состоянии, в котором уже имеется n частиц,
пропорциональна числу частиц. Т.е. бозоны в отличие от фермионов являются «коллективистами».
8.7. Квантовая проводимость твердых тел
Одной из практически важных задач, которую смогла решить квантовая физика применительно к твердым телам – это объяснение механизма их
проводимости.
8.7.1. Электроны в периодическом поле кристаллической решетки
Мы уже знаем, что поведение частицы в какой-либо среде определяется т.н. дисперсионной кривой, т.е. зависимостью энергии от ее импульса (или
волнового вектора k ). Для свободной частицы эта зависимость имеет квадратичный характер 2k 2 / 2m . В металлах в приближении свободных электронов спектр энергии имеет квазинепрерывных характер. Это означает, что
спектр разрешенных значений энергии состоит из множества близкорасположенных уровней.
При движении же электрона в периодическом поле кристаллической
решетки с периодом b ситуация изменяется кардинальным образом. При отсутствии внешнего электрического поля квантовомеханический расчет приводит к следующим результатам.
1. В каждом стационарном состоянии вероятность обнаружить электрон возле любого атома совершенно одинакова и со временем не изменяется. Т.е.
электрон за счет просачивания может равновероятно оказаться возле любого
атома. А это означает, что в периодическом поле бесконечно длинной решетки электрон чувствует себя абсолютно свободным и может легко пройти через кристалл, даже если ему приходится взаимодействовать с атомами. Таким
130
образом, в идеальной решетке электрон не испытывает никакого сопротивления. Конечно, понятие абсолютно свободного электрона достаточно условно.
Позднее мы увидим, что придется видоизменить понятие массы электрона
(будет введено понятие эффективной массы).
2. Для свободного электрона в вакууме существует параболическая зависимость энергии от волнового числа: E   2 k 2 / 2m . Для стационарных состояний электрона в идеальной решетке зависимость E (k ) имеет принципиально
другой вид и совпадает с параболической только при малых k (рис.8.35).
Энергия E0 соответствует энергии электрона, который не смог бы просачиE
ваться от одного атома к другому (бесконечно
~ k2
высокий потенциальный барьер взаимодействия электрона с атомом). Из рисунка также
E0
ΔE видно, что электроны в решетке могут иметь
энергию в пределах полосы E , т.е. им разрешены только эти значения энергии и никакие другие. Ширина полосы разрешенных
 π/b
π/b
0
значений энергии электрона E зависит от
Рис. 8.35
вероятности перескакивания электрона от
атома к атому, от расстояния между атомами и не зависит от размеров кристалла. Значения волнового числа, большие чем  / b , рассматривать не стоит, они не приводят к каким-либо новым состояниям, а просто повторяют те
состояния, которые уже появлялись при меньших k .
Включим теперь внешнее электрическое поле. Для описания динамики
поведения электрона необходимо иметь более определенное представление о
положении электрона. Это означает, что мы должны наложить ограничения
на значения координаты. При этом появляется конечное значение неопределенности его координаты x . Это автоматически в силу соотношения неопределенности должно привести к неопределенности импульса p и связанной
с ней неопределенности волнового числа k . Волновая функция теперь будет представлять суперпозицию плоских волн:
   a exp i(t  kx).
k
Вспомним, что при наложении гармонических волн с близкими значениями волнового числа образуется «волновой пакет». Скорость перемещения
«волнового пакета» называется групповой скоростью:
d
vгр 
.
dk
131
Наиболее вероятное положение электрона совпадает с центром этого
пакета. Следовательно, групповая скорость и представляет собой скорость
электрона. Найдем ее значение:
d 1 dE (k )
vгр 
=
.
dk
 dk
d vгр
Найдем теперь ускорение электрона
:
dt
d vгр
1 d dE
1 d 2 E dk
( )
=
.
dt
 dt dk
 dk 2 dt
dk 1 dp

Так как k  p /  , то
. По второму закону Ньютона производная от
dt  dt
импульса – это сила со стороны внешнего поля, поэтому:
dk
F

dt
2
1
d 2 E  d vгр
.
 2
 dk  dt
Данное соотношение представляет собой второй закон Ньютона, в котором
величина
2
2 d E 1
m*   ( 2 )
dk
играет роль массы и называется эффективной массой электрона.
Итак, если на электрон не действуют внешние силы, то он двигается
свободно (приближение свободных электронов), его положение в кристалле
равновероятно в любой точке. Динамика движения электрона под действием
внешнего электрического поля определяется не истинной массой электрона, а
введенной выше эффективной массой, которая может не иметь ничего общего с обычной массой. В частности эффективная масса может зависеть от направления движения электрона в кристаллической решетке.
Обратимся теперь к зависимости E (k ) . При малых значениях волнового числа, т.е. вблизи дна разрешенной зоны энергия пропорциональна k 2 . Тогда d 2 E / dk 2  const и m*  m . В точке перегиба d 2 E / dk 2  0 и m*   , т.е.
внешнее поле не способно изменить скорость электрона (точка перегиба как
раз и соответствует значению E0 , при котором электрон не способен просачиваться от одного атома к другому). Вблизи потолка разрешенной зоны
d 2 E / dk 2  0 , а это означает, что эффективная масса электрона отрицательна,
и под совместным действием поля решетки и внешнего поля электрон получает ускорение, обратное внешней силе (это приведет нас к понятию «дырки»).
132
8.7.2. Энергетические зоны в кристаллах
Попытаемся теперь понять, как влияет взаимодействие между электронами на их энергетический спектр.
Каждый электрон, как мы уже знаем, может иметь любую энергию в
пределах разрешенной зоны (в этом проявляется периодичность потенциальной энергии взаимодействия электрона с атомами решетки). Если теперь в
кристалл внести два электрона, то их взаимодействие приведет к тому, что
вместо одного уровня энергии появятся два (как говорят, происходит расщепление уровней энергии). Это происходит потому, что каждый энергетический уровень соответствует определенному значению волнового числа, т.е.
определенному состоянию электрона. В силу принципа запрета Паули два
электрона не могут находиться одновременно в одном состоянии, следовательно, не могут и иметь одинаковую энергию. С учетом спина электрона на
любом уровне энергии могут находиться только два электрона, обладающих
противоположными спинами.
При сближении N атомов вместо одного уровня энергии
E
возникает N уровней, расположенных в пределах разрешенной
зоны. Таких разрешенных зон может быть несколько
1
(рис.8.36), т.к. каждая зона образуется из отдельного уровня
энергии атома, а таких уровней может быть несколько. Шири2
E
на разрешенной зоны энергии от размеров кристалла не зависит и обычно бывает порядка нескольких электрон-вольт. И
3
если в кристалле порядка 1023 атомов, то расстояние между
соседними уровнями из-за сближения атомов в зоне порядка
Рис. 8.36
10-23 эВ. На рис. 8.36 цифрами 1 и 3 обозначены разрешенные
зоны, 2 – запрещенная зона ( E - ширина запрещенной зоны). Первая зона
при абсолютном нуле температуры свободна от электронов, третья зона может быть частично или полностью заполнена электронами и называется валентной, т.к. возникает из уровня, на котором находятся валентные электроны в основном состоянии атома.
В зависимости от степени заполнения электронами валентной зоны и
ширины запрещенной зоны возможны три случая:
1) Часть уровней валентной зоны свободна. Достаточно сообщить электронам энергию порядка 10-23 эВ и они могут занять более высокие уровни
энергии. Это происходит, например, за счет теплового движения (энергия теплового движения на 1К порядка 10-4эВ). Электрическое поле также способно переводить электроны на более высокие уровни, и они приобретают
дополнительную скорость в направлении противоположном электрическому
полю. Такие вещества являются металлами – хорошими проводниками. Для
133
них валентная зона является зоной проводимости. Иногда имеет место перекрывание зон (запрещенная зона отсутствует).
2) Валентная зона заполнена полностью. Электрическое поле не способно сообщить энергию электронам, достаточную для преодоления запрещенной зоны. Если ширина запрещенной зоны E невелика (<1эВ), то только энергия теплового движения способна перевести электроны в свободную
зону – она становится зоной проводимости (на самом деле не только энергия
теплового движения способна перевести электроны в зону проводимости – об
этом позднее). Такие вещества являются полупроводниками.
3) Ширина запрещенной зоны E несколько электрон-вольт. Валентная зона заполнена полностью. В этом случае ни тепловое движение, ни
электрическое поле не способны сообщить энергию достаточную для переброса электронов в свободную зону - это диэлектрики. В них электроны настолько связаны, настолько «заперты», что даже сильные поля не могут помочь им вырваться на свободу. И только кванты жесткого электромагнитного
излучения могут дать им свободу.
8.7.3. Электропроводность металлов
Ранее мы показали, что в случае идеальной кристаллической решетки
электроны не испытывают при своем движении никакого сопротивления и
электропроводность металлов должна быть бесконечно большой. Это связано
с тем, что имеется перекрытие волновых функций между соседними атомами
решетки и за счет туннельного эффекта электрон с равной вероятностью может оказаться в любом месте решетки. И только за счет рассеяния электронов
на атомах примеси и тепловых колебаний решетки появляется электрическое
сопротивление.
Удельное сопротивление при ненулевой температуре складывается из
двух слагаемых - сопротивление, определяемое наличием примесей (  прим ) и
сопротивление, обусловленное тепловыми колебаниями решетки (  колеб ):
   прим +  колеб .
При нулевой температуре исчезает сопротивление, обусловленное тепловыми колебаниями решетки, но остается сопротивление, обусловленное
примесями и искажениями решетки.
Введем понятие дрейфовой скорости:
1
vдр   vi ,
(8.21)
n
где сумма берется по всем электронам металла ( n - их число).
При отсутствии внешнего электрического поля скорость дрейфа обращается в нуль и электрический ток отсутствует. При наложении электриче-
134
ского поля vдр становится отличной от нуля и появляется электрический ток.
Кроме кулоновских сил (  eE ) существуют силы сопротивления, пропорциональные дрейфовой скорости:
Fсопр  r vдр ,
r - играет роль коэффициента сопротивления движению электронов.
Запишем уравнение движения электрона с эффективной массой m * ,
движущегося со скоростью vдр :
d vдр
 eE  r vдр .
dt
При отсутствии внешнего поля ( E  0 ) это уравнение имеет решение:
 r 
vдр  const exp  
t.
 m* 
m*
Отношение
  называется временем релаксации и показывает, как
r
быстро уменьшается скорость дрейфа при выключении электрического поля.
Установившееся значение скорости дрейфа равно:
eE
vдр  
.
m*
И для плотности тока ( j  nev ) получаем выражение:
 ne 2 
j
E.
m*
Аналогичное выражение существует и в классической теории электропроводности металлов, только ранее сюда входила масса электрона и среднее
время свободного пробега электрона. Соответствующий квантовомеханический расчет дает линейную зависимость удельного сопротивления от температуры, что соответствует опыту (в «классике» сопротивление пропорционально корню из температуры!).
Различие классической и квантовомеханической трактовок описания
движения электронов проводимости в металле сводится к следующему. При
классическом рассмотрении предполагается, что все электроны возмущаются
внешним электрическим полем. Это приводит к тому, что каждое слагаемое в
(8.21) получает добавку в направлении, противоположном полю. При квантовомеханической трактовке возмущаются полем и изменяют свою скорость
лишь электроны, занимающие состояния вблизи уровня Ферми. Электроны,
находящиеся на более глубоких уровнях, полем не возмущаются, и их вклад
в сумму (8.21) не изменяется. Кроме того, на динамику движения электронов
оказывает влияние не обычная масса электрона, а его эффективная масса.
m*
135
8.7.4. Собственная проводимость полупроводников
Полупроводники по проводимости занимают промежуточное положение между металлами и изоляторами – B, C, Si, P, S, Ge, As. Их главная особенность – чрезвычайно высокая чувствительность проводимости к внешним
воздействиям (температура, давление, примеси, электромагнитное излучение
и т.д.). Например, удельное сопротивление кремния при повышении температуры от 293К до 973К падает в 6  105 раз.
Мы уже знаем, что полупроводниками являются кристаллические вещества, у которых валентная зона полностью заполнена электронами, а ширина запрещенной зоны Ещели невелика. Например, Ещели для кремния около 1,1 эВ, Ещели для германия около 0,72 эВ.
Различают собственные и примесные полупроводники.
Собственные полупроводники – химически чистые полупроводники.
Примесные полупроводники – полупроводники с различными примесями.
E
Рассмотрим сначала механизм собственной
проводимости полупроводников. При абсолютном
зона
проводимости
нуле температуры валентная зона заполнена полноEщели
стью, зона проводимости свободна (рис.8.37). Обычзапрещённая
ного электрического поля недостаточно для переброзона
са электронов из валентной зоны в зону проводимовалентная
зона
сти. Поэтому, при нулевой температуре собственные
полупроводники должны вести себя как изоляторы.
Рис. 8.37
Представим, что каким-то образом (как рассмотрим позднее) удалось перебросить электрон из валентной зоны в зону
проводимости. Тогда в зоне проводимости появляется электрон свободный
от атома и способный под действием электрического поля перемещаться по
кристаллу. В валентной же зоне образуется вакантный уровень, на который
могут попасть другие электроны. Таким образом, электропроводность полупроводника становится не равной нулю.
E
При наличии вакантных уровней в валентной зоне
поведение электронов валентной зоны (т.е. связанных с
атомами) можно представить как движение положительно
электрон
заряженных квазичастиц – «дырок» (рис.8.38). К понятию
дырки можно прийти иначе. Вспомним, что эффективная
дырка
масса электрона m * у потолка энергетической зоны отрицательна. Отсутствие частицы с зарядом (  e ) и отрицательной массой эквивалентно наличию частицы с положиРис. 8.38
тельной массой и положительным зарядом – т.е. опять
136
приходим к понятию дырки!
Если в зоне проводимости нет свободных электронов и валентная зона
заполнена полностью, т.е. в ней нет «дырок», то проводимость полупроводника равна нулю. А это означает, что  vi  0 (сумма берется по всем электронам валентной зоны). После перевода электрона с номером k из валентной
зоны в зону проводимости эта сумма может быть расписана иначе:
 (vi  vk )  0   vi  vk ,
i k
i k
а это означает, что сумма скоростей всех электронов валентной зоны равна со
знаком минус скорости выброшенного в зону проводимости электрона. Все
эти электроны зоны валентной зоны создадут ток J  (e)(vk )  evk . Этот
ток эквивалентен току, который создавала бы частица с зарядом +e и имеющую скорость, противоположную скорости отсутствующего электрона. Такая
частица и получила название «дырка» (в дальнейшем кавычки будем опускать).
Если к кристаллу приложить электрическое поле, то электроны начинают смещаться против поля, а дырки вдоль поля. Начинается дрейф электронов к положительному полюсу, а дырок - к отрицательному.
Таким образом, собственная проводимость полупроводников обусловлена движением электронов в зоне проводимости и дырок в валентной зоне.
Как создать пару электрон-дырка? Есть несколько вариантов. Рассмотрим один из них.
Направим на полупроводник поток квантов электромагнитного излучения (  -квантов). Если энергия фотона больше Ещели (ширины запрещенной
зоны), то образуется пара электрон-дырка. Быстрота образования пар пропорциональна интенсивности излучения. Если к полупроводнику приложить
электрическое поле, то в цепи возникает электрический ток, пропорциональный интенсивности света – так возникает явление фотопроводимости.
Пусть на полупроводник падает поток частиц высоких энергий (протонов, пионов…). Электрическое поле пролетающих через кристалл частиц вырывает электроны из связанных состояний, образуя пару электрон-дырка.
Пролет частиц высоких энергий рождает электрический импульс в кристалле
– на этом принципе работают полупроводниковые счетчики.
До сих пор мы рассматривали свойства полупроводников при нулевой
температуре. При температурах отличных от нуля есть другой механизм образования пар электрон-дырка. Тепловые колебания решетки могут вызвать
самопроизвольное рождение пары электрон-дырка. Т.е. попросту говоря
137
электрон, получая тепловую энергию решетки, способен оторваться от атома
и перейти в зону проводимости, параллельно рождается дырка.
Вероятность образования пары электрон-дырка Pпары пропорциональна
вероятности того, что вблизи какого-либо атома сосредоточится энергия
больше или равная Ещели . По распределению Больцмана:
Pпары  exp(Eщели / kT ) .
Наряду с образованием пар происходит обратный процесс встречи
электрона и дырки, а освобожденная энергия переходит к решетке. Этот процесс называется рекомбинацией электрона и дырки. Вероятность рекомбинации Pрек пропорциональна как числу электронов, так и числу дырок:
Pрек  nnn p ( nn – число электронов в единице объема – отрицательных (negative) носителей заряда, n p – число положительных (positive) носителей заряда
– дырок).
Одновременное действие генерации электронно-дырочных пар и их рекомбинации приводит к установлению в полупроводнике равновесия, характеризующегося равновесной концентрацией носителей заряда. Эта величина
при комнатной температуре для всех полупроводников во много раз меньше,
чем концентрация валентных электронов. Например, в германии на 1010 валентных электронов приходится один электрон проводимости. Но и такого
малого количества носителей заряда достаточно, чтобы полупроводник обладал заметной электропроводностью. Связано это с тем, что удельная проводимость полупроводника  зависит не только от концентрации электронов и
дырок, но и от их подвижностей U n и U p :   e(nnU n  n pU p ) . В чистых полупроводниках подвижность электронов часто значительно больше, чем в
металлах. Например, в антимониде индия ( InSb ) подвижность электронов в
103 раз больше, чем в меди.
При равновесии скорость образования пар должна быть равна скорости
рекомбинации. Это приводит к соотношению:
n p nn  const  exp(Eщели / kT ) ,
где const слабо зависит от температуры.
Если взять совершенно чистое вещество, то число положительных и
отрицательных носителей заряда будет одинаковым: nn  n p  ni . Величина
ni называется собственной концентрацией носителей и изменяется с темпе-
ратурой по закону
ni  exp(Eщели / 2kT ) .
138
Поскольку удельная проводимость  пропорциональна числу носителей заряда, то
   0 exp(Eщели / 2kT )
ln
 Eщели
и быстро растет с увеличением температуры. Экспе1/T риментальную зависимость проводимости от температуры удобно строить в логарифмических коордиРис. 8.39
натах (рис.8.39). Наклон прямой определяется шириной запрещенной зоны, что позволяет экспериментально измерить Ещели .
E
Ge
3
Ge
Ge
Ge
1
2
1
3
2
Ge
Рис. 8.40
На рис. 8.40 отображены процессы рождения и рекомбинации пары электрон-дырка как в пространстве, так и на энергетической диаграмме.
Стрелкой 1 отображен процесс
рождения пары электрон-дырка,
стрелкой 3 – процесс рекомбинации,
стрелка 2 отображает перемещение
электрона по валентной зоне.
8.7.5. Примесная проводимость полупроводников
Кроме собственной проводимости полупроводники обладают еще и
примесной проводимостью. Она возникает если некоторые атомы данного
полупроводника заменить в узлах кристаллической решетки атомами, валентность которых отличается на единицу от валентности основных атомов.
Заменим в решетке германия один атом Ge атомом
Ge
мышьяка As (рис.8.41). Германий - четырехвалентен,
Ge
мышьяк – пятивалентен. Для образования ковалентных
связей с четырьмя атомами Ge, мышьяку необходимо
As
только четыре электрона, пятый оказывается лишним. Он
Ge
слабо связан с ядром, легко отщепляется от атома и начиGe
нает блуждать по кристаллу. Появление лишнего элекРис. 8.41
трона не сопровождается появлением дырки. В окрестности As возникает положительный заряд, но он связан с этим атомом и не
может перемещаться по решетке. Таким образом, в полупроводниках с примесью, валентность которой на единицу больше валентности основных атомов, имеется только один вид носителей тока – электроны. Атомы примеси,
поставляющие электроны называются донорами, сам полупроводник обладает электронной проводимостью и называется полупроводник n-типа
(negative). Донорные узлы заряжены положительно и действуют как ловушка
139
для электронов. Но т.к. энергия связи лишнего электрона с атомом примеси
очень мала, то связь захваченного электрона будет непрочной и легко разрушается за счет тепловых колебаний решетки.
Наличие атома примеси искажает поле решетки,
а это приводит к появлению примесного уровня, расE
положенного в запрещенной зоне (рис.8.42). В полуEщели
донорный
проводниках n-типа – это донорный уровень. Для пауровень
ры Ge-As Е  0,05эВ (напомним: Ещели  0,72эВ).
Уровень Ферми располагается в верхней половине запрещенной зоны.
Пусть теперь валентность примеси на единицу
Ge
Ge
меньше валентности основных атомов, например, в
Ge германий внедрили бор с валентностью три (рис.8.43).
BТрех валентных электронов бора недостаточно для обGe
разования устойчивых связей со всеми четырьмя сосеGe
дями Ge. Тогда атом бора, пытаясь выдать себя за объРис. 8.43
ект с валентностью четыре, должен «утащить» нужный
ему электрон, например, у соседнего атома Ge и окажется отрицательно заряженным атомом. Но там, где он стащит электрон, останется дырка. Избыточный отрицательный заряд возле атома примеси будет связан и не может
перемещаться по кристаллу.
Таким образом, в полупроводниках с примесью, валентность которой
на единицу меньше валентности основных атомов, возникают носители тока
только одного вида – дырки. Атомы примеси, которые способны образовать
дырку являются акцепторами, проводимость называется дырочной, а сам полупроводник – p-типа (positive).
Наличие акцепторных примесей приводит к появлению в запрещенной зоне акцепторных уровней
акцепторный
уровень
(рис.8.44). Для пары Ge-B: E  0,08эВ. Уровень
Eщели
E
Ферми располагается в нижней половине запрещенной зоны. При повышении температуры уровень
Ферми в полупроводниках p- и n-типа смещается к
Рис. 8.44
середине запрещенной зоны.
Электроны и дырки движутся в кристалле под действием электрического поля как свободные частицы, каждая со своей эффективной массой.
Вместе с тем, учет притяжения между дыркой и электроном при их одновременном присутствии в кристалле в условиях, когда концентрация носителей
заряда не очень велика, приводит к чрезвычайно интересным результатам. В
Рис. 8.42
140
частности, электрон и дырка могут при определенных условиях образовать
связанную систему с дискретным энергетическим спектром, которая может
двигаться по кристаллу как единое целое. Такая система носит название экситона. В известном смысле экситон представляет собой возбужденное состояние атома в кристалле, передающееся от атома к атому посредством
квантовомеханического резонанса. Некоторые свойства экситонных уровней
аналогичны свойствам примесных уровней. Например, как экситоны, так и
примеси приводят к появлению энергетических уровней в запрещенной энергетической зоне.
Особый интерес представляют полупроводники со столь большой концентрацией доноров или акцепторов, при которой уровни примесных атомов
расширяются в полосы, сливающиеся с зоной проводимости и валентной зоной. Такой полупроводник близок по своим свойствам к металлу: его электропроводность высока и слабо зависит от температуры. Уровень Ферми оказывается либо в зоне проводимости, либо в валентной зоне. В этом случае
говорят о вырождении электронов или дырок. Такой полупроводник называется вырожденным.
В вырожденном полупроводнике n - типа электроны при T  0K полностью заполняют не только уровни валентной зоны, но и все уровни, лежащие в зоне проводимости вблизи ее дна ниже EF (0) . При повышении температуры электроны переходят на уровни с большей энергией и слой плотно
заполненных уровней уменьшается. Поэтому с ростом температуры уровень
Ферми EF опускается вниз и при достаточно высокой температуре может
оказаться в запрещенной зоне и вырождение может исчезнуть. Критическая
температура, при которой исчезает вырождение, тем выше, чем больше концентрация доноров nn . Например, вырождение электронов в Ge происходит
при концентрации nn  1019 см-3.
Вклад различных механизмов проводимости (собственной и примесной)
определяется концентрацией примесей и сильно зависит от температуры. Например, в чистом Ge собственная концентрация электронов и дырок при
T~293K составляет величину порядка 2,5  1013 1/см3. Число атомов Ge порядка 4,5  1022 1/см3. Если есть примесь, которая полностью «ионизирована», то
при наличии одного атома примеси на 106 атомов Ge, получаем концентрацию дополнительных электронов:
nэлектр  4,5 1022 106  4,5 1016 1/см3
(сравните с собственной концентрацией электронов и дырок!). Таким образом, при низких температурах преобладает примесная проводимость.
141
При повышении температуры концентрация примесных носителей тока
быстро достигает насыщения (т.е. освобождаются все донорные и заполняются все акцепторные уровни), и с ростом температуры все в большей степени начинает сказываться собственная проводимость за счет переброса электронов в зону проводимости. При температуре порядка 3000С собственная
проводимость становится уже преобладающей.
9. Ядерная физика и элементарные частицы
9.1. Основы физики атомного ядра
9.1.1. Состав и характеристики атомного ядра
По современным представлениям ядро состоит из частиц двух типов:
протоны и нейтроны. Их общее название – нуклоны.
Протон: обозначают символом p . Обладает положительным элементарным зарядом e и массой mp  1,6726  1027 кг=1,0076 а.е.м. В ядерной физике массу принято выражать в единицах энергии МэВ=106эВ. Для этого используют соотношение Эйнштейна E0  mc 2 , переводящее массу в килограммах в энергию в джоулях и затем джоули в электрон-вольты (1эВ=
1,6 1019 Дж). Тогда масса протона составит m p  938МэВ. Протон имеет
спин ½ и собственный магнитный момент  p  2,793 я , где я  e / 2mp ядерный магнетон, меньший магнетона Бора в m p / me =1836 раз. Свободный
протон стабилен.
Нейтрон: обозначают символом n . Не имеет заряда. Нейтрон немного
тяжелее протона mn =939МэВ (что это значит, поймем позднее). Спин нейтрона ½ и, несмотря на отсутствие заряда, нейтрон имеет магнитный момент
n  1,91я , противоположный направлению спина. Свободный нейтрон нестабилен и самопроизвольно превращается в протон по схеме n  p  e  
с испусканием электрона и антинейтрино.
Важнейшими характеристиками ядра являются зарядовое число Z ,
равное числу протонов, и массовое число A , равное числу протонов и нейтронов N : A  Z  N . Зарядовое число определяет порядковый номер элемента в таблице Менделеева. Символическая форма записи ядра ZA X (или
Z
X A ). Ядра с одинаковыми A называют нуклидами, с одинаковыми Z - изо-
топами. Примеры изотопов: 11 H - протий, 12 H - дейтерий (ядро дейтерия называют дейтроном d ) и 13 H - тритий (радиоактивен). Размеры ядер порядка
10-15м и их объем пропорционален массовому числу. Спин ядра кратен ½ и в
основном состоянии всех стабильных ядер  9 / 2 .
142
9.1.2. Ядерные силы
Устойчивость большинства ядер, несмотря на наличие в ядре частиц
одного знака заряда, говорит о том, что между нуклонами существует очень
интенсивное взаимодействие, т.н. сильное взаимодействие. Его особенности
1. Короткодействие с радиусом действия порядка 10-15м. При меньших расстояниях притяжение сменяется отталкиванием
2. Зарядовая независимость Fpp  Fpn  Fnn .
3. Нецентральны – т.е. зависят от ориентации спинов нуклонов.
4. Обладают свойством насыщения – т.е. каждый нуклон взаимодействует с
ограниченным числом ближайших соседей.
По квантовым представлениям сильное взаимодействие осуществляется путем обмена особыми частицами  - мезонами. Это т.н. виртуальные
частицы, которые нельзя обнаружить за время их существования. Различают
 ,  и 0 - мезоны. Все они нестабильны. В результате процессов
p
n   , n
p   , p
p  0 , n
n  0
нуклоны окружены облаком виртуальных  - мезонов. Казалось бы, что данные процессы противоречат закону сохранения энергии. Однако, согласно
соотношению неопределенности E    испущенный  - мезон с энергией mc 2 может существовать только время, не больше, чем   / mc2 и если
он укладывается в данный интервал, то никакого нарушения закона сохранения энергии нет (как говорится, не пойман – не вор). Затем идет поглощение
 - мезона другим нуклоном, что и обуславливает сильное взаимодействие.
Если нуклону сообщить достаточную энергию, то он испускает реальный  мезон, существующий независимо от нуклона. Это происходит при столкновениях нуклонов достаточно высоких энергий.
Существование виртуальных  - мезонов легко объясняет наличие у незаряженного нейтрона магнитного момента. Так как нейтрон проводит часть
времени в виртуальном состоянии p   , то орбитальное движение  - мезона и приводит к появлению магнитного момента.
9.1.3. Радиоактивность. Закон радиоактивного распада
Радиоактивность заключается в самопроизвольном (спонтанном) распаде ядер с испусканием элементарных части. Радиоактивны только нестабильные ядра. Отдельные радиоактивные ядра распадаются независимо друг
от друга. Поэтому можно считать, что количество ядер dN , распадающихся
за время dt , пропорционально числу имеющихся на данный момент ядер N
и интервалу времени dt
dN  Ndt ,
(9.1)
143
где   0 - постоянная распада, определяющая вероятность распада в единицу времени. Интегрируя (9.1), имеем
N  N0 exp  t  ,
(9.2)
где N 0 - число нераспавшихся ядер на момент t  0 .
Интенсивность радиоактивного распада (скорость распада) характеризуется числом ядер, распадающихся в единицу времени – активность A . Из
(9.1) следует, что A  N . Измеряется активность в беккерелях [Бк]
(1Бк=1распад/с) и в кюри [Ки] (1Ки= 3,7 1010 Бк).
Существует также понятия периода полураспада T и среднего времени
жизни ядра  . Период полураспада – время, за которое распадается половина
первоначального числа ядер. Из (9.2) следует
ln 2
T
.

Период полураспада для известных в настоящее время радиоактивных ядер
находится в пределах от 3 107 с до 5  1015 лет.
Среднее время жизни определяется как отношение суммы времен жизни всех ядер к их первоначальному числу. Сумма времен жизни dN ядер,
каждое из которых существует время t , равна t  dN . Тогда, очевидно,

1

tdN .
N 0 0
Выражая dN из (9.2), после интегрирования находим   1/  .
9.1.4. Виды радиоактивного распада
Радиоактивность ядер в природных условиях – естественная, в ядерных
реакциях – искусственная. Принципиально они не отличаются. К основным
видам радиоактивного распада относят ,   и  - распады.
Альфа-распад. Это самопроизвольное испускание ядром т.н.  частицы (ядро 42 He ) по схеме
A
Z
U
E
0
6 МэВ
r
Рис. 9.1
X ZA42 Y  42 He ,
где X - исходное (материнское) ядро, Y - дочернее ядро. Причем  - частица не существует внутри ядра, а возникает лишь в момент
распада. Покидая ядро, она преодолевает потенциальный барьер, высота которого превосходит энергию  - частицы E (рис. 9.1).
Внутренняя сторона барьера обусловлена
ядерными силами, внешняя сторона – силами
144
кулоновского отталкивания.
По «классике»  - частица в принципе не может покинуть ядро. Но
благодаря туннельному эффекту существует определенная вероятность обнаружить  - частицу за пределами барьера.
Бета – распад. Существует 3 разновидности  - распада. В одном случае ядро испускает электрон (  - распад), в другом – позитрон (  - распад)
и в третьем, называемом K - захват, ядро захватывает один из электронов K оболочки. Это всегда сопровождается характеристическим рентгеновским
излучением.
Рассмотрим  - распад. В ядре электронов нет. Откуда они берутся? В
этом случае говорят, что электрон рождается при  - распаде. Тогда закон
сохранения заряда требует, чтобы образовалось новое ядро (нуклид) с порядковым номером Z  1 . Однако экспериментально установлено, что верхняя
граница энергетического спектра образовавшихся электронов меньше разности энергий исходного и образовавшегося ядер, т.е.  - распад происходит с
кажущимся нарушением закона сохранения энергии. Кроме того не сохраняется и спин системы. Было предположено, что при  - распаде рождается
еще одна частица, которая и уносит с собой излишек энергии – нейтрино  .
Ее заряд равен нулю, спин равен ½ и масса (если она есть) чрезвычайно мала
(по некоторым данным она составляет несколько эВ, для сравнения – масса
электрона 0,5 МэВ). Из-за фантастически малого взаимодействия с веществом нейтрино свободно проходит через Солнце, а том более через Землю.
Таким образом, процесс  - распада протекает по схеме
A
Z
X ZA1 Y  e   ,
где e  - обозначение электрона,  - антинейтрино (почему, мы поймем позднее). Процесс  - распада можно трактовать как внутринуклонный процесс,
обусловленный взаимным превращением нуклонов в ядре
n  p  e   .
Процесс  - распада протекает по схеме
p  n  e   ,
где e  - обозначение позитрона (антиэлектрона).
Гамма-распад. Этот вид радиоактивного распада заключается в испускании возбужденным ядром  - квантов жесткого электромагнитного излучения, энергия которых варьируется в пределах от 10 кэВ до 5 МэВ. При этом
145
ядро по зарядовому и массовому числам остается тем же. В отличие от  распада  - распад – процесс внутриядерный, а не внутринуклонный.
9.1.5. Масса и энергия связи ядра
Известно, что масса ядра mя всегда меньше суммы масс всех его нуклонов. Это связано с тем, что при объединении нуклонов в ядро выделяется
энергия связи нуклонов друг с другом. По Эйнштейну энергия покоя всех нуклонов ядра Eнукл   Zmp   A  Z  mn  c 2 . Энергия ядра Eя  mя c 2 . Разность
этих энергий называется энергией связи ядра
Eсв  Eнукл  Eя   Zmp   A  Z  mn  mя  c 2
и она равна работе, которую нужно совершить, чтобы развести образующие
ядро нуклоны на достаточно большое расстояние.
Так как в таблицах обычно приводят массу атома mа , а не ядра, то вы-
ражение для энергии связи лучше представить в виде
Eсв   ZmH   A  Z  mn  mа  c 2 ,
где mH - масса атома водорода.
Для упрощения расчетов вводится понятие дефект массы  как разность между массой ядра (в а.е.м.) и его массовым числом:   m  A . Дефект
массы может быть как положительным, так и отрицательным.
Энергия связи, приходящаяся на
Eсв / A, МэВ
один нуклон ядра, называется удельной
9,0
энергией связи. Эта величина характеризует
8,5
меру прочности ядра. На рис. 9.2 приведена
8,0
зависимость удельной энергии связи
7,5
Eсв / A от массового числа. В грубом приA
ближении можно считать, что удельная
энергия связи почти не зависит от массовоРис. 9.2
го числа и равна примерно 8 МэВ. Это означает, что ядерные силы обладают свойством насыщения.
Наиболее прочными являются ядра с массовыми числами от 50 до 60,
т.е. элементов от Cr до Zn . Это делает энергетически выгодным деление тяжелых ядер и синтез (слияние) легких ядер. Оба этих процесса сопровождаются выделением большого количества энергии (тепла) примерно в 106 раз
больше, чем в химических реакциях.
0
50
100
150
200
9.1.6. Ядерные реакции
146
Это процесс сильного взаимодействия атомного ядра X с элементарной частицей или другим ядром Y . Данный процесс символически представляют как
X  a  Y  b или сокращенно X  a, b Y ,
где a, b - легкие частицы: протон, нейтрон,  - частица, дейтрон и  - кванты.
Эти реакции сопровождаются как выделением кинетической энергии (экзоэнергетические) так и ее поглощением (эндоэнергетические).
Экзоэнергетическая реакция может идти при сколь угодно малой кинетической энергии сталкивающихся частиц (если нет каких-либо запретов на
данную реакцию). Данная реакция имеет место, если сумма масс исходных
частиц больше суммы масс образующихся частиц. Эндоэнергетическая же
реакция может идти только тогда, когда суммарная кинетическая энергия
сталкивающихся частиц превосходит некоторое пороговое значение.
Для характеристики вероятности ядерного взаимодействия вводится
понятие эффективного сечения  . Если из N частиц, падающих на слой вещества с концентрацией ядер n и толщиной l , провзаимодействует N частиц, то
N

.
nNl
Единица измерения  - барн (б), 1 барн=10-24 см2.
Наибольшее значение имеют реакции, вызываемые нейтронами. Это
вполне естественно, так как нейтроны не имеют заряда и могут проникать в
ядра, обладая весьма малой энергией. Эффективные сечения реакций обычно
возрастают при уменьшении энергии нейтронов (чем меньше скорость нейтронов, тем больше время, которое он проводит в сфере действия ядерных
сил). Однако часто наблюдаются случаи, когда сечение захвата нейтронов
имеет резко выраженный максимум для нейтронов определенной энергии. В
качестве примера на рис. 9.3 приведена зависимость сечения захвата нейтро238
U от энергии нейнов ядром 92
ln 
10 барн
~7 эВ
Рис. 9.3
тронов в логарифмическом масштабе. Видно, что при энергии 7
эВ сечение захвата резко возрастает, достигая 23000 барн. Это
указывает на то, что явление имеln E ет резонансный характер (аналогично резонансному поглощению
света).
Представляет интерес реак-
147
ция
14
7
N  n, p 6 C , которая постоянно протекает в атмосфере Земли под дей14
ствием нейтронов, образуемых космическими лучами. Возникающий при
этом радиоуглерод 14
6 C  - радиоактивен с периодом полураспада 5730 лет.
Радиоуглерод усваивается при фотосинтезе растениями, участвует в круговороте веществ в природе и его концентрация везде примерно одинакова. Пока
организм жив, убыль в нем радиоуглерода восполняется за счет участия в
круговороте веществ в природе. В момент смерти организма процесс усвоения радиоуглерода сразу же прекращается, и его концентрация начинает экспоненциально убывать. Таким образом, измеряя концентрацию радиоуглерода в останках организма, можно определить дату их смерти, т.е. их возраст.
9.1.7. Реакции деления
В 1938 году (за год до второй мировой войны) немецкие ученые Ган и
Штрассман обнаружили, что при облучении урана нейтронами образуются
элементы из середины таблицы Менделеева. Дальнейшие исследования показали, что захватившее нейтрон ядро урана делится на осколки примерно равной массы. Удельная энергия связи для ядер средней массы примерно на 1
МэВ больше, чем у тяжелых ядер, это приводит к выделению большого количества энергии. Но особенно важно то, что при делении каждого ядра урана выделяется несколько новых нейтронов. Это происходит из-за того, что
относительное количество нейтронов в тяжелых ядрах больше, чем в средних
ядрах. Поэтому осколки деления оказываются перегруженными нейтронами.
Большинство нейтронов испускаются мгновенно ( около 10-14 с), но часть (до
1%) испускается с запаздыванием до 1 мин. Один из путей, которыми осуществляется деление, выглядит следующим образом
235
140
94
92 U  n 55 Cs 37 Rb  2n .
В данной реакции выделяется энергия 0,85 МэВ/нуклон. Выделение
мгновенных и запаздывающих нейтронов не устраняет полностью перегрузку
осколков нейтронами. Поэтому осколки деления оказываются радиоактивными и претерпевают цепочку дальнейших превращений до образования
стабильных элементов.
Ядра 235U делятся нейтронами любых энергий, но особенно сильно тепловыми нейтронами (находящимися в тепловом равновесии с веществом).
Ядра 238U делятся только быстрыми нейтронами (больше 1 МэВ), при меньших энергиях происходит просто захват нейтронов. Эффективное сечение
захвата резко возрастает при E  7 МэВ. Испускание нескольких нейтронов
при делении ядер 235U и др. делает возможным осуществление цепной ядерной реакции, при которой количество нейтронов, рождающихся в каждом
148
поколении, нарастает в геометрической прогрессии. Но это идеальная картина. Из-за конечных размеров делящегося вещества и большой проникающей
способности нейтронов многие нейтроны просто выйдут через боковую поверхность, не породив новых нейтронов. Так как объем тела пропорционален
кубу его размеров, а площадь поверхности пропорциональна квадрату размеров, то относительная доля выбывающих из игры нейтронов уменьшается с
ростом массы делящегося вещества. Это приводит к тому, что существует
некоторая критическая масса, при которой возможна цепная ядерная реакция.
Почему мы еще все не взорвались? Ведь уран не доставляют с Луны!
Дело в том, что природный уран содержит 235U и 238U . Причем концентрация 238U в 140 раз больше, чем концентрация 235U . При малых энергиях нейтронов 238U просто их поглощает без деления, поэтому в природном уране
цепная реакция и не возникает.
Цепная реакция в уране может быть осуществлена двумя способами – в
атомной бомбе и ядерном реакторе.
Ядерный заряд атомной бомбы представляет собой два или более кусков почти чистого 235U или 239 Pu . Масса каждого куска меньше критической
(это несколько килограмм). В земной атмосфере всегда имеется некоторое
количество нейтронов, рожденных космическим излучением. Поэтому для
взрыва достаточно быстро и плотно соединить куски делящегося вещества с
помощью обычного запала. Оболочка такой бомбы служит отражателем нейтронов и несколько сдерживает ядерный заряд от распыления. Цепная реакция идет на быстрых нейтронах.
Иной способ осуществления цепной
3
реакции используется в ядерных реакторах.
Схема уран-графитового реактора на медленных тепловых нейтронах приведена на
рис. 9.4. В качестве делящегося вещества
2
служит природный уран (либо слегка обогащенный изотопом 235U ). Для предотвращения радиационного захвата нейтронов ядрами 238U небольшие блоки (2) делящегося
вещества размещают на небольшом расстоянии, а промежутки между блоками заполня1
ют графитовым замедлителем (1), в которых
Рис. 9.4
нейтроны замедляются до тепловых скоростей. Сечение захвата тепловых нейтронов ядром 238U составляет всего 3
барна, но сечение деления тепловыми нейтронами ядрами 235U почти в 200
149
раз больше. Поэтому, хотя нейтроны сталкиваются с ядрами 238U в 140 раз
чаще, чем с ядрами 235U , радиационный захват происходит реже, чем деление, и при достаточно больших размерах всего устройства коэффициент размножения нейтронов может достигать значений, больших единицы.
Стержни 3 содержат кадмий или бор, интенсивно поглощающие нейтроны. Введение или выведение этих стержней в реактор позволяет регулировать коэффициент размножения нейтронов. Регулирование облегчается
тем, что часть нейтронов испускается с запаздыванием до 1 мин.
Первые промышленные реакторы предназначались для производства
делящегося материала для атомных бомб.
9.1.8. Термоядерные реакции
Ядерный синтез, т.е. слияние легких ядер в одно, требует очень высоких температур. Для преодоления потенциального барьера, обусловленного
кулоновским отталкиванием, ядра с порядковыми номерами Z1 и Z 2 должны
обладать энергией
1 Z1Z 2e2
,
E
40 rя
где rя - радиус действия ядерных сил, равный приближенно 2 105 м. И даже
для самых легких ядер эта энергия составляет около 0,7 МэВ, причем на долю каждого ядра приходится половина этой энергии. Для сообщения данной
энергии требуется разогрев до температуры порядка 2 109 К. На самом деле
за счет случайного распределения частиц по энергиям и туннельного эффекта
синтез может протекать и при более низких температурах порядка 107 К.
Особенно благоприятны условия для синтеза ядер дейтерия и трития.
Для них Z1  Z 2  1 и кроме того реакция между ними носит резонансный характер. Именно эти вещества образуют заряд водородной (термоядерной)
бомбы. «Запалом» в ней служит обычная атомная бомба, при взрыве которой
возникает нужная температура. Реакция синтеза ядер дейтерия и трития протекает по схеме
2
3
4
1 H 1 H 2 He  n .
При этом на каждый нуклон приходится энергия около 3,5 МэВ, что
почти в 4 раза больше, чем при делении ядер урана. Кроме того, размеры
данного устройства и его мощность уже ничем не ограничены.
Синтез легких ядер является основным источником энергии Солнца и
других звезд, температура в недрах которых достигает 107 – 108 К.
В водородной бомбе термоядерная реакция носит неконтролируемый
характер. Для осуществления управляемых термоядерных реакций необхо-
150
димо создать и поддерживать в некотором объеме температуру около108 К.
При столь высокой температуре вещество представляет собой полностью ионизированную плазму. Наряду с необходимостью получения гигантских температур, возникает проблема удержания плазмы в заданном объеме. Такую
температуру не выдержит ни одна стенка. Кроме того, соприкосновение
плазмы со стенкой приведет к остыванию плазмы. В связи с этим для удержания плазмы предложено использовать магнитное поле, в котором заряженные частицы будут двигаться по замкнутым траекториям в ограниченной области пространства.
Осуществление управляемого термоядерного синтеза даст человечеству практически неисчерпаемый источник энергии.
9.2. Элементарные частицы
9.2.1. Виды взаимодействия и классы элементарных частиц
Обычно под элементарными частицами понимают микрочастицы,
внутреннюю структуру которых на данном этапе нельзя представить как
объединение других частиц. Во всех явлениях такие частицы ведут себя как
единое целое, но могут превращаться друг в друга. Например, распад нейтрона n  p  e   , где нейтрон превращается в протон, электрон и антинейтрино. Элементарные частицы обладают рядом своеобразных свойств и
характеристик. Некоторые нам известны и понятны: масса, электрический
заряд, спин и др. Но есть и очень необычные: «цвет», «странность», «очарование» и др.
В природе существует четыре вида фундаментальных взаимодействий:
сильное, слабое, электромагнитное и гравитационное. Эти виды различаются
по радиусу действия, интенсивности взаимодействия и времени жизни частиц, распадающихся за счет данного взаимодействия (время распада).
Сильное взаимодействие. Оно обеспечивает связь нуклонов в ядре.
Наибольшее расстояние, на котором проявляется сильное взаимодействие,
составляет примерно 10-15м. Время жизни частиц за счет данного взаимодействия около 10-23с.
Слабое взаимодействие. Это взаимодействие ответственно за все виды
 - распада ядер (включая K - захват), за многие распады элементарных частиц, а также за все процессы взаимодействия нейтрино с веществом. Слабое
взаимодействие, как и сильное, является короткодействующим (радиус взаимодействия порядка 10-18м. Время жизни частиц за счет данного взаимодействия около 10-8с.
151
Электромагнитное взаимодействие. Универсальное взаимодействие
для всех частиц, обладающих электрическим зарядом. Радиус действия не
ограничен. Время жизни частиц за счет данного взаимодействия около 10-16с.
Гравитационное взаимодействие. Радиус действия не ограничен. Является универсальным для всех частиц, ему подвержены все без исключения
элементарные частицы. Однако в мире элементарных частиц ощутимой роли
не играет.
Элементарные частицы обычно подразделяют на четыре класса: фотоны, лептоны, мезоны и барионы (табл. 1).
Табл. 1
адроны
мезоны
лептоны
класс
наименование
обозначение
фотон

электрон
мюон
нейтрино:
электронное
мюонное
e

cпин барион- лептонвид
ный
ный
взаимодейстS
заряд
заряд
вия
B
L
1
1/2
0
0
0
электромагнитное
1
слабое, если
есть заряд, то
еще электромагнитное
0
сильное, слабое если есть
заряд, то еще
электромагнитное
e

пи - мезоны
 ,  , 0
K - мезоны
эта - мезон
K , K , K 0

0
0
барионы
p
протон
cильное, если
нейтрон
есть заряд, то
n
гипероны:
еще электросигма
0
магнитное
1/ 2

1
кси

омега

лямбда

Мезоны и барионы часто объединяют в один класс сильно взаимодействующих частиц, называемых адронами. В таблице 1 также приведено зна-
152
чение их спина (указывает на принадлежность к фермионам или бозонам) и
т.н. барионный и лептонный заряды (об этом речь пойдет позднее).
Кроме отмеченных в таблице частиц, обнаружено более 200 т.н. резонансов. Это резонансные, короткоживущие, сильновзаимодействующие состояние из двух и более частиц. Их время жизни примерно 10-23-10-24с.
9.2.2. Частицы и античастицы.
Уравнение Шредингера, которое описывает поведение микрочастиц, не
инвариантно по отношению к преобразованиям Лоренца (т.е. его нельзя применять при движении с околосветовыми скоростями). Дираку удалось найти
для электрона релятивистское уравнение - аналог уравнения Шредингера, которое описывает не только квантовое поведение электрона, но и инвариантное по отношению к преобразованиям Лоренца. Из него автоматически без
всяких предположений вытекает наличие у электрона спина и его величина,
т.е. спин имеет не только квантовую, но и релятивистскую природу. Но это
далеко не единственное значение уравнения Дирака. Из него также вытекает
наличие у электрона античастицы – позитрона. Затем выяснилось, что существование античастиц является универсальным свойством всех античастиц:
например, электрону e  соответствует позитрон e  , протону p  - антипротон
p  , нейтрону n - антинейтрон n и т.д. Позитрон и антипротон отличаются от
электрона и протона, прежде всего, знаком электрического заряда. Антинейтрон отличается от нейтрона знаком магнитного момента. В общем случае
античастица отличается от частицы только знаками т.н. зарядов (электрического, барионного, лептонного и др.). В некоторых случаях античастица совпадает со своей частицей, т.е. все свойства частицы и античастицы одинаковы. Такие частицы называют истинно нейтральными. К ним относят фотон,
0 - мезон и 0 - мезон.
При встрече частицы и античастицы происходит их аннигиляция, т.е. их
взаимное уничтожение и превращение в  - кванты. Например e  e    
(рождение двух  - квантов связано с законом сохранения импульса).
Процесс, обратный аннигиляции: рождение пар частица – античастица.
Например,  - квант в поле тяжелого ядра X рождает пару электронпозитрон   X  X  e  e . Для рождения пары необходимо, чтобы энергия  - кванта была не меньше собственной энергии покоя пары 2mec 2 .
В первоначальной теории Дирака электрон и позитрон были неравноправны: позитрон – это дырка в море электронов с отрицательной энергией,
т.е. реальная частица – электрон, а дырка – это эффект отсутствия электрона.
В современной квантовой теории поля частица и ее античастица, совершенно
153
равноправные объекты. Язык квантовой электродинамики – язык превращений частиц.
9.2.3. Законы сохранения в физике элементарных частиц
При взаимодействии элементарных частиц происходят их взаимные
превращения: исчезают одни частицы, взамен появляются новые. Разнообразие продуктов реакции растет с ростом кинетической энергии исходных частиц. Но всегда выполняются законы сохранения: энергии, импульса, момента
импульса (в сочетании со спином) и заряда (электрического).
Кроме этих законов сохранения есть и специфические, характерные
только для мира элементарных частиц: барионного и лептонного зарядов,
четности, изотопического спина, странности и др. Мы рассмотрим только
первые три из них.
Всем барионам (нуклонам и гиперонам) приписывают т.н. барионный
заряд (барионное число) B  1, антибарионам - B  1, всем остальным частицам - B  0 . Это число как некая этикетка, которая навешивается на частицу. Для него существует закон: в любой реакции сохраняется полный барионный заряд. Этот закон обуславливает стабильность самого легкого из барионов – протона. Реакция p  e     запрещена, иначе бы все атомы аннигилировали.
Кроме барионного заряда существует и т.н. лептонный заряд L . Всем
лептонам ( e ,  ,  ) приписывают L  1, антилептонам ( e ,  ,  ) - приписывают L  1, всем остальным L  0 . И в любых реакциях выполняется закон
сохранения лептонного заряда. Рассмотрим, например, распад нейтрона и покажем, что в данной реакции появляется именно антинейтрино
n  p  e   .
Данное соотношение удовлетворяет закону сохранения барионного заряда (для нейтрона и протона B  1, электрон и антинейтрино не имеют барионного заряда, для них B  0 ). Посмотрим, как обстоит дело с лептонным
зарядом. Нейтрон и протон не имеют лептонного заряда ( L  0 ). Лептонный
заряд электрона L  1 и для сохранения лептонного заряда необходимо потребовать, чтобы в данной реакции участвовала частица с L  1. А это
именно антинейтрино. При распаде же протона p  n  e   должно появиться нейтрино.
Несколько сложнее дело обстоит с понятием четности. Данное понятие
связано с волновой функций частицы. При инверсии пространства (т.е. когда
оси координат x, y, z изменяют направление на обратное x   x, y   y и
z   z ) квадрат волновой функции не изменяется, но сама функция может
154
изменить знак. Если волновая функция не изменяет знак, то она называется
четной, если же изменяет знак, то называется нечетной. В этом случае частицы, описываемые четной волновой функцией, обладают, как говорят, положительной внутренней четностью P  1(например, нуклоны), а частицы,
описываемые нечетной волновой функцией, обладают отрицательной внутренней четностью P  1(например,  - мезоны). Четность системы частиц
равна произведению четностей отдельных частиц.
Операция зеркального отражения означает переход от правовинтовой
системы координат к левовинтовой. В квантовой механике существует закон
сохранения четности: при любых превращениях частиц четность состояния
системы частиц не изменяется. Сохранение четности является следствием
инвариантности законов природы по отношению к замене правого левым и
наоборот, т.е. в зеркальном мире все происходит точно также, правое и левое
абсолютно равноправны. Обратимся, например, к реакции
p 37 Li 42 He 42 He .
В ней выполняются все законы сохранения, кроме четности. Поэтому
такая реакция не может быть реализована (а жаль, в ней выделяется энергия
около 17 МэВ).
Закон сохранения четности казался незыблемым для любых видов
взаимодействий, пока не был осуществлен эксперимент по его проверке применительно к слабым взаимодействиям. Если правое и левое в природе неразличимы, то при  - распаде вылет электрона в направлении спина ядра и в направлении,
ему противоположном, должен быть равновероятен. Действительно, при зеркальном отражении ядра направление его «вращения», т.е.
а)
направление спина, изменяется на обратное.
Если ядро испускает  - электроны с равной
вероятностью в обоих направлениях (рис.
9.5,а), то зеркальное отражение системы ядро
- электроны будет неотличимо от самой сисб)
темы (они лишь повернуты друг относительно друга на 1800). Если же  - электроны испускаются преимущественно в одном направлении (рис. 9.5,б), то «левое» и «правое» стаРис. 9.5
новятся различимыми.
В эксперименте наблюдался  - распад радиоактивного кобальта 60 Co
при температуре порядка 0,1 К и была обнаружена значительная разница в
155
количестве испускаемых электронов. Оказалось, что  - электроны испускаются преимущественно в направлении, противоположном ядерному спину.
Таким образом, была доказана экспериментально неравноправность правого
и левого при слабых взаимодействиях.
Позднее была предложена гипотеза о сохранении т.н. комбинированной четности. Симметрия между правым и левым сохраняется, если при инверсии пространства частицы заменить их античастицами. Однако и этот закон оказался не совсем точным.
9.2.4. Кварки
Известно более 30 элементарных частиц (включая античастицы) и около 200 резонансов. Это многовато для «элементарных» частиц. В 1964 г.
Гелл-Манном и Цвейгом была предложена гипотеза кварков, как «истинно
элементарных частиц». Им приписываются дробные квантовые числа. Заряд
q  2 / 3 (кварк u от слова up ), q  1/ 3 (кварк d от слова down ) и кварк s
(от слова strange ) с зарядом q  1/ 3 . Кварк s отличается от кварка d тем,
что для него особое квантовое число странность равна -1 (для кварков u, d
равна нулю). Барионный заряд каждого кварка равен 1/3, спин равен ½. Существуют антикварки u, d , s . Каждому кварку приписывают одинаковый
магнитный момент.
Мезон строится как кварк плюс антикварк, например,   ud . Барион
образуется из трех кварков, например, p  uud . Такие комбинации кварков
определяют все квантовые параметры частиц. Однако последняя комбинация
не удовлетворяет принципу Паули (два кварка - фермиона в одном состоянии). Поэтому пришлось ввести «цвет кварка». Это понятие выражает различие в свойстве, определяющем взаимодействие кварков. Переносчики взаимодействия между кварками – глюоны (от слова glue). Каждый кварк может
существовать в трех состояниях – цветах.
Чуть позднее пришлось ввести еще один кварк c (от слова charmed ).
Его особое квантовое число c (очарование) равно 1, для остальных кварков
c  0 . Затем пришлось ввести пятый кварк - b ( beauty - прелестный) и предсказывают шестой кварк t (от слова top ). Итого кварки u, d , s, c, b, t плюс антикварки и три цвета для каждого кварка.
С помощью идеи кварков удалось систематизировать уже известные
частицы и предсказать ряд новых (например,  - гиперон). Правда поиски
кварков не увенчались успехом. Есть мнение, что кварки не могут существовать в свободном состоянии, но в природе существует именно такая симметрия свойств частиц, как если бы кварки существовали.
156
И в заключение нашего курса лекций рассмотрим один очень важный
вопрос.
Почему наш мир таков, каким мы его видим?
Эйнштейну принадлежит высказывание: «мог ли Бог создать мир
иным?» Это можно понимать как вопрос о том, могла ли окружающая нас
Вселенная быть устроенной иначе. Или – почему законы физики имеют
именно такой, а не другой вид? В практическом плане этот вопрос можно поставить иначе – что произойдет, если, например, изменить немного заряд
электрона, или его массу, или изменить постоянную тяготения.…. То, что
здесь кроется какая-то загадка, физики осознали достаточно давно.
Казалось бы, что небольшие изменения физических констант должны
сопровождаться соответствующим небольшим количественным, но не качественным изменением в окружающем мире. Качественных же глубоких изменений быть не должно. Вот это и оказывается абсолютно неверным!
Обратимся для примера к простейшему (и важнейшему во Вселенной)
атому- атому водорода. Он состоит из протона и электрона и может существовать неограниченно долго без внешних воздействий. А почему электрон не
вступает в реакцию с протоном? Известно, что на ускорителях возможна реакция превращения этих частиц в нейтрон и нейтрино: p  e  n   .
Почему подобное не происходит в атоме водорода? И что это означало
бы для нас, если это было возможным? Все дело в том, что эта реакция
«энергетически невыгодна»: сумма масс протона и электрона меньше, чем
масса нейтрона. На ускорителях эта реакция идет за счет дополнительной
кинетической энергии частиц. Нейтрон тяжелее протона на mnp =1,3 МэВ, а
масса электрона всего me =0,511МэВ. Таким образом, для существования устойчивого атома водорода необходимо выполнение условия:
me  mnp .
Вот если бы масса электрона была, скажем, 2 МэВ, что больше mnp , то
реакция взаимодействия протона и электрона могла бы происходить без затрат энергии, и такой атом водорода просуществовал бы всего около 30 часов! Конечно, можно представить, что не масса электрона выросла, а уменьшилось значение mnp . Если вспомнить, что масса протона или нейтрона около 1000 МэВ, то отсюда становится очевидным, что изменение массы этих
частиц всего на 0,1% приведет к катастрофическим последствиям – к нестабильности самого распространенного элемента во Вселенной – атома водорода - главного ядерного горючего для звезд. Жизнь в такой Вселенной вряд
157
ли была возможна. Наше счастье, что нейтрон немного тяжелее протона и
ровно настолько, насколько это необходимо!
С другой стороны, если mnp будет слишком большим, то неустойчивым окажется уже следующий элемент – дейтерий. Ядро дейтерия состоит из
протона и нейтрона - такая частица называется дейтрон. Энергия связи ядра
дейтерия связи =2,2 МэВ. Это не очень много, другие ядра связаны прочнее.
Теоретически возможен распад нейтрона по схеме: n  p  e   ,
что, кстати, и происходит при  - распаде некоторых элементов, но это привело бы к нестабильности ядра дейтерия. Для устойчивости ядра дейтерия
необходимо, чтобы его энергия была меньше, чем энергия продуктов распада
mp  mn  связи  mp  mp  me .
Тогда условие стабильности дейтерия должно выглядеть следующим образом:
mnp  связи + me .
Но, так как связи =2,2 МэВ больше, чем mnp - me =0,8 МэВ, то распад нейтрона (и соответственно распад дейтерия) энергетически невыгоден. А это
означает, что дейтерий может длительно существовать. Что же в итоге получается? С одной стороны для стабильности атома водорода хорошо бы иметь
mnp побольше. Но с другой стороны, если мы сделаем mnp слишком
большим, то нестабильным окажется уже дейтерий! А это означает, что
обычный путь образования элементов тяжелее водорода стал бы невозможным и это снова приводит к кардинальным качественным изменениям во
Вселенной!
Выберемся теперь из недр ядер и посмотрим на Вселенную с точки
зрения постоянной тяготения. Астрономам известно, что в звездах с массой,
примерно равной массе Солнца и меньше, значительные толщи их поверхностных слоев испытывают конвективное перемешивание. В тоже время более
массивные звезды после образования не имеют поверхностных конвективных
слоев. Существует гипотеза, что образование планетных систем, происходящее совместно с образованием звезд, может успешно проходить только у таких звезд, которые после образования сохранили поверхностную конвекцию.
Это означает, что если бы постоянная тяготения оказалась заметно больше,
чем есть на самом деле, то все звезды после образования не имели бы поверхностных конвективных слоев, а значит, не имели бы, вероятно, и планетных систем.
Таким образом, относительно небольшие вариации фундаментальных
постоянных ведут не просто к небольшим количественным изменениям, а к
158
кардинальным качественным изменениям в природе. Все это выглядит так,
как будто природа специально «подгоняла» значения констант такими, чтобы
могли появиться сложные структуры во Вселенной и, в частности, могла
появиться жизнь. При этом природе «приходится» проводить весьма «тонкую настройку» законов физики и фундаментальных постоянных. Тут уж,
видимо, и до Бога недалеко!
Для объяснения всех этих странных вещей был предложен т.н. антропный принцип (от греческого «антропос» - человек). Суть его заключается в
следующем: существует взаимосвязь между свойствами Вселенной и возможностью появления в ней разумной жизни. Или иначе: наблюдатели (т.е.
мы) могут появиться только при определенном наборе физических констант,
при определенных физических законах. Если и были (или может быть есть)
другие Вселенные с иными законами, то они существуют без сложных структур (т.е. без «свидетелей») и в них никогда не появляется жизнь. Таким образом, наша Вселенная такая, какой мы ее видим, именно потому, что мы в ней
есть.
Ну и, наконец, еще одна «странность» нашего мира: физическое пространство почему-то трехмерно. Что было бы, если бы пространство имело
размерность, отличную от трех?
Рассмотрим изменения в окружающем мире, которые произойдут при
изменении размерности для простейших видов взаимодействия, например,
взаимодействие зарядов или тяготеющих масс. В обоих случаях сила взаимодействия убывает обратно пропорционально квадрату расстояния. Еще Кант
понял, что закон обратных квадратов является следствием трехмерности нашего пространства. С ростом расстояния силовые линии поля точечного заряда (или точечной массы) распределяются по все большей поверхности сферы, охватывающей заряд. Площадь этой сферы растет как r 2 , значит, плотность силовых линий убывает по закону 1 / r 2 , что и определяет закон изменения этой силы. В пространстве N измерений площадь сферы была бы
пропорциональна r N 1 и закон для изменения электростатической или гравитационной силы был бы обратным r N 1 . Рассмотрим теперь простейший атом
– атом водорода. Вокруг положительно заряженного ядра движется электрон.
Закон сохранения момента импульса L требует, чтобы центробежные силы
были обратны r 3 независимо от размерности пространства N
F  mv2 / r ~ r 2 v2 / r 3 ~ L2 / r 3 .
Известно, что для существования устойчивых орбит движения частиц
необходимо, чтобы центробежные силы убывали с расстоянием быстрее, чем
убывает сила притяжения. Иначе движение по круговой орбите будет неус-
159
тойчивым и малейшее возмущение приведет либо к падению заряда на центр,
либо к тому, что заряд улетит в бесконечность. А отсутствие устойчивых орбит означает отсутствие связанных состояний – т.е. атомов. Отсюда следует,
что для существования связанных состояний необходимо выполнение условия N  3 . При несоблюдении этого условия, т.е. в пространствах более высокой размерности нет связанных устойчивых состояний тел, взаимодействующих электрическими и гравитационными силами, т.е. в них не может
быть ни атомов, ни планетных систем, ни Галактик! А если N = 2? В этом
случае силы взаимодействия падают слишком медленно, и центральное тело
притянет другое из любой точки и заставит его двигаться к себе. В таких
пространствах не существовало бы свободного движения тяготеющих тел. И
только в трехмерном пространстве возможны и связанные и свободные состояния, т.е. только в трехмерном пространстве возможно возникновение
сложных структур, возможна жизнь! Поэтому нечего удивляться, что мы живем именно в трехмерном пространстве и именно с таким существующим набором физических констант и законов.
Download