ГЛАВА 3 ОБЩИЕ ПРИНЦИПЫ ИСПОЛЬЗОВАНИЯ АНИЗОТРОПНЫХ СВОЙСТВ МОМЕНТОВ ПРИ ИССЛЕДОВАНИИ КРИСТАЛЛОВ

advertisement
ГЛАВА 3
ОБЩИЕ ПРИНЦИПЫ ИСПОЛЬЗОВАНИЯ АНИЗОТРОПНЫХ СВОЙСТВ
МОМЕНТОВ ПРИ ИССЛЕДОВАНИИ КРИСТАЛЛОВ
Хорошо известно, что по сравнению с экспериментами на поликристаллах,
исследования монокристаллов резко расширяют объём и качество информации о
различных физических свойствах твёрдых тел. Обусловлено это, главным образом, тем,
что при исследовании монокристаллов измеряемые физические величины являются,
как правило, анизотропными. В ядерном магнитном резонансе примерами таких
анизотропных физических величин являются моменты линии поглощения ЯМР,
времена спин-решеточной и спин-спиновой релаксации и др. Экспериментальное
исследование
анизотропии
этих
величин
проводится
посредством изменения

ориентации исследуемого образца в магнитном поле спектрометра B0 . При этом перед
экспериментатором всегда встаёт вопрос - при каких ориентациях кристала

относительно B0 наиболее целесообразно проводить измерения исследуемой
величины. До недавнего времени решение этого вопроса основывалось на чисто
интуитивных
соображениях
и
только
привлечение
математической
теории
планирование эксперимента (см. например [168,169]) позволило наметить пути
решения
проблемы
оптимального
планирования
эксперимента
по
изучению
анизотропии физических величин в ЯМР твёрдого тела. Впервые на важность
использования теории оптимального планирования эксперимента в ЯМР было указано
в связи с рассмотрением задачи практического использования формулы Ван-Флека для
второго момента ( M 2 ) при структурных исследованиях кристаллов [170-172].
Поскольку экспериментальное измерение M 2 проводится со случайными
погрешностями, обусловленными шумами спектрометра и другими причинами
[173,174],
то
точность
определения
структурных
параметров,
описывающих
анизотропию M 2 (b x , b y , b z ) , в значительной степени зависит от того каким образом
этот эксперимент будет проведён. На раннем этапе исследования вопроса об
экспериментальном определении структурных параметров было предложено три
различных метода. Первый из них, использованный Дерепп и др. [128], предполагал
измерения всей "поверхности" вторых моментов, т.е. измерения моментов при очень

большом числе ориентаций B0 относительно системы координат, связанной с
элементами симметрии кристалла. Второй метод, предложенный Мак-Коллом и
86
Хэммингом [121], основывался на экспериментальном изучении пяти угловых
зависимостей. Третий метод [16,175] исходил из минимально возможного количества
установок кристалла и требовал измерения M 2 лищь при 15 его ориентациях в
магнитном поле. Попытки сравнения этих трёх различных методов по обеспечиваемой
точности определения структурных параметров не привели к успеху [176,177],
вследствие того, что было не вполне ясно, какой количественный критерий положить в
основу таких сравнений.
Параллельно с этими исследованиями в математической статистике в конце 60-х
и начале 70-х годов возникло и стало бурно развиваться новое направление - теория
планирования регрессионных экспериментов [168,169,178-183], основной задачей
которой как раз и является разработка строгих количественных критериев,
позволяющих сравнивать различным образом спланированные эксперименты и
находить наиболее оптимальный план эксперимента с точки зрения минимализации
затрат
для
получения
требуемой
точности
экспериментального
определения
параметров регрессионной функции, т.е. такой функции, явный вид котрой известен
заранее.
Использование этой теории позволило разработать оптимальную методику
экспериментального исследования анизотропии M 2 (b x , b y , b z ) , что, в свою очередь,
дало возможность значительно повысить точность определения относительных
координат магнитных ядер в кристаллах методом моментов [135].
В настоящей главе даётся краткое изложение основ теории оптимального
планирования эксперимента применительно к задачам, встречающимся в ЯМР твёрдого
тела. Приводятся оптимальные планы для изучения анизотропии физических величин
A(b x , b y , b z ) , B(b x , b y , b z ) и C(b x , b y , b z ) , описывающих соответственно тензором
второго ранга a 1 2
(скорости спин-решёточной релаксации с случае быстрых
молекулярных движений; цент тяжести спектра, котрый при наличии электронноядерных взаимодействий является анизотропной величиной и др.)
A( b x , b y , b z ) 
a
1 , 2
1 2
 b 1 b 2 ,
(3.1)
тензором четвёртого ранга b 1 2 3 4 (второй момент линии поглощения ЯМР; скорости
спин-решёточной релаксации в лабораторной и вращающейся системах координат и
др.)
87
B(b x , b y , b z ) 
B
1 23 4
1 , 2 ,3 , 4
 b 1 b 2 b 3 b 4
(3.2)
и тензором восьмого ранга c 1 2 8 (четвёртый момент спектра ЯМР)
C(b x , b y , b z ) 
C
1 2 8
1 , 2 ,,8
 b 1 b 2 b 8 .
(3.3)
На примере использования второго и четвёртого моментов спектра ЯМР обсуждаются
также особенности построения оптимальных планов в случае одновременного
измерения нескольких величин, описываемых разнвми регрессионными функциями
[184].
3.1 АНАЛИЗ РЕГРЕССИОННЫХ ЭКСПЕРИМЕНТОВ
Как правило, измеряемая физическая величина y зависит от одного или
нескольких факторов, называемых контролируемыми переменными. В качестве
контролируемых переменных в ЯМР твёрдого тела обычно выступают сферические
углы  и  , определяюшие ориентацию кристала во внешнем магнитном поле

B0 || Oz . Каждой паре контролируемых переменных (k , k ) ( k  1,2,  ) в обычном
трёхмерном пространстве ( X ) на сфере единичного радиуса соответсвует точка,

положение которой будем обозначать в последующем вектром x .

Результат измерения физической величины y( x ) является суммой среднего
значения этой величины и случайной ошибки. Будем предполагать, что связь среднего


значения измеряемой физической величины y( x ) с контролируемыми переменными x
известна и описывается функцией

 
E( y / x )  ( x, ) ,
(3.4)

где E( y / x ) - среднее значение (математическое ожидание) исследуемой величины y в


"точке" x пространства контролируемых переменных X ;  T  1 ,  2 ,,  m - вектор
 
некоторых параметров функции ( x , ) .
Целью анализа экспериментальных данных является определение некоторых или

всех неизвестных параметров  . Так как регистрируемые результаты являются
случайными величинами, то опираясь на них, мы всегда получаем не истинные
~

значения неизвестных параметров  r , а набор случайных величин  . Эксперименты,
~
~ ( x ,  ) , в
цель которых - поиск оценок неизвестных параметров  или поверхности 
88
предположении справедливости (3.4), называют регрессионными, а процедуру поиска
этих оценок - регрессионным анализом. В настоящее время анализ регрессионных
экспериментов достаточно разработан (см. например [168,169]) и поэтому ниже
приводятся сведения в размере минимально необходимым для наших целей.

 
Предположим, что функция ( x , ) линейна по параметрам 
  
 



( x, )  1f1 ( x )   2 f 2 ( x )     m f m ( x )   T f ( x ) ,
(3.5)
 



где f T ( x )  f1 ( x ), f 2 ( x ), , f m ( x ) - известные функции контролируемых переменных

x.
 

Если в точках x1 , x 2 ,, x n произведены независимые измерения y1 , y 2 ,, y n с
дисперсиями 12 ,  22 ,,  2n , то наилучшими линейными оценками для неизвестных

параметров  являются [168,169]
  
  M 1Y ,
(3.6)

где M - информационная матрица Фишера, равная
n 
 


M   f ( x i )  i  f T ( x i ) ,
(3.7)
i 1
n 


Y   f ( x i )  i  y i ,
(3.8)
i 1


i   i2 (x)  (x i ) .
(3.9)

В (3.9) функция (x i ) - функция эффективности эксперимента [168,169], определяет

точность одного измерения в точке x i .

Если в каждой точке x i ( i  1,2,  , n ) проводится i независимых измерений
y i1 , y i 2 ,, y ii , каждое с дисперсией  i2 , то наилучшими линейными оценками

параметров  будут оценки, найденные по формулам (3.6)  (3.9), в которых однако
[168,169]
yi 
1
i
i
y
s 1
и
89
is
,


i  i   i2 (x)  i  ( x i ) .
(3.10)

Ошибки полученных линейных оценок неизвестных параметров  определяются
дисперсионной матрицей [169]
~  ~ 
 

D()  E (    r )(    r ) T   M 1


(3.11)

и не зависят от значения  r .
Наилучшие
оценки


параметров
минимизируют
сумму
взвешенных
квадратичных отклонений [169]


n

  2
S()   i  y i  ( x i , ) .
i 1
(3.12)

В случае линейной параметризации (3.5) наилучшие линейные оценки  совпадают с
оценками полученными методом наименьших квадратов (3.12). При нелинейной
параметризации оценки, полученные методом наименьших квадратов, асимптотически,
при достаточно больших размерах выборки y , являются наилучшими оценками [169].

Иногда при одних и тех же значениях контролируемых переменных x
измеряется несколько физических величин y1 , y 2 ,, y k . Примером может служить
одновременное исследование анизотропии второго и четвёртого моментов линии
поглощения
ЯМР.
коррелированными.
В
общем
Будем
случае
предполагать
величины
y1 , y 2 ,, y k
дисперсийную
матрицу
могут
быть
эксперимента
известной
2
11
12
 1k
  

D( y / x )  21

 222
  2k
 k1



.
(3.13)
 k 2   2kk

Обозначим y T  y1 , y 2 ,  , y k и будем предполагать, что регрессионные функции для
каждой измеряемой физической величины известны
  
 
 
 
 
E( y T / x )  T ( x, )  1 ( x, 1 ), 2 ( x,  2 ), , k ( x,  k ) .
90
(3.14)
В этом случае регрессионный анализ проводится по формулам аналогичным (3.5) (3.12). Например, выражение для суммы взвешенных квадратичных отклонений (3.12)
переходит в [169]




n

    T     
S()   y i  ( x i , )  i  y i  ( x i , ) ,
i 1
(3.12)
где
  

i  D 1 ( y i / x i )
и n - количсетво "точек" контролируемых переменных.
3.2 КРИТЕРИИ СРАВНЕНИЯ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТОВ

Предположим, что для оценки неизвестных параметров  регрессионной
функции
(3.5)
планируется
провести
несколько
различных
экспериментов.
Экспериментом E j будем называть совокупность величин
y1j ,
y 2j , ,
y nj
1j ,  2j , ,  nj .



x 1j , x 2j , , x nj
 

Здесь индекс j нумерует номер эксперимента; x 1j , x 2j ,, x nj - точки j - го эксперимента
в которых проведены независимые измерения интересующей нас физической величины

y( x ) ; ij ( i  1,2,  , n ) определяются выражением (3.9).

Для различных экспериментов значения оценок параметров  будут отличаться
как по величине, так и по "близости" их к "истинным" значениям. Критерии
предпочтительности одних экспериментов перед другими выбираются в соответствии с
целью эксперимента. За наиболее часто употребляемыми критериями оптимальности в
литературе закрепились собственные названия. Их можно поделить на две группы
[169].
К первой группе относятся критерии сравнения экспериментов по "близости"

найденных параметров  к их истинным значениям, т.е. основанные на сравнении

некоторых комбинаций элементов дисперсионных матриц оценок D ( E j )
экспериментов E j . Считается, что эксперимент E1 предпочтительнее эксперимента
E2 , если:
91


1. | D (E1 ) | | D (E 2 ) | - критерий D - оптимальности;


2. SpD (E1 )  SpD (E 2 ) - критерий A - оптимальности;
3. max D  (E1 )  max D  (E 2 ) - критерий E - оптимальности.




Здесь | D ( E j ) | - определитель и SpD ( E j ) - сумма диагональных элементов матрицы

D ( E j ) ; max D  ( E j ) - максимальный диагональный член дисперсионной матрицы


оценок D ( E j ) эксперимента E j .
Ко
второй
группе
относятся
критерии
сравнения
экспериментов
в
"пространстве" результат измерения - контролируемые переменные:



1. max d( x, E1 )  max d ( x , E 2 ) ( x  X ) - минимаксный критерий или критерий G X
X
оптимальности;
 
 
2.  dx d( x, E1 )   dx d( x, E 2 ) - критерий Q - оптимальности, где интегрирование
X
X

производится по всей области X значений контролируемых переменных x и
  
 

d ( x , E j )  f T ( x ) D( E j ) f ( x )
 

- дисперсия оценки поверхности ( x , ) в точке x .
Все критерии сравнения результатов эксперимента зависят от дисперсионной

матрицы D ( E ) оценок параметров. При линейной параметризации (3.5) дисперсионная

матрица D ( E ) , также как и обратная её информационная матрица (3.11), не зависят от

результатов измерений y и истинных значений параметров  r , а определяются, как

видно из (3.7), (3.9) и (3.11), только набором контролируемых переменных x i
( i  1,2,  , n ), в которых производятся измерения, и количеством измерений i в них.
 
Дисперсия единичного измерения  i2 и явный вид функций f ( x ) предполагаются
известными заранее до проведения эксперимента.
Совокупность величин, определяющих критерии оптимальности при линейной
параметризации



x 1 , x 2 , , x n ;
1 ,  2 , ,  n ;
92
(3.15)
n
N   i ,
i 1
где N - общее количество измерений, называется планом эксперимента E ( N ) . Точки
 

x1 , x 2 ,, x n называются спектром плана.
Нормированным планом E называется совокупность величин



x 1 , x 2 , , x n ;
(3.16)
p1 , p 2 ,  , p n ;
где p i  i / N и
n
p
i 1
i
 1.
В случае когда N настолько велико, что критерии сравнения экспериментов
можно рассматривать как непрерывные функции по N , а величины p i могут
принимать практически любые значения между 0 и 1 , план называется нерерывным
[169].
Нормированный
непрерывный
план
можно
характеризовать
функцией

распределения затрат p( x ) , удовлетворяющей условиям
 

p( x )  0 ,
 p(x)dx  1 ,

xX .
X
Информационная матрица тогда имеет вид [169]
      

M ( E )   f (x)(x)f T (x)p( x)dx .
(3.16)
X

Для дискретного плана функция p( x ) будет иметь вид
n

 
p ( x )   p i ( x  x i ) ,
i 1
 
где (x  x i ) - дельта функция Дирака.
План может быть непрерывно распределённым по одной или нескольким
контролируемым переменным, в то время как по другим переменным он может быть
дискретным.
Поскольку
конечной
целью
эксперимента
по
изучению
анизотропных
физических величин в ЯМР твёрдого тела является исследование внутреннего строения
кристаллов, то критерий оптимальности эксперимента целесообразно искать в группе
критериев сравнения в пространстве параметров, характеризующих внутреннее
93
строение кристалла (например, координат магнитных ядер). Однако, учитывая, что
связь экспериментально измеряемых в ЯМР величин с такими параметрами является
сложной нелинейной функцией, использование подобного критерия привело бы к
необходимости последовательного планирования [169], при котором обработка
результатов измерения и коррекция плана эксперимента проводятся в ходе самого
эксперимента. Кроме того, такое планирование, оптимальное для одной модели
 
регрессионной функции ( x , ) , будет, как правило, неоптимальным для другой
модели. Учесть же все возможные модели, связанные с внутренним строением
кристалла (характером расположения и подвижности магнитных ядер и т.п.) не
представляется возможным.
Всё это, вместе с трудностью расчётов при последовательном планировании,
заставляет искать критерии оптимальности в пространстве параметров, описывающих
анизотропию исследунмой физической величины. Регрессионные функциями в ЯМР
твёрдого тела (моменты формы линии ЯМР, скорости спин-решёточной релаксации и
т.д.) являются линейными по этим параметрам. Ниже будем рассматривать только те
физические величины, анизотропию которых можно описать выражениями (3.1) - (3.3).
Отметим, что оптимальный план эксперимента для анизотропной физической
величины, построенной для кристалла с данной симметрией, является оптимальным
для всех кристаллов с такой же симметрией, так как несмотря на различное значение
параметров анизотропии, вид регрессионных функций для них совпадает. Количество
линейно-независимых параметров физических величин, описываемых выражениями
(3.1) - (3.3), для всех 11 групп Лауэ, различаемых методом ЯМР, приведено в таблице
3.1.
Учитывая, что при исследовании анизотропии физических величин интерес
представляет внутреннее строение кристаллов, определяющее всю совокупность
структурных параметров, разумным представляется выбор среди других критериев в
пространстве параметров критерий D - оптимальности, требующий минимизации
определителя ("объёма") матрицы дисперсий оценок параметров. D - оптимальные
планы удобны тем, что для случая измерения физической величины с постоянной

точностью, т.е. при условии, что функция эффективности ( x )  1 , непрерывные D оптимальные планы эквивалентны минимаксным G -оптимальным планам (теорема
эквивалентности
[169]).
Поэтому
для
равноточных
измерений
эксперимент
выполненный по D -оптимальному плану позволяет не только найти параметры
94
регрессионной функции с наилучшей точностью, но также предсказать по найденным

 
оценкам параметров  значения самой регрессионной функции ( x , ) в любой точке

x пространства контролируемых переменных с точностью не худшей, чем точность

измерения физической величины y( x ) в точках плана.
Таблица 3.1
Количество линейно независимых параметров ( m ); количество параметров,
описывающих одну угловую зависимость ( k ) и минимальное число установок
кристалла ( q ) для анизотропных величин, описываемых тензорами второго, четвёртого
и восьмого ранга (выражения (3.1) - (3.3)) с учётом симметрии кристалла [184].
Кристаллографическая система
Триклинная
Моноклинная
Ромбическая
Тригональная
Группа
Лауэ
1
2/m
mmm
3
3m
4/m
4/m mm
6/m
6/m mm
m3
m3m
Тетрагональная
Гексагональная
Кубическая
Тензор 2 ранга
m
k
q
6
3
3
4
3
2
3
3
1
1
2
1
1
1
1
Тензор 4 ранга
m
k
q
15
5
5
9
5
3
6
5
2
5
4
2
4
4
1
5
4
2
4
4
1
3
3
1
2
2
1
Тензор 8 ранга
m
k
q
45
9
9
25
9
5
15
9
3
15
8
3
10
8
2
13
8
3
9
8
2
9
7
2
7
7
1
5
5
1
4
4
1
Теория эквивалентности даёт простой способ проверки D -оптимальности плана.
 
Для этого достаточно убедиться, что значение произведения ( x )d( x, E ) во всём
пространстве контролируемых переменных X не превышает количества искомых
параметров m [169].
В
случае
одновременного
изучения
нескольких
поверхностей
отклика
существует аналогичный способ проверки D -оптимальности плана [169]
   
Sp( x )d( x, E)  m j ,
(3.17)
     
 
  

где ( x )  D( y / x ) - матричная функция эффективности и d ( x , E) = f T ( x )D()f ( x )   

матрица дисперсий оценок поверхностей отклика ( x , ) в точке x .
Обычно желательно, чтобы оптимальные планы обладали возможно большим
спектром свойством инвариантности. Одним из таких свойств, как уже отмечалось,
является эквивалентность D -оптимальных и минимаксных G  оптимальных планов.
Кроме того, для экспериментаторов было бы очень удобно, если построенный план был
95
 

оптимален не только для заданного набора функций f 0 ( x ) и  0 ( x ) и оцениваемых
 



параметров  0 , но и для возможно более широкого семейства наборов f ( x ) ,  ( x ) и  .
Что касается D -оптимальных планов, то они инвариантны относительно любого
 


невырожденного линейного преобразования L ( det L  0 ) набора функций f 0 ( x ) и

оцениваемых параметров  0 [169]
 
  
f (x)  L  f 0 (x) ,
  
  LT  0 .
Поясним это важное свойство инвариантности D -оптимальных планов на
примере экспериментального изучения анизотропии второго момента спектра ЯМР. В
главе 2 отмечалось, что в литературе существуют несколько форм записи
ориентационной зависимости M 2 (b x , b y , b z )  M 2 (, ) [121,122,131-133]. Все эти
различные формы могут быть получены одна из другой с помощью линейного
 
преобразования функций контролируемых переменных f ( x ) , зависящих только от

ориентации
вектора
постоянного
магнитного
поля
относительно
B0
кристаллофизических осей. Поскольку вторые моменты, измеряемые в точках D 
оптимального плана, связаны линейно с оцениваемыми структурными параметрами  ,
то в качестве самих структурных параметров, описывающих анизотропию M 2 удобно
выбрать значения вторых моментов в точках D -оптимального плана. Удобство это
связано с тем, что в отличие от других возможных структурных параметров, например
компонент структурного тензора M 1 23 4 (см. главу 2), экспериментальные значения
вторых моментов являются, хтя тоже случайными, но не коррелированыыми
величинами. Это обстоятельство упрощает последующую процедуру извлечения
структурной информации, поскольку дисперсионная матрица экспериментально
измеренных вторых моментов имеет диагональный вид.
В случае исследования нескольких поверхностей отклика сохраняются
аналогичные свойства инвариантности D -оптимальных планов. В частности D оптимальные планы не зависят от корреляций между результатами измерений
различных поверхностей [168,169]. Последнее обстоятельство особенно важно при
исследовании анизотропии нескольких моментов линии поглощения ЯМР, поскольку
коэффициент корреляции между моментами различного порядка, вычисленными из
одних и тех же спектров ЯМР, близок к 1 [135].
96
3.3 ЗАТРАТЫ НА ЭКСПЕРИМЕНТ. ФУНКЦИЯ ПОТЕРЬ
В экспериментальной практике далеко не безразлично за какое время и при
каких материальных затратах, называемых далее просто затратами и обозначаемых  ,
достигнут тот или иной результат. При одинаковых результатах, в смысле одного из
приведённых в параграфе 3.2 критериев сравнения, предпочтительным представляется
эксперимент с меньшими затратами. И наоборот, при одинаковых затратах
предпочтительным будет эксперимент, позволяющий получить лучшие результаты.
Поэтому выбор того или иного плана эксперимента основывается на сравнении затрат
 и величин, характеризующих точность результатов эксперимента.
Затраты на эксперимент слагаются из затрат на каждое отдельное измерение
n
n
i 1
i 1
( N)   c i  i  N c i p i ,
(3.18)

где c i - затраты на одно измерение в точке x i . При фиксированном нормированным
планк эксперимента затраты прямо пропорциональны количеству измерений N .
Зависимость введённых выше критериев точности результатов эксперимента от
количества измерений N определяется формулами [169]


| D (E( N)) | 1 / m  N 1 | D(E) |1 / m ,


SpD (E( N))  N 1SpD(E) ,
max D  (E ( N ))  N 1 max D  (E) ,




max d ( x , E ( N ))  N 1 max d(x, E) ,
X
X




 dx d(x, E(N))  N  dx d(x, E) .
1
X
X
Здесь m - количество оцениваемых параметров 1 , 2 ,, m регрессионной функции
 
( x , ) .

Обозначим через [D(E)] функционал, характеризующий точность результатов
эксперимента (точность оценок искомых параметров или поверхности отклика).

Функионал  выбран зависящим только от элементов матрицы D ( E ) в силу того, что
при описании точности результатов эксперимента мы опираемся только на матрицу

D ( E ) . Явный вид функционала определяется конечной целью эксперимента. Для
вышеприведённых критериев сравнения
97


[D(E( N))]  N 1 [D(E)] .
(3.19)
Сравнивая величины, приведённые в (3.18) и (3.19), можно видеть, что для
непрерывного плана эксперимента произведение

R (E)   ( N)  [D(E( N))]
(3.20)
не зависит от количества измерений N и определяется только нормированным планом
E.
Наилучшим планом эксперимента будет являться план, минимизирующий
функцию потерь R ( E ) . Число измерений N ограничивается либо конечностью затрат

 ( N) , либо достижением необходимой точности результатов [D(E( N))]
эксперимента. Решение задачи минимизации функции потерь (3.20) определяется
конкретной зависимостью затрат  от плана эксперимента, определяемой, в свою
очередь, особенностями методики эксперимента.
В
спектрометрах
ЯМР
исследуемый
кристалл
обычно
помещается
в
цилиндрическую катушку индуктивности, ось которой перепендикулярна вектору

магнитного поля B0 . Отношение объёма образца к объёму катушки (коэффициент
заполнения) в значительной степени влияет на отношение "сигнал/шум" спектров ЯМР,
а следовательно, и на точность измерения изучаемой физической величины.
Экспериментальное исследование анизотропии физических величин в ЯМР
твёрдого тела может быть осуществлено двумя методами. В первом методе [128]
применяют сложные конструкции кристалловращателей, позволяющих установить

любую ориентацию кристалла относительно B0 . Образец при этом, как правило имеет
сферическую (или близкую к ней) форму, что приводит к значительному уменьшению
коэффициента запиднения и, как следствие, к ухужшению точности измерения

экспериментальных величин (уменьшению функции эффективности  ( x ) ) по
сравнению с использованием цилиндрических образцов. Такое падение точности
экспериментальных результатов может быть скомпенсировано, как это видно из (3.10),
лишь увеличением количества измерений N , а следовательно, и затрат  ( N) , в
соответсвующее число раз. Поскольку измерения в различных ориентациях кристалла

относительно B0 в таком методе практически равнотрудоёмки, т.е. c i  c ( i  1,2,  , n ),
то затраты
98
n
 ( N )  c  i  cN
(3.21)
i 1
не зависят от плана эксперимента и минимизация функции потерь (3.20) эквивалентна

минимизации функционала [D(E)] .
Второй метод, обычно используемый на практике, предполагает вращение
цилиндрического монокристаллического образца вокруг оси, совпадающей с осью
катушки индуктивности. Коэффициент заполнения в этом случае близок к единице.
Методика изучения угловых зависимостей позволяет для одного образца определить
значения измеряемой анизотропной величины только в тех ориентациях магнитного

поля B0 , которые лежат в плоскости, перпендикулярной оси вращения. Для
определения всех независимых параметров, описывающих анизотропию изучаемой
физической
величины,
требуется,
в
общем
случае,
несколько
различных
монокристаллических образцов, оси которых по разному ориентированы относительно
системы координат, связанной с кристаллом.
Оптимальный план эксперимента в этом случае, как и в первом методе, можно
найти минимизируя функцию потерь (3.20) по всем планам. Однако функцию  ( N) для
этого метода нельзя свести к простому виду (3.21), так как затраты на эксперимент в
данной точке плана определяются, кроме количества измерений i , также затратами на
выращивание кристалла, его ориентировку и т.д., определяемыми, в свою очередь, как
требуемой планом угловой зависимостью, так и химическим составом кристалла. Такая
неопределённость затрат, связанная с трудность введения количественной их оценки,
не
позволяет
получить
оптимальные
планы
непосредственной
минимизацией

выражения (3.20). Разумным упрошением задачи является минимизация [D(E)] при
различных ограничениях, налагаемых на спектр плана эксперимента и соответственно
на затраты  , с последующим подбором среди найденных такого, который даёт
меньшую функцию потерь (3.20). К таким ограничениям относятся, например,
количество точек плана n и количество угловых зависимотей (установок кристалла).
Минимальное число точек спектра плана эксперимента n равно количеству
оцениваемых линейно независимых параметров m , описывающих анизотропию
исследуемой физической величины (см. таблицу 3.1). Это число определяется группой
Лауэ кристалла. Минимальное число угловых зависимостей (установок кристалла) q ,


позволяющее получить невырожденную информационную матрицу M(E) ( M(E)  0 )
99
плана, также определяется группой Лауэ кристалла. Покажем на примере величин,
описываемых выражением (3.2), каким образом может быть определено минимальное
число установок кристалла. Для кристаллов триклинной симметрии регрессионная
функция (3.2) описывается 15 параметрами ( m  15 ). Выберем прямоугольную систему
координат таким образом, чтобы для первой установки кристалла угловая зависимость
лежала в плоскости xOy (вращение цилиндрического образца вокруг оси Oz ). Эта
угловая зависимость B(b x , b y ,0) описывается выражением (см. главу 2)
B(b x , b y ,0)  b xxxx b 4x  b yyyyb 4y  6b xxyy b 2x b 2y  4b xxxxy b 3x b y  4b xyyy b x b 3y ,
Рис.3.2 Пересечение угловых
зависимостей в кристалле моноклинной
симметрии ( m - плоскость симметрии).
Рис.3.1 Пересечение угловых
зависимостей в кристалле триклинной
симметрии.
и позволяет определить пять параметров регрессионной функции (3.2). Любая другая
угловая зависимость также описывается пятью параметрами. Но две различные
угловые зависимости позволяют определить не десять, а девять парметров, так как
точка пересечения зависимостей приводит к одному уравнению, связывающему обе
зависимости (рис.3.1). Аналогично третья угловая зависимость пересекает две
предыдущие и, следовательно, позволяет определить только три новых параметра и
т.д.Таким образом, для определения всех 15 параметров регрессионной функции (3.2)
необходимо иметь минимум пять различных угловых зависимостей (установок
кристалла), так как число линейно независимых параметров m  15  5  4  3  2  1.
При повышении симметрии кристалла рассмотрение несколько усложняется. Так, для
моноклинного кристалла пересечение двух угловых зависимостей приводит не к
одному, как в случае триклинной симметрии кристалла, а к двум уравнениям,
связывающим параметры угловых зависимостей (рисю3.2). В этом случае минимальное
число установок кристалла равно трём ( m  9  5  3  1 ).
100
Для кристаллов с симметрией выше
ромбической уменьшается количество
параметров k , описывающих одну
угловую зависимость. Так, для кристаллов
тригональной группы 3 любая угловая
зависимость содержит две точки, в
которых значения анизотропных величин
B(b x , b y , b z ) совпадают (рис.3.3). Это
приводит к уменьшению параметров k ,
описывающих угловую зависимость
Рис.3.3 Пересечение угловых
зависимостей в кристалле тригональной
симметрии (группа 3 ).
тригонального кристалла на единицу и
минимальное число установок кристалла
равно в этом случае двум ( m  5  4  1).
Подобное рассмотрение может быть проведено и для других групп Лауэ.
Результаты такого рассмотрения для регрессионных функций (3.1) - (3.3) приведены в
таблице 3.1 [184].
3.4 ОПТИМАЛЬНЫЕ ПЛАНЫ ЭКСПЕРИМЕНТА ДЛЯ МЕТОДА МОМЕНТОВ
Аналитическое решение задачи построения D -оптимальных планов возможно,
по-видимому, в случае простых регрессионных функций, таких как (3.1), (3.2). Однако
построение планов для исследования анизотропных величин, описываемых достаточно
сложной регрессионной функцией, например, функцией (3.3), требует привлечения
численных методов поиска решений.
Математический аппарат численного поиска условного экстремума в настоящее
время хорошо развит (см. например [185-187]). Имеется много стандартных программ
для ЭВМ, реализующих различные методы поиска экстремума (метод случайного
поиска,
параллельных
касательных,
наискорейшего
спуска,
квадратичной
интерпретации и др.). Количество переменных, по которым ведётся поиск экстремума
функционала, зависит от используемого метода и достигает для средних ЭВМ порядка
50, что в рассматриваемом нами случае (функции (3.1) - (3.3)) является вполне
достаточным.
В [184] при поиске максимума
стандартный
метод
случайного

M( E )
поиска,
101
(минимума
который,
при

D(E ) ) использовался
большом
количестве
варьируемых переменных, имеет некоторые преимущества перед другими методами.
Этот метод позволяет также нпйти решение и при неудачном выборе начального
приближения.
Расчёты оптимальных планов проводились на ЭВМ в следующим порядке. Для
каждой группы Лауэ, исходя из ограничений на количество угловых зависимостей и
точек плана, выбиралось несколько мотивов планов и их первые приближения. Затем

планы уточнялись. При этом точки x i и относительное количество измерений p i в них
варьировалось в широких пределах. Функция эффективности везде принималась

равной ( x )  1 (равноточные планы).
В приложениях 1 - 4 приведены непрерывные нормированные оптимальные
планы
эксперимента
для
исследования
анизотропных
величин,
описываемых
выражениями (3.1) - (3.3) [184]. Приведены оптимальные планы с непрерывной

функцией распределения p( x ) ; планы с угловыми зависимостями, каждая из которых
содержит
ось
Oz ;
планы
с
угловыми
зависимостями,
содержащими
кристаллографические оси или лежащими в плоскостях симметрии кристалла и,
наконец, планы с минимально возможным количеством установок кристалла
Выбор осей прямоугольной системы координат проведён общепринятым
способом (см. таблицу 2.1). В этой системе координат направление вектора магнитного

поля B0 задаётся сферическими углами  и  в градусах. Напомним, что угол 
отсчитывается от оси Oz , а угол  - от оси Ox в плоскости xOy .
Угловые зависимости, образованные вращением кристалла вокруг осей, не
совпадающих с элементами симметрии, задаются в системе координат x / y / z / ,
связанной с первоначальной системой координат xyz тремя углами Эйлера , ,  (в
градусах): углом нутации  между осями Oz и Oz / , углом прецессии  между осью
Ox и прямой пересечения плоскостей xOy и x / Oy / , углом чистого вращения  между
прямой пересечения плоскостей xOy и x / Oy / и осью Ox / (рис.3.4). В новой системе
координат x / y / z / точки спектра плана задаются как и прежде сферическими углами  /
и  / . Учитывая, что угловые зависимости и точки плана на них могут быть заданы
разными наборами углов Эйлера, для однозначности принято   90 0 и   0 0 .
102
Среди нескольких планов, построенных
для некоторой регрессионной функции и
симметрии кристалла, экспериментатору
необходимо выбрать план, удобный для
конкретного случая, т.е. план, дающий
минимум функции потерь (3.20) при
затратах
(3.18),
конкретного
определённых
эксперимента.
характеризующая
для
Величина,
точность
результатов


1/ m
[D(E)]  D(E)
(3.22)
эксперимента
Рис.34 Углы Эйлера
либо равна минимальной при выполнении условия (3.17), либо больше минимальной. В
этом случае для каждого плана в приложениях приведено число равное отношению


1/ m
1/ m
.
D(E)
min D(E)
E
Это число показывает во сколько раз нужно увеличить общее количество измерений N
(количество спектров ЯМР), чтобы получить конечный результат, совпадающий по
критерию оптимальности с результатом эксперимента, план которого удовлетворяет
неравенству (3.17). Зачастую эта величина не слишком отличается от единицы, а
уменьшение
количества
необходимых
для
эксперимента
образцов
кристалла
существенно снижает затраты на весь эксперимент. Такие планы эксперимента часто
можно предпочесть планам, удовлетворяющим условию (3.17).
В настоящей главе рассматривались только непрерывные оптимальные планы.
Однако план, практически используемый в эксперименте, должен содержать целое

число измерений i в каждой точке x i . Он может быть получен округлением
требуемого непрерывным планом E ( N ) числа измерений в каждой точке
i  Npi
( i  1,2,  , n )
~
до ближайшего целого числа. План E ( N ) , полученный в результате округления, по
критерию (3.22) будет, в общем случае, хуже исходного непрерывного плана E ( N ) . Как
показано в [169]
103

 ~
| D (E( N)) | 1 / m  | D(E ( N )) |1 / m 

N
| D(E( N)) |1 / m
Nn/2
(3.23)
и знак равенства в левой части имеет место только и только тогда, когда все Npi
~
( i  1,2,  , n ) - целые числа и планы E ( N ) и E ( N ) совпадают. Из правого неравенства
(3.23) видно, что выгоднее округлять тот план E ( N ) , спектр которого содержит
наименьшее число точек n .
104
Download