инварианты математических моделей

advertisement
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Санкт-Петербургский государственный университет
аэрокосмического приборостроения
__________________________________________________________________
Л. А. Мироновский
ИНВАРИАНТЫ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ
Учебное пособие
Часть 2
Санкт-Петербург
1993
ББК:В1
М63
УДК 512.7
МИРОНОВСКИЙ Л.А.
Инварианты математических моделей. Учеб.пособие часть 2 / СПГУАП. СПб., 1993. 116 с.
ил.
Излагаются основы математической теории инвариантов. Рассматриваются
классические инварианты квадратичных и билинейных форм и линейных операторов по
отношению к изометрическим, аффинным и другим преобразованиям евклидова
пространства.
Текст лекций предназначен для слушателей факультета повышения квалификации
преподавателей.
Утверждено редакционно-издательским советом университета
в качестве учебного пособия
© Санкт-Петербургский государственный университет
аэрокосмического приборостроения, 1993
ОГЛАВЛЕНИЕ
ПРЕДИСЛОВИЕ
1. ИНВАРИАНТЫ КВАДРАТИЧНОЙ ФОРМЫ
1.1. Задачи поиска инвариантов квадратичных форм
1.2. Аффинные инварианты
1.3. Изометрические инварианты квадратичной формы
1.4. Унипотентные инварианты квадратичной формы
2. ИНВАРИАНТЫ СОВОКУПНОСТИ КВАДРАТИЧНЫХ ФОРМ
2.1. Инварианты пары квадратичных форм
2.2. Инварианты бинарных квадратичных форм
2.3. Результанты, якобианы и гессианы бинарных форм
2.4. Инварианты неоднородных форм
3. ИНВАРИАНТЫ БИЛИНЕЙНЫХ ФОРМ
3.1. Определение и постановка задачи.
3.2. Инварианты эквивалентного преобразования билинейной формы.
3.3. Инварианты конгруэнтного преобразования билинейной формы.
4. ИНВАРИАНТЫ ЛИНЕЙНЫХ ОПЕРАТОРОВ
4.1. Постановка задачи.
4.2. Аффинные инварианты линейных операторов.
4.3. Критерии подобия матриц.
4.4. Канонические формы матриц.
4.5. Инварианты унитарного подобия.
4.6. Канонические формы для ортогонального подобия.
4.7. Совместные инварианты линейных операторов и однородных форм.
Заключение
Библиографический список
И лишь в одном душа моя тверда:
Я изменяюсь, но не изменяю.
З.Гиппиус. Улыбка
ПРЕДИСЛОВИЕ
Теория инвариантов играет фундаментальную роль в математических, технических и
естественных науках. Она дает методологию и конкретный математический аппарат для
определения тех свойств, характеристик и параметров исследуемых объектов, которые
остаются неизменными при различных преобразованиях этих объектов. Примерами
инвариантов могут служить различные законы сохранения в физике, химии и других науках,
фундаментальные физические константы, такие как гравитационная постоянная, скорость
света или таинственное число 1/137, встречающееся в атомной физике и биологии.
В математическом моделировании использование инвариантов обеспечивает
необходимый уровень строгости и адекватности при построении математических моделей,
их конкретный анализ и эффективную вычислительную реализацию. Описание свойств
математических моделей и технических объектов в терминах инвариантов обычно обладает
большей общностью и глубиной, чем их «координатные» аналоги.
Теория инвариантов как математическая дисциплина возникла в середине прошлого
века. Ее создание внесли свой вклад такие выдающиеся ученые, как Лагранж, Кели, Клейн,
Гильберт и другие. Сегодня эта теория находит многочисленные применения как внутри
математики, так и за ее пределами.
Краткие сведения о классической теории инвариантов и решаемых в ней задачах
приведенные ранее изданной работе [1]. Напомним определения основных понятий.
Пусть задано множество объектов М с элементами m  M и группа преобразований
G c элементами g  G . Действие преобразования g на объект m приводит к получению
объекта m   gm , принадлежащего тому же множеству М.
В соответствии с общим определением инвариантов функция , заданная на
множестве объектов М, называется инвариантом группы G на множестве М, если для
любых m  M , g  G выполняется равенство ( g m)  (m).
Если, например, в качестве объектов рассматривать многоугольники на плоскости, и в
качестве преобразований взять группу преобразований подобия, то инвариантами этой
группы будут углы многоугольников.
В теории инвариантов различают арифметические и алгебраические инварианты, а
также абсолютные и относительные.
Если инвариант может принимать только целочисленные значения   Z , то он
называется арифметическим. В противном случае, когда инвариант может принимать
произвольные вещественные или комплексные значения (   R или   G ) , он называется
алгебраическим. Только что упомянутые углы многоугольника – это алгебраические
инварианты. Примерами арифметических инвариантов могут служить число сторон или
вершин многоугольника, размерность фигуры, ее связность, числа Бетти и т.п. Простой
пример алгебраических инвариантов с комплексными значениями – собственные числа
матрицы (это инварианты преобразования подобия).
Определенные выше инварианты называются абсолютными, поскольку они не
изменяют своего значения под действием преобразований. Наряду с ними рассматривают
относительные инварианты, которые определяются равенством ( g m)  c(m) , где с –
коэффициент, не зависящий от m (но зависящий от g). Заметим, что отношение двух
относительных инвариантов – абсолютный инвариант.
В приведенном примере относительными инвариантами будут длины сторон
многоугольников – все они при преобразовании подобия изменяются в одно и тоже число
раз. Отношения длин сторон при этом не изменяются, т.е. являются абсолютными
инвариантами.
Следующие определения характеризуют наборы инвариантов данной группы
преобразований G. Набор инвариантов называется полным, если из равенства инвариантов
двух элементов m1, m2 следует их эквивалентность m2  gm1 , g  C.
Полный набор инвариантов называется минимальным, если при удалении из него
любого элемента он теряет свойство полноты. Например совокупность трех углов
треугольника образует полный набор инвариантов для преобразования подобия, а
совокупность двух любых его углов – минимальный полный набор.
Набор инвариантов (1, …, N) называется базисом, если всякий другой инвариант
может быть выражен через них в виде функции F(1, …, N). Если функция F – полином, то
базис называется рациональным или алгебраическим.
Очевидно, что всякий базисный набор – полный, однако обратное утверждение в
общем случае не имеет места.
При одновременном преобразовании нескольких объектов важную роль играет
понятие совместных инвариантов совокупности объектов. Дело в том, что при таком
преобразовании не только сохраняются инварианты каждого из них, но появляются новые
инварианты. Они отражают взаимосвязь этих объектов, характеризуя, например, их взаимное
расположение и поэтому называются совместными.
Например единственным изометрическим инвариантом вектора X является его длина
I X 
x
I1  X ,
I2  Y ,
2
i
. Изометрическими инвариантами пары векторов X, Y будут их длины
а также их скалярное произведение
I 3  (X, Y)   xi yi . Оно
представляет собой их совместный инвариант. Вместо него можно использовать угол 
между векторами, который легко выражается через скалярное произведение и длины
векторов  = arccos(I3/(I1I2)). Аналогично угол между двумя плоскостями будет их
совместным изометрическим инвариантом.
Совместный арифметический инвариант линейной формы L( x)  c1 x1  ...  cn xn и
точки b = [b1, ..., bn]T– это значение линейной формы в данной точке, т.е. величина h =
c1b1+...+cnbn. Указанный инвариант допускает простое геометрическое истолкование. Он
характеризует положение точки b относительно плоскости L(x) = 0. Равенство h = 0
означает принадлежность точки b этой плоскости, а положительные и отрицательные
значения h соответствуют точкам, лежащим по разные стороны от плоскости. В теории
управления этот инвариант известен как нулевой марковский параметр системы
  AX  bU, y  cX , где Х – вектор состояния, u(t) и y(t) – входной и выходной
X
сигналы системы, b – вектор-столбец, с – вектор-строка. Он совпадает с начальным
значением импульсной весовой функции системы, т.е. h = y(0) при u(t) = (t). При h = 0
график весовой функции выходит из начала координат.
Приведенные примеры относились к алгебраическим инвариантам. Точно также
вводятся совместные арифметические инварианты. Например, для системы векторов
совместным арифметическим инвариантом будет ранг матрицы, составленной из этих
векторов.
Аналогичным
образом
рассматриваются
совместные
арифметические
и
алгебраические инварианты линейной и квадратичной формы или пары квадратичных форм,
пары линейных операторов и т.п. Соответствующие результаты приводятся в следующих
разделах.
В приведенном общем определении инвариантов фигурируют три множества –
множество объектов М, множество преобразований G и множество инвариантов Ф. Их
взаимосвязь можно проиллюстрировать с помощью диаграммы
Объекты М
Преобразования G
Инварианты Ф
Полагая два из множеств М, G, Ф заданными, а третье – подлежащим определению,
получаем три типа задач, которые можно назвать прямой, обратной и инверсной:
а) даны М, G, найти Ф – прямая задача;
б) даны М, Ф, найти G – обратная задача;
а) даны G, Ф найти М – инверсная задача.
Остановимся на них подробнее.
Прямая задача (поиск инвариантов). Для заданного множества объектов М
требуется найти множество инвариантов Ф относительно заданной группы преобразований
G (обычно речь идет об отыскании полного или базисного набора). Это – главная задача
теории инвариантов. Именно ей уделено основное внимание в работе [1] и в настоящем
пособии.
Пример 1. Требуется найти множество аффинных инвариантов совокупности n точек
n-мерного пространства.
Как известно [1], искомое множество содержит единственный аффинный инвариант –
это определитель матрицы, составленной из декартовых координат указанных точек. При n
= 3 он равен объему тетраэдра с вершинами в этих точках и начале координат.
Обратная задача (поиск преобразований). Для заданного класса объектов M 0  M
требуется найти множество преобразований G 0  G , сохраняющих неизменными заданные
функции (m).
Пример 2. Уравнение эллипса имеет вид a2x2 + b2y2 = 1. Требуется указать все
линейные замены переменных, не изменяющие коэффициентов этого уравнения. Задачи
такого типа возникают, например, в технической диагностике при анализе неразличимых
дефектов.
В данном случае G 0  GL(2) , а инвариантами являются элементы матрицы A =
2
diag(a , b2) квадратичной формы ХТАХ, где XT = [x, y]. При замене переменных Y = G0X
матрица А преобразуется по формуле G T0 AG 0 (см.разд.1). Решая систему уравнений
A  G T0 AG 0 относительно неизвестных элементов матрицы G0, получаем
 (a / b) cos  
 sin 
G0  
,
sin 
(b / a) cos 

где  – свободный параметр. Эта формула описывает однопараметрическую группу матриц,
представляющую собой решение поставленной задачи. Заметим, что матрица G0 допускает
факторизацию
a 0  sin   cos   1 / a 0 
G0  


,
0 b cos  sin    0 1 / b
которая позволяет вскрыть геометрический смысл полученного решения.
Он состоит в тои, что сначала за счет масштабирования эллипс превращается в
окружность, которую затем поворачивают на произвольный угол  и демасштабируют.
Ясно, что такая процедура не изменит вид эллипса, хотя и приведет к перемещению его
точек по периметру.
Инверсная задача (поиск инвариантных подмножеств). Для заданной группы
преобразований G 0  G
указать подмножество M 0  M , обладающее заданными
инвариантами I = (m).
n
n
Пример 3. Требуется найти все квадратичные формы Q   aij xi x j , у которых
j 1 i 1
при произвольном варьировании масштабов переменных остаются
коэффициенты aij при i  j .
Перейдем к матричной формулировке задачи. Обозначим через
неизменными
А
матрицу
квадратичной формы Q, а через D – диагональную матрицу масштабного преобразования.
Тогда М – это множество всех симметричных матриц n-го порядка, G0 – группа
диагональных матриц n-го порядка. Требуется найти подмножество матриц M 0  M ,
внедиагональные элементы которых являются инвариантами указанного преобразования.
Решение получаем, приравнивая внедиагональные элементы матриц А и DAD,
характеризующих квадратичную форму до и после преобразования. Результат оказывается
очень простым – матрица А должна быть диагональной. Таким образом искомое
n
подмножество квадратичных форм описывается формулой Q   ai xi2 , где а1, …, аn –
i 1
произвольные коэффициенты.
Пример 4. Пространство
Rn
подвергается действию линейного оператора,
описываемого матрицей А. Требуется указать: а) все векторы, сохраняющие свое
направление после такого преобразования; б) все двумерные плоскости, инвариантные по
отношению к этому преобразованию.
В данном случае М – это множество векторов или плоскостей, G0 – циклическая
группа, порождаемая оператором А, инвариантами служат направляющие орты векторов
или плоскостей.
Хорошо известно, что решением первой задачи являются собственные векторы
матрицы А, а решением второй – плоскости, задаваемые разными парами собственных
векторов. Таким образом подмножество М0 образовано объединением одномерных либо
двумерных инвариантных подпространств линейного оператора А.
Задачи такого рода встречаются, например, при исследовании подпространств
управляемости и наблюдаемости динамических систем.
В классической теории инвариантов основное внимание уделяется прямой задаче,
требующей отыскания инвариантов при заданных множествах М и G. При этом в первую
очередь изучаются инварианты стандартных математических объектов – точек, векторов,
линейных и квадратичных форм, линейных операторов – по отношению к полной аффинной
группе преобразований или ее подгруппам.
Следуя этой традиции, в работе [1] были описаны инварианты векторов и линейных
форм для группы GL(n) и ее подгрупп – унимодулярной SL(n), ортогональной 0(n) и
унипотентной (треугольной) T(n).
В данном учебном пособии рассматриваются инварианты трех других стандартных
математических объектов – одной квадратичной формы (разд.1), совокупности квадратичных
форм (разд.2), билинейных форм (разд.3) и линейных операторов (разд.4). В математической
формулировке речь идет о инвариантах конгруэнтного преобразования одной или
нескольких симметричных матриц, инвариантах конгруэнтного и эквивалентного
преобразования несимметричных матриц и инвариантах подобия произвольных квадратных
матриц.
Параллельно приводятся сведения о канонических формах соответствующих матриц.
Обычно параметрами канонических форм оказываются инварианты соответствующих
преобразований, однако из этого правила имеются исключения. Характерным примером
служат канонические формы и инварианты ортогонального подобия (инварианты Шпехта),
описываемые в разд.4
Изложение сопровождается иллюстрирующими примерами математического и
физического характера. В заключении приводятся таблицы, в которые сведены инварианты,
описанные в работе [1] и данном учебном пособии.
Ваятель этой формы многоликой
Нам ниспослал из милости великой
Спасительный, бесценный дар забвенья.
Х.Борхес. Сыну.
1. ИНВАРИАНТЫ КВАДРАТИЧНОЙ ФОРМЫ
1.1. Задачи поиска инвариантов квадратичных форм
Квадратичные формы относятся к числу стандартных математических объектов,
широко используемых в науке и технике. Общеизвестным примером могут служить
выражения для кинетической и потенциальной энергий системы n взаимодействующих
материальных точек
т
E к   mi vi2 / 2,
ш 1
т
E п   k i xi2 / 2,
ш 1
представляющие собой квадратичные формы относительно скоростей точек и их координат.
Другой известный пример – анализ устойчивости динамических систем с помощью
функций Ляпунова, в качестве которых обычно используются квадратичные формы от
переменных состояния. Ряд системных матриц линейных динамических систем, например
грамианы управляемости и наблюдаемости, при замене переменных преобразуются как
матрицы квадратичных форм. Из других областей применения квадратичных форм отметим
теорию вероятностей (корреляционные соотношения, эллипсы рассеивания), теорию
погрешностей (расчет допусков), теорию распознавания образов и т.д.
Во всех перечисленных и многих других случаях знание свойств квадратичных форм
и их инвариантов может оказать существенную помощь в получении результатов и их
интерпретации.
Напомним некоторые определения из теории квадратичных форм. В математике
квадратичной формой от n переменных x1, ..., xn называют однородный многочлен второго
порядка
n
n
Q( x1 , ..., xn )   aij xi x j
(1.1)
i 1 j 1
где aij – постоянные коэффициенты.
Его удобно записывать в матричной форме
Q(X) = XT AX,
(1.2)
где вектор X  R n и квадратная матрица A  R nxm определяются равенствами
 x1 
 a11  a1n 
X   ,
A       .
 xn 
a n1  a nn 
Отметим некоторые свойства квадратичных форм.
1. Квадратичная форма является однородной функцией своих аргументов – при
изменении их в c раз значение квадратичной формы изменяется в c2 раз: Q (cX) = c2 Q (X).
2. Без ограничения общности матрицу квадратичной формы можно считать
симметричной. Действительно, если исходная матрица A была несимметричной, ее всегда
можно представить в виде суммы симметричной и кососимметричной матриц
A = S + K,
где S = (A + AT)/ 2, K = (A – AT)/ 2.
После подстановки этого выражения в формулу (1.2), получаем
Q(X) =XT(S+K) X = XTSX,
поскольку любая квадратичная форма с кососимметричной матрицей тождественно равна
нулю.
3. Если для квадратичной формы существует хотя бы один ненулевой вектор X, при
котором Q (X) = 0, то она называется вырожденной. Простейшим примером является форма
 1  1
с матрицей A  
:
 1 1 
Q( x, y)  x 2  2by  y 2  ( x  y) 2 ,
которая обращается в нуль при любых x = y.
Степень вырожденности квадратичной формы характеризуется ее рангом, который
равен рангу матрицы A. Таким образом признаком вырожденности квадратичной формы
может служить равенство нулю определителя матрицы
A. Ранг невырожденной
квадратичной формы равен n.
4. Квадратичная форма называется положительно определенной, если при любом
X  0 выполняется неравенство Q (X) > 0, и отрицательно определенной, если
выполняется неравенство Q (X) < 0. Общее название для них – знакопостоянные формы.
Если приведенные строгие неравенства заменить нестрогими, то говорят о положительно
полуопределенной (синоним – неотрицательно определенной) и отрицательно
полуопределенной квадратичных формах. Формы, не относящиеся ни к одному из указанных
классов, называют неопределенными.
Иногда знакопостоянные формы называют положительными и отрицательными, а
полуопределенные – неположительными и неотрицательными. Такие же названия
используются и для матриц этих форм. Обозначения A > 0, A < 0, A  0, A  0 говорят о
том, что матрица A положительно определена, отрицательно определена и т.д. Например
для матрицы A = BT B всегда справедливо неравенство A  0.
Геометрически каждой квадратичной форме можно сопоставить характеристическую
поверхность второго порядка, задаваемую уравнением
XT AX = 1
 x
При n = 2, когда X    ,
 y
(1.3)
a b 
A
 , это уравнение имеет вид
b c 
ax 2  2bxy  cy 2  1.
(1.4)
Оно задает на плоскости x, y центральную кривую второго порядка, которая для
положительно определенных форм представляет собой эллипс, а для неопределенных –
гиперболу. Вид этих кривых при a = 1, b = 0, c = (2 показан на рис.1.1.
Рис.1.1
 x
При n = 3, когда X   y  ,
 z 
имеет вид
a
A  d
 e
d
b
f
e
f  , уравнение характеристической поверхности
c 
ax 2  by 2  cz 2  2dxy  2exz  2 fyz  1.
(1.5)
3
В трехмерном пространстве R ему соответствует некоторая поверхность второго порядка
(эллипсоид или гиперболоид). Аналогично этому в общем случае пространства Rn говорят о
соответствующих гиперповерхностях, например каждой положительно определенной
квадратичной форме будет соответствовать некоторый гиперэллипсоид.
В общей теории квадратичных форм можно выделить две основные задачи –
классификация квадратичных форм и приведение их к каноническому виду. Первая из них
состоит в том, чтобы непосредственно по коэффициентам формы определить, какой тип
поверхности (эллиптический, гиперболический или иной) ей соответствует. Вторая задача
связана с поиском системы координат, в которой квадратичная форма принимает наиболее
простой вид (обычно это сумма квадратов переменных).
При решении обеих задач важную роль играют инварианты квадратичных форм.
Напомним, что в свое время именно изучение квадратичных форм привело Лагранжа к
открытию одного из первых алгебраических инвариантов – дискриминанта квадратичной
формы. В случае бинарной формы Q (x, y ) = a x2 + 2 b x y + cy2 он вычисляется по формуле
D = – (b2 – a c) и знаком сегодня всем школьникам, поскольку используется при нахождении
корней квадратных уравнений.
Вопрос об отыскании инвариантов квадратичных форм ставится следующим образом.
Сделаем в квадратичной форме (1.2) линейную замену переменных с невырожденной
матрицей G
X  GY, G  GL (n) .
(1.6)
В результате получим новую квадратичную форму, коэффициенты которой будут отличаться
от исходных
Q(Y) = YT GT AGY YTBY.
(1.7)
Инвариантом квадратичной формы (1.1) относительно линейной замены переменных
(1.6) называется любая функция I = f(a11, a12, ..., ann) от коэффициентов этой формы, не
изменяющаяся при преобразованиях указанного вида, т.е. удовлетворяющая условию
f (A)  cf (B),
G  GL (n).
(1.8)
Если скалярный коэффициент c равен единице, инвариант называется абсолютным, в
противном случае – относительным.
Совершенно аналогично определяются инварианты квадратичных форм относительно
любой подгруппы полной линейной группы – унимодулярной, ортогональной, треугольной и
др.
Рассмотрим три взаимосвязанных задачи:
а) найти инварианты квадратичной формы относительно полной группы линейных
преобразований и ее ортогональной подгруппы;
б) установить простейший вид к которому можно привести квадратичную форму
преобразованиями заданного вида;
в) найти классы эквивалентности, на которые разбивается множество квадратичных
форм под действием указанных преобразований.
Эти задачи допускают также матричную и геометрическую формулировки.
Матричную формулировку получаем, выписывая соотношения, связывающие матрицы
исходной и преобразованной форм (1.2), (1.7) :
B = GT AG,
A = G-1B(G-1)T
(1.9)
В линейной алгебре такое преобразование матриц называется конгруэнтным, а
матрицы, связанные соотношениями вида (1.9) – конгруэнтными. Поэтому первая из
поставленных задач сводится к поиску инвариантов конгруэнтного преобразования
симметричных матриц, вторая – к определению канонической формы таких матриц под
действием конгруэнтного преобразования, а третья – к разбиению множества симметричных
матриц на классы эквивалентности.
Геометрическую формулировку получаем, сопоставляя каждой квадратичной форме
ее характеристическую поверхность (1.3). Замена переменных (1.6) означает обычный
переход к новой системе координат, поэтому первая задача состоит в перечислении
геометрических свойств характеристической поверхности, допускающих бескоординатное
описание. Если, например, исходная поверхность представляла собой эллипсоид, то он
останется эллипсоидом при любом выборе базиса в Rn, т.е. свойство "быть эллипсоидом"
инвариантно по отношению к любому аффинному преобразованию. Соответственно вторая
задача сводится к выбору базиса, согласованного с главными направлениями данной
характеристической поверхности, а третья – с классификацией поверхностей второго
порядка на эллипсоиды, гиперболоиды и др.
Ключевым моментом при решении всех поставленных задач является знание
инвариантов квадратичных форм.
1.2. Аффинные инварианты
Изучение инвариантов квадратичных форм начнем со случая полно линейной группы
преобразований, когда в качестве матрицы G используется произвольная невырожденная
G  GL (n) .
квадратная матрица
Геометрически этому соответствует произвольное
центроаффинное преобразование пространства Rn .
В случае аффинных преобразований число свободных параметров в матрице
преобразования почти вдвое превышает число коэффициентов квадратичной формы,
поэтому расчитывать на большое число инвариантов не приходится (их могло бы вообще не
оказаться). Тем не менее имеются три аффинных инварианта - дискриминант квадратичной
формы (это относительный алгебраический инвариант), ее ранг и сигнатура (арифметические
инварианты). Рассмотрим их подробнее.
Согласно формулам (1.9) матрицы A и B, характеризующие исходную и
преобразованную квадратичные формы, связаны соотношением B = GT A G. Переходя к
определителям, получаем
2
B  G A  cA .
(1.10)
Таким образом определитель матрицы B отличается от определителя матрицы A
2
числовым множителем c  G .
Следовательно определитель
матрицы
D A
квадратичной формы представляет собой относительный инвариант, его порядок равен двум.
Ввиду его важности он получил специальное название - дискриминант квадратичной формы.
Инвариант D  A – единственный алгебраический (и функциональный) аффинный
инвариант квадратичной формы.
Перейдем к рассмотрению булевых и арифметических инвариантов. Один из них
можно получить из соотношения (1.10), учитывая что коэффициент c всегда строго
положителен. Отсюда следует что аффинное преобразование сохраняет знак определителя,
позволяя разбить все квадратичные формы на три больших класса – с положительным,
отрицательным и нулевым дискриминантами (последний из них объединяет все
вырожденные квадратичные формы).
С помощью аффинного преобразования нельзя вывести квадратичную форму за
пределы своего класса, принадлежность к которому определяется значением булева
инварианта вида  = sign D. Хотя этот инвариант производный от относительного, сам он
является абсолютным в том смысле, что его значение не зависит от матрицы преобразования
G.
Еще два булевых инварианта получаем, рассматривая свойства положительной и
отрицательной определенности квадратичных форм. Оба эти свойства, также как и свойства
положительной и отрицательной полуопределенности, сохраняются при произвольных
аффинных преобразованиях. Матричная формулировка этого результата состоит в
следующем. Если симметричная матрица A удовлетворяет одному из неравенств A > 0, A 
0, A < 0, A  0, то матрица GT A G, где G  GL (n) , также будет симметричной и будет
удовлетворять такому же неравенству. Заметим, что указанные свойства сохраняются и при
обращении матрицы, т.е. матрица A-1 останется симметричной и будет удовлетворять тому
же неравенству, что и матрица A. Последнее вытекает из того, что при обращении матриц
собственные числа также обращаются  i  1 /  i , следовательно их знаки сохраняются.
Таким образом свойства симметричности, положительной определенности и
отрицательной определенности матриц инвариантны по отношению к обращению и
конгруэнтному преобразованию матриц.
Простейшим арифметическим инвариантом служит ранг квадратичной формы,
определяемый равенством r = rank A. Инвариантность этой величины следует из теоремы о
ранге матричного произведения, примененной к соотношению (1.10). В зависимости от
степени вырожденности квадратичной формы этот инвариант может принимать
целочисленные значения из диапазона 0 r  n. Учет инварианта r позволяет расщепить
упомянутый выше класс вырожденных квадратичных форм на n подклассов с разной
степенью вырожденности.
Названные инварианты не исчерпывают множества всех арифметических
инвариантов квадратичных форм. Полный перечень их содержится в знаменитой теореме,
известной под несколько необычным названием "закон инерции квадратичных форм". Она
была получена в 1852 г. английским математиком Дж.Сильвестром и обязана своим
названием приложениями в механике.
Прежде чем привести строгую формулировку этой теоремы, воспользуемся
геометрической интерпретацией. Предположим сначала, что исходная квадратичная форма Q
(X) положительно определена, тогда ее характеристическая поверхность Q (X) = 1 имеет
вид эллипсоида в n - мерном пространстве.
Выберем n главных осей этого эллипсоида в качестве новых координатных осей, а в
качестве единичных ортов возьмем полуоси эллипсоида. Тогда уравнение эллипсоида в
новом базисе станет предельно простым y12    y n2  1. . Матрица B этой квадратичной
формы диагональна и совпадает с единичной матрицей B = E.
Если исходная форма Q (X) невырождена, но не является знакопостоянной, то ее
характеристическая поверхность представляет собой гиперболоид. Поступая аналогично и
выбирая базис, ориентированный по главным направлениям этого гиперболоида, получим
квадратичную форму Q(Y) с диагональной матрицей B вида B = [1, ..., 1].
Наконец, если включить в рассмотрение вырожденные квадратичные формы, то с
помощью аналогичной процедуры приходим к диагональной форме с матрицей B, у
которой на главной диагонали могут быть элементы вида +1, -1, 0. Обозначим число
положительных отрицательных элементов через p и q. Тогда можно так выбрать
нумерацию осей, чтобы матрица B приняла вид
B  diag [1, ...,1  1,...,  1, 0, ... ,0].
(1.11)
p
q
Ей соответствует следующее выражение для квадратичной формы
(1.12)
Q  x12    x 2p  x 2p1    x 2pq ,
которое называется каноническим видом квадратичной формы для случая аффинных
преобразований.
В теории квадратичных форм доказывается, что любую квадратичную форму
подходящей заменой переменных можно привести к каноническому виду с диагональной
матрицей (1.11).
Матричная формулировка этого результата сводится к утверждению, что всякая
симметричная матрица конгруэнтна диагональной матрице, у которой диагональные
элементы равны +1, –1 или 0. Существенно, что числа p и q, равные количеству
положительных и отрицательных диагональных членов, однозначно определяются исходной
формой.
В этом и состоит суть теоремы Сильвестра, полная формулировка которой
приводится ниже.
Теорема (закон инерции квадратичных форм). Число положительных и
отрицательных коэффициентов в каноническом виде квадратичной формы Q (x) являются
инвариантами формы, т.е. не зависят от выбора базиса.
При решении практических задач часто возникает необходимость преобразования
исходной квадратичной формы к каноническому виду (1.12). Опишем классическую
процедуру такого преобразования, предложенную Лагранжем.
Алгоритм Лагранжа. Идея Лагранжа заключается в последовательном выделении в
исходной квадратичной форме полных квадратов, которые принимаются за новые
переменные. Число шагов алгоритма равно числу переменных квадратичной формы.
Поясним алгоритм Лагранжа на примере квадратичной формы от трех переменных
Q( x, y, z)  9 y 2  9 z 2  12 xy12 xz  6 yz.
Шаг 1. Выделим члены, содержащие y (они подчеркнуты) и дополним их до полного
квадрата слагаемыми, не зависящими от y:
9 y 2  12 xy  6 yz  (3 y  2 x  z ) 2  4 x 2  z 2  4 xz.
Обозначая выражение в скобках через u, приходим к квадратичной форме Q = u2 + R1 (x,z).
Шаг 2. Выделяем в форме R1 (x,z) члены, зависящие от x и дополняем их до полного
квадрата –4 (x – 2z)2 – 16z2. Обозначая выражение в скобках через v и подставляя его в
предыдущую формулу, приводим ее к виду
Q = u2 –4v2 R2 (z).
Шаг 3. Выражение R2 (z) содержит только квадратичный член R2 = 24z2, поэтому
принимаем w = z. Перейдя от переменных x, y, z к переменным u, v, w, мы избавились от
всех перекрестных произведений переменных и привели исходную квадратичную форму к
диагональному виду
Q = u2 –4v2 +24z2.
Выполненное преобразование переменных можно записать в матричной форме
 u  2 3  1   x 
 v   1 0  2  y .
  
 
 w 0 0 1   z 
Шаг 4. Чтобы сделать коэффициенты квадратичной формы единичными, используем
обычное масштабирование переменных x1 = u, x3 = 2v, x 2  24 w (этому соответствует
диагональная матрица преобразований). В результате форма принимает канонический вид
Q  x12  x 22  x32 .
В данном случае p = 2, q = 1, т.е. форма относится к гиперболическому типу.
В зависимости от порядка выделения полных квадратов, численные значения
коэффициентов диагональной формы, получаемой на третьем шаге алгоритма, могут
различаться. Однако знаки этих коэффициентов подчиняются закону инерции, т.е. число
положительных, отрицательных и нулевых коэффициентов во всех случаях будет равно
инвариантам p, q и n – p – q.
Числа p и q называются иногда положительными и отрицательными индексами
инерции квадратичной формы. Если не считать относительного инварианта D  A , то они
являются единственными инвариантами квадратичной формы. Все остальные
арифметические и булевы инварианты могут быть выражены через них. В частности ранг r
формы равен их сумме r = p + q.
Разность s чисел p и q называется сигнатурой квадратичной формы s = p – q. Ранг
и сигнатура также представляют собой исчерпывающий набор арифметических инвариантов,
поскольку инварианты p и q легко выражаются через них
p = ( r + s )/ 2,
q = ( r – s )/ 2.
Равенство p = n эквивалентно положительной определенности формы, а равенство q = n ее
отрицательной определенности.
Изложенные результаты дают решение всех трех поставленных выше задач для
случая аффинных преобразований. Так полный набор инвариантов квадратичных форм
относительно указанных преобразований содержит три независимых инварианта –
дискриминант формы, ее ранг и сигнатуру. Простейший канонический вид, к которому
можно привести квадратичную форму, дается формулой (1.12), причем число
положительных и отрицательных членов в ней определяется инвариантами p и q.
Соответственно, все квадратичные формы разбиваются на классы эквивалентности,
отличающиеся числом положительных и отрицательных элементов в матрице канонической
формы (1.11). В частности свойства положительной определенности Q > 0, отрицательной
определенности Q < 0, полуопределенности Q  0 и Q  0, а также свойство
неопределенности являются инвариантными по отношению к любому линейному
преобразованию G GL (n). Необходимым и достаточным условием эквивалентности двух
квадратичных форм является равенство их рангов и сигнатур.
Эти результаты почти полностью переносятся и на случай унимодулярной аффинной
группы, когда на матрицу преобразования G накладывается дополнительное условие G  1.
1.3. Изометрические инварианты квадратичной формы
Рассмотрим теперь задачу о инвариантах квадратичной формы Q(X) = X TAX по
отношению к изометрическим преобразованиям пространства. Такие преобразования
задаются формулой Y = G X, где G – ортогональная матрица. Число ее свободных
параметров равно n (n – 1) / 2, т.е. на n меньше числа коэффициентов квадратичной формы.
Поэтому в данном случае естественно ожидать появления n алгебраических инвариантов.
Множество ортогональных матриц образуют подгруппу 0(n) полной линейной группы.
Матрицы G  0(n) характеризуются равенствами
G T G  E,
G  1,
G 1  G T .
Отсюда вытекает, что формулу конгруэнтного преобразования матрицы квадратичной
формы B = GT A G в случае ортогонального преобразования можно переписать в виде
B = G-1AG
(1.13)
Такое преобразование в линейной алгебре называется преобразованием подобия. Как
известно, (см. разд. 4) оно сохраняет определитель и след матрицы A, а также ее
собственные числа
A , trA, 1 ,,  n .
Следовательно все эти величины будут являться инвариантами изометрического
преобразования. Поскольку определитель матрицы равен произведению ее собственных
чисел, а след – их сумме, то фактически мы имеем n независимых инвариантов 1 ,,  n .
Их называют также характеристическими числами квадратичной формы.
Из симметричности матрицы квадратичной формы следует вещественность всех ее
собственных чисел. Знаки их определяются сигнатурой формы. В частности для
положительно определенных форм все числа i положительны, а для отрицательно
определенных – отрицательны.
Чтобы выяснить геометрический смысл инвариантов
рассмотрим
1 ,,  n ,
характеристическую поверхность Q (X) = 1, которая в случае положительно определенной
формы будет представлять собой эллипсоид в Rn. Главные оси этого эллипсоида будут
определяться собственными векторами H1, ..., Hn матрицы A квадратичной формы. В этом
можно убедиться, отыскивая на поверхности эллипсоида точки с экстремальной нормой
2
X  X T X.
Математически эта задача эквивалентна определению экстремальных значений
квадратичной формы XT A X на единичной сфере XT X = 1, которая решается путем
дифференцирования функции
f  X T AX  (-XT X  1),
где  – множитель Лагранжа. Приравнивая производную по X нулю, получаем
2AX – 2X = 0,
AX = X.
Последнее равенство означает, что искомые экстремальные направления совпадают с
собственными векторами H1, ..., Hn матрицы A, которые вследствие симметричности
матрицы A образуют ортонормальную систему.
Вычисляя значения квадратичной формы при X = Hi, получаем Q (H1) = 1, ..., Q (Hn) = n,
т.е. собственные числа матрицы A численно равны экстремальным значениям квадратичной
формы на единичной сфере. Максимальное и минимальное из них задают границы
изменения квадратичной формы при X  1 :
 n  Q(X)  1 .
С помощью подходящей матрицы ортогонального преобразования G выполним
поворот исходной системы координат таким образом, чтобы ее оси совпали с векторами H1,
..., Hn. В новой системе координат уравнение характеристической поверхности примет вид
Q(Y )  21 y1    2n y n  1.
(1.14)
Это уравнение описывает центральный эллипсоид, ориентированный по осям координат.
Длины его полуосей соответственно равны 1 / 1 ,,1 /  n . Таким образом, инварианты
1 ,,  n задают геометрические размеры характеристического эллипсоида квадратичной
формы. В случае неопределенной квадратичной формы их геометрический смысл
аналогичен.
Из описанной процедуры вытекает два варианта алгоритма приведения квадратичной
формы к диагональному виду с помощью ортогональных преобразований (метод Лагранжа в
данном случае неприменим).
Алгоритм 1 (с вычислением матрицы преобразования).
Шаг 1. Выписать матрицу A исходной квадратичной формы и найти ортогональную
совокупность H1, ..., Hn ее собственных векторов.
Шаг 2. Выполнить ортогональную замену переменных X = H Y, где H = [H 1, ..., Hn]
– матрица из собственных векторов, найденных на шаге 2:
Q = XTAX = (HY)TAHY = YTHTAHY = YTBY.
В результате получается квадратичная форма с диагональной матрицей B = diag ( 1 ,,  n ),
представляющая собой канонический вид квадратичной формы для случая изометрических
преобразований.
Q  1 y12   2 y 22    2n y n2  1.
(1.15)
1 ,,  n –
Коэффициентами канонической формы (1.15) служат инварианты
собственные числа матрицы A исходной квадратичной формы. Учет этого обстоятельства
позволяет упростить процедуру нахождения канонической формы.
Алгоритм 2 (без вычисления матрицы преобразования).
Шаг 1. Найти собственные числа 1 ,,  n матрицы A исходной квадратичной
формы.
Шаг 2. Записать каноническую форму (1.15).
Очевидно, что коэффициенты квадратичной формы (1.15) должны подчиняться закону
инерции, т.е. среди них должно быть p положительных, q отрицательных и n – p – q
нулевых, где p и q – индексы инерции квадратичной формы. Отсюда получаем новый
критерий положительной определенности, согласно которому необходимым и достаточным
условием положительной определенности квадратичной формы является положительность
всех собственных чисел ее матрицы. Соответственно ранг квадратичной формы равен числу
ненулевых собственных чисел.
Стандартная классификация квадратичных форм на эллиптические, гиперболические и
параболические также однозначно определяется знаками инвариантов i : в первом случае
все инварианты должны быть одного знака, во втором – разных знаков (но все – ненулевые).
Третий случай (параболические формы) получаем, если хотя бы один из инвариантов равен
нулю.
От ортогональной канонической формы (1.15) с помощью масштабирования
переменных легко перейти к аффинной канонической форме (1.12), однако такое
преобразование не будет изометрическим.
С алгебраической точки зрения инварианты i – это корни характеристического
полинома n – го порядка
(1.16)
E  A  n  an1n1    a1  a0 .
Они не выражаются рационально через элементы матрицы A. В этом смысле более удобной
системой инвариантов оказываются коэффициенты ai характеристического полинома,
которые связаны с корнями i формулами Виета
a 0  (1) n  1 2   n , , a n 1  ( 1     n ).
(1.17)
Эти коэффициенты рациональным образом (с помощью сложений и умножений)
вычисляются через элементы матрицы A, и поэтому представляют собой совокупность
алгебраических инвариантов. В частности для коэффициентов a0 и an-1 имеем равенства
a0  (1) n A ,
an1  trA  (a11    a1n ).
Поскольку инварианты ai вычисляются проще, чем инварианты i, возникает вопрос,
можно ли с их помощью анализировать знакоопределенность квадратичной формы. Для
ответа на него достаточно обратиться к формулам (1.17). Из них видно, что если все i > 0
(случай положительно определенной формы), то знаки коэффициентов
ai
будут
чередоваться.
Отсюда следует, для положительной определенности квадратичной формы общее
число перемен знаков в коэффициентах характеристического полинома (1.16) при просмотре
их слева направо должно быть равно n.
Обобщением этого критерия является известное правило Декарта, согласно которому
число положительных корней характеристического полинома равно числу перемен знака его
коэффициентов.
Пример 1. Дана квадратичная форма
Q( x, y, z )  7 x 2  6 y 2  5z 2  4 xy  4 yz.
Требуется: а) определить ее тип (эллиптический, гиперболический или параболический);
б) оценить диапазон ее изменения на единичной сфере;
в) привести ее ортогональным преобразованием к каноническому виду, не
выписывая само преобразование.
Решение.
а) Находим характеристический полином квадратичной формы
7
2
0
E  A  2   6 2  3  182  99  162.
0
2
5
Коэффициенты характеристического полинома знакочередующиеся (число перемен знака
равно трем), поэтому согласно правилу Декарта имеется три положительных корня. Форма
положительно определена, ее тип – эллиптический.
б) Чтобы оценить диапазон изменения формы при ||X|| = 1, находим корни
характеристического полинома:  1 = 9,  2 = 6,  3 = 3. Следовательно 3 Q  9.
в) Ортогональным преобразованием форма приводится к каноническому виду
Q  9 x12  6 x 22  3 x32 .
Пример 2. Свободное движение математического маятника описывается уравнениями
(1.18)
x  y, y   x  0,2 y, x(0)  x0 , y(0)  y0 .
Нужно исследовать зависимость энергии свободных колебаний

E   x 2 (t )dt
0
от начальных условий, ответив на следующие вопросы:
а) в каких пределах может изменяться энергия E, если векторы начальных условий
имеют единичную длину x02  y 02  1, т.е. стартовые точки лежат на единичной окружности
в фазовой плоскости (рис.1.2,а)?
б) при каких начальных условиях энергия E будет наибольшей? Проще говоря, как
нужно толкнуть маятник, чтобы он подольше качался? Предполагается, что начальные
условия по-прежнему принадлежат единичной окружности;
в) как расположены на фазовой плоскости точки начальных условий, для которых E =
1?
Решение.
Покажем сначала, что ответы на эти вопросы можно получить, исследуя некоторую

квадратичную форму. Перепишем выражение для энергии в виде E   X T xdt и подставим
0
вместо x(t) его аналитическое выражение
1 
x 
0
X(t )  ce At X 0 , X 0   0 ,
A
, c  [1 0],
y

1

0
,
2
0


 
где A – матрица системы уравнений (1.18). Выполняя несложные преобразования, получим
  AT t T At 
T
E  X 0   e c ce dt X 0  X T0 W0 X 0 .
(1.19)
0

Здесь через W0 обозначено выражение, заключенное в скобки. Оно представляет собой
симметричную числовую матрицу, которая в теории управления называется грамианом
наблюдаемости.
Тем самым задача свелась к исследованию бинарной квадратичной формы (1.19). Это
позволяет без труда ответить на все поставленные вопросы.
а) Диапазон изменения энергии
E
при условии x02  y 02  1,
определяется
неравенством  2  E   1, где  1 и  2 – максимальное и минимальное собственные
числа грамиана наблюдаемости. Вычисляя их, получаем
0,7415 0,6710
W0  
 , 1  3,0525,  2  2,0475.
0,6710 0,7415
б) Максимально возможная энергия колебаний равна 3,0525. Она достигается,если
вектор начальных условий совпадает по направлению с первым собственным вектором
0,7415
грамиана: X 0  H1  
 . Минимальная энергия E=2,0475 получается,если в качестве
0,6710
 0,6710 
начальных условий взять второй собственный вектор X 0  H 2  
.
 0,7415
Фазовые траектории для обоих случаев показаны на рис.1.2,б, а графики колебаний - на
рис.1.2,в. Если изменить знаки начальных условий, т.е. взять X0  H1 , X0  H 2 , то все
кривые симметрично "переворачиваются", но энергия остается той же. Физическая
интерпретация полученного результата сводится к тому, что для наилучшей раскачки
маятника надо его отклонить на некоторый угол и подтолкнуть в ту же сторону (именно так
выгоднее поступать, раскачивая качели с ребенком).
Множество начальных условий, для которых энергия колебаний будет единичной,
задается уравнением X T0 W0 X 0  1. В теории управления этот эллипс (он показан на
рис.1.2,г) называется эллипсом наблюдаемости. Чем сильнее он вытянут вдоль некоторого
направления, тем хуже оно наблюдаемо (для получения единичной энергии на выходе надо
задавать большие начальные условия).
В отличие от окружности на рис.1.2,б, эллипс наблюдаемости обладает тем свойством,
что все траектории, начинающиеся на нем, целиком лежат внутри него. Это связано с тем,
что квадратичная форма (1.19) является одной из функций Ляпунова для данной системы.
1.4. Унипотентные инварианты квадратичной формы
Рассмотрим инварианты унипотентной группы преобразований T(n), описываемой
верхнетреугольными матрицами с единичной диагональю
 1 g12  g1n 
0
1  g 2 n 

G
.
    


0  1 
0
Число свободных параметров в такой матрице, как и в случае изометрических
преобразований, ровно на n меньше числа коэффициентов квадратичной формы, поэтому
следует ожидать, что число унипотентных инвариантов будет совпадать с числом
изометрических инвариантов. В то же время собственные числа матрицы A уже не будут
инвариантами, поскольку конгруэнтное преобразование с треугольной матрицей не есть
преобразование подобия.
Чтобы найти инварианты унипотентного преобразования, рассмотрим равенство AG = G B,
связывающее матрицы исходной и преобразованной квадратичных форм. Запишем его в
блочном виде
A ii x  G ii x  G ii x  Bii x 
 x x  0 x   0 x  x x ,


 


где через Aii, Bii, Gii обозначены подматрицы размеров i x i, находящиеся в левом верхнем
углу матриц A, B, G, а крестиками помечены остальные блоки этих матриц. Отсюда в
соответствии с правилами матричного умножения получаем равенства
Aii Gii = Gii Bii ,
справедливые для i = 1,2,...,n.
Переходя к определителям и учитывая, что матрицы Gii – треугольные с единицами на
диагонали, получаем
A ii  Bii ,
i  1, n.
Таким образом n угловых миноров матрицы квадратичной формы
a11 a12 a13
a12
(1.20)
M1  a11 ,
, M 3  a 21 a 22 a 23 ,, M n  A
a 22
a31 a32 a33
не меняются при унипотентном преобразовании, т.е. являются его алгебраическими
инвариантами.
Простейший вид, к которому можно привести квадратичную форму с помощью
треугольного преобразования, вновь оказывается диагональным. Легче всего это
доказывается с помощью разложения Холецкого или его обобщения - треугольного UD –
разложения матрицы квадратичной формы A = UT D U, где U – верхняя треугольная матрица
с единичной диагональю, D – диагональная матрица. Делая замену переменных
Y = U X:
Q = XT A X = XT UT D U X = YT D Y,
получаем квадратичную форму с диагональной матрицей
Q  d1 y12  d 2 y 22    d n y n2 .
(1.21)
Формула (1.21) описывает канонический вид квадратичной формы для случая унипотентных
преобразований.
Недостаток приведенного способа получения канонической формы состоит в
необходимости вычисления треугольного разложения матрицы A. Существует более простой
способ нахождения этой квадратичной формы, известный как алгоритм Якоби. Он не требует
вычисления матрицы преобразования G и позволяет найти коэффициенты квадратичной
формы di прямо по инвариантам Mi с помощью формул
d1  M1 , d 2  M 2 /M 1 , d 3  M 3 /M 2 ,, d n  M n /M n1 . (1.22)
Для вывода этих формул достаточно рассмотреть равенство
 a11  a1n   1  g1n   1  g1n  d1  0 
                  ,


 


a n1  a nn   0  1   0  1   0  d n 
a
M 2  11
a 21
связывающее матрицу A исходной квадратичной формы с диагональной матрицей
канонической формы. Приравнивая последовательно угловые миноры в правой и левой
частях равенства, получаем соотношения
a11 a12
a11  d1 ;
 d1d 2 ,, A  d1 ,, d n ,
a21 a22
из которых сразу следует формула (1.22).
Единственным ограничением для применения алгоритма Якоби служит требование,
чтобы среди инвариантов M1, ..., Mn-1 не было нулевых. Если это требование выполняется,
то существует единственное треугольное преобразование, приводящее квадратичную форму
к диагональному виду.
Таким образом как и ранее, коэффициенты канонической формы выражаются через
инварианты преобразования, причем рациональным образом (в случае изометрического
преобразования коэффициентами канонической формы служили корни характеристического
полинома, представляющие собой иррациональные функции от коэффициентов
квадратичной формы).
Знаки коэффициентов di по-прежнему подчиняются закону инерции Сильвестра, в
частности для положительно определенных квадратичных форм все коэффициенты di
должны быть положительны. Отсюда вытекает простой критерий положительной
определенности.
Критерий Сильвестра. Для положительной определенности квадратичной формы
необходимо и достаточно, чтобы все угловые миноры M1, ..., Mn (1.20) матрицы
квадратичной формы были положительны.
Критерий Сильвестра требует меньше вычислений, чем изложенные ранее критерии,
основанные на вычислении сигнатуры матрицы A , ее собственных чисел или на проверке
чередования знаков коэффициентов характеристического полинома, поэтому именно его
обычно используют на практике.
Пример 3. Дана квадратичная форма
Q( x, y, z )  2 x 2  6 y  5z 2  4 xy  4 yz.
Требуется определить тип формы и найти ее канонический вид для случая унипотентных
преобразований.
Решение.
Выписываем матрицу A квадратичной формы и вычисляем ее угловые миноры
 2 2 0 
A   2 6  2 , M1  2, M 2  8, M 3  32.
 0  2 5 
Все миноры положительны, поэтому согласно критерию Сильвестра форма положительно
определена. Тип формы - эллиптический.
Вычисляем коэффициенты di квадратичной формы
d1  2, d 2  M 2 /M 1  4, d 3  M 3 /M 2  4.
Следовательно исходная квадратичная форма треугольной заменой переменных с матрицей
G T(3) может быть приведена к каноническому виду
Q  2 x12  4 x 22  4 x32 .
Соответствующее унипотентное преобразование является единственным.
Подведем некоторые итоги. Мы рассмотрели три типа преобразований квадратичных
форм – аффинное, изометрическое и унипотентное, для каждого из них нашли инварианты и
установили вид канонической формы. Универсальным алгебраическим инвариантом во всех
трех случаях оказался дискриминант квадратичной формы. Для аффинного преобразования
это единственный алгебраический инвариант (притом относительный). Для изометрического
и унипотентного преобразований существует n абсолютных алгебраических инвариантов –
это коэффициенты характеристического полинома матрицы квадратичной формы в первом
случае и ее угловые миноры - во втором (дискриминант является элементом и того, и
другого набора инвариантов). Арифметическими инвариантами во всех трех случаях служат
ранг и сигнатура квадратичной формы.
С помощью каждого из указанных преобразований квадратичную форму можно
привести к диагональному каноническому виду, причем в аффинном случае
коэффициентами канонической формы служат 1, в изометрическом – собственные числа
матрицы A , в унипотентном – отношения ее угловых миноров. Построение этих
канонических форм производится с помощью алгоритмов Лагранжа, ортогональных
преобразований и Якоби соответственно.
Получаемые диагональные формы аффинно эквивалентны, а знаки их коэффициентов
подчиняются закону инерции Сильвестра. Однако они различаются видом
диагонализирующих преобразований и не являются ортогонально или треугольно
эквивалентными. Геометрический смысл этих различий можно пояснить простым примером.
Пример 4. Требуется, используя ортогональную и треугольную замену переменных,
преобразовать уравнение эллипса
5 x 2  5 y 2  8 xy  5
к диагональному виду и выяснить, в какие точки отображаются концы его полуосей.
Решение.
Ориентация исходного эллипса на плоскости x, y показана в центре рис.1.3. Она
определяется собственными векторами матрицы A квадратичной формы
5 4
1
1
A
,
H

,
H

 2  1.
1
2

1
 1 , 1  9,
4 5

 
Рис.1.3
При ортогональном преобразовании с матрицей G  [H 1 H 2 ] / 2 эллипс поворачивается как
твердое тело по часовой стрелке до совмещения его осей с осями координат (левая часть
рис.1.3). При этом точки a и b по-прежнему находятся на концах его полуосей. Уравнение
эллипса в канонических координатах u, v имеет вид
9u 2  v 2  2,5.
При унипотентном преобразовании коэффициенты канонической формы определяются
равенствами d1 = M1 =5, d2 = M2 /M1 = 9/5 = 1,8, т.е. уравнение эллипса в канонических
координатах (назовем их z,w) имеет вид
5z 2  1,8w 2  1.
Соответствующий эллипс показан на рис.1.3 справа. Он получается из исходного эллипса
1 0,6
умножением на треугольную матрицу преобразования G  
 . Преобразование
0 1 
координат с помощью такой матрицы описывается уравнениями z = x + 0,6 y, w = y.
Геометрически это означает, что все точки исходной фигуры перемещаются
горизонтально на величину, пропорциональную их ординате. В результате на конце большой
полуоси окажется точка исходного эллипса, имевшая максимальную ординату, а точка a ,
находившаяся на конце большой полуоси, займет некоторое промежуточное положение. При
этом она останется на векторе H1, но он уже не будет собственным вектором матрицы
квадратичной формы в новой системе координат.
Точно также точка b, находившаяся на конце малой полуоси эллипса, займет после
преобразования некоторое промежуточное положение, а на конце малой полуоси окажется
точка исходного эллипса, лежавшая на оси x.
Такая деформация исходного эллипса происходит вследствие замены прямоугольных
координат на косоугольные, осуществляемой при унипотентном преобразовании.
В заключение приведем матричную формулировку полученных результатов о
диагонализации квадратичной формы. Всякая симметричная матрица А конгруэнтным
преобразованием с помощью невырожденной матрицы G может быть приведена к
диагональному виду GATG = diag(d1, …, dn), причем матрицу G можно брать из класса
треугольных матриц (тогда di – отношение угловых миноров матрицы А), из класса
ортогональных матриц (тогда di – собственные числа матрицы А) или из класса
произвольных невырожденных матрий (тогда все di можно сделать равными 1).
Download