АЛГЕБРА МАТРИЦ - Кафедра Высшая и прикладная математика

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования «Пензенский государственный университет» (ПГУ) Т. В. Черушева, О.Б. Васюнина Алгебра матриц Учебное пособие Издание второе, переработанное и дополненное Пенза Издательство ПГУ 2010 УДК 512(075.8) Ч-45 Р е ц е н з е н т ы: Кафедра «Алгебра» Пензенского государственного педагогического университета им. В. Г. Белинского Кандидат физико-математических наук, доцент кафедры «Математика» Пензенской государственной технологической академии Н. С. Лаврушкина Черушева, Т. В. Ч-45 Алгебра матриц : учеб. пособие / Т. В. Черушева, О.Б. Васюнина – 2-е изд., перераб. и доп. - Пенза : Изд-во ПГУ, 2010. – 61 с. Рассматриваются действия над матрицами специального вида, применение блочных матриц к решению систем линейных уравнений, интегрирование и дифференцирование матриц и приложения этих операций к решению дифференциальных уравнений. Даны понятия матричной и векторных норм, согласованности норм, абсолютных векторных норм. Во второе издание включены примеры анализа плоских электрических цепей с использованием матричной алгебры. Учебное пособие подготовлено на кафедре «Высшая и прикладная математика» и предназначено для студентов второго курса, обучающихся по специальности «Энергетические системы и сети». Пособие также может быть использовано студентами других технических специальностей университета, изучающими алгебру матриц. УДК 512(075.8) © Черушева Т. В., Васюнина О.Б., 2010, с изменениями © ГОУ ВПО «Пензенский государственный университет», 2010 2 Предисловие В основе большинства научных применений современных компьютерных технологий лежат матричные вычисления. В связи с этим важно понимать, как правильно и эффективно выполнять такие вычисления, чтобы оптимизировать работу на персональном компьютере. Навстречу этой потребности идет данное учебное пособие. В предлагаемом учебном пособии рассматриваются действия над матрицами специального вида, применение матричного исчисления к решению систем линейных уравнений, интегрирование и дифференцирование матриц и приложения этих операций к решению дифференциальных уравнений. В пособии даются понятия матричной и векторных норм, согласованности норм, абсолютных векторных норм. В первых четырех разделах настоящего пособия, кроме теоретического материала, приводятся примеры решения систем линейных уравнений, линейных дифференциальных уравнений и их систем, а также примеры вычисления функций от матриц. Пятый раздел пособия имеет теоретический характер. Во второе издание включены примеры анализа плоских электрических цепей с использованием матричной алгебры. Данное учебное пособие предназначено для студентов второго курса специальности «Электроэнергетические системы и сети», продолжающих изучение алгебры матриц в рамках спецкурса. При работе с пособием студенты должны владеть терминами: матрица, определитель (детерминант) матрицы, обратная матрица, оператор и самосопряженный оператор матрицы, собственные числа и собственные векторы матрицы, скалярное произведение; а также должны уметь выполнять элементарные действия над матрицами. Читателям, незнакомым с этой терминологией, можно посоветовать обратиться к дополнительной литературе или прочитать, например, первые главы [2] и [3]. Авторы выражают благодарность доцентам кафедры «Высшая и прикладная математика» Руденко А. К., Семеновой Т. В. за внимание к работе и ценные замечания. 3 1. Действия над матрицами 1.1. Обращение треугольных матриц Операция определения обратной матрицы A1 имеет исключительно большое значение для решения системы линейных алгебраических уравнений. Как известно, для невырожденной матрицы A обратная матрица может быть найдена по формуле 1 ( AV )T , где AV - матрица алгебраических дополнений det A элементов матрицы A . Получение A1 по этой формуле в случае, когда порядок матрицы A большой, требует сложной вычислительA 1  ной работы. Для треугольных матриц большого размера практический интерес представляет следующий вычислительный алгоритм, сущность которого рассмотрим на примере матрицы четвертого порядка. Пусть А - верхняя треугольная матрица четвертого порядка  a11 a12   0 a22 A 0 0   0 0  a13 a23 a33 0 a14   a24  . a34   a44  Обратную ей матрицу, элементы которой  i j подлежат определе- нию, запишем в виде A1  11 12   22  =  21   32  31   41  42 13 14    23  24  .  33  34    43  44  Как известно, А1А = Е. Следовательно, 4  11    21   31   41 12  22  32  42 13  23  33  43 14   a11 12 13 14   1 0 0     24   0 a22  23  24   0 1 0   34   0 0 a33  34   0 0 1     44   0 0 0 a44   0 0 0 0  0 . 0  1  Используя правило умножения матриц и исходя из определения равенства матриц, получаем четыре системы линейных уравнений, сравнив соответствующие элементы строк: по первой строке: 11a11  1,  a   a  0,  11 12 12 22  11a13  12 a23  13a33  0, 11a14  12 a24  13a34  14 a44  0; по второй строке:  21a11  0,  a   a  1,  21 12 22 22   21a13   22 a23   23a33  0,  21a14   22 a24   23a34   24 a44  0; по третьей строке:  31a11  0,  a   a  0,  31 12 32 22   a   32 a 23   33 a33  1,  31 13  31a14   32 a24   33a34   34 a44  0; 5 по четвертой строке:  41a11  0,  a   a  0,  41 12 42 22   41a13   42 a23   43a33  0,  41a14   42 a24   43a34   44 a44  1. Из первой системы получаем  11  1 , a11 13   12   1 21 1k ak 2 , a22 k 1 1 31 1 41 ,  a    1k ak 4 ;  1k k 3 14 a  a33 k 1 44 k 1 из второй   21  0 ,  22  1 1 31 1 41 ,  23   ,  a     2 k ak 4 ;  2k k 3 24 a  a22 a33 k 2 44 k  2 из третьей   31  0 ,  32  0 ,  33  1 1 41 ,  34    3k ak 4 ; a33 a44 k 3 из четвертой   41  0 ,  42  0 ,  43  0 ,  44  1 . a44 Заметим, что все элементы обратной матрицы  ij , стоящие под главной диагональю ( i  j ) , равны нулю, т.е. полученная A1 будет также верхней треугольной. Если A имеет порядок n , то элементы обратной ей матрицы находятся последовательно по аналогичным формулам: 6 1 , если i  j; aii  ij  0, если i  j;  ii   ij   1 a jj j 1  k 1 ik akj , если i  j. (1) (2) (3) В последней формуле под знаком суммы - произведения элементов, стоящих в матрице A1 левее определяемого элемента, на соответствующие элементы того столбца матрицы A , в котором стоит определяемый элемент. Применяя формулу (3), надо иметь в виду, что будут равны нулю те произведения, в которых первый индекс элемента матрицы A1 больше его второго индекса (или положить, как и для матрицы четвертого порядка, k  i ). Рассуждая так же, как и при обращении верхней треугольной матрицы, получим формулы для определения элементов матрицы  11   1 B   21 .    n1 0  22 .  n2 ... 0   ... 0  , . .   ...  nn  являющейся обратной нижней треугольной матрице  b11 0 ... 0     b21 b22 ... 0  . B  . . . .    b  b ... b nn   n1 n 2 Последовательно находим :  ij  0, если i  j; 1  ii  , если i  j; bii 7 (4) (5)  ij   1 bii i 1  k 1 b , если i  j. (6) kj ik В последней формуле под знаком суммы – произведения элементов, начиная с первого элемента того столбца, в котором находится определяемый элемент, на соответствующие элементы той строки матрицы B , в которой стоит определяемый элемент. Здесь будут равны нулю те произведения, в которых первый индекс элемента матрицы B 1 меньше его второго индекса. 1.2. Разложение квадратной матрицы на произведение двух треугольных (факторизация) и ее обращение Любую квадратную матрицу C = cij, i = 1, 2, …, n, j = 1, 2, …, n, можно единственным образом представить в виде произведения двух треугольных матриц – нижней и верхней, если выполняются следующие условия: 1) диагональные элементы одной из треугольных матриц не равны нулю; 2) главные диагональные миноры отличны от нуля. Пусть надо провести факторизацию матрицы C третьего порядка. Запишем исходную матрицу в виде произведения двух треугольных:  c11 c12   c21 c22 c  31 c32 c13   b11 0 0   a11 a12    c23    b21 b22 0   0 a22 c33   b31 b32 b33   0 0 a13   a23  . a33  Используя правило умножения матриц и исходя из определения равенства матриц, получаем три системы линейных уравнений, сравнив соответствующие элементы строк: 8 c11  b11a11 ,  c12  b11a12 , c  b a ,  13 11 13 c21  b21a11 ,  c22  b21a12  b22 a22 , c  b a  b a , 21 13 22 23  23 c31  b31a11 ,  c32  b31a12  b32 a22 , c  b a  b a  b a .  33 31 13 32 23 33 33 В общем случае можно получить n 2 уравнений для определения n 2  n неизвестных bij (i  j ) и aij (i  j ) . Пользуясь произвольностью выбора значений n неизвестных, положим, например, в матрице B все диагональные элементы равными единице: b11  b22  b33  1 . Тогда матричное уравнение и соответствующие ей системы линейных уравнений примут вид  c11 c12   c21 c22 c  31 c32 c11  a11 ,  c12  a12 , c  a , 13  13 c13   1 0   c23    b21 1 c33   b31 b32 c21  b21a11 ,  c22  b21a12  a22 , c  b a  a , 21 13 23  23 0   a11 a12  0   0 a22 1   0 0 a13   a23  , a33  c31  b31a11 ,  c32  b31a12  b32 a22 , c  b a  b a  a . 31 13 32 23 33  33 Из первой системы получаем, что элементы первой строки матрицы A , равны соответствующим элементам исходной матрицы. Из первых уравнений следующих двух систем получаем элементы первого столбца матрицы B ( i  1, b11  1 ). Далее находим элементы второй строки матрицы A ( j  1, a21  0 ), затем – элементы второго столбца матрицы B ( i  2, b22  1 ) и, наконец, последний элемент третьей строки матрицы A . Объединяя решения, получим следующие формулы для последовательного нахождения элементов строк матрицы A (i  j ) и элементов столбцов матрицы B (i  j ) : 9 i 1 aij  cij   bik akj , i  j , (7) k 1 j 1 bij  (cij   bik akj ) / a jj , i  j . (8) k 1 Эти формулы верны для представления квадратных матриц любой размерности (nn) в виде произведения двух треугольных. Отметим последовательность, в которой определяются элементы треугольных матриц: сначала заполняется строка матицы A , потом - столбец с таким же номером матрицы B . Для квадратных матриц, разложенных на произведение двух треугольных, с вычислительной точки зрения представляет интерес следующая теорема. Теорема 1. Пусть В и A– две квадратные матрицы одинаковой размерности и C = ВA. Тогда C1 = A1В1. (9) Доказательство. Умножим равенство C = ВA последовательно на В-1 и A-1 слева: A1В1 C = A1В1 ВA. Получим A1В1C=Е. Откуда C1 = A1В1. Следствие. Если А=А1 А2 … Аn , то А1 =Аn1 Аn11 Аn21 … А11. Формула (9) дает еще один способ получения обратной матрицы. Однако можно найти матрицу, обратную данной, минуя определение матриц В-1 и A-1 , обратных тем треугольным, в виде произведения которых представлена исходная матрица C . Умножим обе части (9) слева на матрицу A : AC 1  AA1 B 1  AC 1  B 1 (10) Умножим обе части (9) справа на матрицу B : C 1 B  A1 B 1 B  10 C 1 B  A1 . (11) Элементы матрицы C будем обозначать cij , а элементы ей обратной матрицы -  ij , элементы треугольных матриц A и B и им обратных обозначим соответственно a ij , bij ,  ij и  ij . Тогда в развернутом виде формула (10) примет вид: 0 ... 0   a11 a12 ... a1n    11  12 ...  1n   1       0 a22 ... a2 n    21  22 ...  2 n   b21 1 ... 0  =  . . . .  . . . .   . . . .       0 0 ... ann    n1  n 2 ...  nn   bn1 bn 2 ... 1   Используя правило умножения матриц и условие равенства двух матриц, получим формулы для определения диагональных элементов и элементов, стоящих над главной диагональю ( i  j ) , матрицы C 1 :  nn  1 ann и  ii   ij   n 1   1   aik  ki  при aii  k i 1  1 aii n a k i 1 ik  kj , i  j . i  n, (12) (13) Для определения элементов матрицы C 1 , стоящих под главной диагональю ( i  j ) , используем в развернутом виде формулу (11). 0 ... 0   11 12 ... 1n    11  12 ...  1n   1        21  22 ...  2 n   b21 1 ... 0   0  22 ...  2 n  = .  . . . .  . . . .  . . . .         b   0   ...  b ... 1 0 ...  n2 nn   n1 n2 nn   n1   11 Опять на основе правила умножения матриц и условия равенства двух матриц получим: n  ij     ik bkj , i  j . (14) k  j 1 Из полученных формул видно, что элементы обратной матрицы C выражаются через элементы тех треугольных матриц, в виде произведения которых представлена данная матрица C , а также через уже вычисленные элементы обратной матрицы. Поскольку между элементами матрицы C 1 существует зависимость, определенная формулами (12) - (14), укажем последовательность, в которой следует вести вычисление элементов  ij . Сначала следует 1 определить элементы последней строки матрицы C 1 , начиная с последнего элемента  nn , затем - элементы последнего столбца, начиная тоже с последнего. Далее аналогично заполняется предпоследняя строка, затем предпоследний столбец матрицы C 1 и т.д. Отметим, что для представления квадратной матрицы в виде произведения двух треугольных, можно рассмотреть и другие случаи. Например, положить равными единице диагональные элементы матрицы A или поменять порядок сомножителей – нижнюю и верхнюю треугольные матрицы. Относящиеся к этим случаям формулы можно получить самостоятельно. 12 2.Блочные матрицы и их применение к решению систем линейных уравнений Системы линейных уравнений решаются матричным методом, методами Крамера, Гаусса. Эти методы хороши для систем малой размерности или в том случае, когда надо определять все неизвестные. Если требуется найти часть неизвестных, то удобно использовать разбиение матрицы на блочные. Пусть дана система линейных уравнений a11 x1  a12 x2  ...  a1n xn  y1  . . . .  . a x  a x  ... a x  y , nn n n  n1 1 n 2 2 (1) которую надо решить относительно первых k неизвестных х1, х2, …,  x1    хk. Обозначим через Х матрицу неизвестных  ...  , через Y – столбец x   n  y1    свободных членов  ...  , через А – матрицу коэффициентов аij, y   n i = 1, 2, …, n, j = 1, 2, …, n. Представим матрицы А, Х, Y следующим образом: a11 ... a1k a1, k 1 ... a1n   . . .  . . .   a k1 ... a kk a k , k 1 ... a kn А a k 1, k 1 ... a k 1, n  a k 1,1 ... a k 1, k  . . .  . . .   a n1 ... a nk a n, k 1 ... a nn  13         A1  A2  ,   A3  A4       x1   y1       ...   ...   x  X   y  Y  X   k    1  , Y   k    1  .  xk 1   X 2   yk 1   Y2   ...   ...       xn   yn  От обычных матриц перейдем к блочным матрицам, и тогда система (1) примет вид  A1   A3 A2  X1   Y1    . A4  X 2   Y 2  (2) По правилу умножения матриц получаем  A1 X 1  A2 X 2  Y1 ,   A3 X 1  A4 X 2  Y2 . Отсюда выражаем X2 = A41(Y2  A3X1) и подставляем в первое уравнение системы: Y1 = A1X1 + A2A41(Y2  A3X1) = A2A41Y2 + ( A1  A2A41 A3) X1 или Y1 A2A41Y2 = (A1 A2A41 A3) X1. Тогда X1= (A1A2A41 A3)1 (Y1 A2A41Y2), (3) т. е. получили матричное уравнение относительно неизвестных х1, х2, …, хk. Значения хk+1, хk+2, …, хn искать не надо. При решении линейных систем возможна ситуация, когда надо решить много уравнений малой размерности с одинаковыми коэффициентами. Пусть даны n линейных систем с m неизвестными в каждой системе, m значениями правой части и одной матрицей коэффициентов А размерности (mm). Тогда можно перейти к одному матричному уравнению АХ =Y, или 14  а11 ... а1m   x1    . .  .  . a    m1 ... amm   xm xm 1 ... xn( m 1)   y1   . .  . x2m ... xnm   ym ym 1 ... yn( m 1)   . . . y2m ... ynm  Первый столбец в матрице Х соответствует неизвестным первой системы, второй – неизвестным второй системы и т. д. Аналогично, первый столбец в матрице Y соответствует правой части первой системы, второй – правой части второй системы и т. д. Тогда решение всех систем можно найти по формуле Х = А1Y. 15 3. Функции от матриц Вспомним, для того чтобы возвести матрицу А в степень n, надо умножить ее на себя n раз: Аn = ААА … А. Если матрица А диагональная, то в степень возводятся диагональные элементы. 3.1. Теорема ГамильтонаКэли Напомним, что собственным числом  матрица А называется число, удовлетворяющее при ненулевом векторе х уравнению (А   Е) х = 0, а характеристическим уравнением называется уравнение det(А   Е) = 0. Раскрывая определитель, получим характеристический многочлен с(  ) = det(А   Е) по степеням  . Теорема ГамильтонаКэли имеет несколько формулировок [4]. 1. Если А – квадратная матрица с характеристическим многочленом с(), то с(А) = 0. Доказательство. с(А) = det(A – AE) = det(A – A) = det(O) = 0, где О – нулевая матрица. 2. Каждая квадратная матрица удовлетворяет своему характеристическому уравнению. 3. Если А есть самосопряженный оператор с матрицей коэффициентов А и с() = det(А –  ), то с(А) = 0. Доказательство. Если А – самосопряженный оператор, то его собственное число  является корнем характеристического уравнения, т. е. с(  ) = 0 и с(А) = 0. Теорема доказана. Распишем с(  ). с(  ) = det(A   E) = (–1)n  n + (–1)n–1A1  n–1 + + (–1)n–2A2  n–2 + …+(–1)An–1  + An = 0. В этом выражении: n – порядок матрицы А, A1 – сумма всех диагональных миноров первого порядка, 16 (1) A2 – сумма всех диагональных миноров второго порядка и т. д., An – сумма всех диагональных миноров n-го порядка. Уравнение (1) имеет n-ю степень, поэтому оно имеет n корней. Определение. Следом матрицы SpA (или TrA) называется сумма ее диагональных элементов SpA  n  aii . i 1 Введем обозначения. Пусть SpA = S1, SpA2 = S2, …, SpAk = Sk. Коэффициенты в выражении (1) определяются по формулам [3]: A0 = 1, A1 = A0S1, A2 = (A1S1 – A0S2)/2, A3 = (A2S1 – A1S2 + A0S3)/3, n A4 = (A3S1 – A2S2 + A1S3 – A0S4)/4, …, Ak =  1 (1) k 1 An  k S k . n k 1 (2) В этом случае обратную матрицу можно найти следующим образом. По теореме ГамильтонаКэли с(А) = 0 или c(А) = (–1)nАn + (–1)n–1A1Аn–1 + (–1)n–2 A2Аn–2 +…+(–1)An–1A + AnE = 0. (3) –1 Умножим (3) слева на А . Тогда (–1)n А–1Аn + (–1)n–1А1 A–1Аn-1 + (–1)n–2A2 А–1 Аn–2+…+(–1)An–1 А–1A + + An А–1E = 0 и окончательно получаем, что А-1 = – ((–1)nАn–1 + (–1)n–1A1Аn–2+…+(–1)An–1 Е)/An. 3.2. Интерполяционные многочлены 3.2.1. Многочлены Лагранжа и теорема Сильвестра Пусть заданы система произвольных чисел а1, а2, а3,…, аn и многочлен (n1)-й степени Рn1(x). Надо построить интерполяционный многочлен степени (n1), который бы связал числа аi (i = 1, 2, …, n) и известные значения многочлена Рn1(аi). Такой многочлен называется интерполяционным многочленом Лагранжа [4] и имеет вид 17 n  ( x  as ) P( x)  s 1 s i n n  Pn 1(ai ) i 1 ,  (ai  as ) s 1 s i n где  (.)  произведение соответствующих множителей по всем s 1 s i s = 1, …, n, s  i. Рассмотрим многочлен от матрицы n  ( А  as Е ) P( А)  n  i 1 s 1 s i Pn 1 (ai ) n . (4)  (ai  as ) s 1 s i Из теоремы Гамильтона–Кэли следует, что многочлен Pn+p(A), степени большей n, может быть выражен с помощью матричного полинома степени (n1). В самом деле, воспользуемся формулой (1): с(  ) = det(A   E) = = (1)n  n+(1)n1A1  n1+(1)n2A2  n2+…+(1)An1  +An = 0. Пусть с(  ) = 0 – характеристическое уравнение. Тогда, если с(А) = 0, то  n = A1  n1 A2  n2+…+(1)n2An1  +(1)n1An и Аn = A1Аn1  A2 Аn2 +…+(1)n2An1 A + (1)n1An E. 18 Последовательные умножения этих равенств на  p и Ap дадут  n+p = A1  n+p1  A2  n+p2 +…+(1)n2An1  p+1 + (1)n1An  p ; Аn+p = A1Аn+p1  A2 Аn+p2 +…+(1)n2An1 Ap+1 + (1)n1An E Ap . Слагаемое A1  n+p1 можно переписать в виде A1  n+p1= = A1  p  n1=A1  n1. По аналогии также перепишутся все остальные. Следовательно,  n+p и Аn+p могут быть выражены как функции от  , …,  n1 и А,…,Аn1 соответственно. Пусть f()=Pn1() и f(A)=Pn1(A), где Рn1(х) – многочлен степени (n1). Применим к Pn1(A) формулу (4). Предположив, что i  j, i  j, i = 1, …, n, j = 1,…, n, напишем формулу, которая выражает теорему Сильвестра: n  ( А  s Е) f ( А)  n f i 1 ( i )Z i , Z i  s 1 s i n , (5)  ( i   s ) s 1 s i где i – cсобственные числа матрицы А. Матрица Zi имеет следующие свойства: 1) Матрица Zi вырождена, rang(Zi) = 1.  0, i  j , 2) Zi Z j    Z i , i  j. 3) Zi m = Zi , т. е. это свойство является следствием второго. Пусть функция (x) раскладывается в степенной ряд, сходящийся при x < R. Обозначим этот ряд через f(x). Тогда формула (5) показывает, что f(A) сходится в том только случае, когда все ряды f(i) сходятся. Это положение позволяет применять теорему Сильвестра не только к многочлену, но и к функции, представимой степенным рядом. 19 Следствия из теоремы Сильвестра: 1. Пусть f()  1. Тогда n  Zi  E . i 1 n 2. Пусть f(А)=А. Тогда  i 1 f ( i ) Z i A, следовательно, n  i Zi  A . i 1 Пример 1. Применить формулу (5) к вычислению матричного  11  6 2    2 многочлена (А) = А + 3А + Е, где матрица A    6 10  4  .  2 4 6    Найдем собственные числа этой матрицы по формуле det(A E) = 0 и расположим их в порядке убывания. Получим 1 = 18, 2 = 6, 3 = 3. Тогда (1) = 182 + 3  18 + 1 = 379, (2) = 92 + 3  9 + 1 = 55, (3) = = 32 + 3  3 + 1 = 19. Найдем Z1, Z2, Z3.  11  6 2   6 0 0   11  6 2   3 0 0            6 10  4    0 6 0     6 10  4    0 3 0   2  4 6   0 0 6   2  4 6   0 0 3     Z1   (18  6)(18  3)  4 4 2   1    4 4  2 ; 9   2 2 1   11  6 2  18 0 0   11  6 2   3 0 0            6 10  4    0 18 0     6 10  4    0 3 0   2  4 6   0 0 18   2  4 6   0 0 3     Z2   (6  18)(6  3) 2  4  4  1   2 1  2 ; 9   4  2 4  20  11  6 2  18 0 0   11  6 2   6 0 0           6 10  4  0 18 0   6 10  4  0 6 0             2  4 6   0 0 18   2  4 6   0 0 6     Z3   (3  18)(3  6)  1 2 2  1   2 4 4 . 9   2 4 4  195  152 64    Тогда ( A)    152 183  88  .  64  88 75   Формулу (5) для функции f(A) можно представить в другом виде – в виде формулы Бэкера. 3.2.2. Формула Бэкера Вернемся к формуле (4). Произведения, стоящие в числителе и знаменателе, можно записать через определители D и Di. В этом случае формула (5) перепишется в виде [3,4] D D D (6) f ( A)  n 1 An 1  n  2 An  2  ...  0 E , D D D где D – определитель Вандермонда, 1 1 ... 1   2 ...  n , Dr1 – это определитель D, в котором D 1 . . . . n11 n21 ... nn1 r-я строка заменена на строку ((1), (2), … , (n)), i = 1, …, n. Формула (6) называется формулой Бэкера. 1 0  . Пример 2. Вычислить еА, A   0 2 21 а) прямой ход: Разложим еА в степенной ряд: ех  1 Тогда е A  E   n х х2 хn x .   ...   ...  1! 2! n! n! n 0   n A A2 An A . Матрица А – диаго  ...   ...  1! 2! n! n! n 0  n 1n 1 0    нальная, следовательно, A   0  0 2  n 0  2n    1    0    e 0  An 1  1 0   n  0 n! A   и       n 2   e ;  n 0 2 0 e n ! n ! 2      n 0 n 0   0  n ! n 0       б) по формуле Сильвестра (5): так как матрица А диагональная, то ее собственные числа известны и e A  e1 Z1  e  2 Z 2 , 1  1,  2  2 . Найдем Z1, Z2. 1 0  2 0 1 0 1 0         0 2  0 2 1 0 0 2   0 1   0 0    ; Z 2   . Z1      1 2 2 1  0 0 0 1 Тогда 1 0 2 0 0  e 0    e     e A  e1 2  ; 0 0 0 1 0 e  в) по формуле Бэкера (6): D D f ( A)  1 A  0 E, D D 22 где D 1 1 1 1 1  , D1   1  2 1 2 e 1 D0  e 1 1 1 e 2  1 e 1  e 2  e, e2 e 2 e e2   2e  e 2 . 2 1 2 Тогда f ( A)  е 2  е  1 0  2е  е 2  1 0   е 0      . 1  0 2  1  0 1   0 е 2  3.2.3. Случай недиагональной матрицы Мы рассматривали случаи, когда матрица А была диагональной. Если матрица А не является такой, то в базисе, состоящем из собственных векторов, соответствующих попарно различным собственным числам  1, …,  n, она имеет диагональный вид  1 0  A'   0  2 0 0  0  0   diag (1 ,  2 ,  3 ) .  3  Так как любую матрицу можно рассматривать как матрицу некоторого линейного отображения, а изменение матрицы такого отображения при замене базиса осуществляется по формуле А= H1AH, где Н – невырожденная матрица перехода от старых координат к новым, то можно подобрать такую невырожденную матрицу Н, для которой матрица Н1АН будет диагональной, причем на диагонали будут стоять указанные собственные числа. Если у характеристического уравнения не все корни вещественны и для некоторого корня найден соответствующий собственный вектор, то этот вектор не будет иметь геометрического смысла, но в общем случае матрица Н может быть комплексной. 23 Если у характеристического уравнения заданной матрицы имеются равные корни, то в общем случае такая матрица к диагональному виду не приводится. При замене базиса матрица А меняется по формуле А= H1AH, но характеристическое уравнение остается без изменения. В самом деле, det( A'I )  det( H 1 AH   I )  det( H 1 ( A   I ) H )  1 det( H 1 ) det( A   I ) det( H )  det( A   I ) det( H )  det( A   I ). det H Матрицы А и А называются сопряженными и получаются одна из другой с помощью матрицы перехода Н . Более того, определители матриц А и А равны. В самом деле, det( A' )  det( H 1 AH )  det( H 1 ) det( A) det( H )  1  det( A) det( H )  det( A). det H 3.3. Высокие и дробная степени матрицы Применим формулу Сильвестра к матрице Ар. Получим n  ( А  s Е) Ар  n  i 1 s 1 s i  pi Z i , Z i  n .  ( i   s ) s 1 s i Следовательно, Zi не зависит от р. Предположим, что n корней характеристического уравнения расположены по убывающим модулям 12 … n. Если р очень велико, то можно пренебречь 2р, …, np по сравнению с 1р. Тогда 24 А р  1р Z1  n A  s E . 1   s s 1  s i  11  6 2   428     6 10  4  Пример 3. Приближенно вычислить A  2 4 6    428 . Как известно (см. пример 1), 1 = 18, 2 = 6, 3 = 3 и  4 4 2   1 Z1    4 4  2  . 9   2 2 1  Тогда А 428  18 428  4 4 2   1    4 4  2 . 9   2 2 1  Пусть задана матрица А размерности (22). Формула Сильвестра (5), примененная к (А) = А12, дает (А) = А12 = 11/2Z1 + 21/2Z2. По аналогии можно записать (А) = А1/m = 11/mZ1 + 21/mZ2+ … + = = n11/mZn1+n1/mZn, i  j, i = 1, 2, …, n, j = 1, …, n. В общем случае существует mn корней m-й степени из матрицы порядка (nn), если все собственные числа различны. В противном случае имеем бесчисленное множество корней [4]. 25 4. Дифференцирование и интегрирование матриц Пусть задана матрица А(t) = аij(t), где i = 1, …, n, j = 1, …, n. Продифференцировать матрицу А – значит продифференцировать каждый элемент этой матрицы, т. е. d d  A(t )  DA   aij (t )  . dt  dt  Проинтегрировать матрицу А – значит проинтегрировать каждый элемент этой матрицы, т. е. t  t  A()d  QA  aij ()d, i  1,..., n, j  1,..., n . t0 t0 Пример 4. Проинтегрировать и продифференцировать матрицу  t 2 sin 2t  . A 1 t    2t 2 cos 2t  , а Сначала продифференцируем матрицу А: DA   1  0 теперь проинтегрируем матрицу А в пределах от нуля до t. В итоге t  t 2 dt  имеем QA   0 t   dt   0    sin 2tdt    3  0    t / 3  cos(2t ) / 2  . t 2    t t / 2  tdt   0  t   26 4.1.Правила дифференцирования и свойства интегрирования матриц Если соответствующие матричные действия имеют смысл, то 1) производная суммы матриц равна сумме производных d d d ( A(t )  B(t ))  A(t )  B(t )  A' (t )  B' (t ) ; dt dt dt 2) если С – матрица постоянных, то d С = 0; dt 3) производная произведения (С – матрица постоянных) зависит от порядка следования матриц: 3.1) d (СА) = СА(t); dt 3.2) d (АС) = А(t)C; dt 3.3) d (А(t)B(t)) = A(t)B(t) + A(t)B(t); dt 4) производная обратной матрицы имеет вид (A1(t)) = A1(t) A(t)A1(t). Пусть А(t) – невырожденная матрица, А1(t) – обратная матрица, т. е. A(t)A1(t) = E. Продифференцируем обе части этого равенства по t: (A(t))A1(t) + A(t)(A1(t)) = 0 Окончательно получаем (A1(t)) = A1(t) A(t)A1(t); 5) введем производную скалярного произведения. Пусть задано скалярное произведение V(t) = (x(t), y(t)) = (y(t)*, x(t)), где х(t), у(t) – непрерывно дифференцируемые функции на отрезке [a, b]. Тогда производная V(t) = (x(t), y(t)) + (x(t), y(t)); 27 6) введем производную степени. Пусть Y ' (t )  Y (t )  X (t )m  X (t ) X (t ) ... X (t ) . Тогда производная m 1  X i (t ) X ' (t ) X mi 1(t ) . Если матрицы коммутируют, т. е. i 1 X (t ) X ' (t )  X ' (t ) X (t ) , то Y ' (t )   mX ' (t )X (t ) m 1 m 1  X i (t ) X ' (t ) X m i 1(t )  i 1 ; 7) выведем производную матричного ряда. Пусть а) задана последовательность матриц одного и того же типа Fp(t) = (fij(p)(t)), где fij(p)(t) – непрерывно дифференцируемые на отрезке [a, b] функции и р = 1, 2, …., i = 1, …, n, j = 1, …, m;  б) матричный ряд  F p (t ) сходится при t  (a, b); p 1   F p ' (t ) сходится равномерно на (а, b), в) ряд производных p 1  т. е. все функциональные ряды  dt f ij( p) (t ) d p 1 на (a, b). Тогда верна формула     d F p (t )  F p ' (t ) ; dt p 1 p 1 28 равномерно сходятся 8) введем производную вектор-функции  f1 ( x)    f 2 ( x)   f ( x)  ,  ...     f m ( x) где fi ( x)  fi ( x1, x2 ,..., xn ) есть функция n переменных. Если fi (x)  непрерывно дифференцируема, то под производной такой функции по вектору x понимается матрица Якоби  f1  x f i ( x)  1 f  f ' ( x)   . xk x  f m  x  1 f1   xn  . . ; f m  ... xn   ... 9) выведем производную сложной функции. Пусть u  f ( x), u  (u1, u2 ,..., um ), x  ( x1, x2 ,..., xn ), где x  (t ), t  (t1, t 2 ,.., t p ) , причем функции f ( x), (t )  непрерывно дифференцируемы. По правилу дифференцирования сложной функции получаем n dui ui xs  , i  1, ..., m, k  1, ..., n . dt k s 1 xs t k Используя правило умножения матриц, получим: ui xs   ui  xs  u   ,   t  s x s t k   x s  t k  т. е. d dx . f ( x)  f ' ( x) dt dt   29 Перейдем к свойствам интегралов от матриц: t  1) Если F(t) = Ф(t), то F ()d   (t )   (t 0 ) . t0 2) Если С – это матрица постоянных, то t  t  CF ()d C F ()d t0 t и t0 t  F ( )Cd  F ()dC . t0 t0  3) Если функции F(t), G(t) непрерывны на [t0, t], то t  t t   t0 t0 [ F ()  G ()]d  F ()d  G ()d . t0 4) Если функции F(t), G(t) дифференцируемы на [t0, t], то получим формулу интегрирования по частям: t  t  F ()G ' ()d  F (t )G (t )  F (t 0 )G (t 0 )  F ' ()G ()d . t0 5) Оценка модуля интеграла t0 t t t0 t0  F ()d   F () d . 30 4.2. Приложение к решению дифференциальных уравнений 4.2.1. Решение систем линейных дифференциальных уравнений Дана система линейных дифференциальных уравнений первого порядка .  dx1  a11 x1  a12 x 2  ...  a1n x n  x1 ,   dt .  dx 2  a x  a x  ...  a x  x , 21 1 22 2 2 n n 2  dt  ...  dx .  n  a n1 x1  a n 2 x 2  ...  a nn x n  x n ,  dt (1) что в операторной форме равносильно выражению DA  AX , или dX  AX , где aij (t ) = a ji (t ) . dt d Предположим, что n = 1 и y  Ay, y(t 0 )  y0 . dt t Тогда  t0 d ydt  dt t  t Aydt , и y  y0  t0  Aydt , t0 t  или y  y 0  Aydt. (2) t0 Это интегральное уравнение можно приближенно решить методом последовательных приближений Пикара. t  Пусть операция интегрирования обозначена через Q  (.)dt . Тоt0 гда выражение (8) с использование рекурсии перепишется в виде 31 Y = y0 + QAy = y0 + QA(y0 + QAy) = y0 + QAy0 + QAQAy =…= = (E + QA + QAQA + QAQAQA +…)y0. Этот ряд быстро сходится [6]. Аналогично поступим с матричным уравнением: d X  AX , X (t 0 )  X 0 , dt t X (t )  X 0   AXdt. t0 По методу Пикара получим t ,t Х(t) = (E + QA + QAQA + QAQAQA +…) X0 =  0 ( A) X 0 , где t0 ,t ( A)  оператор интегрирования, примененный к матрице А. Окончательно X(t)= t0 ,t ( A) X 0 . (3) Свойства оператора t0 ,t ( A) X 0 : 1) t0 ,t0 ( A)  E . d t 0 ,t  ( A)  At 0 , t ( A) . dt 3) Если матрица А  матрица постоянных, то система ЛДУ запиdX шется в виде  AX . Решим ее и получим X 0  exp( A(t  t0 )) . dt Следовательно, сравнивая последнее равенство и (9), можно записать: 2) t ,t 0 ( A)  exp( A(t  t0 )) . (4) Тогда X (t )   t0 ,t ( A) X 0  exp( A(t  t 0 )) X 0 . 32 (5) Пример 5. Пусть n = 2 и собственные числа 1=a + b, 2 = a – b. Тогда по формуле Бэкера, рассмотренной выше, получим D 1 1 1  2b, D1  ( a  b)(t  t 0 ) a b a b e 1 e ( a  b )(t  t 0 )    2e a (t  t 0 ) shb(t  t 0 ), D0  e (a  b)(t  t0 ) ( a  b) e (a  b)(t  t0 )  2e a(t  t0 ) (ashb(t  t 0 )  bchb(t  t 0 )). ( a  b) Теперь найдем e A ( t t 0 )  D D1 A  0 E. D D 1 e a ( t t 0 ) e A(t t0 )  e a (t t0 ) shb (t  t 0 ) A  (ashb (t  t 0 )  bchb(t  t 0 )) E  b b a  a11  a  shb (t  t 0 )  chb(t  t 0 ) 12 exp( a(t  t 0 )) shb (t  t 0 )   b b .   a21  a22  a exp( a(t  t 0 )) shb (t  t 0 ) exp( a(t  t 0 )) shb (t  t 0 )  chb(t  t 0 )   b  b  Осталось подставить в (5) полученное значение exp( A(t  t0 )) . Если n > 2 и матрица А симметрическая, а ее коэффициенты не превосходят некоторой константы на отрезке [t0, t], вычисление экспоненты вызывает большие затруднения. В какой-либо степени избежать их поможет такой способ: разделим отрезок [t0, t] на s интервалов, в которых коэффициенты матрицы приближенно можно считать постоянными. По формуле (5) получим X s 1 (t )  exp( A(t  t0 )) X s . (6) 33 4.2.2. Решение линейного дифференциального уравнения n-го порядка Линейное дифференциальное уравнение n-го порядка имеет вид dn X dt n   n (t ) d n 1 X dt n 1   n 1 (t ) dn2 X dt n  2  ...  1 (t ) X  0 . (7) dX d n 1 X  X 2 (t ),...,  X n (t ) . Тогда уравdt dt n 1 dX n нение (7) перепишется в виде  1 X 1   2 X 2  ...   n X n , что dt равносильно уравнению Положим X (t )  X 1 (t ), d X n  [] X n , dt (8) где  0 1 0 ... 0     0 0 1 ... 0  . []   . . . . .        ...  n  1 2 3 (9) Решение такой системы можно найти, используя формулу (5) и заменяя матрицу А на матрицу []. Пример 6. Решить задачу Коши для уравнения d2 X dt 2  2t dX 6  X  0, X (0)  0,5, X ' (0)  0 . 1  t dt 1  t 2 2 Пусть X (t )  X 1 (t ), dX 2 2t 6 dX  X2  X1 .  X 2 (t ) . Тогда 2 dt dt 1 t 1 t2 0   6 Матрица []  А и []     1 t2 34 1  2t  .  1 t2  Решать будем по формуле (5). Найти экспоненту нелегко. Предположим, что t  [0; 0,1]. Коэффициенты во второй строке матрицы А будем считать на рассматриваемом отрезке приближенно равными некоторой константе, равной их среднему значению на этом промежутке: 1 a21  0,1 a22  1 0,1 0,1 6  1  t 2 dt  6,015, 0 0,1 2t  1  t 2 dt  0,1. 0 Тогда матрица А перейдет в матрицу А1, равную 1  0  и e 0,1 A1 X 0  X , A1     6,015 0,1  1 c ( )   0, 1, 2  0,05  2,45i.  6,015 0,1   Осталось подставить найденные значения в формулу (5), найти   0,5   x1   и продолжить первое приближение X 1     exp( 0,1A1 )   0   x2  процесс, полагая t  [0,1; 0,2] , и так далее до конца отрезка. 35 5. Нормы векторов и матриц Приведем некоторые предварительные определения. Определение 1. Кольцом называется множество Х элементов a, b, …, c, для которых определены две бинарные операции – сложение и умножение – такие, что 1) a + b = b + a; 6) (ab)c = a(bc); 2) a + 0 = a; 7) a(b + c) = ab + ac; 3) a + (b + c) = (a + b) + c; 8) (b + c)a = bа + ca; 4) a + (a) = 0; 9) a  0 = 0. 5) a  b= c, c X; Определение 2. Если кольцо содержит левую единицу, то 1а = а. Если кольцо содержит правую единицу, то а1 = а. Если содержит обе единицы, то правая равна левой единице, единица единственная и говорят о кольце с единицей. Определение 3. Левым обратным элементом называется такой элемент аl1, для которого верно равенство аl1а = 1. Правым обратным элементом называется такой элемент аr1, для которого верно равенство aаr1 = 1. Если аl1 = аr1= а1, то говорят, что элемент а имеет обратный элемент. Определение 4. Поле – это кольцо с единицей, которое содержит хотя бы один ненулевой элемент и для каждого а  0 существует элемент а1 такой, что аа1 = а1а = 1. Определение 5. Множество Х называется метрическим пространством, если каждой паре его элементов (х, у) поставлено в соответствие неотрицательное вещественное число x(х, у), удовлетворяющее условиям: 1) х(х, у) = 0 тогда и только тогда, когда х = у – аксиома тождества; 2) х(х, у) = х(у, х) – аксиома симметрии; 3) х(х, у) + х(у, z)  х(х, z) – аксиома треугольника. 36 Число х(х, у) называется расстоянием между элементами х и у (метрикой пространства Х), 13 – аксиомами метрики. Из аксиом метрики легко получается обратное неравенство треугольника | x(х, z)  х(у, z)|  х(х, у). Доказательство. х(х, z)  х(х, у) + х(у, z). Следовательно, х(х, z)  х(у, z)  ≤ х(х, у). Воспользуемся второй аксиомой для х и у, получим  (х(х, z)  х(у, z))  х(у, x) = х(х, у). Следовательно, х(х, у)  х(у, z) х(х, у). Теорема 1. Если последовательность точек {xn} метрического пространства Х сходится к точке х  Х, то любая подпоследовательность {xnк} последовательности {xn} сходится к этой точке. Обозначим через x  ( x1 , x2 , ..., xn ), y  ( y1 , y 2 , ..., y n ) векторы x  X , y Y . Определение 6. Расстоянием между множествами Х и Y называется inf x X , yY x y . Определение 7. Матрица А, принадлежащая пространству Сnn комплекснозначных матриц размерности (nn), называется нормальной, если АА* = А*А, где А*  это транспонированная матрица, комплексно сопряженная к А. Определение 8. Матрица А называется эрмитовой, если А = А*; косоэрмитовой, если А = А*; унитарной, если Е = AA*, где Е – единичная матрица. Можно сделать вывод, что унитарная матрица невырожденная, А1 = А*. Определение 9. Если собственному числу  соответствует m  1 линейно независимых собственных векторов, то m называется геометрической кратностью собственного числа. 37 Определение 10. Квадратная матрица А называется простой, если для каждого собственного значения матрицы А его кратность равна геометрической кратности. В противном случае матрица называется дефектной. 5.1. Матричные нормы Определение 11. Функция с вещественными значениями, определенная на всех квадратных матрицах А с комплексными элементами, называется матричной нормой и обозначается как А , если она удовлетворяет аксиомам: 1) А  0 и А = 0, если матрица А нулевая; 2) СА  С А , С – комплексное число; 3) А  В  А  В ; 4) АВ  А  В , матрицы А и В квадратные, одного порядка. Определение 12. Обобщенная матричная норма – это вещественнозначная функция, удовлетворяющая условиям 13, но не обязательно условию 4. Таким образом, любая матричная норма является обобщенной, но не наоборот. Пусть А и В – две квадратные матрицы одного порядка. Для норм матриц верны следующие теоремы. Теорема 2. Обобщенная матричная норма непрерывно зависит от элементов матрицы, т. е. для любого сколь угодно малого положительного  существует ()  0 такое, что A  B <  как только aij – bij< , i = 1, …, n, j = 1, …, n. Доказательство. Для доказательства потребуется неравенство A  B  A B . 38 Пусть Еij – матрица, имеющая единицу на месте (i, j) и нули на A B  всех остальных местах. Тогда n  (aij  bij ) Eij . Пусть i , j 1 k  max Eij  0 (по аксиоме 1). Тогда аксиомы 13 дают i, j n  (aij  bij )Eij   aij  bij A B  i , j 1 Eij  k  aij  bij ij . ij Для любого сколь угодно малого положительного  определим () = /(kn2). A B  k Следовательно,   kn2   и A B  A B  . ij A B Следовательно,   как только aij – bij< . Теорема доказана. Существует много матричных норм. Рассмотрим некоторые из них [4]: 1) A   aij . ij  2) A  { 2 aij }1 / 2  евклидова норма. ij Для евклидовых норм верны свойства: а) A E  n max aij . ij 2 б) A E  Sp( A* A) , где А*  транспонированная матрица, элементы которой комплексно сопряжены элементам матрицы А.  3) A p  { p aij }1 / p  норма Гельдера. Эта норма при 1  р  2 ij является матричной, при р  1 – обобщенной матричной нормой. 39 4) Обобщенной матричной нормой является норма A  max aij . ij Для любой матричной нормы выполняются следующие неравенства. 1) An  A . n Докажем это неравенство. Действительно n A n  A A A .... A  A A A ... A  А . 2) I  1 . По первой, например, норме имеем I   aij  n  1 . ij 3) A1  1 / A . Доказательство. I  AA1  A  A1 , I  1  A  A1  1 / I   A1  I /  I  A   1 / A . Теорема 3. Пусть A , N ( A)  любые две обобщенные матричные нормы, вычисленные в Сnn. Тогда существуют такие числа r1 > 0, r2 > 0, зависящие лишь от выбора норм, что для любой комплекснозначной квадратной матрицы А  0 размерности (nn) выполняется неравенство r1  A  r2 . N ( A) Определение 13. Множество собственных чисел матрицы А образует спектр матрицы. Пусть 1, … , n – собственные числа матрицы А, обозначим через  A  max  i , i  1,..., n – спектральный радиус матрицы А. i Теорема 4. Если А  Сnn, А – спектральный радиус, то при любой матричной норме А  А . 40 Доказательство. Пусть   собственное число матрицы А, А = . Тогда существует вектор х , не равный нулю, такой, что А х =  х . Определим квадратную (nn) матрицу Ах, равную Ах= ( х 0 … 0 ). Тогда ААх = Ах. Возьмем норму от обеих частей последнего равенства: ААх  А  Ах и Ах    Ах . Тогда   Ах  А  Ах . По определению, матрица Ах не равна нулю. Следовательно, норма ее тоже не равна нулю. Поэтому А     А  А   А . Теорема доказана. В теории матриц для последовательностей матриц существуют аналоги теорем сходимости матричных последовательностей. Теорема 5. Если А1, А2,…, Ар,… последовательность матриц из Сnn, то при любой обобщенной норме Ар  А при р  , что равносильно А р  А  0 при р  0. Доказательство. Введем метрику (А, В) = А  В . Сходимость определяется как А  lim Ap . Следовательно, A  Ap  0 при р   . p Теорема 6. Если А1, А2,…, Ар,…  последовательность матриц из Сnn и для каждого положительного числа N BN  N  i 1 N Ai , то  Ai сходится к i 1 матрице А при любой матричной норме ВN  A  0 при N  . 41 5.2. Векторные нормы Определение 14. Вещественнозначная функция h, определенная в n-мерном комплексном пространстве Cn, называется векторной нормой в Cn, если для любых векторов х и у из этого пространства выполняются следующие условия: 1) h( х )  0, h( х ) = 0, если х = 0; 2) h(с х ) = с h( х ), с  С; 3) h( х + у )  h( х )+ h( у ). Существует множество векторных норм, из которых выделим четыре [4]: 1) h( х ) = max xi ; i n 2) h( х ) =  xi ; i 1 n xi 1) h( х ) =    i 1  1/ 2 2     евклидова норма; 1/ p p n  xi  2) h( х ) = , p  1 – норма Гельдера.    i 1  Евклидова норма не меняет своего значения после поворота координатных осей относительно начала координат. Теорема 7. Векторная норма непрерывно зависит от координат вектора, т. е. для любого сколь угодно малого положительного  существует ()  0, такое, что h( х )  h( у )  как только xi  yi< , i = 1, …, n.  Доказательство. Пусть е i  единичный вектор-столбец, у которого единица стоит на i-м месте, а все остальные элементы – нули. Тогда 42 х у= n  ( xi  yi ) еi . i 1 Пусть K = max еi >0. i Тогда h( х  у ) = h( n  i 1 ( xi  yi ) n е i)  k  xi  yi . i 1 Выберем xi  yi <  = /(Kn). Тогда h( х  у ) (Kn) K = . Получаем h( х )  h( у ) h( х  у )  . Теорема доказана. Теорема 8. Пусть h( х ), ( х ) – любые две векторные нормы, вычисленные в Сn. Тогда существуют такие числа r1 > 0, r2 > 0, зависящие лишь от выбора норм, что выполняется неравенство r1  h( х )  r2 . (х) Теорема 9. Пусть векторы х 1, х 2, …, х n – последовательность векторов пространства Сn. Тогда при любой векторной норме х р  х при р  , или  х р  х   при р  . Доказательство. Введем метрику ( х , у ) = x  y . Введенное расстояние удовлетворяет всем условиям метрики (проверить!). Сходимость последовательности элементов определяется теперь как х  lim х р , p  т. е. х  х р  0 при р  . Теорема доказана. Теорема 10. Пусть векторы х 1, х 2, …, х n принадлежат пространству Сn и yN  N  n 1 N хn для любого положительного целого N. Тогда дится к х , или y N  x   при N  . Доказательство основано на теореме 1. 43  хn n 1 схо- 5.3. Согласованность норм Очень часто на практике встречается задача определения нормы вектора у = А х , А  Сnn, х  Сn, у  Сn. Определение 15. Векторная норма h и матричная норма А согласованы, если для любого вектора х  Сn и для любой матрицы А  Сnn выполняется неравенство h(А х )  А h( х ). Матричная норма М ( А)  n max aij согласована с векторными i, j нормами 1, 2, 3. Действительно, 1) h( х )  max xi ,  ( Aх ) max i i  max i 2) h( х )   n n   max k 1 i n  aik k 1 xk  n aik h( х )  M ( A)h( х );  aik h( х )  n max k ,i k 1 x j , h( Aх )  max ai , j x j  i 1 j 1  n  3) h( х )   xj  j 1   h 2 ( Aх )  n n n  j  n  aik xk (aij x j )  i 1 j 1 n n n  ai, j i 1 j 1 n n   M ( A) M ( A) xj  n x j  M ( A)h( х ); n n i 1 j 1 j 1 1/ 2 2 2  n    h (х)   x j .  j 1    n  n 2 2 n n  xk  aik aik xk  k 1 k 1      i 1 k 1 xj   2   i 1   2 .  M 2 ( A) 2 nh ( х )  M 2 ( A)h 2 ( х ) . Следовательно, h 2 ( Aх )  n 2 n 44 Окончательно получаем h( Aх )  M ( A)h( х ) . Также между собой согласованы евклидовы матричные и векторные нормы. В аналитической геометрии единичная сфера определяется множеством векторов из R3, для которых выполняется равенство х12 + х22 + х32 = 1, т. е. скалярное произведение ( х , х ) = 1, х = (х1, х2, х3). В общем случае, в пространстве Сn единичная сфера будет зависеть от выбора нормы. Определение 16. Сфера Jn в пространстве Сn с центром х 0 и радиусом r – это множество всех векторов х  Сn, для которых h( х  х 0 ) = r. Рассмотрим сферы в R2 для векторных норм 14, которые являются нормами Гельдера. Для первой нормы (h1) величина р равна бесконечности, для второй (h2) – единице, для третьей (h3) – двум, для четвертой нормы (h4) величина р точно не определяется, это общий случай. Докажем это. Пусть вектор х = (х1, х2, …, хn) и ( х ) = хi  абсолютные величины m координат. Рассмотрим общий случай. 1/ p  n p   h4 ( х )   xj     j 1      xi p 1/ p   x1 p  x2 p  ...  xn  p 1/ p  (m  1p   2p  ...   np m )   ( х ) m  1p   2p  ...   np m    ( х )m1 / p , т. е. h p ( х )   ( х ) при p  . x Здесь  i  k , h1  max xi  норма Гельдера при р  . xi i Покажем единичные сферы для четырех векторных норм (рис.1): 1) p = 1, h2; 2) p = 2, h3; 3) p = , h1. 45 х2 (3) 1 (1) (2) (3) х1 1 Рис.1 Определение 17. Выражение t х +(1 – t) у , t  [0, 1], называется прямым сегментом. Определение 18. Множество векторов L  Cn выпукло, если вместе с векторами х и у из L принадлежит L и элемент t х + (1 – t) у , t  [0, 1]. Определение 19. Единичным шаром Bh в пространстве Сn с векторной нормой h( х ) называется множество точек на единичной сфере и внутри неё, т. е. х  Bh, х  Сn, что h( х )  1. Теорема 11. Если h( х ) – векторная норма в Сn, то единичный шар Bh есть выпуклое множество. Доказательство. Пусть х  Bh, у  Bh. Тогда z = t х +(1 – t) у , t [0, 1]. Надо доказать, что z  Bh. По аксиомам векторной нормы h( z ) = h(t х + (1 – t) у )th( х ) + 1 – th( у ), h( х ), h( у )  1. Следовательно, h( z ) t + (1 – t) = 1. Следовательно, z  Bh. Следствие. Множество х  Сn, для которых h( х  х 0) = r есть шар с центром в х 0 и радиусом r. Этот шар – выпуклое множество. 46 Доказательство основано на том, что метрика инвариантна относительно сдвига, т. е. ( х , у ) = ( х + z , у + z ). Вводится метрика h( х + у ), проверяются аксиомы, и доказательство сводится к повторению рассуждений доказанной выше теоремы. Пусть h( х ) – векторная норма в Сn, матрица А  Сnn. Тогда отношение h(A х )/h( х ) больше нуля для любого ненулевого вектора х из пространства Сn. Определение 20. Индуцированной матричной нормой называется норма h( Aх ) . А  sup x 0 h( х ) Для этой нормы верны свойства: 1) A  max h( Aх ) ; h( х ) 2) существует вектор х 0 , зависящий от матрицы А, такой, что h( х 0 ) = 1 и А = h(А х 0 ). Значение индуцированных норм частично объясняется следующей теоремой. Теорема 12. Если Oh – единичная сфера в Cn с векторной нормой h( х ), то 1) A  max h( Aх )  матричная норма; хOh 2) векторная норма h( х ) и матричная норма A  max h( Aх ) соh( х ) 1 гласованы; 3) если N – любая согласованная с h матричная норма, то А  N (A) для всех АСnn, A  max h( Aх ) . h( х ) Определение 21. Мерой «удаления» матрицы А от вырожденности (detA = 0) является нижняя грань матрицы А относительно векторной нормы h h( Aх ) glb h ( A)  inf . х  0 h( х ) 47 Если h( х )  1 , то glb h ( A)  min h( Aх ) . h( х ) 1 Существует такой вектор у 0 (А), что h( у 0 )=1 и glb h ( A)  h( Aу0 ) . Ранее было доказано, что A1  1 / A , если detA  0, то A1   . Теорема 13. Если A  матричная норма, индуцированная векторной нормой, то нижняя грань  1 , если det A  0,  glb h ( A)   A 1   0, если det A  0. Доказательство. Пусть det A  0. Определим у = А х . Тогда для любого х  0 существует у  0 и h( Aх ) h( у ) 1 1  inf   .  1 h( у ) х  0 h( х ) у  0 h( A у ) A1 sup 1 у  0 h( A у ) glb h ( A)  inf Пусть det A = 0. Тогда существует вектор z  0, A z = 0, h( z ) = 1. Тогда glb h ( A)  min h( Az )  0 , т. е. минимум достигается при х = z . z 1 Следствие 1. Если матрицы А и В принадлежат пространству Сnn, то glb h ( AB)  glb h ( A) glb h ( B) . Доказательство. glb h ( AB)  1 ( AB) 1  1 B 1 A1  48 1 B 1 A1  glb h ( A) glb h ( B) . Следствие 2. Если векторная норма h( х ) = max xi ; D = diag{d1, d2, …, dn} – i диагональная матрица, то glb h ( D)  min d i . i Доказательство. Пусть di  0, i = 1, …, k. Тогда glb h ( D )  1 D 1  1 1 max i di  min d i . i Если di = 0, i = 1, …, k, то glbh(D) = 0, так как detD = 0, min di =0. i Теорема доказана. 5.4. Поле значений Если матрица А принадлежит пространству Сnn, то собственные значения матрицы образуют множество из n точек (не обязательно различных) на комплексной плоскости. Пусть h – евклидова норма вектора. Определение 22. Полем значений F(A) матрицы А из Сnn называется множество всех чисел х * Aх  ( х , Aх )  n n   a jk x j xk , j 1 k 1 х  Сn , h( х )  1 . ( х , Aх )  R ( x ) связано с полем значений и наобо(х, х) рот. Поэтому поле значений можно описать как множество всех возможных значений отношения Релея для матрицы А. Это множество замкнуто и ограничено на комплексной плоскости и выпукло. Поле значений матрицы А есть отрезок действительной оси тогда и только тогда, когда матрица А – эрмитова. Отношение Релея 49 5.5. Абсолютные векторные нормы Почти все рассмотренные векторные нормы зависят только от абсолютных значений элементов. Такие нормы называются абсолютными векторными нормами. Лемма. Если h – абсолютная векторная норма и h( х )  H(x1, x2, …, xn), то H – неубывающая функция от абсолютных значений величин x1, x2, …, xn. Доказательство. Зафиксируем x2, …, xn. Следовательно, Н(x1, x2, …, xn) = Н(x, x2, …, xn) = f(x). Рассмотрим поведение функции f(x), когда х принадлежит множеству действительных чисел R. Пусть f(x) – убывающая функция, т. е. из p < q следует f(p) > f(q). Но f(x) = f(x) и f(q) = f(q). Следовательно, векторы у 1= (q, x2, …, xn)т и у 2= (q, x2, …, xn)т принадлежат шару, состоящему из векторов х , для которых h( х )  f(q). Шар – это выпуклое множество, а так как вектор z = (р, x2, …, xn)т принадлежит простому отрезку, соединяющему у 1 и у 2, то h( х )  f(q). Но h( z ) = f(p)>f(q). Это противоречие доказывает лемму. Определим свойство монотонности абсолютных норм. Обозначим через  х вектор, элементы которого есть xi. 1) Для любых векторов у , z из пространства Rn будем считать у  z , если yi  zi. 2) Векторная норма называется монотонной тогда и только тогда, когда из  х   у  следует h( х )  h( у ). Доказанная лемма означает, что это условие обязательно выполняется для абсолютных векторных норм. Обратное верно тоже: если h( х )  h( у ), то  х   у . 3) Следующее свойство относится к индуцированной матричной норме. Когда вычисляется норма для диагональной матрицы D = = diag{d1, d2, …, dn}, то считаем норму хорошей, если для нее выполняется свойство D  max d i . i 50 Теорема 14. Если h – векторная норма и A  матричная норма, индуцированная h, то следующие условия эквивалентны: 1) h – абсолютная векторная норма; 2) h – монотонная векторная норма; 3) D  max d i  для любой диагональной матрицы i D = diag{d1, d2, …, dn}. Доказательство. Теорема будет доказана, если покажем, что из условия 1) следует условие 2), из 2) следует 3), из 3) следует 1). Из 1-го условия следует 2-е условие по лемме. Докажем, что из 2-го условия следует условие 3. Пусть D  0, d  max d i , Dх  dх . Следовательно, h Dх  h dх  dh(х ) . Тогда i h( Dх ) d. x  0 h( х ) D  sup Если сможем доказать, что существует такой вектор а , что h( Dа ) d , h( а ) то условие 2 докажем. Пусть m – целое число, для которого d = dm. h( Dеm ) h(d mеm ) Тогда   dm  d . h(еm ) h(еm ) h( Dx )  d или D  d . Эта часть доказана. x  0 h( x ) Следовательно, sup Теперь докажем, что из 3-го условия следует 1-е. Пусть выполняется условие 3 и D = diag{d1, d2, …, dn}, x = {x1, x2, …, xn}, хi  0, di = хiхi = 1. Тогда  x = D x . 51 Для матрицы D третье свойство означает, что D  D 1  1 . Тогда h( х )  D h( х )  h( х ) . Но х1=D1 х . Следовательно, h( х )  D 1 h( х )  h( х ) . Поэтому h( х )  h( х ) для любого векто- ра  х . Теорема полностью доказана. 52 Список литературы 1. Кострикин, А. И. Введение в алгебру. Ч. 1. Основы алгебры: учебник для вузов / А. И. Кострикин. – М. : Изд-во физ.-матем. литературы, 2000. – 272 с. 2. Курош, А. Г. Курс высшей алгебры / А. Г. Курош. – 10-е изд. – М. : Наука, 1971. 3. Каплан, И. А. Практические занятия по высшей математике / И. А. Каплан. Ч. 5. – Харьков : Изд-во Харьк. ун-та, 1972. – 412 с. 4. Ланкастер, П. Теория матриц: пер. с англ. / П. Ланкастер. – М. : Наука, 1978. – 280 с. 5. Вержбицкий, В. М. Численные методы (Линейная алгебра и нелинейные уравнения): учеб. пособие для вузов / В. М. Вержбицкая. – М. : ООО «Издательский дом Оникс 21 век», 2005. – 432 с. 6. Понтрягин, Л. С. Обыкновенные дифференциальные уравнения / Л. С. Понтрягин. – М. : Наука, 1982. – 331 с. 7. Уоткинс, Д.С. Основы матричных вычислений./ Д. Уоткинс; Пер. с англ. – М.: БИНОМ. Лаборатория знаний, 2006. 53 Приложение. Примеры анализа плоских электрических цепей с использованием алгебры матриц Многочисленные примеры приложения матричных вычислений даны в [7]. Приведем некоторые примеры анализа плоских электрических цепей, в которых используется алгебра матриц. Рассмотрим электрическую цепь, изображенную на рис.2. Рис.2 Предположим, что цепь находится в состоянии равновесия: все напряжения и токи в ней постоянны. Четыре неизвестные узловые напряжения x1 , x2 , x3 , x4 можно определить следующим образом. По закону Кирхгофа для тока, в каждом из четырех узлов сумма вытекающих из них токов должна быть нулевой, что позволяет записать уравнение для каждого узла. В каждом из этих уравнений токи могут быть выражены по закону Ома, согласно которому падение напряжения (в вольтах - В) равно току (в амперах - А), умноженному на сопротивление (в Омах - Ом). Предположим, что ток от узла 3 к узлу 4 через резистор на 5 Ом равен I А. Тогда, в соответствии с законом Ома, x3  x4  5 I , так что I  0,2( x3  x4 ) . Рассматривая таким же образом два других тока, текущих из узла 3, и применяя закон Кирхгофа для тока, получим уравнение 0,2( x3  x4 )  ( x3  x1 )  0,5( x3  6)  0 54 или  x1  1,7 x3  0,2 x4  3. Рассуждая аналогично относительно 1-го, 2-ого и 4-ого узлов, получим систему четырех линейных уравнений с четырьмя неизвестными 2 x1  x2  x3  0,    x  1,5 x  0,5 x  0,  1 2 4    x1  1,7 x3  0,2 x4  3,  0,5 x2  0,2 x3  1,7 x4  0. Полученная система может быть записана в матричной форме AX  B. Здесь A - матрица коэффициентов при неизвестных, X - матрицастолбец неизвестных узловых напряжений, B - матрица-столбец свободных членов. 1 1 0  2 0     0  0,5    1 1,5 0 A , B  .  1 0 1,7  0,2 3      0  0,5  0,2  1,7  0     Матрица A - невырожденная, так что система имеет единственное решение. Решая ее одним из методов, например матричным, получим  3,0638     2,4255  X  , 3,7021     1,1489    т.е. неизвестные узловые напряжения x1 , x2 , x3 , x4 . По найденным x1 , x2 , x3 , x4 и заданным узловым напряжениям x5 , x6 можно лег- 55 ко вычислить ток через любой из резисторов по закону Ома. Например, ток, текущий от узла 3 к узлу 4, равен 0,2( x3  x4 )  0,5106 А. Другой способ анализа плоских электрических цепей состоит в нахождении контурных токов вместо узловых напряжений. На рис.3 приведена та же самая цепь, что и на рис.2, но теперь здесь x1 и x2 - неизвестные контурные токи. Рис.3 Для резисторов, расположенных на границе цепи, контурный ток – это реальный ток, протекающий через резистор, а ток, текущий через резистор в 5 Ом, равен разности контурных токов. Уравнение для каждого контура может быть получено на основе закона Кирхгофа для напряжения, по которому сумма падений напряжения вдоль контура должна быть нулевой. Падение напряжения на каждом резисторе может быть выражено через контурные токи с помощью закона Ома. Суммируя напряжения на четырех резисторах 1-ого контура, получим уравнение 5 ( x1  x2 )  x1  x1  2 x1  0 . Точно так же для 2-ого контура 5 ( x2  x1 )  x2  6  2 x2  0 . Получим систему из двух уравнений с двумя неизвестными 56  9  5   x1   0         .   5 8   x2   6  Решая эту систему найдем, что x1  0,6383 А и x2  1,1489 А. Таким образом, например, ток, протекающий сверху вниз через резистор 5 Ом, равен x2  x1  0,5106 А, а падение напряжения на нем составляет 2,5530 В. Очевидно, что эти результаты согласуются с выше полученными результатами анализа цепи, представленной на рис.2. По аналогии легко провести анализ цепей с большим числом неизвестных узловых напряжений или контурных токов. Например, анализ электрической цепи, изображенной на рис.4, приводит к решению линейной системы из семи уравнений для семи неизвестных напряжений в узлах x1 , ... , x7 . Рис.4. 57 При анализе цепи, приведенной на рис.5, получается линейная система из четырех уравнений для четырех неизвестных контурных токов x1 , x2 , x3 , x4 . Решив эту систему одним из методов, используя Рис.5 закон Ома и вычисленные контурные токи, можно, например, найти падение напряжения от узла, помеченного как n1 , до узлов, помеченных как n2 и n3 . Кроме того, можно проверить, согласуется ли это решение с результатами, полученными при анализе той же электрической цепи, изображенной на рис.4, где были неизвестны узловые напряжения. Или наоборот, используя закон Ома и напряжения, вычисленные при анализе цепи рис.4, можно, например, найти ток, проходящий через резистор R1 (рис.5) и проверить, как он согласуется с расчетами контурных токов в этой цепи. Вычисление контурных токов в электрической цепи, приведенной на рис.6, где все сопротивления равны 1 Ом, потребует решения линейной системы из девяти уравнений с девятью неизвестными. 58 Рис.6. Еще большая электрическая цепь, имеющая, например m контуров, будет описываться уже m уравнениями с m неизвестными. Очевидно, что при решении получающихся при этом систем линейных уравнений большой размерности целесообразно использовать вычислительные алгоритмы, которые обсуждались в первой главе настоящего пособия. 59 СОДЕРЖАНИЕ Предисловие ......................................................................................................... 3 1. Действия над матрицами ................................................................................. 4 1.1. Обращение треугольных матриц .................................................................4 1.2. Разложение квадратной матрицы на произведение двух треугольных (факторизация) и ее обращение. ................................................... 8 2. Блочные матрицы и их применение к решению систем линейных уравнений ............................................................................................ 13 3. Функции от матриц .......................................................................................... 16 3.1. Теорема ГамильтонаКэли ........................................................................... 16 3.2. Интерполяционные многочлены .................................................................17 3.2.1. Многочлен Лагранжа и теорема Сильвестра ...................................... 17 3.2.2. Формула Бэкера .................................................................................... 21 3.2.3. Случай недиагональной матрицы........................................................ 23 3.3. Высокие и дробная степени матрицы .......................................................... 24 4. Дифференцирование и интегрирование матриц ............................................ 26 4.1.Правила дифференцирования и интегрирования матриц ........................... 27 4.2. Приложение к решению дифференциальных уравнений…………………31 4.2.1. Решение систем линейных дифференциальных уравнений .............. 31 4.2.2. Решение линейного дифференциального уравнения n-го порядка ..34 5. Нормы векторов и матриц ............................................................................... 36 5.1. Матричные нормы ......................................................................................... 38 5.2. Векторные нормы .......................................................................................... 42 5.3. Согласованность норм .................................................................................. 44 5.4. Поле значений ............................................................................................... 49 5.5. Абсолютные векторные нормы .................................................................... 50 Cписок литературы .............................................................................................. 53 Приложение. Примеры анализа плоских электрических цепей с использованием алгебры матриц ...................................................................... 54 60 Учебное издание Черушева Татьяна Вячеславовна Васюнина Ольга Борисовна Алгебра матриц ________________________________________________________________ Издательство ПГУ, 440026, Пенза, Красная,40 61

АЛГЕБРА МАТРИЦ - Кафедра Высшая и прикладная математика

Related documents

Products

Support

АЛГЕБРА МАТРИЦ - Кафедра Высшая и прикладная математика

Related documents

Add this document to collection(s)

Add this document to saved

Suggest us how to improve StudyLib