Псевдообратная матрица

advertisement
Реферат на тему:
Псевдообратная матрица
План:
Введение






1 Определение
2 Свойства
3 Особые случаи
4 Происхождение
5 Вычисление
6 Применение
Введение
Псевдообра́тная ма́трица — обобщение понятия обратной матрицы в линейной алгебре.
Псевдообратная матрица к матрице A обозначается A + . Наиболее известно
псевдообращение Мура — Пенроуза, которое было независимо описано Э. Х. Муром*
(Moore) и Роджером Пенроузом *. Концепцию псевдообратных интегрирующих
операторов в 1903 году представил Фредгольм. Обобщенное обращение (Generalized
inverse) включает в себя псевдообращение, удовлетворяющее более строгим условиям.
Псевдообращение можно понимать как наилучшую аппроксимацию (по методу
наименьших квадратов) решения соответствующей системы линейных уравнений (см.
далее в применении). Псевдообращение определено для любых матриц над
действительными и комплексными числами. Псевдообратная матрица может быть
вычислена с помощью собственного представления матрицы.
1. Определение
A + называется псевдообратной матрицей для матрицы A, если она удовлетворяет
следующим критериям:
1. AA + A = A;
2. A + AA + = A +
(A + является слабым обращением в мультипликативной
полугруппе);
3. (AA + ) * = AA +
(это означает, что AA + — эрмитова матрица);
4. (A + A) * = A + A
(A + A — тоже эрмитова матрица).
Здесь M * — эрмитово сопряжённая матрица M (для матриц над полем действительных
чисел M * = MT).
Существует эквивалентный способ задания псевдообратной матрицы через предел
обратных:
(смотрите регуляризация Тихонова). Этот предел существует, даже если (AA * ) − 1 и (A * A)
−1
не определены.
2. Свойства





Псевдообращение обратимо, более того, эта операция обратна самой себе:
(A + ) + = A.
Псевдообращение коммутирует с транспонированием, сопряжением и эрмитовым
сопряжением:
(AT) + = (A + )T,
,
(A * ) + = (A + ) * .
Псевдообратное произведения матрицы A на скаляр α равно соответствующему
произведению матрицы A + на обратное число α - 1:
(αA) + = α − 1A + , для α ≠ 0.
Если псевдообратная матрица для A * A уже известна, она может быть
использовано для вычисления A + :
A + = (A * A) + A * .
Аналогично, если матрица (AA * ) + уже известна:
A + = A * (AA * ) + .
3. Особые случаи

Если столбцы матрицы A линейно независимы, тогда матрица A * A обратима. В
таком случае псевдообратная матрица задаётся формулой
A + = (A * A) − 1A * .
Это эквивалентно тому, что в первой части определения через предел убирается слагаемое
с δ. Отсюда следует что A + — левая обратная матрица для A: A + A = I .

Если строки матрицы A линейно независимы, тогда матрица AA * обратима. В
таком случае псевдообратная матрица задаётся формулой
A + = A * (AA * ) − 1.
Это эквивалентно тому, что во второй части определения через предел убирается
слагаемое с δ. Отсюда следует, что A + — правая обратная матрица для A: AA + = I .

Если и столбцы и строки линейно независимы (что верно для квадратных
невырожденных матриц), псевдообращение равно обращению:
A + = A − 1.

Если A и B таковы, что произведение AB определено, и
o либо A * A = I,
o либо BB * = I,
o либо столбцы A линейно независимы и строки B линейно независимы,
тогда
(AB) + = B + A + .

Псевдообращение можно применять и к скалярам, и к векторам. Это
подразумевает, что их будут считать матрицами. Псевдообратный к скаляру x —
ноль, если x — ноль, и обратный к x в противном случае:

Псевдообратный для нулевого вектора — транспонированый нулевой вектор.
Псевдообратный для иного вектора — сопряжённый транспонированный вектор,
делённый на квадрат своей длины:
Для доказательства достаточно проверить, что эти величины удовлетворяют определению
псевдообратных.
4. Происхождение
Если (A * A) − 1 существует, то
Ax = b,
A * Ax = A * b,
(A * A) − 1(A * A)x = (A * A) − 1A * b,
x = (A * A) − 1A * b,
что порождает понятие псевдообращения
A + = (A * A) − 1A * .
5. Вычисление
Пусть k — ранг матрицы A размера
. Тогда A может быть представлена как A = BC,
где B — матрица размера
и C — матрица размера
. Тогда
A + = C * (CC * ) − 1(B * B) − 1B * .
Если A имеет полнострочный ранг, то есть k = m, тогда в качестве B может быть выбрана
единичная матрица и формула сокращается до A + = A * (AA * ) − 1. Аналогично, если A
имеет полностолбцовый ранг, то есть, k = n, имеем A + = (A * A) − 1A * .
Простейший вычислительный путь получения псевдообратной матрицы — использование
собственного представления матрицы (СПМ).
Если A = UΣV * — собственное представление A, тогда A + = VΣ + U * . Для диагональной
матрицы, такой как Σ, псевдообратная вычисляется обращением каждого ненулевого
элемента на диагонали.
Существуют оптимизированые подходы для вычисления псевдоинверсии блочных
матриц.
Если псевдоинверсия известна для некой матрицы и нужно найти псевдоинверсию для
аналогичной матрицы, иногда она может быть вычислена с помощью специальных
алгоритмов, требующих меньшего количества расчётов. В частности, если аналогичная
матрица отличается от начальной на один изменённый, добавленный или удалённый
столбец или строку — существуют накопительные алгоритмы, которые могут
использовать взаимосвязь между матрицами.
6. Применение
Псевдоинверсия реализирует решение метода наименьших квадратов для системы
линейных уравнений (СЛУ) *.
При этом для данной системы Ax = b ищется вектор x, который минимизирует невязку
, где
обозначает евклидову норму.
Общее решение неоднородной системы Ax = b представимо как сумма частного решения
неоднородной системы и общего решения соответствующей однородной системы Ax = 0.
Лемма: Если (AA * ) − 1 существует, тогда решение x всегда представимо как сумма
решения псевдообратного решения неоднородной системы и решения однородной
системы:
x = A * (AA * ) − 1b + (1 − A * (AA * ) − 1A)y.
Доказательство:
Здесь вектор y случаен (с точностью до размерности). В двух других членах есть
псевдообратная матрица A * (AA * ) − 1. Переписав её в форме A + , приведём выражение к
форме:
x = A + b + (1 − A + A)y.
Первый член — псевдообратное решение. В терминах метода наименьших квадратов —
это наилучшее приближение к настоящему решению. Это значит, что корректирующий
член имеет минимальную евклидову норму. Следующий член даёт решение однородной
системы Ax = 0, потому что (1 − A + A) — оператор проектирования на ядро оператора A,
тогда как (A + A) = A * (AA * ) − 1A — оператор проектирования на образ оператора A.
Download