Описание метода

advertisement
Применение метода многомерного регрессионного анализа к
задаче реконструкции размеров сосудов
Приведем общие сведения из теории многомерного регрессионного анализа
(Крамер, Математические методы статистики, издательство «МИР», Москва, 1975).
Рассмотрим n случайных величин 1,...,n и случайную величину  , которая
линейно зависит от величин 1,...,n :
  a0  a11  a22  ...  ann
Пусть над многомерной
наблюдений.
Обозначим:
случайной величиной
j
(1,...,n , )
xij
– значение случайной величины
yi
– значение случайной величины  в i -ом наблюдении, i  1,..., m ;
проведено m
( j  1,..., n ) при i -ом наблюдении, i  1,..., m ;
Задача многомерного регрессионного анализа состоит в нахождении значений
коэффициентов a0 , a1 , a2 ,..., an (методом наименьших квадратов), что позволяет по
известным значениям случайных величин 1,...,n спрогнозировать значение случайной
величины  .
Иными словами, задача регрессионного анализа состоит в том, чтобы найти
коэффициенты регрессии a1 , a2 ,..., an и свободный член a0 на основе замеров
( x1i ,..., xni , yi ),
которые доставляют минимум функции:
m
( yi  a  a1x1i  a2 x2i  ...  an xni )2

i 1
0
без ограничений на
(1)
a0 , a1,..., an .
Функцию (1) называют также среднеквадратичной ошибкой приближения.
В нашем случае случайная величина (1,...,n , ) представляет собой вектор,
составленный из размеров сосудов: 7 диаметров и 6 высот:
Применительно к задаче реконструкции формы сосудов в качестве независимых
переменных выступают известные замеры параметров сосудов (высот и диаметров) (см.
рисунок), а в качестве зависимой переменной – параметр, значение которого требуется
восстановить.
Чтобы определить коэффициенты регрессии, дифференцируем функцию (1) по
каждому из n+1 неизвестных коэффициентов a0 , a1 ,..., an и получаем таким образом n+1
уравнение:
m
( yi  a0  a1x1i  ...  an xni )  0

i 1
,
(1,а)
m
( yi  a0  a1x1i  ...  an xni ) x1i  0 ,

i 1
(2,а)
. . . . . . . . . . . . . . . . . . .
m
( yi  a0  a1x1i  ...  an xni ) xni  0

i 1
(n+1,а)
Открываем скобки и получаем:
m
m
m
m
y   a0   a x  ...   an xni  0

i 1
i 1
i 1
i 1
m

i 1
i
m
i
1 1
m
,
m
x   a x   a x x  ...   an xni x1i  0
yi 1i
i 1
i
0 1
i 1
i i
1 1 1
(1,b)
,
(2,b)
i 1
. . . . . . . . . . . . . . . . . . . . . . . . . .
m
m
m
m
i 1
i 1
i 1
i 1
 yi xni   a0 xni   a1x1i xni  ...   an xni xni  0
(n+1,b)
Делим правую и левую часть уравнения (1,b) на m и получаем:
a0  y  a1 x1  a2 x2  ...  an xn (1,c)
Где
y
формуле
- выборочное среднее значение случайной величины
y 
,
определяемое по
1 m i
y ,
m i 1
m
x j - выборочное среднее значение величины  j , j  1, n ; x j  1  xij
m i 1
Подставляем полученное значение a0 в оставшиеся n уравнений ((2б),…,(n+1б)):
m

i 1
m
m
x   ( y  a1 x1  a2 x2  ...  an xn )x   a x x
yi 1i
i
1
i 1
i 1
i i
1 1 1  ... 
m
an xni x1i  0

i 1
,
(2,c)
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
m
m
m
m
i 1
i 1
i 1
i 1
 yi xni   ( y  a1 x1  a2 x2  ...  an xn )xni   a1x1i xni  ...   an xni xni  0
(n+1,c)
Преобразуем уравнения системы:
m
m
m
m
m
m
i 1
i 1
i 1
i 1
i 1
i 1
 a1x1i x1i  ...   an xni x1i   a1 x1 x1i  ...   an xn x1i   yi x1i   y x1i ,
(2,d)
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
m
m
m
m
m
m
 a1x1i x1i  ...   an xni x1i   a1 x1 xni  ...   an xn xni   yi xni   y xni
i 1
i 1
i 1
i 1
i 1
(n+1,d)
i 1
Разделим обе части всех уравнений на m и, сгруппировав однородные члены,
получим:
m
m
m
a1 ( 1  x1i x1i  x1 x1)  ...  an ( 1  xni x1i  xn x1)  1  yi x1i  y x1 ,
m i1
m i1
m i1
(2,e)
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
m
m
m
a1 ( 1  x1i xni  x1 xn )  ...  an ( 1  xni xni  xn xn )  1  yi xni  y xn
m i1
Как известно,
m i1
1 m i i
xk xl  xk xl  cov( xk , xl )
m
i 1
ковариации между k -ой и l -ой с.в. (размерами
следующую систему уравнений:
m i1
-
выборочный
(n+1,e)
коэффициент
сосуда) . Таким образом, получаем
cov( x1, x1)a1  cov(x2 , x1)a2 ... cov(xn , x1)an  cov( y, x1),
(2,f)
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
cov( x1, xn )a1  cov( x2 , xn )a2 ...  cov(xn , xn )an  cov( y, xn ).
(n+1,f)
Для решения этой системы мы используем метод Гаусса решения систем линейных
алгебраических
уравнений
(http://bspu.secna.ru/~pvv/mathpage/calcmath/complex/part2/part22_a.htm#p4). После чего из
a0
уравнения
(1,c)
находим
свободный
член
по
формуле:
a0  y  a1 x1  a2 x2  ...  an xn .
Задачу восстановления размеров можно решать по любому числу n>0 известных
параметров сохранившейся части.
Рассмотрим пример.
Пусть известны все размеры сосуда, кроме диаметра устья по венчику ( d1 ):
Имеются данные по 26 целым сосудам (аналогичного типа):
На основе исходных данных вычисляются статистические характеристики и на их основе
находятся коэффициенты регрессии и свободный член.
Из корреляционной матрицы видно, что между многими размерами сосуда существует
тесная линейная связь и, следовательно, можно ожидать для них хорошего прогноза. (Так,
при известном диаметре основания горловины ( d 3 ) мы точнее всего можем предсказать
диаметры - d1, d2 , d4 , а так же высоту h2 .)
Величину
d1
запишем приближённо:
d1  a0  a2d2i  ...  a7d7i  a8h1i  ... a13h6i ,
Таким образом,
свободный член
26
i  1,...,26;
мы отыскиваем коэффициенты регрессии
a2,..., a13
и
a0 на основе размеров 26-ти целых сосудов, минимизируя функцию:
(d1  a0  a2d2i  ...  a7d7i  a8h1i ... a13h6i )2 ,

i 1
a0 , a2 ,..., a13 .
i  1,...,26;
относительно
На основе вычисленной матрицы ковариации строим систему линейных уравнений:
cov( x2 , x2 )a1  cov( x3 , x2 )a2 ... cov( x13 , x2 )an  cov( y, x2 ),
cov( x2 , x3 )a1  cov( x3 , x3 )a2  ...  cov( x13 , x3 )an  cov( y, x3 ),
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
cov( x2 , x13 )a1  cov( x3 , x13 )a2  ...  cov( x13 , x13 )an  cov( y, x13 ).
1 26 i i
где cov( xk xl ) 
xk xl  xk xl , k  2,...,13; l  1,...,13; - коэффициент ковариации
26 
i 1
между k -ым и l -ым размерами сосуда.
Решаем эту систему методом Гаусса.
Свободный член 0 находится по формуле:
a
a0  d1  a2 d2 ...  a7 d7  a8 h1  ...  a13 h6 .
Коэффициенты регрессии, рассчитанные на основе ранее упоминаемых размеров
26-ти целых сосудов:
a2 =0,912; a3 =-0,15; a4 =0,306; a5 =-0,445; a6 =0,195; a7 =0,088; a8 =0.217;
a9 =0.196; a10 =-0.142; a11 =0.234; a12 =0.21; a13 =-0.129; a0 =6.390.
То есть
Таким образом, спрогнозированное значение d1=61мм. Оценить качество прогноза
по значению диаметра d1 можно при помощи графика, описывающего контур сосуда.
График строится на основе метода сплайн-интерполяции.
Как
видим,
сплайн-интерполяция
выполнена
удовлетворительное качество реконструкции формы сосуда.
правильно,
достигнуто
Download