Факторный анализ

advertisement
Факторный анализ. Алгоритм.
Алгоритм
0
Оформление множества полученных данных в форме таблицы вида n x m:
Респонденты/
Параметры оценки/ переменные /
оцениваемые
шкалы ~ оси исходного базиса
объекты
объем
e1 (x)
…(y)
em
выборки
1
…
n
1 Центрирование выборочных значений (по каждой переменной в отдельности).
n
xi  xi  x , где
x
x
i 1
n
i
, x - среднее арифметическое,
 x - сумма всех значений переменной x с 1 по n, n – объем выборки
i
1
i 1
2 Стандартизация выборочных значений (по каждой переменной в отдельности).
n
n
 x
2
i
i 1
xi
, где S x  D x 
, S x - стандартное отклонение2, Dx - дисперсия3, n 1 - количество степеней свободы4
n

1
Sx
3 Нахождение попарных корреляций между переменными5
xi 
n
 xy 
 x  y
i 1
i
n 1
i
n

 x  y 
i 1
i
i
(n  1)  S x  S y

Rxy
(n  1)  S x  S y
, где Rxy – ковариация между переменными x, y.
Переменная – качество или характеристика объекта, подлежащая измерению (например, рост человека). Показатель – мера оценки переменной, результат применения
процедуры измерения к объекту (например, для роста: 1. количество сантиметров в вертикально стоящей фигуре от подошвы до макушки, 2. количество прыжков лягушки от
подошвы до конца тени, отбрасываемой человеком в четыре часа дня в день весеннего равноденствия). В тексте могут употребляться как синонимы.
2
Отклонение от выборочного среднего (см. формулу). Вычисляется как квадратный корень из дисперсии.
3
Мера вариативности (изменчивости) выборочных значений, то есть мера сходства результатов множества измерений между собой относительно среднего значения.
4
Количество независимых выборочных значений.
5
Этапы 1,2 можно совместить с вычислением коэффициентов корреляций (они входят в полную формулу ρxy).
1
1
и запись их в виде матрицы корреляций (Аe):
  e1e1

 ...

  ene1
...  e1en 

... ... 

...  enen 
Содержание матрицы корреляций является обобщенным описанием имеющегося множества точек. Если рассматривать коэффициенты
корреляций как показатель угла между векторами-переменными (cosα), можно представить себе пространство, отличное от заданного
процедурой измерения (с ортогональными векторами-переменными). В «новом» пространстве векторы-переменные, измеряющие одно и то
же, или очень близкие аспекты одного явления, или два субъективно сходных объекта, будут «расти пучком» (пространственная аналогия:
часовая и минутная стрелки в 01:06 или 14:15, например) или, наоборот, в противоположных направлениях (12:30, 15:40), а оценки разных
явлений, не имеющих отношения друг к другу, сохранят ортогональность.
4 Нахождение собственных значений: поиск решений характеристического уравнения матрицы (Ае- λЕ) - det(Aе-λЕ)=0:
 e1e1  

 ...

 en e1
5
6
7
8
...
e e  
i i
...


... 
en en   
e e
1 n
Найденные собственные значения (λ1- λn) упорядочиваются от большего к меньшему.
Собственные значения соответствуют дисперсии выборочных значений по векторам-факторам (собственные векторы).
Нулевые собственные значения говорят о том, что размерность пространства меньше, чем количество переменных. Собственные значения,
близкие к нулевым, позволяют снизить размерность пространства (основная задача ФА) с минимальной потерей информации, убрав измерения
соответствующих собственных векторов, т.е. через проекцию всего множества точек в пространство оставшихся собственных векторов.
а) Нахождение собственных векторов: ненулевые решения системы уравнений для каждого собственного значения (Ае- λЕ)v=0,
б) нормирование собственных векторов (делением каждой координаты вектора на его длину; длина вектора – квадратный корень из суммы
квадратов его координат). Матрица перехода С.
Факторные нагрузки – вклад фактора в дисперсию по переменным: каждый столбец матрицы перехода (собственный вектор = координаты
фактора Fi в старом базисе) домножаются на корень из соответствующего собственного значения. Таким образом, производится
стандартизация факторов. (аналогия с длиной: при переходе от сантиметров к метрам единица измерения увеличивается в 100 раз)
Факторные значения – координаты точек в новом базисе: координаты каждой точки (результаты испытуемого по всем переменным)
переводятся в новый базис через транспонированную матрицу перехода (до транспонирования в м-це С каждый вектор-столбец должен быть
разделен на корень из соответствующего собственного значения). Этот этап сочетает в себе как перевод точек в новые координаты, так и их
стандартизацию по факторам. (продолжение аналогии: при измерении в новых единицах оценка длины предмета уменьшается в 100 раз)
Интерпретация полученной факторной структуры.
2
Download