Uploaded by Всеволод Григорьев

Descriptive Statistics

advertisement
2009 год
Descriptive Statistics
N
Minimum
Maximum
Mean
Std. Deviation
Мясо 2009
80
37
105
64,36
11,550
Молоко 2009
80
63
368
238,16
52,413
Яйца 2009
80
83
327
244,44
50,620
Сахар 2009
80
24
58
38,03
7,058
Картоф 2009
80
42
202
113,61
32,391
Овощи 2009
80
12
202
100,70
26,395
Рмасло 2009
80
6,9
19,6
12,279
2,4082
Хлеб 2009
80
63
165
119,24
15,877
Valid N (listwise)
80
По таблице описательные статистики мы можем видеть, что минимальное и максимальное потребление
некоторых видов товаров отличаются по регионам в несколько раз. Как пример Овощи в 16,8 раз или масло яйца
в 4 раза. Меньшее потребление одних продуктов должно компенсироваться большим потреблением других. Для
изучения таких взаимосвязей вычислим корреляции показателей потребления.
Correlations
Мясо 2009
Мясо
Молоко
2009
2009
Pearson Correlation
Молоко 2009
2009
2009
2009
2009
2009
,079
,026
,001
,006
,485
,821
80
80
80
-,036 ,194
,134
,085
,235
,754
80
80
80
80
1 ,441**
,054
,215
,166
,002
,275*
Sig. (2-tailed)
,001
,000
,637
,056
,142
,989
,013
80
80
Pearson Correlation
,303**
,441**
Sig. (2-tailed)
,006
,000
80
80
80
,079
,054
,171
Sig. (2-tailed)
,485
,637
,130
80
80
,026
,215
,169
Sig. (2-tailed)
,821
,056
,134
Pearson Correlation
-,036 ,166
80
80
80
80
,169
,240*
,285*
,136
,130
,134
,032
,010
,230
80
80
1
80
80
,341**
,088
,067
,002
80
80
,892
,252
80
,130
80
-,223* ,343**
1 ,130
80
80
,206
80
-,015
,192
80
-,015 ,192
,892
80
,240*
80
1 ,171
80
Pearson Correlation
80
80
80
Pearson Correlation
N
Овощи 2009
Хлеб
,363**
N
Картоф 2009
Рмасло
Pearson Correlation
N
Сахар 2009
Овощи
,303**
80
N
Яйца 2009
Картоф
1 ,363**
Sig. (2-tailed)
N
Яйца 2009
Сахар
,047
80
1 ,028
,002
80
80
,228*
Sig. (2-tailed)
,754
N
Рмасло 2009
80
,032
80
,088
80
,194
,002
,285*
,206
Sig. (2-tailed)
,085
,989
,010
,067
80
,252
80
Pearson Correlation
N
Хлеб 2009
,142
80
,804
80
80
-,223* ,028
,047
80
80
80
,275*
,136
,341**
,343**
,228*
Sig. (2-tailed)
,235
,013
,230
,002
,002
,042
80
80
80
80
1
-,139
,219
80
,134
80
80
,804
Pearson Correlation
N
,042
80
80
80
-,139
1
80
80
,219
80
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).
Матрица корреляции показывает, что среди параметров нет строгой линейной зависимости. Наиболее сильная
линейная зависимость присутствует между потреблением молока и яиц с коэффициентом корреляции 0,441 .
Кроме этой пары признаков сильно коррелированы хлеб и картофель (коэффициент 0,343), также сильно
коррелированы хлеб и сахар (коэффициент 0,341) и молоко с мясом (коэффициент 0,363).
Кроме того, по матрице корреляций можем сказать, что потребление овощей положительно слабо
коррелировано с потреблением яиц, сахара и хлеба, а про остальные продукты мы ничего не можем сказать.
Иными словами, регионы, потребляющие больше овощей, имеют тенденцию потреблять больше яиц, сахара и
хлеба.
Так как матрица корреляций значимо отличается от единичной, для изучения структуры потребления можно
применять метод главных компонент. Анализ будем проводить для исходных показателей, и главные
компоненты будут выделены на основе матрицы корреляций.
Total Variance Explained
Initial Eigenvalues
Compo
nent
Total
% of Variance
Extraction Sums of Squared Loadings
Cumulative %
Total
% of Variance
Cumulative %
1
2,207
27,586
27,586
2,207
27,586
27,586
2
1,486
18,574
46,160
1,486
18,574
46,160
3
1,195
14,933
61,093
1,195
14,933
61,093
4
,919
11,488
72,581
5
,712
8,894
81,475
6
,580
7,245
88,720
7
,480
6,001
94,721
8
,422
5,279
100,000
Extraction Method: Principal Component Analysis.
Из таблицы доли объясненной дисперсии следует, что дисперсии первых трех главных компонент составляют
2,207, 1,486 и 1,195 и согласно запросу на критерий Кайзера с целью снижения размерности извлечены первые
три компоненты (только их дисперсии превышают единицу). При этом первая главная компонента объясняет
27,5% суммарной дисперсии, вторая еще 18,5%, третья еще 14,9%. И тремя компонентами вместе объяснены
60,9% суммарной дисперсии стандартизованных показателей потребления.
На рисунке показан график «каменистой осыпи». График свидетельствует в пользу извлечения лишь одной –
первой главной компоненты, т.к. дисперсии остальных компонент заметно меньше. Вместе с тем с целью извлечь
три главные компоненты (по критерию Кайзера) или даже четыре (так как дисперсии третьей и четвертой
компоненты почти одинаковы).
Communalities
Initial
Extraction
Мясо 2009
1,000 ,579
Молоко 2009
1,000 ,664
Яйца 2009
1,000 ,611
Сахар 2009
1,000 ,691
Картоф 2009
1,000 ,587
Овощи 2009
1,000 ,419
Рмасло 2009
1,000 ,702
Хлеб 2009
1,000 ,634
Extraction Method: Principal Component
Analysis.
Из таблицы Общностей мы видим, что наилучшим образом учтена дисперсия стандартизованного потребления
рмасла, молоко и сахара (70,2%, 66,4%, 69,1% ) и достаточно полно учтена дисперсия потребления хлеба и яиц
(63,4% и 61,1%).Изменчивость показателей потребления остальных видов продуктов учтена в меньшей степени
(57,9%, 58,7% и 41,9%) (критерий разделения 60%).
Component Score Coefficient Matrix
Component
1
2
3
Мясо 2009
,231
Молоко 2009
,318
Яйца 2009
,320
,207
Сахар 2009
,196
,091
Картоф 2009
,187
-,413
Овощи 2009
,205
-,108 ,364
Рмасло 2009
,085
Хлеб 2009
,272
,249
-,358
-,009
,531
-,346
-,118
,583
-,165
,176
-,309 ,211
Extraction Method: Principal Component Analysis.
Component Scores.
С помощью таблицы весовых коэффициентов в соответствии с методом главных компонент определяем
стандартизованные значения трех главных компонент:
Здесь через
, j=1,2,3, обозначены три стандартизованные главные компоненты, а нижний индекс ст
указывает на то, что показатель потребления соответствующего продукта стандартизован. Для определения
значения
, j=1,2,3 для конкретного региона в приведенные выше формулы нужно подставить значения
стандартизованных показателей потребления, соответствующие данному региону.
Component Matrixa
Component
1
2
3
Мясо 2009
,509
Молоко 2009
,702
Яйца 2009
,705
,307
Сахар 2009
,432
,135
Картоф 2009
,413
-,614
Овощи 2009
,452
-,160 ,434
Рмасло 2009
,188
Хлеб 2009
,600
,370
-,427
-,014
,789
-,413
-,141
,697
-,197
,211
-,460 ,252
Extraction Method: Principal Component Analysis.
a. 3 components extracted.
Из таблицы матрица компонент можно выразить стандартизованные показатели потребления через
стандартизованные значения главных компонент:
Многоточие напоминает о том, что из рассмотрения исключены компоненты с четвертой по восьмую.
Таблица матрица компонент представляет собой
где:
- сумма квадратов элементов в столбце с номером S совпадает с дисперсией главной компоненты
- сумма квадратов элементов в строке с номером j равна
- сумма квадратов всех элементов матрицы
- общности стандартизованного признака
, s=1,...m;
j=1,…k;
равна сумме дисперсии выделенных m главных компонент,
равна сумме общностей и не превышает числа k.
Обычно главная компонента «получает имя» того признака, с которым наиболее тесно коррелирована. В нашем
случае мы можем назвать первую, вторую, третью компоненту соответственно яичная, рмаслянная и сахарная.
Сравнение с 1995 годом
Descriptive Statistics
N
Minimum
Maximum
Mean
Std. Deviation
Мясо 1995
78
30
99
55,22
10,730
Молоко 1995
78
121
394
255,38
58,453
Яйца 1995
78
24
380
207,12
59,546
Сахар 1995
78
22
51
32,01
5,828
Картоф 1995
78
24
238
132,67
51,782
Овощи 1995
78
15
149
77,95
26,536
Рмасло 1995
78
4,6
11,0
7,079
1,3717
Хлеб 1995
78
80
158
120,49
16,286
Valid N (listwise)
78
Descriptive Statistics
N
Minimum
Maximum
Mean
Std. Deviation
Мясо 2009
80
37
105
64,36
11,550
Молоко 2009
80
63
368
238,16
52,413
Яйца 2009
80
83
327
244,44
50,620
Сахар 2009
80
24
58
38,03
7,058
Картоф 2009
80
42
202
113,61
32,391
Овощи 2009
80
12
202
100,70
26,395
Рмасло 2009
80
6,9
19,6
12,279
2,4082
Хлеб 2009
80
63
165
119,24
15,877
Valid N (listwise)
80
По таблицам за 95 и 09 года мы можем сказать, что минимальное и максимальное потребление в
среднем почти не изменилось в употреблении мяса, сахара минимальное потребление молока, овощей и
хлеба стало еще меньше. Минимальное потребление картофеля и яиц увеличилось. Максимальное
потребление молока, яиц и картофеля стало меньше и возросло у овощей и хлеба.
Мы можем сказать, что мяса стали употреблять на 9 кг больше, молока на 17 кг больше, меньше яиц на
37, сахара на 6 кг, картофеля на 19кг больше, на 23 кг овощей больше, на 5 кг масла больше и хлеба на
1кг меньше. Другими словами жить стали лучше употребление почти всех товаров увеличилось,
исключая хлеб, тут оно почти не изменилось, и исключая яйца их стали есть меньше.
Различия по регионам в целом не изменились, различия по молоку яйцам и картофелю уменьшились.
Рассмотрел значения по региону Чувашская республика.
Что бросилось в глаза с 1995 по 2009 год стали меньше употреблять картофеля на 100кг, больше овощей
на 32кг, меньше хлеба на 29 кг, молока меньше на 79 кг остальные продукты в целом также.
Download