ЛАБОРАТОРНАЯ РАБОТА №1

advertisement
ЛАБОРАТОРНАЯ РАБОТА №1
По предприятиям легкой промышленности региона получена
информация, характеризующая зависимость объема выпуска продукции (Y,
млн. руб.) от объема капиталовложений (X, млн. руб.)
Требуется:
1. Построить диаграмму рассеяния для переменных «объёмы продаж» -Y и
«индекс потребительских расходов» - X
2. Оценить тесноту взаимосвязи.
3. Оценить значимость вычисленного коэффициента парной корреляции.
4. Найти параметры уравнения линейной регрессии, дать экономическую
интерпретацию коэффициента регрессии.
5. Вычислить остатки; найти остаточную сумму квадратов; оценить
дисперсию остатков S2ε; построить график остатков.
6. Проверить выполнение предпосылок МНК.
7. Осуществить проверку значимости параметров уравнения регрессии с
помощью t-критерия Стьюдента (α = 0,05)
8. Вычислить коэффициент детерминации, проверить значимость
уравнения регрессии с помощью F- критерия Фишера (α = 0,05), найти
среднюю относительную ошибку аппроксимации. Сделать вывод о
качестве модели.
9. Осуществить прогнозирование среднего значения показателя Y при
уровне значимости α = 0,1, если прогнозное значения фактора Х
составит 80% от его максимального значения.
10.Представить графически: фактические и модельные значения Y, точки
прогноза.
11.Составить уравнения нелинейной регрессии:
 гиперболической;
 степенной;
 показательной.
Привести графики построенных уравнений регрессии.
12.
Для указанных моделей найти коэффициенты детерминации и
средние относительные ошибки аппроксимации. Сравнить модели по
этим характеристикам и сделать вывод.
Вариант 1
X
66
58
73
82
81
84
55
67
81
59
Y
13
10
14
16
16
17
10
13
15
11
3
7
5
2
3
0
4
2
9
6
Решение:
1.Диаграмма рассеяния имеет вид:
Объем продаж
Диаграмма рассеяния
90
80
70
60
50
40
30
20
10
0
0
50
100
150
200
Индекс потребительских расходов
2. Средние значения случайных величин х и у:
1
1
х̅ = ∑𝑛𝑖=1 𝑥𝑖 = 70.6
𝑦̅ = ∑𝑛𝑖=1 𝑦𝑖 = 139.1
𝑛
𝑛
1
1102.4
𝑆𝑥2 =
= 122.49
∑(𝑥𝑖 − 𝑥̅ )2 =
𝑛−1
9
1
5364.9
𝑆𝑦2 =
= 596.1
∑(𝑦𝑖 − 𝑦̅)2 =
𝑛−1
9
Рассчитаем стандартные ошибки случайных величин х и у:
𝑆𝑥 = √
𝑆𝑦 = √
1
𝑛−1
1
𝑛−1
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 =11.07
∑𝑛𝑖=1(𝑦𝑖 − 𝑦̅)2 =24.42
Рассчитаем коэффициент корреляции:
1 n
 ( xi  x)( yi  y) 1∙2418.4
n  1 i 1
9
𝑟𝑥𝑦 =
=
SxSy
11.07∙24.42
1
2
3
4
5
6
7
8
9
y
133
107
145
162
163
170
104
132
159
x 𝑦𝑖 − 𝑦̅ 𝑥𝑖 − 𝑥̅
66
-6,1
-4,6
58 -32,1 -12,6
73
5,9
2,4
82
22,9
11,4
81
23,9
10,4
84
30,9
13,4
55 -35,1 -15,6
67
-7,1
-3,6
81
19,9
10,4
(𝑦𝑖 − 𝑦̅)(𝑥𝑖 − 𝑥̅ )
28,06
404,46
14,16
261,06
248,56
414,06
547,56
25,56
206,96
= 0.994
(𝑥𝑖 − 𝑥̅ )2
(𝑦𝑖 − 𝑦̅)2
21,16
158,76
5,76
129,96
108,16
179,56
243,36
12,96
108,16
37,21
1030,41
34,81
524,41
571,21
954,81
1232,01
50,41
396,01
10
116
59 -23,1 -11,6
267,96
134,56
533,61
сумма 1391
706
2418,4
1102,4
5364,9
ср.
139,1
70,6
Знач
3. Оценим значимость коэффициента корреляции. Рассчитаем значение t–
статистики:
0,994√8
t = r n  22 =
=25,324
√1−0,988
1 r
Полученное значение коэффициента корреляции значимо.
4. Построение линейной модели парной регрессии.
Определим линейный коэффициент парной корелляции:
∑(𝑦𝑖 − 𝑦̅)(𝑥𝑖 − 𝑥̅ )
2418.4
𝑟𝑥𝑦 =
=
= 0.994
√∑(𝑦𝑖 − 𝑦̅)2 × ∑(𝑥𝑖 − 𝑥̅ )2 √5364.9 ∙ 1102.4
Уравнение линейной регрессии имеет вид: ŷ = a + b × x
Значения параметров a и b линейной модели определим, используя данные
таблицы
b=
y*x y*x
x x
2
2

10062.3  139.1 * 70.6
 2.19
5094.6  70.6 2
a=𝑦̅ − 𝑏 × 𝑥̅ = 139.1-2.194*70.6=-15.796
𝑦
̂1 = -15.796+2.194*66=129.008
𝑦
̂2 = −15.796 + 2.194 ∗ 58 = 111.456
𝑦
̂3 = −15.796 + 2.194 ∗ 73 = 144.366
𝑦̂4 = −15.796 + 2.194 ∗ 82 = 164.112
𝑦
̂5 = −15.796 + 2.194 ∗ 81 = 161.918
𝑦
̂6 = −15.796 + 2.194 ∗ 84 = 168.5
𝑦
̂7 = −15.796 + 2.194 ∗ 55 = 104.874
𝑦
̂8 = −15.796 + 2.194 ∗ 67 = 131.202
𝑦
̂9 = −15.796 + 2.194 ∗ 81 = 161.918
𝑦̂
10 = −15.796 + 2.194 ∗ 59 = 113.65
1
2
3
4
5
6
7
8
9
10
y
133
107
145
162
163
170
104
132
159
116
x
66
58
73
82
81
84
55
67
81
59
y*x
8778
6206
10585
13284
13203
14280
5720
8844
12879
6844
x*x
4356
3364
5329
6724
6561
7056
3025
4489
6561
3481
𝑦̂
129,008
111,456
144,366
164,112
161,918
168,5
104,874
131,202
161,918
113,65
ε |𝜀/𝑦| ∗ 100%
3,992
3,001504
-4,456
-4,16449
0,634
0,437241
-2,112
-1,3037
1,082
0,663804
1,5
0,882353
-0,874
-0,84038
0,798
0,604545
-2,918
-1,83522
2,35
2,025862
сумма
ср.
Знач
1391
139,1
706 100623 50946
70,6 10062,3 5094,6
-0,004
-0,52849
-0,05285
Уравнение линейной регрессии имеет вид:
у̂ = -15,796+2,194*х
Рассчитаем коэффициент детерминации:
2
𝑅2 = 𝑟𝑦𝑥
= 0.988
Оценку значимости уравнения регрессии проведем с помощью критерия
Фишера:
2
𝑟𝑦𝑥
0.988
(𝑛
𝐹=
×
−
2)
=
× 8 = 658.667
2
1 − 𝑟𝑦𝑥
1 − 0.988
Уравнение регрессии статистически значимое.
Определим среднюю относительную ошибку:
|𝐸𝑖 |
1
−0.528
̅̅̅̅̅̅
𝐸𝑜тн = × ∑
× 100% =
= −0.0528%
𝑛
𝑦
10
В среднем расчетные значения у̂ для линейной модели отличаются от
фактических значений на -0,0528%.
5. Построение степенной модели.
Уравнение степенной модели имеет вид: у̂ = а × х𝑏
Произведем логарифмирование обеих частей уравнения:
lg у̂ = lg a + b lg x
1
2
3
4
5
6
1
2
3
4
5
6
7
8
9
10
итого
ср. знач.
y(t)
133.0
107.0
145.0
162.0
163.0
170.0
104.0
132.0
159.0
116.0
1391
139.1
y
x
Y
133
107
145
162
163
170
2,123852
2,029384
2,161368
2,209515
2,212188
2,230449
66
58
73
82
81
84
lg (y)
2.124
2.029
2.161
2.209
2.212
2.231
2.017
2.121
2.201
2.064
21.369
2.137
x(t)
66
58
73
82
81
84
55
67
81
59
706
70.6
X
YX
X*X
1,819544
1,763428
1,863323
1,913814
1,908485
1,924279
3,864441
3,578672
4,027326
4,2286
4,221927
4,292007
3,31074
3,109678
3,471972
3,662683
3,642315
3,702851
𝑦̂
127,732
108,681
144,885
167,547
164,997
172,671
lg (x)
1.819
1.763
1.863
1.914
1.908
1.924
1.741
1.826
1.908
1.771
18.437
1.844
ε
5,268
-1,681
0,115
-5,547
-1,997
-2,671
|𝜀/𝑦|
∗ 100%
3,960902
-1,57103
0,07931
-3,42407
-1,22515
-1,57118
𝜀2
27,75182
2,825761
0,013225
30,76921
3,988009
7,134241
7
8
9
10
Сум
ма
104
132
159
116
1391
2,017033
2,120574
2,201397
2,064458
21,37022
55
67
81
59
706
1,740363
1,826075
1,908485
1,770852
18,43865
3,51037
3,872327
4,201333
3,65585
39,45285
3,028862
3,334549
3,642315
3,135917
34,04188
101,701
130,156
164,997
111,029
2,299
1,844
-5,997
4,971
-3,396
2,210577
1,39697
-3,7717
4,285345
5,285401
3,400336
35,96401
24,71084
141,8429
Y=lg у̂, X=lg x, A=lg a.
Уравнение примет вид: Y=A+bX – линейное уравнение регрессии.
̅̅̅̅̅̅
𝑌 ∙ 𝑋 − 𝑌̅ ∙ 𝑋̅ 3.9449 − 2.1369 ∗ 1.8437 0.005
=
=
= 1.25
̅̅̅̅
3.4036 − 1.8437 ∗ 1.8437 0.004
𝑋 2 − 𝑋̅ 2
𝐴 = 𝑌̅ − 𝑏𝑋̅ = 2.1369 − 1.25 ∗ 1.8437 = −0.168
Уравнение регрессии: Y=-0,168+1,25Х
у̂ = 10−0,168 ∙ х1,25
у̂ = 0,679 ∙ х1,25
Индекс корреляции:
𝑏=
𝜌𝑦𝑥 = √1 −
∑(𝑦 − 𝑦̂)2
= 0.994
∑(𝑦 − 𝑦̅)2
Связь между показателем у и фактором х можно считать достаточно сильной.
Коэффициент детерминации: 0,989
2
𝑅2 = 𝜌𝑦𝑥
= 0.9942 = 0.989
F критерий Фишера:
𝑅2
0.989
(𝑛
𝐹=
×
−
2)
=
× 8 = 719.273
1 − 𝑅2
1 − 0.989
Cредняя относительная ошибка:
0,37
̅̅̅̅̅̅
𝐸𝑜тн =
= 0,037%
10
В среднем расчетные значения у̂ для степенной модели отличаются от
фактических на 0,037%.
6. Построение показательной функции
Уравнение показательной кривой: у̂ = 𝑎𝑏𝑥
lg у̂ = lg a +x lg b
Y= lg у̂,
B=lg b, A=lg a.
Получим линейное уравнение регрессии: Y=A+Bx
y
1
2
3
4
5
6
7
Y
133
107
145
162
163
170
104
x
2,124
2,029
2,161
2,209
2,212
2,231
2,017
66
58
73
82
81
84
55
Yx
x*x
140,184
117,682
157,753
181,138
179,172
187,404
110,935
4356
3364
5329
6724
6561
7056
3025
̅
У-У
-0,0129
-0,1079
0,0241
0,0721
0,0751
0,0941
-0,1199
8
9
10
2,121
2,201
2,064
21,369
2,1369
67 142,107
81 178,281
59 121,776
706 1516,432
70,6
(𝑌 − 𝑌̅)2 x-𝑥̅
(𝑥
− 𝑥̅ )2
𝑦̂
0,000166
0,011642
0,000581
0,005198
0,00564
0,008855
0,014376
0,000253
0,004109
0,005314
0,056135
21,16
158,76
5,76
129,96
108,16
179,56
243,36
12,96
108,16
134,56
1102,4
итого
Ср. знач
132
159
116
1391
139,1
-4,6
-12,6
2,4
11,4
10,4
13,4
-15,6
-3,6
10,4
-11,6
125,298
110,356
140,023
161,526
158,982
166,736
105,224
127,303
158,982
112,121
(𝑦 − 𝑦̂)2
7,702
-3,356
4,977
0,474
4,018
3,264
-1,224
4,697
0,018
3,879
4489
6561
3481
50946
ε
-0,0159
0,0641
-0,0729
|𝜀/𝑦|
∗ 100%
59,3208
11,26274
24,77053
0,224676
16,14432
10,6537
1,498176
22,06181
0,000324
15,04664
160,9837
5,791
-3,136
3,4324
0,2926
2,465
1,92
-1,177
3,5583
0,0113
3,344
16,5016
1,6502
̅̅̅̅̅̅
𝑌 ∙ 𝑥 − 𝑌̅ ∙ 𝑥̅ 151.643 − 2.137 ∗ 70.6
=
= 0.007
̅̅̅2 ∙ 𝑥̅ 2
5094.6 − 70.6 ∗ 70.6
𝑥
𝐴 = 𝑌̅ − 𝐵 ∙ 𝑥̅ = 2.137 − 0.007 ∗ 70.6 = 1.643
Уравнение будет иметь вид: Y=1.643+0.007x
𝑦̂ = 101.643 ∗ (100.007 )𝑥 = 43.95 ∗ 1.016𝑥
𝐵=
∑(𝑦−𝑦̂)2
Индекс корреляции: 𝜌𝑦𝑥 = √1 − ∑(𝑦−𝑦̅)2 =√1 −
16.098
5364.9
= 0.998
2
Индекс детерминации: 𝑅2 = 𝑃𝑦𝑥
=0.996
F критерий Фишера:
𝑅2
0.996
(𝑛
𝐹=
×
−
2)
=
∗ 8 = 1992
1 − 𝑅2
1 − 0.996
Cредняя относительная ошибка:
16.5016
̅̅̅̅̅̅
𝐸𝑜тн =
= 1.6502%
10
В среднем расчетные значения у̂ для показательной функции отличаются от
фактических на 1,6502%.
7. Построение гиперболической функции
Уравнение гиперболической функции: у̂ = а+b/x
X=1/x
у̂ = а+bX
y
133
107
145
162
163
170
104
132
159
116
1391
139,1
1
2
3
4
5
6
7
8
9
10
итого
Ср.
знач
(𝑌
− 𝑌̅)2
37,21
1030,41
34,81
524,41
571,21
954,81
1232,01
50,41
396,01
533,61
5364,9
x
66
58
73
82
81
84
55
67
81
59
706
70,6
X
0,015152
0,017241
0,013699
0,012195
0,012346
0,011905
0,018182
0,014925
0,012346
0,016949
0,144939
ε
𝑦̂
132,021
109,316
147,806
164,141
162,505
167,296
99,098
134,478
162,505
112,491
1391,657
yX
2,015152
1,844828
1,986301
1,97561
2,012346
2,02381
1,890909
1,970149
1,962963
1,966102
19,64817
(𝑦 − 𝑦̂)2
0,979
-2,316
-2,806
-2,141
0,495
2,704
4,902
-2,478
-3,505
3,509
-0,657
0,958441
5,363856
7,873636
4,583881
0,245025
7,311616
24,0296
6,140484
12,28503
12,31308
81,10465
X*X
0,00023
0,000297
0,000188
0,000149
0,000152
0,000142
0,000331
0,000223
0,000152
0,000287
0,00215
̅
У-У
-6,1
-32,1
5,9
22,9
23,9
30,9
-35,1
-7,1
19,9
-23,1
|𝜀/𝑦|
∗ 100%
0,73609
-2,16449
-1,93517
-1,3216
0,303681
1,590588
4,713462
-1,87727
-2,2044
3,025
0,865882
̅̅̅̅̅̅
𝑦 ∙ 𝑋 − 𝑦̅ ∙ 𝑋̅
1.9648 − 139.1 ∗ 0.0145
=
= −10864.583
̅̅̅̅
0.000215 − 0.0145 ∗ 0.0145
𝑋 2 − 𝑋̅ 2
𝑎 = 𝑦̅ − 𝑏𝑋̅ = 139.1 + 10864.583 ∗ 0.0145 = 296.636
Уравнение гиперболической модели: у̂ = 296.636 − 10864.583⁄𝑥
𝑏=
∑(𝑦−𝑦̂)2
𝜌𝑦𝑥 = √1 − ∑(𝑦−𝑦̅)2 =√1 −
81.105
5364.9
= 0.992
2
𝑅2 = 𝜌𝑦𝑥
= 0.9922 = 0.985
𝑅2
0.985
(𝑛
𝐹=
×
−
2)
=
∗ 8 = 525.333
1 − 𝑅2
1 − 0.985
Cредняя относительная ошибка:
0.866
= 0.0866%
10
В среднем расчетные значения у̂ для гиперболической модели отличаются от
фактических значений на 0.0866%.
Для выбора лучшей модели построим сводную таблицу результатов:
̅̅̅̅̅̅
𝐸𝑜тн =
Линейная модель
Степенная модель
Показательная
модель
Гиперболическая
модель
Коэффициент
детерминации
𝑅2
0.988
0.989
0.996
F критерий
Фишера
658.667
719.273
1992
Индекс
корреляции
𝜌𝑦𝑥
0.994
0.994
0.998
Cредняя
относительная
ошибка ̅̅̅̅̅̅
𝐸𝑜тн
-0.0528
0.037
1.6502
0.985
525.333
0.992
0.0866
Все модели имеют примерно одинаковые характеристикиб но большее
значение критерия Фишера и большее значение коэффициента детерминации
имеет гиперболическая модель. Ее можно взять в качестве лучшей для
построения прогноза.
Download