корреляционно-регрессионная модель зависимости объема

advertisement
УДК 330.562.338.43
Пронченко Л.В., д.э.н., профессор
КОРРЕЛЯЦИОННО-РЕГРЕССИОННАЯ МОДЕЛЬ ЗАВИСИМОСТИ
ОБЪЕМА ВЫПУСКА ПРОДУКЦИИ И ФАКТОРОВ
ВОЗДЕЙСТВУЮЩИХ НА НЕГО
Разработана
модель
зависимости
объема
выпуска
сельскохозяйственной продукции и факторов воздействующих на него.
КЛЮЧЕВЫЕ СЛОВА: ОБЪЕМ ВЫПУСКА ПРОДУКЦИИ,
РЕГРЕССИОННЫЙ АНАЛИЗ, КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ,
УРАВНЕНИЕ, ВЗАИМОЗАВИСИМОСТЬ.
Совершенствование управления в сельском хозяйстве приводит к
увеличению числа факторов, воздействующих на обобщающие показатели
деятельности, в том числе на объем выпуска продукции. Влияние каждого
фактора на величину выпуска является многоступенчатым, зависящим от
других факторов.
Изучение сложной системы взаимосвязей между экономическими
показателями в условиях неопределенности их формирования требует
применения методов математической статистики, которые учитывают
стохастические связи. Одним из таких методов является корреляционнорегрессионный анализ.
Объем выпуска продукции, как стоимостная экономическая
категория, характеризуется многомерной системой факторов. Сложность
этого показателя, невозможность на стадии теоретического анализа
получения однозначного решения о правильности произведенного отбора
факторов, обуславливает особый интерес исследования корреляционной
зависимости величины выпуска продукции от факторов, ее формирующих,
и их совокупности действия.
В целях установления правомерности отбора факторов при анализе
применяется разработанный и подробно освещенный в экономической
литературе многошаговый регрессионный анализ, при пользовании
которым на первой стадии отбираются все факторы, поддающиеся
количественному измерению, а на второй и последующих отсеиваются
несущественные факторы.
Регрессионный анализ позволяет измерить влияние таких факторов,
которые с помощью только функционального анализа определить не
возможно. В процессе регрессионного анализа в математической форме
определяется долевое участие различных факторов, находящихся с
объемом выпуска в стохастической зависимости. В регрессионном анализе
объем выпуска рассматривается как зависимая переменная (функция), а
факторы, ее определяющие, как независимые переменные (аргументы).
Целью регрессионного анализа является раскрытие характера и
степени влияния аргументов-факторов на функцию - объем выпуска
продукции. Изучение этой связи происходит в несколько этапов:
- постановка задачи, отбор основных факторов, влияющих на
уровень выпущенной продукции;
- выбор вида связи между анализируемыми показателями;
- решение уравнения;
- анализ полученных результатов и их использование для оценки
деятельности.
Проведем корреляционно - регрессионный анализ производства
сельскохозяйственной продукции по областям Центрального и СевероЗападного округам России.
Для проведения анализа объема выпуска продукции выделим
следующие основные факторы, которые оказывают наиболее
существенное влияние на ее уровень:
- численность сельского населения (тыс. чел.);
- инвестиции в основной капитал (млн. руб.);
- производство зерна на душу населения (кг);
- производство картофеля на душу населения (кг);
- производство скота и птицы на убой на душу населения (кг);
- производство молока на душу населения (кг);
- производство яиц на душу населения (шт).
Чем большая совокупность факторов исследуется, тем точнее
результаты анализа.
При отборе факторов учтены причинно-следственные связи между
показателями и исключены те факторы, связь которых с результативным
показателем имеет криволинейный характер.
Для проведения корреляционно-регрессионного анализа представим
исходные данные по Центральному и Северо-Западному округам России
(таблица 1).
Таблица 1
Исходные данные по Центральному и Северо-Западному округам России
для расчета зависимости объема производства сельскохозяйственной
продукции и факторов воздействующих на него
Округ,
Область
(респуб
л.)
Производ
ство
продукци
и
с.-х.
(млн.
руб.)
Численн
ость
сельског
о
населен
ия
(тыс.
чел.)
Инвестиции
в основной
капитал
(млн.
руб.)
Произво
дство
зерна
на душу
населен
ия (кг)
Произво
дство
картоф.
на душу
населен
ия (кг)
Производс
тво скота
и птицы
на убой на
душу
насел.(кг)
Произво
дство
молока
на душу
населен
ия (кг)
Произво
дство
яиц
на душу
населени
я (шт)
Центр
альный
округ
Белгор
одская
Брянск
ая
Влади
мирска
я
Ворон
ежская
Ивано
вская
Калин
инска
Костр
омская
Курска
я
Липец
кая
Моско
вская
Орлов
ская
Рязанс
кая
Смоле
нская
Тамбо
вская
Тверск
у
Х₁
Х₂
Х₃
Х₄
Х₅
Х₆
Х₇
78701
512
35572
2144
314
354
377
930
21279
408
2201
423
539
65
275
268
18737
319
3423
123
186
30
220
347
69020
833
14172
1990
516
57
285
281
8869
206
1301
94
100
22
167
278
18443
238
3445
190
322
51
225
214
12185
218
781
119
221
34
226
797
41123
413
3779
2892
714
67
358
179
39381
417
13123
2498
432
110
255
422
62244
1287
29679
36
106
28
133
84
24960
291
6139
2725
499
72
308
247
26506
347
3039
1331
330
41
319
415
13264
275
1316
162
216
34
341
256
35552
461
4836
2605
393
52
246
193
16039
352
2922
107
174
38
253
127
ая
Тульск
ая
Яросл
авская
Северо
Западн
ый
округ
Карел
ия
Коми
Архан
гельск
ая
Волог
одская
Калин
инград
ская
Ленин
градск
ая
Мурма
нская
Новго
родска
я
Псков
ская
27984
310
4401
855
395
49
155
380
16696
238
3785
78
137
32
223
642
3674
162
612
1
114
12
103
82
5854
7991
231
334
664
1971
1
2
96
99
19
12
64
99
181
134
19993
15
3190
193
21
42
394
418
15134
220
12260
243
128
29
143
144
41342
548
9412
60
200
90
340
1444
2596
74
574
1
10
9
35
199
8499
190
1709
26
292
27
172
238
9134
224
2021
44
161
31
337
109
Рассчитанные коэффициенты парной корреляции показали наличие
различной тесноты связи между объемом производства продукции и
факторами. Это дает основание все отобранные факторы включить в
модель анализа.
Чтобы наиболее полно определить совместное влияние изменения
вышеперечисленных
факторов
на
результативный
показатель,
воспользуемся функцией ЛИНЕЙНАЯ рабочего листа Excel. В таблице 2
представлены результаты вычислений данной функции.
Таблица 2
Результаты вычислений, выполненных с помощью функции ЛИНЕЙНАЯ
8,115
24,186 27,023 7,107 4,376 0,838 33,108
-7097,71
4,7801
14,361
0,947
5451,994
46,117
18
9595616672 535036490,4
47,88 12,92 1,998 0,442 10,619 3332,333
-
Из таблицы 2 видно, что коэффициент детерминации r2 равен 0,947
(см. строку 3, графа 1), что указывает на сильную зависимость между
независимыми переменными и объемом производства продукции.
Результат, рассчитанный с помощью функции ЛИНЕЙНАЯ,
представляет уравнение регрессии, с помощью которого можно
предсказать объем производства сельскохозяйственной продукции по
исследуемым округам (областям)
на основе изменения выбранных
факторов.
у = 33,1*х1 +0,8*х2 + 4,37*х3 + 7,1*х4 +27,1*х5 +24,2*х6+8,1*х77097,7
где:
у – объем производства сельскохозяйственной продукции (млн. руб.)
х1-численность сельского населения (тыс. чел.);
х2-инвестиции в основной капитал (млн. руб.);
х3-производство зерна на душу населения (кг);
х4 -производство картофеля на душу населения (кг);
х5-производство скота и птицы на убой на душу населения(кг);
х6-производство молока на душу населения (кг);
х7-производство яиц на душу населения (шт).
В правой части уравнения находятся восемь слагаемых. Первые семь
слагаемых представляют собой произведения соответствующих
коэффициентов корреляции и независимых переменных (х1-х7). Последнее
слагаемое представляет собой отрезок на оси ординат (у-пересечение).
Коэффициенты уравнения показывают количественное воздействие
каждого фактора на результативный показатель при неизменности других.
В данном случае можно дать следующую интерпретацию
полученному уравнению: при увеличении численности сельского
населения
на
одну
тысячу
человек
объем
производства
сельскохозяйственной продукции увеличится на 33,1 млн. рублей; с
увеличение инвестиций в основной капитал на один млн. рублей объем
производства возрастет на 0,8 млн. рублей; при увеличении производства
зерна на душу населения на один кг – 4,37 млн. руб.; при росте
производства картофеля на душу населения на один кг – 7,1 млн. руб.; при
увеличении производства скота и птицы на убой на душу населения на
один кг и производства молока на душу населения на один кг объем
производства соответственно возрастет на 27,1 и 24,1 млн. рублей;
Далее следует определить является ли этот результат (с таким
высоким значением коэффициентом детерминации) случайным. Для этого
можно использовать F-статистику. Предположим (гипотеза), что на самом
деле нет взаимосвязи между переменными, просто статистический анализ
вывел сильную взаимозависимость. Если F-наблюдаемое больше, чем Fкритическое, то взаимосвязь между переменными имеется. F-критическое
можно получить из таблицы F-критических значений в любом справочнике
по математической статистике. Для того, чтобы найти это значение,
используя односторонний тест, положим величину Альфа равной 0,05, а
для числа степеней свободы (обозначаемых обычно v1 и v2), положим v1 =
k = 7 и v2 = n – (k + 1) = 26 – (7 + 1) = 18, где k – это число переменных, а n
– число точек данных. Из таблицы справочника F-критическое равно 2,51.
F-наблюдаемое равно 46,117 (см. четвертую строку первой колонки
таблицы 2), что заметно больше чем F-критическое (2.51). Следовательно,
полученное регрессионное уравнение полезно для предсказания
зависимости объема продаж от факторов воздействующих на них.
После экономического и статистического анализа параметров
уравнения произведем анализ соответствия фактических значений объема
производства сельскохозяйственной продукции (млн. руб.) с расчетным
значениям по приведенным регионам двух округов (таблица 3).
Таблица 3
Фактические и расчетные значения объема производства
сельскохозяйственной продукции (млн. руб.)
Центральный округ Фактические значения Расчетные значения Отклонения (+,-)
Белгородская
78701
77539,85418
1161,145823
Брянская
21279
24522,08048
-3243,080476
Владимирская
18737
17143,41598
1593,584022
Воронежская
69020
55460,51685
13559,48315
Ивановская
8869
8825,954701
43,04529941
Калининская
Костромская
Курская
Липецкая
Московская
Орловская
Рязанская
Смоленская
Тамбовская
Тверская
Тульская
Ярославская
Северо-Западный
округ
Карелия
Коми
Архангельская
Вологодская
Калининградская
Ленинградская
Мурманская
Новгородская
Псковская
18443
12185
41123
39381
62244
24960
26506
13264
35552
16039
27984
16696
15349,0617
15719,94458
39400,5977
44284,90842
65973,75593
34559,53045
27302,61836
16599,37255
35337,97904
16889,2908
21564,26563
16740,83157
3093,938299
-3534,944582
1722,402302
-4903,908416
-3729,755928
-9599,530453
-796,6183608
-3335,372554
214,0209605
-850,2907989
6419,734373
-44,83156625
3674
5854
7991
19993
15134
41342
2596
8499
9134
3074,848965
5324,321605
10132,41761
11125,67621
17854,34339
42999,42248
-1385,99095
9636,990014
13223,99176
599,1510355
529,6783947
-2141,41761
8867,32379
-2720,343393
-1657,422484
3981,990947
-1137,990014
-4089,99176
Отклонения незначительны, следовательно, можно использовать
полученную корреляционно-регрессионную модель для анализа и
прогнозирования.
Список литературы:
1. Калберг Конрад, Бизнес – анализ с помощью Excel: Пер. с англ. –
К.: Диалектика, 1997. – 448с.
Download