3. Варианты заданий контрольной работы №1

advertisement
Оглавление
Введение ...............................................................................................2
1. Однофакторный регрессионно-корреляционный анализ экономической модели 3
2. Типовой пример выполнения контрольной работы № 1 .............8
3. Варианты заданий контрольной работы №1...............................19
Литература .........................................................................................21
Приложения .......................................................................................22
Введение
В соответствии с учебным планом и рабочей программой по дисциплине «Эконометрика»
каждый студент, обучающийся по направлению 080100.62 – экономика должен выполнить в VI
семестре одну домашнюю контрольную работу (№ 1).
Задания контрольной работы ориентированы на освоение начального курса эконометрики.
Изучение этой дисциплины предполагает приобретение студентами опыта построения
эконометрических моделей, принятия решения о спецификации и идентификации модели, оценки
параметров модели, интерпретации результатов, получения прогнозных оценок.
Контрольная работа № 1 «Парная регрессия и корреляция» содержит 5 заданий. Перед
выполнением заданий контрольной работы рекомендуется ознакомиться /1/ с соответствующими
темами указанного раздела эконометрики:
– линейная модель наблюдений;
– оценка существенности параметров линейной регрессии и корреляции;
– нелинейная связь между переменными;
– интервалы прогноза по линейному уравнению регрессии;
– нелинейная регрессия;
– корреляция для нелинейной регрессии;
– средняя ошибка аппроксимации.
В данных методических указаниях в краткой форме приведены основные понятия
перечисленных тем, предложен пример выполнения контрольной работы В конце методических
указаний содержатся варианты заданий контрольной работы №1 и основные статистико–
математические таблицы, необходимые для решения задач.
1. Однофакторный регрессионно-корреляционный анализ экономической модели
Уравнение связи двух переменных у и х
 
y  f (x)
называется уравнением парной регрессии (однофакторной моделью). Переменную y при этом
называют результативным признаком (эндогенной переменной), а переменную х – факторным
признаком (экзогенной переменной).
Пусть имеется n значений переменных у и х: уi и хi (i = 1, 2 ,…, n). Разместив на
плоскости в прямоугольной системе координат точки (хi, уi) с абсциссами хi и ординатами уi ,
получим диаграмму регрессии (поле корреляции). Эти точки будут образовывать облако
рассеяния, вытянутое в некотором направлении. По виду поля корреляции формулируют гипотезу
о форме связи.
Различают линейные и нелинейные регрессии.
Линейная модель наблюдений имеет вид
у i  (а  b  хi )   i , (i = 1, 2,…, n).
Нелинейные регрессии делятся на два класса:
– регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но
линейные по оцениваемым параметрам. Например, полиномы разных степеней
у  а  bx  cx 2   ,
у  а  bx  cx 2  dx 3   ,
b
;
x
– регрессии нелинейные по оцениваемым параметрам. Например,
степенная функция у  аx b   ,
равносторонние гиперболы у  а 
показательная функция у  аb x   ,
экспоненциальная функция у  e a bx   .
Построение уравнения регрессии сопровождается оценкой его параметров. Для оценки
параметров регрессий, линейных по параметрам, используют метод наименьших квадратов
(МНК).
Согласно МНК, среди всех возможных значений параметров  и , претендующих на роль
оценок параметров а и b, следует выбрать такую пару , , для которой


  2   ( у i  у i ) 2  min  ( у i  у i ) 2 .
n
n
i 1
i 1
n
 ,  i 1
Иначе говоря, выбирается такая пара параметров , , для которой сумма квадратов
невязок оказывается наименьшей.
Для линейных и приводимых к линейным нелинейных уравнений, заданное условие
приводит к системе нормальных уравнений
n
n
n   x i   y i ,
i 1
i 1
n
n
n
i 1
i 1
i 1
  xi   xi2   xi yi .
решая которую, имеем

где
cov( x, y ) у  х  у  х

,   у  х ,
var( x)
х2  х 2
n
х
 xi
i 1
n
– среднее значение последовательности х1, х2,…, хn,
n
у
 уi
i 1
n
– среднее значение последовательности у1, у2,…, уn,
n
var( x) 
 ( xi  x ) 2
i 1
– выборочная дисперсия,
n
n
соv( x, y ) 
 ( xi  x )( у i  у )
i 1
– выборочная ковариация.
n
Для любой точки (хi, уi) на диаграмме рассеяния можно записать


уi  y  ( уi  уi )  ( уi  y ) ,

где у i      х i – ордината точки линии регрессии (модели), имеющей абсциссу хi.
Задача дисперсионного анализа состоит в анализе дисперсии зависимой переменной.
Возведем обе части последнего представления в квадрат и просуммируем левые и правые
части полученных для каждого из i равенств соответственно, получим
n
 ( уi
i 1
n
n
n


 
 y ) 2   ( у i  y i ) 2   ( у i  y ) 2  2 ( у i  y i )( у i  y ) .
Рассмотрев сумму
i 1
n
 ( уi
i 1
i 1
i 1
 
 y i )( у i  y ) более подробно, можно показать, что она в силу
системы нормальных уравнений равна нулю.
Тогда
n
 ( уi
i 1
общая
сумма квадратов
отклонений
TSS
сумма квадратов
отклонений,
объясненная
регрессией
ESS
n
n


 y ) 2   ( уi  y ) 2   ( уi  yi ) 2
i 1
(1)
i 1
остаточная
сумма
квадратов
отклонений
RSS
Выражение (1) представляет собой разложение полной суммы квадратов на сумму
квадратов, объясненную моделью, и остаточную сумму квадратов.
Долю дисперсии, объясняемую регрессией в общей дисперсии результативного признака у,
характеризует коэффициент (индекс) детерминации R 2
n

 ( у i  y ) 2 ESS
R 2  i n1

.
TSS
2
 ( уi  y)
i 1
Этот коэффициент изменяется в пределах от 0 (при   0 , т.е. RSS = TSS) до 1 (при RSS =
0). Таким образом,
0  R2  1.
Значение R 2 тем выше, чем больше доля объясненной моделью суммы квадратов ESS по
отношению к полной сумме квадратов TSS.
Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции
ryx для линейной регрессии (  1  r  1 )
rхy  
 х cov( x, y) у  х  у  х
,


у
х у
х у
где  y ,  x – средние квадратические ошибки выборки величин х и у,
и индекс корреляции  хy – для нелинейной регрессии ( 0   хy  1 )
 ( уi

 yi ) 2
 ( уi
 y)
n
 ху  1 
i 1
n
.
2
i 1
Чем ближе значение коэффициента (или индекса) корреляции к единице, тем теснее
корреляционная связь.
Заметим, что коэффициент детерминации есть квадрат коэффициента или индекса
корреляции.
Средний коэффициент эластичности для рассматриваемой парной модели регрессии
рассчитывается по формуле
Э yх  f ( x)
х
у
и показывает, на сколько процентов в среднем по совокупности изменится результативный
признак у от своей средней величины при изменении факторного признака х на один процент.
Бета–коэффициент показывает, на какую часть величины своего среднего
квадратического отклонения изменится в среднем значение результативного признака при
изменении факторного признака на величину его среднего квадратического отклонения и задается
формулой
 yх  
x
.
y
После того, как построено уравнение регрессии, необходимо провести оценку значимости
как уравнения в целом, так и отдельных его параметров. Оценка значимости уравнения регрессии
часто делается с помощью F – критерия Фишера. При этом выдвигается нулевая гипотеза Н0 о
том, что коэффициент регрессии равен нулю ( = 0) и тем самым предполагается, что фактор х не
оказывает влияния на результат у.
Существует равенство между числом степеней свободы общей и факторной с остаточной
суммами квадратов. Имеем два соответствующих друг другу равенства
n
n
i 1
i 1


n
 ( у  y ) 2   ( у  y) 2   ( у  y) 2 ,
i 1
n – 1 = 1 + (n –2).
Разделив каждую сумму квадратов на соответствующее ей число степеней свободы,
получим средний квадрат отклонений, или дисперсию D на одну степень свободы
n
Dобщ 
 ( у  y) 2
i 1
n 1
n
, Dфакт 

 ( у  y) 2
i 1
1
n
, Dост 

 ( у  y) 2
i 1
n2
.
Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы,
получим F – критерий
F
Dфакт
Dост

rxy2
1  rxy2
(n  2) .
Разработаны таблицы (см. приложение) критических значений F – критерия при разных
уровнях существенности нулевой гипотезы и различном числе степеней свободы. Вычисленное
значение F – критерия признается достоверным (отличным от единицы), если оно больше
табличного (Fфакт>Fтабл,). В этом случае нулевая гипотеза Но об отсутствии связи признаков
отвергается.
Если же его величина окажется меньше табличной (Fфакт<Fтабл,), то вероятность нулевой
гипотезы Но выше заданного уровня значимости  (например  = 0,05) и она не может быть
отклонена без серьезного риска сделать неправильный вывод о наличии связи. В этом случае
уравнение регрессии считается статистически незначимым, Но не отклоняется.
Оценка значимости уравнения регрессии обычно дается в виде таблицы 1 дисперсионного
анализа
Таблица 1
Источники
вариации
Число
степене
й
свобод
ы
Сумма
квадратов
отклонений
n–1
 ( у  y)
2
Dобщ 
i 1

 ( у  y) 2
 ( у  y) 2
i 1
n 1
1
i 1
n–2
i 1
Dфакт 
1

n

 ( у  y) 2
n
Остаточная

n
 ( у  y) 2
n
Объясненная
F – отношение
таблич.
факт
при
=0,05
n
n
Общая
Дисперсия
на одну
степень
свободы
Dост 
i 1
 ( у  y) 2
i 1
n2
В линейной регрессии обычно оценивается не только уравнение в целом, но и отдельные
его параметры. С этой целью по каждому из параметров определяется его стандартная ошибка: m,
m.
Стандартная ошибка коэффициента регрессии определяется по формуле

n
m 
 ( y  y) 2
(n  2)
i 1
n
 (x  x)

где
n
 (x  x)
2
i 1
2
 ост
2
 ост

2
 ост
x n
,
i 1
 Dост – остаточная дисперсия на одну степень свободы
n
 ост 

 ( yi  yi ) 2
i 1
n2
.
Для оценки существенности коэффициента регрессии его величина сравнивается с его

стандартной ошибкой, т.е. определяется фактическое значение t – критерия Стьюдента t  
,
m
которое затем сравнивается с табличным значением (см. приложение) при определенном уровне
значимости  и числе степеней свободы (n – 2).
2
Можно показать справедливость равенства t   F .
Если фактическое значение t – критерия превышает табличное, то гипотезу о
существенности коэффициента можно отклонить.
Границы доверительного интервала коэффициента регрессии  определяются как
  t   m .
Стандартная ошибка параметра  определяется по формуле

n
 ( y  y) 2
i 1
m 
n2
n

n
 x2
i 1
n
n ( x  x )
2
  ост

2
i 1
Процедура
оценивания
 x2
 ост 
i 1
n

n ( x  x )
2
n
 x2
i 1
n x
.
i 1
существенности
данного
параметра
не
отличается от

рассмотренной выше для коэффициента регрессии. Вычисляется t – критерий: t  
, его
m
величина сравнивается с табличным значением при (n –2) степенях свободы и заданном уровне
значимости .
Границы доверительного интервала параметра  определяются как   t   m .
Предельная ошибка  каждого показателя имеет вид
   t табл m  ,   tтаблm .
Значимость линейного коэффициента корреляции проверяется по
коэффициента корреляции
m rху 
При этом, t r 
rxy
m rху
1  rxy2
n2
величине ошибки
.
– фактическое значение t – критерия Стьюдента.
Данная формула свидетельствует о том, что в парной линейной регрессии t r  F , и
t t
2
r
2
.
Т.о., проверка гипотез о значимости коэффициентов регрессии и корреляции равносильна
проверке гипотезы о существенности уравнения регрессии.
Если значение t r значительно превышает табличное значение при заданном уровне
значимости , то коэффициент корреляции существенно отличен от нуля, и построенная модель
является достоверной.
Рассмотренная оценка коэффициента корреляции рекомендуется к применению при
большом числе наблюдений и если r не близок к +1 или –1.
Фактические значения результативного признака у отличаются от теоретических значений

у , рассчитанных по уравнению регрессии. Чем меньше это отличие, тем ближе теоретические
значения подходят к эмпирическим данным, лучше качество модели.
Величина отклонений фактических и расчетных значений результативного признака

( у  у ) по каждому наблюдению представляет ошибку аппроксимации. Их число соответствует

объему совокупности. Отклонения ( у  у) несравнимы между собой. Так, если для одного

наблюдения ( у  у )  5 , а для другого оно равно 10, то это не означает, что во втором случае
модель дает вдвое худший результат. Для сравнения используются величины отклонений,
выраженные в процентах к фактическим значениям.
Чтобы иметь общее представление о качестве модели, из относительных отклонений по
каждому наблюдению определяют среднюю ошибку аппроксимации – среднее отклонение
расчетных значений от фактических

1 n у  yi
1 n
А  i
 100 %   Ai  100 % .
n i 1 у i
n i 1
Допустимый предел значений А – не более 8–10%.
Прогнозное значение ур определяется путем подстановки в уравнение регрессии

у х      х соответствующего (прогнозного) значения хр.
Средняя стандартная ошибка прогноза определяется по формуле
m y p  ост  1 
( x p  x )2
1
.
 n
n
2
 ( xi  x )
i 1
Границы доверительного интервала прогноза определяются как

y p   y p , где
 y p  t табл  m y p – ошибка прогноза.
2. Типовой пример выполнения контрольной работы № 1
Задача
По территориям региона приводятся данные за 199Х год (табл.2). Требуется:
1. Построить поле корреляции.
2. Для характеристики зависимости у от х:
а) построить линейное уравнение парной регрессии у от х;
б) оценить тесноту связи с помощью показателей корреляции и коэффициента
детерминации;
в) оценить качество линейного уравнения с помощью средней ошибки аппроксимации;
г) дать оценку силы связи с помощью среднего коэффициента эластичности и бета –
коэффициента;
д) оценить статистическую надежность результатов регрессионного моделирования с
помощью F – критерия Фишера.
е) оценить статистическую значимость параметров регрессии и корреляции.
3. Проверить результаты, полученные в п. 2 с помощью ППП Excel.
4. Рассчитать параметры показательной парной регрессии. Проверить результаты с
помощью ППП Excel. Оценить статистическую надежность указанной модели с помощью F –
критерия Фишера.
5. Обоснованно выбрать лучшую модель и рассчитать по ней прогнозное значение
результата, если прогнозное значение фактора увеличится на 5% от среднего уровня. Определить
доверительный интервал прогноза при уровне значимости  = 0,05.
Таблица 2
Средне душевой
№ региона
1
2
3
4
5
6
7
8
9
10
11
12
прожиточный минимум
в день, руб .
Среднедневная зарплата,
руб.
х
у
78
82
87
79
89
106
67
88
73
87
76
115
133
148
134
154
162
195
139
158
152
162
159
173
Решение
1. Построим поле корреляции, для чего отложим на плоскости в прямоугольной
системе координат точки (хi, уi) (рис 1.)
Поле корреляции
250
200
150
100
50
60
80
100
120
Рисунок 1
2. Для расчета параметров линейной регрессии строим расчетную таблицу 3
Таблица 3
2 а) Построим линейное уравнение парной регрессии у по х. Используя данные таблицы 3,
имеем

ух ух
х2  х 2

13844  155,75  85,58
 0,92 ,
7492,25  85,58 2
  у  х  155,8  0,92  85,58  76,976 .
Тогда линейное уравнение парной регрессии имеет вид

у  76,976  0,92  х .
Оно показывает, что с увеличением среднедушевого прожиточного минимума на 1 руб.
средняя зарплата возрастает в среднем на 0,92 руб.
2 б) Тесноту линейной связи оценим с помощью линейного коэффициента парной
корреляции
rхy  
х
12,95
 0,92 
 0,721 .
у
16,53
Найдем коэффициент детерминации
R 2  rхy2  0,5198 .
Это означает, что почти 52% вариации заработной платы у объясняется вариацией фактора
х – среднедушевого прожиточного минимума.
2 в) Для оценки качества полученной модели найдем среднюю ошибку аппроксимации
А

1 n уi  yi
1 n
69,025
 100%   Ai  100% 
%  5,752% .

n i 1 уi
n i 1
12
В среднем, расчетные значения отклоняются от фактических на 5,752%. Качество
построенной модели оценивается как хорошее, т.к. значение А – менее 8 %.
2 г) Для оценки силы связи признаков у и х найдем средний коэффициент эластичности
Э yх  f ( x)
х
х
0,92  85,58


 0,5057 .
у   х 76,976  0,92  85,58
Т.о., в среднем на 0,5% по совокупности изменится среднедневная зарплата от своей
средней величины при изменении среднедушевого прожиточного минимума в день одного
трудоспособного на 1%.
Бета–коэффициент
 yх  
x
12,95
 0,92 
 0,72 ,
y
16,53
показывает, что среднее квадратическое отклонение среднедневной зарплаты изменится в среднем
на 72% от своего значения при изменении прожиточного минимума в день одного
трудоспособного на величину его среднего квадратического отклонения.
2 д) Для оценки статистической надежности результатов используем F – критерий
Фишера.
Выдвигаем нулевую гипотезу Но о статистической незначимости полученного линейного
уравнения.
Рассчитаем фактическое значение F – критерия при заданном уровне значимости  = 0,05
Fфакт 
rxy2
1  rxy2
(n  2) 
0,52 2
1  0,52 2
(12  2)  10,828 .
Сравнивая табличное Fтабл=4,96 и фактическое Fфакт  10,828 значения, отмечаем, что
Fфакт  Fтабл ,
что указывает на необходимость отвергнуть выдвинутую гипотезу Но.
2 е) Оценку статистической значимости параметров регрессии проведем с помощью t –
статистики Стьюдента и путем расчета доверительного интервала для каждого из показателей.
Выдвигаем гипотезу H0 о статистически незначимом отличии показателей регрессии от
нуля:  =  = rxy = 0.
Табличное значение t – статистики tтабл для числа степеней свободы
df = n – 2 = 12 – 2 = 10
при заданном уровне значимости  = 0,05 составляет 2,23.
Определим величину случайных ошибок
 ост 
m 
n
 x2
i 1
n x

12,55  89907
 24,212 ,
12  12,95
m 
m rху 
 ост
x n
1  rxy2
n2
12,55

 0,28 ,
12,95 12

1  0,52
 0,219 .
12  2
Найдем соответствующие фактические значения t – критерия Стьюдента
t 


76,976
0,92

 3,291 , t  

 3,179 ,
m 0,28
m 24,212
tr 
rxy
m rху

0,721
 3,291 .
0,219
Фактические значения t – статистики превосходят табличное значение tтабл= 2,23
t   3,291  t табл ,
t   3,179  t табл ,
t r  3,291  t табл ,
поэтому гипотеза H0 о статистически незначимом отличии показателей регрессии от нуля
отклоняется, т.е. параметры ,  и rxy не случайно отличаются от нуля, а статистически значимы.
Для расчета доверительных интервалов для параметров  и  определим их предельные
ошибки
   t табл m   2,23  24,212  53,947 ,
  tтаблm  2,23  0,28  0,623 .
Доверительные интервалы
для параметра : (23,029; 130,923),
для параметра : (0,297; 1,5436).
С вероятностью
р = 1 –  = 1 – 0,05 = 0,95
можно утверждать, что параметры  и , находясь в указанных границах, не принимают нулевых
значений, т.е. не являются статистически незначимыми и существенно отличны от нуля.
3. Проверим результаты, полученные в п. 2 с помощью ППП Excel.
Параметры парной регрессии вида у    х определяет встроенная статистическая
функция ЛИНЕЙН. Порядок вычисления следующий:
1) ведите исходные данные или откройте существующий файл, содержащий
анализируемые данные;
2) выделите область пустых ячеек 5х2 (5 строк, 2 столбца) для вывода результатов
регрессионной статистики;
3) активизируйте Мастер функций любым из способов:
а) в главном меню выберете Вставка/Функция;
б) на панели Стандартная щелкните по кнопке Вставка функции (рис. 4)
(в результате появится диалоговое окно Мастер функций (рис. 2));
4) в окне Категория (рис. 2) выберите Статистические, в окне Функция – ЛИНЕЙН.
Щелкните по кнопке ОК (в результате появится диалоговое окно ввода аргументов функции
ЛИНЕЙН (рис. 3));
Рисунок 2. Диалоговое окно «Мастер функций»
Рисунок 3. Диалоговое окно ввода аргументов функции ЛИНЕЙН
5) заполните аргументы функции (рис. 3):
Известные значения у – диапазон, содержащий данные результативного признака;
Известные
значения
х – диапазон, содержащий данные факторов независимого
признака;
Константа – логическое значение, которое указывает на наличие или на отсутствие
свободного члена в уравнении; если Константа = 1, то свободный член рассчитывается
свободным образом, если Константа = 0, то свободный член равен 0;
Статистика – логическое значение, которое указывает, выводить дополнительную
информацию по регрессионному анализу или нет; если Статистика
= 1, то
дополнительная информация выводится, если Статистика = 0, то выводятся только
оценки параметров уравнения
Щелкните кнопкой ОК;
6) в левой верхней ячейке выделенной области появится первый элемент итоговой
таблицы. Чтобы раскрыть всю таблицу. Нажмите клавишу <F2>, а затем – на комбинацию клавиш
<CTRL>+<SHIFT>+<ENTER>.
Дополнительная регрессионная статистика будет выводиться в порядке, указанном в
следующей схеме (табл. 4)
Таблица 4
Значение коэффициента 
Значение коэффициента 
Среднее квадратическое
отклонение 
Среднее квадратическое
отклонение 
Коэффициент детерминации R2
Cреднеквадратическое отклонение у
F – статистика
Число степеней свободы
Регрессионная сумма квадратов
Остаточная сумма квадратов
Для данных рассматриваемого примера результат вычисления функции ЛИНЕЙН
представлен на рис. 4
Мастер функции
Рисунок 4. Результат вычисления функции ЛИНЕЙН
Замечание
С помощью инструмента анализа данных Регрессия, помимо результатов регрессионной
статистики, дисперсионного анализа и доверительных интервалов, можно получить остатки и
графики подбора линии регрессии, остатков и нормальной вероятности. Порядок действий
следующий:
1) проверьте доступ к пакету анализа. В главном меню последовательно выберите
Сервис/Настройки. Установите флажок Пакет анализа (рис. 5);
Рисунок 5. Подключение надстройки Пакет анализа
2) в главном меню выберите Сервис/Анализ данных/Регрессия (рис. 6). Щелкните по
кнопке ОК;
Рисунок 6. Диалоговое окно Анализ данных
3) заполните диалоговое окно ввода данных и параметров вывода (рис. 7):
Входной интервал Y – диапазон, содержащий данные результативного признака;
Входной интервал Х – диапазон, содержащий данные факторов независимого признака;
Метки – флажок, который указывает, содержит ли первая строка названия столбцов или
нет;
Константа – нуль – флажок, указывающий на наличие или на отсутствие свободного
члена в уравнении;
Входной интервал – достаточно указать левую верхнюю ячейку будущего диапазона;
Новый рабочий лист – можно задать произвольное имя нового листа.
Если необходимо получить информацию и графики остатков, установите соответствующие
флажки в диалоговом окне. Щелкните кнопкой ОК.
Рисунок 7. Диалоговое окно ввода параметров инструмента Регресси
Результаты регрессионного
представлены на рис. 8
анализа
для
данных
рассматриваемой
Рисунок 8. Результаты применения инструмента Регрессия
задачи
Сравнивая полученные вручную и с помощью ППП Excel.
правильности выполненных действий.
данные, убеждаемся в
4. Построению показательной модели
у    х
(2)
предшествует процедура линеаризации переменных.
Прологарифмируем обе части уравнения (2), получим
ln у  ln   х  ln  .
(3)
Введем обозначения
Y  ln у , C  ln  , В  ln  .
Тогда уравнение (3) запишется в виде
Y C  Вх.
(4)
Параметры полученной линейной модели (4) рассчитываем аналогично тому, как это было
сделано выше. Используем данные расчетной таблицы 5
Таблица 5
Построим линейное уравнение парной регрессии Y по х. Используя данные таблицы 5, имеем
В
Y  X Y  X
X X
2
2

432 ,528  85,58  5,043
 0,0056 ,
7492 ,3  85,58 2
C  Y  В  X  5,0428  0,0056  85,58  4,559 .
Получим линейное уравнение регрессии
Y  4.559  0,0056  х .
(5)
Тесноту полученной линейной модели характеризует линейный коэффициент парной
корреляции
rхy  В
х
12,95
 0,0056 
 0,706 .
Y
0,104
Коэффициент детерминации при этом равен
R 2  rхy2  0,4986 .
Это означает, что почти 50% вариации фактора Y объясняется вариацией фактора х.
Средняя ошибка линейной аппроксимации составляет
А

1 n уi  yi
1 n
1,149
 100%   Ai  100% 
%  0,0957 % .

n i 1 уi
n i 1
12
Проведя потенцирование уравнения (5), получим искомую нелинейную (показательную)
модель

у  95,5328  х1,0056 .
(6)
Результаты вычисления параметров показательной кривой (2) можно проверить с
помощью ППП Excel, для чего используем встроенную статистическую функцию ЛГРФПРИБЛ.
Порядок вычисления аналогичен применению функции ЛИНЕЙН.
В результате применения функции ЛГРФПРИБЛ дополнительная регрессионная
статистика будет выводиться в порядке, указанном выше (табл. 4), причем в первой строке
таблицы (рис. 9) функция ЛГРФПРИБЛ возвращает коэффициенты показательной модели (2),
остальные параметры соответствуют линейной модели (4) (рис. 9).
Рисунок 9. Результат вычисления функции ЛГРФПРИБЛ
индекса корреляции
вспомогательной таблицей 6
Для
расчета
 хy
Таблица 6
нелинейной
регрессии
воспользуемся
 ( уi

 yi ) 2
 ( уi
 y) 2
n
 ху  1 
i 1
n
 1
1572 ,8455
 0,7215 .
3280 ,25
i 1
Найдем коэффициент детерминации
R 2   2хy  0,7215 2  0,52051 .
Это означает, что 52% вариации заработной платы у объясняется вариацией фактора х –
среднедушевого прожиточного минимума.
Рассчитаем фактическое значение F – критерия при заданном уровне значимости  = 0,05
Fфакт 
 2xy
1   2xy
(n  2) 
0,7215 2
1  0,7215 2
(12  2)  10,855 .
Сравнивая табличное Fтабл=4,96 и фактическое Fфакт  10,855 значения, отмечаем, что
Fфакт  Fтабл ,
что указывает на необходимость отвергнуть гипотезу Но о статистически незначимых параметрах
уравнения (6).
5. Так как коэффициенты детерминации, соответствующие линейной и показательной
моделям практически равны (около 52% вариации заработной платы у объясняется вариацией
фактора х – среднедушевого прожиточного минимума в обеих моделях), то нет весомых
оснований отдать предпочтение какой либо модели. Тем не менее, прогнозное значение результата
2
2
рассчитаем по показательной модели ( R лин
 0,5198 < Rпоказ
 0,52051 ).
По условию задачи прогнозное значение фактора выше его среднего уровня х  85,58 на
5%, тогда оно составляет
х р  1,05  х  1,05  85,58  89,86 ,
и прогнозное значение зарплаты при этом составит

у р  95,5328  х1,0056  95,5328  89,861,0056  158,69 руб.
Найдем ошибку прогноза
m y p
  ост
(x p  x)2
1
1 (89,86  85,58) 2
 1  n
 1

 13,1081
n
12
2012 ,917
2
(
x

x
)
 i
i 1
и доверительный интервал прогноза при уровне значимости  = 0,05.
Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит
 у р  t табл m у р  2,23  13,1081  29,2067 .
Доверительный интервал прогноза
(60,6558; 119,0692).
3. Варианты заданий контрольной работы №1
В таблице 7 приведены данные по территориям региона за 199Х год. Число k
рассчитывается по формуле
k = 100 + 10i + j,
где i, j – две последние цифры зачетной книжки соответственно.
Требуется:
1. Построить поле корреляции.
2. Для характеристики зависимости у от х:
а) построить линейное уравнение парной регрессии у от х;
б) оценить тесноту связи с помощью показателей корреляции и коэффициента
детерминации;
в) оценить качество линейного уравнения с помощью средней ошибки аппроксимации;
г) дать оценку силы связи с помощью среднего коэффициента эластичности и бета –
коэффициента;
д) оценить статистическую надежность результатов регрессионного моделирования с
помощью F – критерия Фишера.
е) оценить статистическую значимость параметров регрессии и корреляции.
3. Проверить результаты, полученные в п. 2 с помощью ППП Excel.
4. Рассчитать параметры показательной парной регрессии. Проверить результаты с
помощью ППП Excel. Оценить статистическую надежность указанной модели с помощью F –
критерия Фишера.
5. Обоснованно выбрать лучшую модель и рассчитать по ней прогнозное значение
результата, если прогнозное значение фактора увеличится на 5% от среднего уровня. Определить
доверительный интервал прогноза при уровне значимости  = 0,05.
№ региона
1
2
3
4
5
6
Среднедушевой прожиточный
минимум в день, руб.
х
97
79
86
77
104
69
Таблица 7
Среднедневная
зарплата, руб.
у
k +2i
k – 4j
k+j
k – 3i
k+i
k – 5i
7
8
9
10
11
12
100
93
81
102
74
90
k–j
k + 2j
k–i
k + 4i
k – 3j
k
Литература
1. Доугерти К. Введение в эконометрику.– М.: Финансы и статистика, 1999.
2. Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика: Начальный курс.– М.: Дело,
2001.
3. Эконометрика. Под ред. И. И. Елисеевой.– М.: Финансы и статистика, 2001.
4. Афанасьев В. Н., Юзбашев М. М. Анализ временных рядов и прогнозирование.– М.: Финансы и
статистика, 2001.
5. Экономико–математические методы и прикладные модели. Под ред. В. В. Федосеева.– М.:
ЮНИТИ, 2001.
5. Экономико–математические методы и модели. Под ред. А. В. Кузнецова.– Минск: БГЭУ, 2000.
4. Кулинич Е. И. Эконометрика.– М.: Финансы и статистика, 2001.
Приложения
Приложение 1. Критические значения t – критерия Стьюдента
при уровне значимости 0,01, 0,05, 0,01 (двухсторонний)

Число
степеней
свободы, df
0,1
0,05
0,01
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
6,3137
2,9200
2,3534
2,1318
2,0150
1,9432
1,8946
1,8595
1,8331
1,8125
1,7959
1,7823
1,7709
1,7613
1,7531
1,7459
1,7396
12,7062
4,3027
3,1824
2,7765
2,5706
2,4469
2,3646
2,3060
2,2622
2,2281
2,2010
2,1788
2,1604
2,1448
2,1315
2,1199
2,1098
63,6559
9,9250
5,8408
4,6041
4,0321
3,7074
3,4995
3,3554
3,2498
3,1693
3,1058
3,0545
3,0123
2,9768
2,9467
2,9208
2,8982
Число
степеней
свободы, df

18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120

0,1
0,05
0,01
1,7341
1,7291
1,7247
1,7207
1,7171
1,7139
1,7109
1,7081
1,7056
1,7033
1,7011
1,6991
1,6973
1,6839
1,6706
1,6576
1,6449
2,1009
2,0930
2,0860
2,0796
2,0739
2,0687
2,0639
2,0595
2,0555
2,0518
2,0484
2,0452
2,0423
2,0211
2,0003
1,9799
1,9600
2,8784
2,8609
2,8453
2,8314
2,8188
2,8073
2,7970
2,7874
2,7787
2,7707
2,7633
2,7564
2,7500
2,7045
2,6603
2,6174
2,5758
Приложение 2. Таблица значений F – критерия Фишера при уровне значимости  = 0,05
K1
K2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
60
70
80
90
100
125
150
200
1
2
3
4
5
6
7
8
12
24
161,4462
199,4995
215,7067
224,5833
230,1604
233,9875
236,7669
238,8842
243,9047
249,0524
18,5128
10,1280
7,7086
6,6079
5,9874
5,5915
5,3176
5,1174
4,9646
4,8443
4,7472
4,6672
4,6001
4,5431
4,4940
4,4513
4,4139
4,3808
4,3513
4,3248
4,3009
4,2793
4,2597
4,2417
4,2252
4,2100
4,1960
4,1830
4,1709
4,1213
4,0847
4,0566
4,0343
4,0012
3,9778
3,9604
3,9469
3,9362
3,9169
3,9042
3,8884
19,0000
9,5521
6,9443
5,7861
5,1432
4,7374
4,4590
4,2565
4,1028
3,9823
3,8853
3,8056
3,7389
3,6823
3,6337
3,5915
3,5546
3,5219
3,4928
3,4668
3,4434
3,4221
3,4028
3,3852
3,3690
3,3541
3,3404
3,3277
3,3158
3,2674
3,2317
3,2043
3,1826
3,1504
3,1277
3,1108
3,0977
3,0873
3,0687
3,0564
3,0411
19,1642
9,2766
6,5914
5,4094
4,7571
4,3468
4,0662
3,8625
3,7083
3,5874
3,4903
3,4105
3,3439
3,2874
3,2389
3,1968
3,1599
3,1274
3,0984
3,0725
3,0491
3,0280
3,0088
2,9912
2,9752
2,9603
2,9467
2,9340
2,9223
2,8742
2,8387
2,8115
2,7900
2,7581
2,7355
2,7188
2,7058
2,6955
2,6771
2,6649
2,6498
19,2467
9,1172
6,3882
5,1922
4,5337
4,1203
3,8379
3,6331
3,4780
3,3567
3,2592
3,1791
3,1122
3,0556
3,0069
2,9647
2,9277
2,8951
2,8661
2,8401
2,8167
2,7955
2,7763
2,7587
2,7426
2,7278
2,7141
2,7014
2,6896
2,6415
2,6060
2,5787
2,5572
2,5252
2,5027
2,4859
2,4729
2,4626
2,4442
2,4320
2,4168
19,2963
9,0134
6,2561
5,0503
4,3874
3,9715
3,6875
3,4817
3,3258
3,2039
3,1059
3,0254
2,9582
2,9013
2,8524
2,8100
2,7729
2,7401
2,7109
2,6848
2,6613
2,6400
2,6207
2,6030
2,5868
2,5719
2,5581
2,5454
2,5336
2,4851
2,4495
2,4221
2,4004
2,3683
2,3456
2,3287
2,3157
2,3053
2,2868
2,2745
2,2592
19,3295
8,9407
6,1631
4,9503
4,2839
3,8660
3,5806
3,3738
3,2172
3,0946
2,9961
2,9153
2,8477
2,7905
2,7413
2,6987
2,6613
2,6283
2,5990
2,5727
2,5491
2,5277
2,5082
2,4904
2,4741
2,4591
2,4453
2,4324
2,4205
2,3718
2,3359
2,3083
2,2864
2,2541
2,2312
2,2142
2,2011
2,1906
2,1719
2,1595
2,1441
19,3531
8,8867
6,0942
4,8759
4,2067
3,7871
3,5005
3,2927
3,1355
3,0123
2,9134
2,8321
2,7642
2,7066
2,6572
2,6143
2,5767
2,5435
2,5140
2,4876
2,4638
2,4422
2,4226
2,4047
2,3883
2,3732
2,3593
2,3463
2,3343
2,2852
2,2490
2,2212
2,1992
2,1665
2,1435
2,1263
2,1131
2,1025
2,0836
2,0711
2,0556
19,3709
8,8452
6,0410
4,8183
4,1468
3,7257
3,4381
3,2296
3,0717
2,9480
2,8486
2,7669
2,6987
2,6408
2,5911
2,5480
2,5102
2,4768
2,4471
2,4205
2,3965
2,3748
2,3551
2,3371
2,3205
2,3053
2,2913
2,2782
2,2662
2,2167
2,1802
2,1521
2,1299
2,0970
2,0737
2,0564
2,0430
2,0323
2,0133
2,0006
1,9849
19,4125
8,7447
5,9117
4,6777
3,9999
3,5747
3,2839
3,0729
2,9130
2,7876
2,6866
2,6037
2,5342
2,4753
2,4247
2,3807
2,3421
2,3080
2,2776
2,2504
2,2258
2,2036
2,1834
2,1649
2,1479
2,1323
2,1179
2,1045
2,0921
2,0411
2,0035
1,9745
1,9515
1,9174
1,8932
1,8753
1,8613
1,8503
1,8304
1,8172
1,8008
19,4541
8,6385
5,7744
4,5272
3,8414
3,4105
3,1152
2,9005
2,7373
2,6090
2,5055
2,4202
2,3487
2,2878
2,2354
2,1898
2,1497
2,1141
2,0825
2,0540
2,0283
2,0050
1,9838
1,9643
1,9464
1,9299
1,9147
1,9005
1,8874
1,8332
1,7929
1,7618
1,7371
1,7001
1,6738
1,6542
1,6389
1,6267
1,6048
1,5902
1,5720
Related documents
Download