Задача. По территориям Сибирского и Дальневосточного федеральных округов известны

advertisement
Задача.
По территориям Сибирского и Дальневосточного федеральных округов известны
денежные доходы и потребительские расходы в расчете на душу населения (файл
Лабораторная работа 1. Xlsx)
за июнь 2009 года
Требуется:
1) построить поле корреляции, добавить линию тренда линейного типа с выводом
уравнения на график,
2) рассчитать параметры уравнения линейной регрессии, зависимости
потребительских расходов от денежного дохода,
3) оценить тесноту связи с помощью показателя детерминации,
4) оценить статистическую надежность результатов регрессионного
моделирования с помощью F- критерия Фишера,
5) оценить качество уравнений с помощью средней ошибки аппроксимации,
6) оценить значимость параметров регрессии с помощью t-критерия Стьюдента и
путем расчета доверительного интервала каждого из показателей.
Решение (рекомендации)
В главном меню выберем Анализ данных/Регрессия.
Заполним диалоговое окно ввода данных и параметров вывода:
входной интервал Y – диапазон, содержащий данные результативного признака,
входной интервал X – диапазон, содержащий данные факторов независимого признака,
метки – флажок, который указывает, содержит ли первая строка названия столбцов или
нет,
константа – ноль – флажок, указывающая на наличие или отсутствие свободного члена в
уравнении,
выходной интервал – левая верхняя ячейка диапазона вывода результатов исследования,
В итоге получим таблицу результатов исследования:
ВЫВОД ИТОГОВ
Регрессионная статистика
Множест. R
R-квадрат
0,785588626
0,61714949
Нормир. R-кв.
0,569293176
Ст. ошибка
Наблюдения
0,503435237
10
Дисперсионный анализ
df
SS
MS
Регрессия
1
3,268423699
3,268423699
Остаток
Итого
8
9
2,027576301
5,296
0,253447038
Коэффициенты
a
b
16,40465876
-0,000117801
Ст. ошибка
t-стат.
0,317061236 51,73971742
3,28037E-05 -3,591084015
F
12,8958844
P-Значение
2,15755E-11
0,007073334
Значимость F
0,007073334
Нижние 95%
Верхние 95%
15,67351424 17,13580328
-0,000193446 -4,21553E-05
2) Из последней таблицы получаем значения коэффициентов a и b парной линейной
регрессии: a=16,4047, b=-0,0001. Уравнение регрессии имеет вид y=16,40470,0001x.
3) Из первой таблицы имеем R2≈0,617. Таким образом, уравнением регрессии
объясняется 61,7% дисперсии результативного признака, а на долю прочих
факторов приходится 38,3% .
4) 1
способ.Значение
Fкритерия
находится
во
второй
таблице
Fфакт=12,9>Fтаб(0,05;m;n-2)= Fтаб(0,05;1;8)=5,3, значит, Но - гипотеза о случайной
природе оцениваемых характеристик отклоняется и признается статистическая
значимость и надежность уравнения регрессии.
2 способ. По p-значению p(F) («Значимость F») делаем вывод статистической
значимости уравнения регрессии:
0,007073334<  (где   0,05 -уровень значимости), значит, Но - гипотеза о
случайной природе оцениваемых характеристик отклоняется и признается
статистическая значимость и надежность уравнения регрессии.
5) Используя значения остатков, найдем коэффициент аппроксимации

yi  yi
1
A 
 100% .
п
yi
Допустимые пределы средней ошибки аппроксимации 8-10%,
6) Значения t-критерия для параметров a и b возьмем из последней таблицы: ta=51,74, tb=3,59. C помощью функции СТЬЮДРАСПОБР найдем табличное значение t-критерия
tтаб(0,05;n-2). ta> tтаб , | tb |> tтаб. Если фактические значения t-критерия превышают
табличное, гипотезу о несущественности коэффициентов можно отклонить.
Доверительный интервал для параметров a и b берем также из последней таблицы:
15,67351<a<17,13580; -0,00019<b<-0,00004. Таким образом, с вероятностью 0,95
параметры a и b, находясь в указанных границах, не принимают нулевых значений, не
являются статистически незначимыми.
Download