Document 679909

advertisement
Федеральное государственное образовательное бюджетное
учреждение высшего профессионального образования
ФИНАНСОВЫЙ УНИВЕРСИТЕТ
ПРИ ПРАВИТЕЛЬСТВЕ РОССИЙСКОЙ ФЕДЕРАЦИИ»
(Финансовый университет)
Кафедра «Статистика»
СТАТИСТИКА
Алгоритмы и формат отчета к лабораторной работе
"Автоматизированный корреляционно-регрессионный анализ
взаимосвязи статистических данных в среде MS Excel"
Учебно-методические материалы для преподавателей
МОСКВА 2007
Учебно-методическое издание разработали:
доктор физико-математических наук, профессор Г.П. Кожевникова,
кандидат технических наук, доц. А.В.Голикова
Учебно-методическое издание одобрено на заседании Научно-методического совета
ВЗФЭИ.
Проректор, председатель НМС, профессор Д.М. Дайитбегов
Статистика. Алгоритмы и формат отчета к лабораторной работе "Автоматизированный
корреляционно-регрессионный анализ взаимосвязи статистических данных в среде MS
Excel". Учебно-методические материалы для преподавателей. - М.: ВЗФЭИ, 2007.
© Всероссийский заочный финансовоэкономический институт (ВЗФЭИ), 2007
2
Методическое обеспечение лабораторной работы "Автоматизированный
корреляционно-регрессионный анализ взаимосвязи статистических данных в
среде MS Excel" разработано на кафедре статистики, апробировано в учебном
процессе
и
издано
в
методических
указаниях
[1]
–
Компьютерные
лабораторные работы: Методические указания к лабораторной работе №2
"Автоматизированный
корреляционно-регрессионный
анализ
взаимосвязи
статистических данных в среде MS Excel", – М.: Вузовский учебник, 2006.
В
настоящих
учебно-методических
материалах
представлены
рекомендации, которыми необходимо руководствоваться преподавателям
кафедры статистики при проведении компьютерной лабораторной работы №2
(ЛР-2) с использованием методических указаний [1]. Приведены также новая
(упрощенная)
версия
алгоритмического
обеспечения
ЛР-2
и
стандартизированный формат отчета студента по выполненной работе.
I. Методические рекомендации для преподавателей
по проведению лабораторной работы
Лабораторная
работа
"Автоматизированный
корреляционно-
регрессионный анализ взаимосвязи статистических данных в среде MS Excel"
является второй из трех лабораторных работ, выполняемых студентами в
рамках 4-х академических часов, которые отведены учебным планом на
освоение студентами технологии компьютерных статистических расчетов.
ЛР-2 является составной частью проводимого с применением компьютера
статистического исследования выборочной совокупности предприятий и
частично использует результаты Лабораторной работы № 1 (ЛР-1).
В
ЛР-2
изучается
взаимосвязь
между
факторным
признаком
Среднегодовая стоимость основных производственных фондов (признак Х) и
результативным признаком Выпуск продукции (признак Y). В качестве
значений признаков выступают исходные данные ЛР-1 после исключения из
них аномальных наблюдений.
3
Выполнение
ЛР-2
основано
на
использовании
инструментов
программной надстройки Пакет анализа табличного процессора Microsoft Excel.
1. Информационное обеспечение лабораторной работы
При выполнении ЛР-1 каждым студентом была создана персональная
папка студента (с именем ФИО), содержащая два файла:
 Рабочий файл (с именем Лаб.xls) с индивидуальными исходными
данными и макетами результативных таблиц;
 Отчетный файл (с именем Отчет.doc), необходимый для
составления отчета по результатам выполненной лабораторной
работы.
Оба файла предназначены для использования как в ЛР-1, так и в ЛР-2:
 в Рабочем файле для ЛР-1 отведен Лист 1, для ЛР-2 – Лист 2;
 в Отчетном файле содержатся два раздела – со
стандартизованными текстами отчетов по ЛР-1 и ЛР-2
соответственно.
Структура персональной папки студента приведена на рис.1.
Персональная папка студента
Рабочий файл
Лист 1
(для ЛР-1)
Исходные
данные
Таблицы
Лист 2
(для ЛР-2)
Табл.1
Табл.7
Исходные
данные
Отчетный файл
Раздел 1.
Стандартный
текст отчета
по ЛР-1
Раздел 2.
Стандартный
текст отчета
по ЛР-2
Таблицы
Рис. 1. Структура персональной папки студента
В соответствии с принятой структурой Рабочего и Отчетного файлов
информационное обеспечение ЛР-2 составляют:
 Лист 2 Рабочего файла, который содержит исходные данные для
ЛР-2 и макеты результативных таблиц;
4
 Раздел 2 Отчетного файла, содержащий стандартный текст
отчета по ЛР-2.
Исходными данными ЛР-2 являются данные, полученные в ЛР-1 в
результате удаления из индивидуальных исходных данных варианта работы
аномальных единиц наблюдения.
В макетах результативных таблиц размещаются в процессе выполнения
ЛР-2 результаты компьютерных расчетов.
Стандартный текст отчета предназначен для использования студентом на
этапе составления отчета по выполненной ЛР-2.
2. Структура лабораторной работы
Выполнение ЛР-2 включает три этапа – подготовительный, расчетный и
аналитический.
На подготовительном этапе студент размещает (в своей персональной
папке) на Листе 2 Рабочего файла информацию из ЛР-1, необходимую для
проведения компьютерных расчетов в ЛР-2.
На расчетном этапе производится вычисление показателей для оценки
тесноты
связи
факторного
и
результативного
признаков,
строятся
однофакторные регрессионные модели – линейная и нелинейные.
На данном этапе выполняются следующие задания:
Задание 1. Построение
аналитической
группировки
для
выявления
корреляционной зависимости результативного признака от
факторного и оценка тесноты взаимосвязи признаков.
Задание 2. Построение однофакторной линейной регрессионной модели связи
изучаемых признаков с помощью инструмента Регрессия
надстройки Пакет анализа.
Задание 3. Построение однофакторных нелинейных регрессионных моделей
связи признаков с помощью инструмента Мастер диаграмм и
выбор наиболее адекватного нелинейного уравнения регрессии.
На заключительном, аналитическом этапе (выполняемом вне рамок
времени ЛР-2) производится анализ результатов проведенных компьютерных
расчетов:
 устанавливается наличие статистической и
зависимости между изучаемыми признаками;
корреляционной
5
 делаются выводы о степени тесноты взаимосвязи факторного и
результативного признаков;
 анализируются адекватность и практическая
построенной линейной регрессионной модели;
пригодность
 выбирается наиболее адекватное нелинейное уравнение регрессии.
Результаты анализа и выводы заносятся в отчет.
3. Коррективы, внесенные в алгоритмическое
обеспечение лабораторной работы. Технологические
особенности его использования
Алгоритмическое обеспечение всех трех этапов ЛР-2 представлено в
методических указаниях [1]. По сравнению с [1] алгоритмическое обеспечение
ЛР-2 модифицировано с целью упрощения работы с электронными таблицами и
сокращения времени выполнения ЛР. В текущей версии алгоритмического
обеспечения:

для алгоритмического обеспечения ЛР-2 указана структура
распределения
памяти
Листа
2
Рабочего
файла,
регламентирующая расположение на нем результативных таблиц;

расчетные формулы необходимых статистических функций
размещены в соответствующих ячейках макетов результативных
таблиц (это заменяет самостоятельное составление студентами
расчетных формул и обращение к библиотеке статистических
функций Excel);

из Задания 1 исключена задача 3 – "Оценка тесноты связи
изучаемых признаков на основе линейного коэффициента
корреляции" и, как следствие, алгоритм 3.1. – "Расчет линейного
коэффициента корреляции";

из Задания 2 исключено построение графика подбора (в алгорит-ме
1 – " Расчет параметров уравнения линейной регрессии и проверки
адекватности модели исходным данным");

из Задания 3 исключено построение уравнения регрессии и графика
для экспоненциальной модели зависимости признаков (в алгоритме
1 – "Построение уравнений регрессионных моделей для различных
видов зависимости признаков с использованием средств
инструмента Мастер диаграмм");

выявлены наиболее часто встречающиеся при выполнении
алгоритмов ошибочные действия студентов и в тексты алгоритмов
внесены предупреждения о возможных ошибках.
6
Внесенные коррективы значительно сокращают время выполнения ЛР-2 и
способствуют корректному выполнению ее заданий.
Алгоритмическое обеспечение содержит пример, демонстрирующий
результаты поэтапного выполнения расчетов. Таблицы демонстрационного
примера отмечены идентификатором ДП.
Преподавателю необходимо руководствоваться следующим:
1. Обеспечить каждое рабочее место студента в компьютерной
лаборатории инструкцией с текстами алгоритмов ЛР-2.
Инструкции должны быть отформатированы таким образом, чтобы
тексты алгоритмов и таблицы демонстрационного примера не разрывались
межстраничными переходами. Для длительной сохранности текста инструкций
рекомендуется листы инструкции вложить каждый в отдельный прозрачный
файл, а файлы - в папку, которой снабжается каждое место в компьютерных
классах.
Обращение студентов к алгоритмам методических указаний [1] во время
выполнения ЛР не допускается! Методические указания [1] используются
студентами при подготовке к ЛР-2 для ознакомления с технологией
выполнения заданий и особенностями применения Пакета анализа при
автоматизированном решении статистических задач Заданий 1–3.
2. Обратить внимание студентов на необходимость систематической
проверки на этапах ЛР-2 правильности адресации получаемых
результативных таблиц (проверка выполняется на основе структуры
распределения памяти Листа 2 Рабочего файла, с которой студент
ознакамливается на подготовительном этапе ЛР-2). При этом во избежание
ошибок содержание каждой получаемой результативной таблицы следует
сопоставлять с соответствующими таблицами демонстрационного примера.
Настоящие учебно-методические материалы содержат в разделе II
текущую версию алгоритмического обеспечения ЛР-2. Отформатированные
надлежащим образом тексты алгоритмов представлены также на странице
кафедры статистики сайта института по адресу
http://www.vzfei.ru/rus/platforms/stat.htm
При внесении каких-либо корректив в алгоритмическое обеспечение ЛР2 соответствующие изменения в алгоритмах будут отражены на сайте.
Информация о модификации алгоритмов будет доведена до преподавателей
кафедры для оперативного внесения необходимых изменений в инструкции к
ЛР-2.
7
4. Отчетность по лабораторной работе
По
результатам
выполнения
подготавливает отчет, который
лабораторной
работы
студент
должен содержать текстовую часть и
ПРИЛОЖЕНИЕ.
Текстовая часть включает:

выводы о наличии статистической и корреляционной связи
результативного и факторного признаков;

оценку тесноты взаимосвязи признаков, сделанную на основе
анализа показателей аналитической таблицы;

математическую модель взаимосвязи исследуемых признаков в
виде
однофакторного
линейного
уравнения
регрессии
(построенного с помощью инструмента Регрессия надстройки
Пакет анализа), а также результаты анализа адекватности этой
модели;

математические модели зависимости между исследуемыми
признаками в виде однофакторных нелинейных уравнений
регрессии (построенных с помощью инструмента Мастер
диаграмм) и обоснование выбора наиболее адекватной из них.
ПРИЛОЖЕНИЕ к отчету должно включать:

таблицу исходных данных и результативные таблицы Заданий
1-2 (табл. 2.2-2.9);

графики нелинейных уравнений регрессии Задания 3.
Текст
отчета
должен
быть
подготовлен
в
соответствии
со
стандартизованным форматом, разработанным кафедрой (стандартный формат
отчета по ЛР-2 скопирован в Отчетный файл персональной папки студента
на подготовительном этапе ЛР-1).
Настоящие учебно-методические материалы содержат в третьем разделе
текущую версию стандартного формата отчета по ЛР-2, которая
представлена также на странице кафедры статистики сайта института по адресу
http://www.vzfei.u/rus/platforms/stat.htm
Стандартный формат отчета носит замкнутый характер в том смысле, что
в
нем
конспективно
изложены
основные
теоретические
положения,
достаточные для обоснования выводов по каждой задаче ЛР-2.
8
В соответствии с требованиями стандартного формата отчета:
 таблицы и пробелы в формулировках выводов заполняются
вручную;
 все статистические показатели представляются в таблицах отчета с
точностью до 4-х знаков после запятой;
 в выводах при выборе альтернативного варианта ответа ненужный
вариант вычеркивается.
Подготовка отчета производится студентом вне рамок времени,
отведенного на выполнение ЛР-2.
Преподавателю необходимо руководствоваться следующим:
1. Подготовить на основе демонстрационного примера наглядный
образец отчета, содержащий заполненные таблицы и сделанные на
заключительном этапе ЛР-2 выводы.
2. В процессе проведения ЛР-2 ознакомить студентов с наглядным
образцом отчета.
Отчет сдается для проверки преподавателю, проводившему ЛР-2. Защита
проверенного отчета состоит в обосновании студентом выводов, сделанных им
на основе результатов выполненных компьютерных статистических расчетов.
Результаты защиты отчета учитываются преподавателем при получении
студентом зачета. Учебным планом предусмотрен один общий зачет по всем
выполненным лабораторным работам.
9
II. Алгоритмическое обеспечение лабораторной работы
Для
выполнения
ЛР-2
выделяется
Лист
2
Рабочего
файла,
сформированного в персональной папке студента при выполнении ЛР-1, и
используется следующая информация из ЛР-1 (Лист 1 Рабочего файла):
 исходные данные – Таблица 1 (А4:С33), полученная после удаления
аномальных значений признаков);
 интервальный ряд распределения единиц совокупности по факторному
признаку Х – Среднегодовая стоимость основных производственных
фондов, представленный табл. 7 (А102:В106);
 диаграмма рассеяния признаков, расположенная начиная с ячейки F4.
Компьютерное выполнение ЛР-2 включает два этапа:
1. Подготовительный этап.
2. Этап выполнения статистических расчетов.
1. Подготовительный этап
На Листе 2 Рабочего файла персональной папки студента при
выполнении
ЛР-1
были
заготовлены
макеты
результативных
таблиц,
используемые в ЛР-2.
На
данном
этапе
студент
должен
скопировать
необходимую
информацию ЛР-1 из Листа 1 в Лист 2 Рабочего файла персональной папки
в соответствии с нижеследующей таблицей:
Лист 1
Номер
таблицы
Содержимое
Адресация
таблицы
содержимого
Исходные
Табл. 1
A4 : С33
данные
Диаграмма
рассеяния
Начиная с Копировать в
–
(копируется
ячейки F4
дважды)
Интервальный
ряд
Табл. 7 распределения А102 : В106
факторного
признака Х
Лист 2
Номер
таблицы
Табл. 2.1
–
Содержимое Адресация
таблицы
содержимого
Исходные
A4 : С33
данные
Диаграмма
рассеяния
Начиная
с ячейки Е4
и Е20
Интервальный
Табл. 2.2
ряд
B41 : C45
и
распределения
и
табл. 2.3 факторного
B52 : C56
признака Х
►Внимание! Табл.7 и диаграмма рассеяния копируются на Лист 2
Рабочего файла дважды!
10
По окончании копирования информации ЛР-1 необходимо ознакомиться
с распределением памяти Листа 2, выделенной для результативных таблиц с
тем, чтобы систематически проверять на этапах ЛР-2 правильность адресации
получаемых результативных таблиц. При этом во избежание ошибок
содержание каждой получаемой результативной таблицы следует сопоставлять
с соответствующими таблицами демонстрационного примера.
11
Структура Листа 2 Рабочего файла stat_lab.xls
(распределение памяти для результативных таблиц )
A
B
D
E
Таблица 2.1
1
Исходные данные
2
3
C
Номер
предприятия
Среднегодовая стоимость
основных
производственных фондов,
млн руб.
Выпуск продукции,
млн руб.
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
12
A
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
Номер
группы
1
2
3
4
5
Итого
Номер
группы
1
2
3
4
5
Итого
B
C
D
E
Таблица 2.2
Зависимость выпуска продукции от среднегодовой стоимости
основных производственных фондов
Выпуск продукции, млн руб.
Группы предприятий по
признаку Среднегодовая
Число
В среднем
стоимость основных
предприятий
Всего
на одно
производственных фондов,
предприятие
млн руб.
СУММ()
D41/C41
СУММ()
D42/C42
СУММ()
D43/C43
СУММ()
D44/C44
СУММ()
D45/C45
СУММ(C41:C45) СУММ(D41:D45) D46/C46
Таблица 2.3
Показатели внутригрупповой дисперсии
Группы предприятий по
признаку Среднегодовая
Число
Внутригрупповая
стоимость основных
предприятий
дисперсия
производственных фондов,
млн руб.
ДИСПР()
ДИСПР()
ДИСПР()
ДИСПР()
ДИСПР()
СУММ(C52:C56)
Таблица 2.4
Показатели дисперсий и эмпирического корреляционного отношения
Средняя из внутригрупповых
Общая
Межгрупповая
Эмпирическое
дисперсий
дисперсия
дисперсия
корреляционное
2
σ общ
σ 2j
δх2
отношение η
ДИСПР
(C4:C33)
СУММПРОИЗВ
(D52:D56,C52:C56)/C46
A63-B63
КОРЕНЬ
(C63/A63)
64
65
66
67
68
69
70
71
72
13
A
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
C
D
E
F
ВЫВОД ИТОГОВ
Таблица 2.5
Регрессионная статистика
Множественный R
R-квадрат
Нормированный R-квадрат
Стандартная ошибка
Наблюдения
Таблица 2.6
Дисперсионный анализ
df
SS
MS
F
B
C
D
E
F
G
H
Коэффициенты
Стандартная ошибка
t-статистика
P- значение
Нижние
95%
Верхние
95%
Нижние
68,3%
Значимость F
Регрессия
Остаток
Итого
A
89
90
91
92
93
94
95
96
97
98
99
…
B
Выходные таблицы
73
I
Таблица 2.7
Верхние
68,3%
Y-пересечение
Переменная X1
Таблица 2.8
Наблюдение
ВЫВОД ОСТАТКА
Предсказанное Y
Остатки
14
2. Этап выполнения статистических расчетов
Задание 1
Построение аналитической группировки для выявления
корреляционной зависимости результативного признака от
факторного и оценка тесноты взаимосвязи признаков
Выполнение Задания 1 заключается в решении следующих двух задач:
Задача 1. Построение аналитической группировки предприятий по
факторному
признаку
Х
–
Среднегодовая
стоимость
основных
производственных фондов.
Задача 2. Оценка тесноты связи изучаемых признаков на основе
эмпирического корреляционного отношения.
Алгоритмы выполнения Задания 1
Задача 1. Построение аналитической группировки предприятий по
признаку
Среднегодовая
стоимость
основных
производственных фондов.
Задача решается в три этапа:
1. Ранжирование единиц совокупности по возрастанию факторного
признака Х – Среднегодовая стоимость основных производственных фондов
– алгоритм 1.1.
2. Распределение
предприятий
по
группам
в
соответствии
с
интервальным рядом распределения факторного признака – алгоритм 1.2.
3. Расчет суммарных и средних групповых значений результативного
признака Y – Выпуск продукции – алгоритмы 1.3 и 1.4.
Алгоритм 1.1. Ранжирование исходных данных по факторному признаку
1. Выделить исходные данные (вместе с заголовком) табл. 2.1 (А3:С33);
2. Данные => Сортировка;
3. Сортировать по <= заголовок столбца, по которому выполняется
сортировка, т.е. Среднегодовая стоимость основных производственных
фондов;
4. По возрастанию/по убыванию – устанавливается в положение по
возрастанию;
5. Затем и В последнюю очередь по – НЕ активизировать;
15
6. Идентифицировать поля по подписям/обозначениям столбцов листа
– устанавливается в положение подписям;
7. ОК.
В результате указанных действий в таблице 2.1 размещаются данные,
ранжированные по возрастанию признака Среднегодовая стоимость основных
производственных фондов.
Алгоритм 1.2. Выделение групп предприятий с
помощью заливки контрастным цветом
1. Из всего диапазона отсортированных данных A4:C33 выделить мышью
диапазон ячеек первой группы, для чего необходимо отсчитать в
ранжированном ряду количество строк, соответствующее числу
предприятий первой группы (графа 3 табл.2.2);
2. Нажать на панели инструментов кнопку
для выбора цвета заливки;
3. Выбрать цвет заливки по собственному усмотрению;
►Внимание! Цвет желательно брать контрастный, чтобы четко
отделить одну группу от другой.
4. Выполнить действия 1–3 для всех групп, выбирая контрастные цвета для
цветовой заливки очередной группы.
Результаты работы алгоритмов 1.1 и 1.2 для демонстрационного примера
представлены в табл.2.1–ДП.
А
В
С
Таблица 2.1–ДП
1
2
Исходные данные
3
Номер
предприятия
4
1
Среднегодовая стоимость
основных
производственных фондов,
млн руб.
94,00
5
2
107,00
101,00
6
3
134,00
120,00
7
4
157,00
81,00
8
5
163,00
80,00
9
6
167,00
114,00
10
29
167,00
114,00
11
7
173,00
161,00
12
8
173,00
90,00
13
9
177,00
178,00
14
10
179,00
107,00
Выпуск продукции,
млн руб.
110,00
16
15
11
200,00
125,00
16
12
201,00
108,00
17
13
205,00
133,00
18
30
205,00
133,00
19
14
208,00
124,00
20
15
212,00
201,00
21
16
213,00
161,00
22
17
214,00
151,00
23
18
216,00
169,00
24
19
218,00
149,00
25
20
230,00
180,00
26
21
234,00
148,00
27
22
237,00
162,00
28
23
241,00
166,00
29
24
248,00
168,00
30
32
260,00
224,00
31
26
276,00
171,00
32
27
290,00
191,00
33
28
298,00
220,00
Алгоритм 1.3. Расчет суммарных групповых значений
результативного признака
1. В ячейке (D41), выделенной для суммарного значения результативного
признака Выпуск продукции первой группы, перед формулой поставить
знак равенства «=»;
2. В качестве аргумента функции СУММ() указать диапазон ячеек из табл.
2.1 с результативными значениями уi первой группы (визуально легко
определяется по цвету заливки диапазона);
►Внимание! Здесь возможен ошибочный захват мышью столбца значений
первого (факторного) признака Х. Необходимо проконтролировать
правильность задания аргумента функции СУММ().
3. Enter;
4. Выполнить действия 1–3 поочередно для всех групп, используя цветовые
заливки диапазонов.
Алгоритм 1.4. Расчет средних групповых
значений результативного признака
В таблице 2.2 приведены формулы для расчета средних групповых
значений результативного признака Выпуск продукции.
1. В ячейках (Е41), выделенной для среднего значения результативного
признака Выпуск продукции первой группы, перед формулой поставить
знак равенства «=»;
17
2. Enter;
3. Выполнить действия 1–2 поочередно для всех групп;
4. В ячейках (C46, D46 и E46), выделенных для расчета итоговых сумм,
перед формулами поставить знак равенства «=».
Результаты работы алгоритмов 1.3 и 1.4 для демонстрационного примера
приведены в табл. 2.2–ДП.
A
37
38
39
40
B
C
D
E
Таблица 2.2–ДП
Зависимость выпуска продукции от среднегодовой стоимости основных фондов
Группы предприятий по
Выпуск продукции, млн руб.
признаку Среднегодовая
Номер
Число
В среднем
стоимость основных
группы
предприятий
Всего
на одно
производственных фондов,
предприятие
млн руб.
41
1
94 – 134,8
3
331,00
110,33
42
2
134,8 – 175,6
6
640,00
106,67
43
3
175,6 – 216,4
11
1590,00
144,55
44
4
216,4 – 257,2
6
973,00
162,17
45
5
257,2 – 298
46
Итого
4
30
806,00
4340,00
201,50
144,67
Задача 2. Оценка тесноты связи изучаемых признаков на основе
эмпирического корреляционного отношения
Задача решается в два этапа:
1. Расчет внутригрупповых дисперсий результативного признака.
2. Расчет эмпирического корреляционного отношения.
Алгоритм 2.1. Расчет внутригрупповых
дисперсий результативного признака
1. В ячейке, выделенной для внутригрупповых дисперсий первой группы
(D52), перед формулой поставить знак равенства «=»;
2. В качестве аргумента функции ДИСПР() указать диапазон ячеек из табл.
2.1 со значениями yi первой группы – визуально легко определяется по
цвету заливки диапазона;
►Внимание! Здесь возможен ошибочный захват мышью столбца значений
первого (факторного признака) Х. Необходимо проконтролировать
правильность задания аргумента функции ДИСПР().
3. Enter;
4. Выполнить действия 1–3 поочередно для всех групп, используя цветовые
заливки диапазонов.
5. Для расчета итоговой суммы в табл. 2.3 (в ячейке C57) перед формулой
необходимо поставить знак равенства «=».
18
Результат работы алгоритма 2.1 для демонстрационного примера
представлен в табл.2.3–ДП.
A
B
C
D
Таблица 2.3–ДП
49
Показатели внутригрупповой дисперсии
50
51
Номер
группы
Группы предприятий по
признаку Среднегодовая
стоимость основных
производственных фондов,
млн руб.
52
1
94 – 134,8
3
60,22
53
2
134,8 – 175,6
6
784,56
54
3
175,6 – 216,4
11
821,16
55
4
216,4 – 257,2
6
123,47
56
5
257,2 – 298
Итого
4
30
472,25
57
Число
предприятий
Внутригрупповая
дисперсия
Алгоритм 2.2. Расчет эмпирического корреляционного отношения
1. В ячейке, выделенной для общей дисперсии (А63), перед формулой
поставить знак равенства «=»;
2. В ячейке, выделенной для средней из внутригрупповых дисперсий (В63),
перед формулой поставить знак равенства «=»;
►Примечание. В случае если при выполнении вычисления в ячейке В63
выдается сообщение "Ошибка в формуле", то разделительный знак «,»
между аргументами функции СУМПРОИЗВ(Д1,Д2) необходимо
заменить на знак «;».
3. В ячейке, выделенной для значения межгрупповой (факторной)
дисперсии (С63), перед формулой поставить знак равенства «=»;
4. В ячейке, выделенной для эмпирического корреляционного отношения
(D63), перед формулой поставить знак равенства «=».
Результат работы алгоритма 2.2 для демонстрационного примера
представлен в табл.2.4–ДП.
A
60
61
62
63
B
C
D
Таблица 2.4–ДП
Показатели дисперсий и эмпирического корреляционного отношения
Средняя из внутригрупповых
Общая
Межгрупповая
Эмпирическое
дисперсий
дисперсия
дисперсия
корреляционное
2
σ общ
σ 2j
δх2
отношение η
1450,288889
551,6853535
898,6035354
0,787148735
19
Задание 2
Построение однофакторной линейной регрессионной модели
связи изучаемых признаков с помощью инструмента РЕГРЕССИЯ
надстройки ПАКЕТ АНАЛИЗА
Алгоритм выполнения Задания 2
Алгоритм 1. Расчет параметров уравнения линейной регрессии и
проверки адекватности модели исходным данным
1. Сервис => Анализ данных => Регрессия => ОК;
2. Входной интервал Y <= диапазон ячеек таблицы со значениями
признака Y – Выпуск продукции (С4:С33);
3. Входной интервал X – диапазон ячеек таблицы со значениями признака
X – Среднегодовая стоимость основных производственных фондов
(В4:В33);
4. Метки в первой строке/Метки в первом столбце – НЕ
активизировать;
5. Уровень надежности <= 68,3 (или 68.3);
6. Константа–ноль – НЕ активизировать;
7. Выходной интервал <= адрес ячейки заголовка первого столбца первой
выходной результативной таблицы (А75);
8. Новый рабочий лист и Новая рабочая книга – НЕ активизировать;
9. Остатки – Активизировать;
10.Стандартизованные остатки – НЕ активизировать;
11.График остатков – НЕ активизировать;
12.График подбора – НЕ активизировать;
13.График нормальной вероятности – НЕ активизировать;
14.ОК.
В результате указанных действий осуществляется вывод четырех
выходных таблиц на Лист 2 Рабочего файла, начиная с ячейки, указанной в
поле Выходной интервал диалогового окна инструмента Регрессия (для
демонстрационного примера они имеют следующий вид).
А
77 Регрессионная статистика
78 Множественный R
79 R–квадрат
80 Нормированный R-квадрат
81 Стандартная ошибка
82 Наблюдения
В
0,753661673
0,568005917
0,552577557
25,90882817
30
20
84
85
86
87
88
А
B
C
Дисперсионный анализ
df
SS
Регрессия
1
24713,1801
Остаток
28
18795,48657
Итого
29
43508,66667
A
D
E
MS
24713,1801
671,2673773
F
36,81570256
F
Значимость F
1,52606E-06
C
D
E
F
G
H
I
Стандартная
Нижние Верхние Нижние Верхние
90
Коэффициенты
t-статистика P-Значение
ошибка
95%
95%
68,3%
68,3%
91 Y-пересечение 21,64454934
20,81975413 1,039615992 0,307412837 -21,0028 64,29193 0,432468 42,85664
92 Переменная X 1 0,605324507
0,099763508 6,067594462 1,52606E-06 0,400968 0,809681 0,503681 0,706968
96
97
98
99
100
101
102
…
128
A
ВЫВОД ОСТАТКА
Наблюдение
1
2
3
4
…
30
B
B
Предсказанное Y
78,54505301
86,4142716
102,7580333
116,680497
…
202,0312525
C
Остатки
31,45494699
14,5857284
17,24196671
-35,68049696
…
17,96874754
21
Задание 3
Построение однофакторных нелинейных регрессионных моделей
связи признаков с помощью инструмента МАСТЕР ДИАГРАММ и
выбор наиболее адекватного нелинейного уравнения регрессии
Алгоритмы выполнения Задания 3
Алгоритм 1. Построение уравнений регрессионных моделей для
различных видов нелинейной зависимости признаков с
использованием средств инструмента Мастер диаграмм
1. Выделить мышью диаграмму рассеяния признаков, расположенную
начиная с ячейки Е4, и увеличить диаграмму на весь экран, используя
прием "захват мышью";
2. Диаграмма => Добавить линию тренда;
3. В появившемся диалоговом окне Линия тренда выбрать вкладку Тип и
задать вид регрессионной модели – полином 2-го порядка;
4. Выбрать вкладку Параметры и выполнить действия:
1. Переключатель
Название
аппроксимирующей
кривой:
автоматическое/другое – установить в положение другое и ввести
имя тренда– полином 2-го порядка;
2. Поле Прогноз вперед на – НЕ активизировать;
3. Поле Прогноз назад на – НЕ активизировать;
4. Флажок Пересечение кривой с осью Y в точке –
НЕ активизировать;
5. Флажок
Показывать
уравнение
на
диаграмме
–
Активизировать;
6. Флажок Поместить на диаграмму величину достоверности
аппроксимации R2 – Активизировать;
7. ОК;
8. Установить курсор на линию регрессии и щелкнуть правой
клавишей мыши;
9. В появившемся диалоговом окне Формат линии тренда выбрать
по своему усмотрению тип, цвет и толщину линии;
10. ОК;
11. Выделить уравнение регрессии и индекс детерминации R2 и с
помощью приема "захват мышью" вынести их за корреляционное
поле. При необходимости уменьшить размер шрифта.
5. Действия 2 – 4 (в п.4 шаги 1–11) выполнить поочередно для следующих
видов регрессионных моделей:
– полином 3-го порядка,
– степенная функция.
22
По окончании работы алгоритма 1 выполнить следующие действия:
1. Присвоить полученной диаграмме заголовок "Диаграмма 2.1" и
удалить линии сетки по оси Y (алгоритм 2);
2. Снять заливку области построения (алгоритм 3);
3. При необходимости изменить масштаб шкалы осей диаграммы
(алгоритм 4).
Алгоритм 2. Присвоение полученной диаграмме заголовка
"Диаграмма 2.1" и удаление линий сетки по оси Y
1. Выделить мышью построенную диаграмму;
2. Диаграмма => Параметры диаграммы;
3. В появившемся диалоговом окне Параметры диаграммы выбрать
вкладку Заголовки и в поле Название диаграммы ввести
заголовок диаграммы "Диаграмма 2.1";
4. Выбрать вкладку Линии сетки, в полях Ось Х и Ось Y все флажки
– Не активизировать;
5. ОК.
Алгоритм 3. Снятие заливки области построения
1. Выделить мышью Область построения диаграммы;
2. Формат => Выделенная область построения;
3. В появившемся диалоговом окне Формат области переключатель
Заливка установить в положение Обычная;
4. ОК.
Алгоритм 4. Изменение масштаба шкалы осей диаграммы
1. Выделить на полученной диаграмме ось, для которой необходимо
изменить масштаб (подвести курсор к требуемой оси и щелкнуть
левой клавишей мыши);
2. Формат => Выделенная ось;
3. В появившемся диалоговом окне Формат оси выбрать вкладку
Шкала;
4. В поле Минимальное значение – ввести минимальное (или
несколько
ниже)
значение
признака,
соответствующего
форматируемой оси;
5. В поле Максимальное значение – ввести максимальное (или
несколько
выше)
значение
признака,
соответствующего
форматируемой оси;
6. ОК.
Выделить диаграмму и с помощью приема "захват мышью" переместить
ее в конец Рабочего файла.
23
В результате указанных действий для выбранных видов моделей регрессии
осуществляется вывод на диаграмму рассеяния 3-х уравнений регрессии, их
графиков и значений соответствующих индексов детерминации R2 (для
демонстрационного примера Диаграмма 2.1–ДП приведена на рис. 2.1).
Диаграмма 2.1-ДП
250,00
y = 0,0021x2 - 0,2179x + 98,895
R2 = 0,5967
230,00
y = -3E-05x3 + 0,0224x2 - 3,9975x + 316,74
R2 = 0,6205
210,00
190,00
y = 2,7974x0,74
R2 = 0,4899
170,00
150,00
130,00
110,00
90,00
70,00
50,00
50,00
100,00
150,00
200,00
250,00
300,00
350,00
Ряд1
Полином 2-го порядка
Полином 3-го порядка
Степенная функция
Рис 2.1. Уравнения регрессии и их графики
Алгоритм 5. Построение наиболее адекватного уравнения регрессии
1. Путем визуального анализа значений R2, приведенного на построенной
диаграмме 2.1, выбрать по максимальной величине R2 наиболее
адекватное уравнение регрессии;
2. Выделить диаграмму рассеяния, расположенную с ячейки Е20;
3. Диаграмма => Добавить линию тренда;
4. Выбрать вкладку Тип и задать вид выбранной наиболее адекватной
нелинейной регрессионной модели;
5. Выбрать вкладку Параметры:
1. Переключатель
Название
аппроксимирующей
кривой:
автоматическое/другое – установить в положение другое и ввести
имя наиболее адекватного уравнения регрессии;
2. Поле Прогноз вперед на – НЕ активизировать;
3. Поле Прогноз назад на – НЕ активизировать;
24
4. Флажок Пересечение кривой с осью Y в точке –
НЕ активизировать;
5. Флажок
Показывать
уравнение
на
диаграмме
–
Активизировать;
6. Флажок Поместить на диаграмму величину достоверности
аппроксимации R2 – Активизировать;
7. ОК.
По окончании работы алгоритма 5 присвоить полученной диаграмме
заголовок "Диаграмма 2.2", удалить линии сетки по оси Y, при необходимости
изменить масштаб шкалы осей диаграммы по описанным выше алгоритмам 24.
Выделить диаграмму и с помощью приема "захват мышью" переместить
ее в конец Рабочего файла.
В результате указанных действий осуществляется вывод на диаграмму
рассеяния признаков X, Y уравнения регрессии, выбранного в качестве
наиболее адекватной модели связи признаков, а также его графика и значения
индекса детерминации R2 (для демонстрационного примера Диаграмма 2.2–ДП
приведена на рис. 2.2).
Диаграмма 2.2-ДП
y = -3E-05x3 + 0,0224x2 - 3,9975x + 316,74
R2 = 0,6205
250,00
230,00
210,00
190,00
170,00
150,00
130,00
110,00
90,00
Ряд1
70,00
Полином 3-го
порядка
50,00
50,00
100,00
150,00
200,00
250,00
300,00
350,00
Рис.2.2. Наиболее адекватное уравнение регрессии и его график
25
III. Стандартный формат отчета
Стандартный формат отчета включает:
1. Постановку задачи статистического исследования.
2. Выводы по результатам выполненной лабораторной работы.
3. Приложение, содержащее распечатку Рабочего файла и графиков.
Титульный лист лабораторной работы приведен ниже.
ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ ИНСТИТУТ
КАФЕДРА СТАТИСТИКИ
ОТЧЕТ
о результатах выполнения
компьютерной лабораторной работы
Автоматизированный корреляционно-регрессионный
анализ взаимосвязи статистических данных в среде MS Excel
Вариант №____
Выполнил: студент III курса гр._____________
_________________________
Ф.И.О.
Проверил:________ _________________
Ф.И.О.
Москва ………..г.
26
1. Постановка задачи статистического исследования
Корреляционно-регрессионный анализ взаимосвязи признаков является
составной частью проводимого статистического исследования деятельности 30ти предприятий и частично использует результаты ЛР-1.
В ЛР-2 изучается взаимосвязь между факторным признаком
Среднегодовая стоимость основных производственных фондов (признак Х) и
результативным признаком Выпуск продукции (признак Y), значениями
которых являются исходные данные ЛР-1 после исключения из них
аномальных наблюдений.
Таблица исходных данных
В процессе статистического исследования необходимо решить ряд задач.
1. Установить наличие статистической связи между факторным
признаком Х и результативным признаком Y графическим методом.
2. Установить наличие корреляционной связи между признаками Х и Y
методом аналитической группировки.
3. Оценить тесноту связи признаков Х и Y на основе эмпирического
корреляционного отношения η.
4. Построить однофакторную линейную регрессионную модель связи
признаков Х и Y, используя инструмент Регрессия надстройки Пакет
анализа, и оценить тесноту связи признаков Х и Y на основе линейного
коэффициента корреляции r.
5. Определить адекватность и практическую пригодность построенной
линейной регрессионной модели, оценив:
а) значимость и доверительные интервалы коэффициентов а0, а1;
б) индекс детерминации R2 и его значимость;
в) точность регрессионной модели.
6. Дать экономическую интерпретацию:
а) коэффициента регрессии а1;
б) коэффициента эластичности КЭ;
в) остаточных величин εi.
7. Найти наиболее адекватное нелинейное уравнение регрессии с
помощью средств инструмента Мастер диаграмм. Построить для этого
уравнения теоретическую кривую регрессии.
27
2. Выводы по результатам выполнения лабораторной работы1
Задача 1. Установление наличия статистической связи между
факторным признаком Х и результативным признаком Y графическим методом.
Статистическая связь является разновидностью стохастической
(случайной) связи, при которой с изменением факторного признака X
закономерным
образом
изменяется
какой–либо
из
обобщающих
статистических показателей распределения результативного признака Y.
Вывод:
Точечный график связи признаков (диаграмма рассеяния, полученная в
ЛР-1 после удаления аномальных наблюдений) позволяет сделать вывод, что
имеет (не имеет) место статистическая связь. Предположительный вид связи –
линейная (нелинейная) прямая (обратная).
Задача 2. Установление наличия корреляционной
признаками Х и Y методом аналитической группировки.
связи
между
Корреляционная связь – важнейший частный случай стохастической
статистической связи, когда под воздействием вариации факторного признака
Х закономерно изменяются средние значения y x результативного признака
i
Y (усредняются значения y i 1 , y i 2 ,..., y i n , полученные под воздействием на Y
фактора xi ). Для выявления наличия корреляционной связи используется
метод аналитической группировки.
Вывод:
Результаты выполнения аналитической группировки предприятий по
факторному признаку Среднегодовая стоимость основных производственных
фондов даны в табл. 2.2 Рабочего файла, которая показывает, что с
увеличением значения факторного признака Х закономерно (незакономерно)
увеличивается (уменьшается) значение результативного признака Y.
Следовательно, между признаками Х и Y ………………………………………..
………………………………………………………………………………………..
Задача 3.Оценка тесноты связи признаков Х и Y на основе
эмпирического корреляционного отношения.
Для анализа тесноты связи между факторным и результативным
признаками рассчитывается показатель η - эмпирическое корреляционное
отношение, задаваемое формулой
1
Все статистические показатели необходимо представить в таблицах с точностью до 4-х
знаков после запятой. Таблицы и пробелы в формулировках выводов заполнять вручную. В
выводах при выборе альтернативного варианта ответа ненужный вариант вычеркивается.
28
δх2
,
η=
2
σ общ
где δ 2х
и
2
σ общ
- соответственно межгрупповая и общая дисперсии
результативного признака Y - Выпуск продукции (индекс х дисперсии δ 2х
означает, что оценивается мера влияния признака Х на Y).
Для качественной оценки тесноты связи на основе показателя
эмпирического корреляционного отношения служит шкала Чэддока:
Значение η
Сила связи
0,1 – 0,3
Слабая
0,3 – 0,5
Умеренная
0,5 – 0,7
Заметная
0,7 – 0,9
Тесная
0,9 – 0,99
Весьма тесная
Результаты выполненных расчетов представлены в табл. 2.4 Рабочего
файла.
Вывод:
Значение коэффициента η =……………………, что в соответствии с
оценочной шкалой Чэддока говорит о …………………………степени связи
изучаемых признаков.
Задача 4. Построение однофакторной линейной регрессионной модели
связи изучаемых признаков с помощью инструмента Регрессия надстройки
Пакет анализа и оценка тесноты связи на основе линейного коэффициента
корреляции r.
4.1. Построение регрессионной модели заключается в нахождении
аналитического выражения связи между факторным признаком X и
результативным признаком Y.
Инструмент Регрессия на основе исходных данных (xi , yi), производит
расчет параметров а0 и а1 уравнения однофакторной линейной регрессии
yˆ = a0 + a1 x , а также вычисление ряда показателей, необходимых для
проверки адекватности построенного уравнения исходным (фактическим)
данным.
Примечание. В результате работы инструмента Регрессия получены
четыре результативные таблицы (начиная с заданной ячейки А75). Эти
таблицы выводятся в Рабочий файл без нумерации, поэтому необходимо
вручную присвоить им номера табл.2.5 – табл.2.8 в соответствии с их
порядком.
Вывод:
Рассчитанные в табл.2.7 (ячейки В91 и В92) коэффициенты а0 и а1
позволяют построить линейную регрессионную модель связи изучаемых
признаков в виде уравнения ŷ = …………………….
29
4.2. В случае линейности функции связи для оценки тесноты связи
признаков X и Y, устанавливаемой по построенной модели, используется
линейный коэффициент корреляции r.
Значение коэффициента корреляции r приводится в табл.2.5 в ячейке В78
(термин "Множественный R").
Вывод:
Значение коэффициента корреляции r =…………… , что в соответствии с
оценочной шкалой Чэддока говорит о ..….………………………. степени связи
изучаемых признаков.
Задача 5. Анализ адекватности и практической пригодности построенной
линейной регрессионной модели.
Анализ адекватности регрессионной модели преследует цель оценить,
насколько построенная теоретическая модель взаимосвязи признаков отражает
фактическую зависимость между этими признаками, и тем самым оценить
практическую пригодность синтезированной модели связи.
Оценка соответствия построенной регрессионной модели исходным
(фактическим) значениям признаков X и Y выполняется в 4 этапа:
1) оценка статистической значимости коэффициентов уравнения а0, а1
и определение их доверительных интервалов для заданного уровня надежности;
2) определение практической пригодности построенной модели на
основе оценок линейного коэффициента корреляции
r
и индекса
2
детерминации R ;
3) проверка значимости уравнения регрессии в целом по F-критерию
Фишера;
4) оценка погрешности регрессионной модели.
5.1.
Оценка статистической значимости коэффициентов
уравнения а0, а1 и определение их доверительных
интервалов
Так как коэффициенты уравнения а0 , а1 рассчитывались, исходя из
значений признаков только для 30-ти пар (xi , yi), то полученные значения
коэффициентов являются лишь приближенными оценками фактических
параметров связи а0 , а1. Поэтому необходимо:
 проверить значения коэффициентов на неслучайность (т.е. узнать,
насколько они типичны для всей генеральной совокупности предприятий
отрасли);
 определить (с заданной доверительной вероятностью 0,95 и 0,683)
пределы, в которых могут находиться значения а0, а1 для генеральной
совокупности предприятий.
Для анализа коэффициентов а0, а1 линейного уравнения регрессии
используется табл.2.7, в которой:
30
– значения коэффициентов а0, а1 приведены в ячейках В91 и В92
соответственно;
– рассчитанный уровень значимости коэффициентов уравнения
приведен в ячейках Е91 и Е92;
– доверительные интервалы коэффициентов с уровнем надежности
Р=0,95 и Р=0,683 указаны в диапазоне ячеек F91:I92.
5.1.1. Определение значимости коэффициентов уравнения
Уровень значимости – это величина α=1–Р, где Р – заданный уровень
надежности (доверительная вероятность).
Режим работы инструмента Регрессия использует по умолчанию уровень
надежности Р=0,95. Для этого уровня надежности уровень значимости равен α
= 1 – 0,95 = 0,05. Этот уровень значимости считается заданным.
В инструменте Регрессия надстройки Пакет анализа для каждого из
коэффициентов а0 и а1 вычисляется уровень его значимости αр, который указан
в результативной таблице (табл.2.7 термин "Р-значение"). Если рассчитанный
для коэффициентов а0, а1 уровень значимости αр, меньше заданного уровня
значимости α= 0,05, то этот коэффициент признается неслучайным (т.е.
типичным для генеральной совокупности), в противном случае – случайным.
Примечание. В случае, если признается случайным свободный член а0, то
уравнение регрессии целесообразно построить заново без свободного члена а0.
В этом случае в диалоговом окне Регрессия необходимо задать те же самые
параметры за исключением лишь того, что следует активизировать флажок
Константа-ноль (это означает, что модель будет строиться при условии
а0=0). В лабораторной работе такой шаг не предусмотрен.
Если незначимым (случайным) является коэффициент регрессии а1, то
взаимосвязь
между признаками X и Y в принципе не может
аппроксимироваться линейной моделью.
Вывод:
Для свободного члена а0 уравнения регрессии рассчитанный уровень
значимости есть αр =…..………… Так как он меньше (больше) заданного
уровня значимости α=0,05, то коэффициент а0 признается типичным
(случайным).
Для коэффициента регрессии а1 рассчитанный уровень значимости есть
αр =………..…… Так как он меньше(больше) заданного уровня значимости
α=0,05, то коэффициент а1 признается типичным (случайным).
5.1.2. Зависимость доверительных интервалов коэффициентов
уравнения от заданного уровня надежности
Доверительные интервалы коэффициентов а0, а1 построенного уравнения
регрессии при уровнях надежности Р=0,95 и Р=0,683 представлены в табл.2.7,
на основе которой формируется табл.2.9.
31
Таблица 2.9
Границы доверительных интервалов коэффициентов уравнения
Границы доверительных интервалов
Коэффициенты
Для уровня надежности
Для уровня надежности
Р=0,95
Р=0,683
нижняя
верхняя
нижняя
верхняя
а0
а1
Вывод:
В генеральной совокупности предприятий значение коэффициента а0
следует
ожидать
с
надежностью
Р=0,95
в
пределах
……………. ≤ а0 ≤ ….……….., значение коэффициента а1 в пределах
…………… ≤ а1 ≤ ….………… Уменьшение уровня надежности ведет к
расширению (сужению) доверительных интервалов коэффициентов уравнения.
5.2.
Определение
практической
регрессионной модели.
пригодности
построенной
Практическую пригодность построенной модели yˆ = a0 + a1 x можно
охарактеризовать по величине линейного коэффициента корреляции r:
 близость r к единице свидетельствует о хорошей аппроксимации
исходных (фактических) данных с помощью построенной линейной
функции связи yˆ = a0 + a1 x ;
 близость r к нулю означает, что связь между фактическими данными Х и
Y нельзя аппроксимировать как построенной, так и любой другой
линейной моделью, и, следовательно, для моделирования связи следует
использовать какую-либо подходящую нелинейную модель.
Пригодность построенной регрессионной модели для практического
использования можно оценить и по величине индекса детерминации R2,
показывающего, какая часть общей вариации признака Y объясняется в
построенной модели вариацией фактора X.
В основе такой оценки лежит равенство R = r (имеющее место для
линейных моделей связи), а также шкала Чэддока, устанавливающая
качественную характеристику тесноты связи в зависимости от величины r.
Согласно шкале Чэддока высокая степень тесноты связи признаков
достигается лишь при r >0,7, т.е. при R >0,7. Для индекса детерминации R2
это означает выполнение неравенства R2 >0,5.
32
При недостаточно тесной связи признаков X,Y (слабой, умеренной,
заметной) имеет место неравенство r ≤0,7, а следовательно, и неравенство
R 2  0,5 .
С учетом вышесказанного, практическая пригодность построенной
модели связи yˆ = a0 + a1 x оценивается по величине R2 следующим образом:
 неравенство R2 >0,5 позволяет считать, что построенная модель
пригодна для практического применения, т.к. в ней достигается высокая
степень тесноты связи признаков X и Y, при которой более 50% вариации
признака Y объясняется влиянием фактора Х;
 неравенство R 2  0,5 означает, что построенная модель связи
практического значения не имеет ввиду недостаточной тесноты связи между
признаками X и Y, при которой менее 50% вариации признака Y объясняется
влиянием фактора Х, и, следовательно, фактор Х влияет на вариацию Y в
значительно меньшей степени, чем другие (неучтенные в модели) факторы.
Значение индекса детерминации R2 приводится в табл.2.5 в ячейке В79
(термин "R - квадрат").
Вывод:
Значение линейного коэффициента корреляции r и значение индекса
детерминации R2 согласно табл. 2.5 равны: r =…….…….., R2 =……..……….
Поскольку
r > 0,7 ( r ≤ 0,7) и (R 2 > 0,5) (R 2
линейная регрессионная модель связи
практического использования.
5.3.
≤
0,5) , то построенная
пригодна (не пригодна) для
Общая оценка адекватности регрессионной модели по
F-критерию Фишера
Адекватность построенной регрессионной модели фактическим данным (xi,
yi) устанавливается по критерию Р.Фишера, оценивающему статистическую
значимость (неслучайность) индекса детерминации R2.
Рассчитанная для уравнения регрессии оценка значимости R2 приведена в
табл.2.6 в ячейке F86 (термин "Значимость F"). Если она меньше заданного
уровня значимости α=0,05, то величина R2 признается неслучайной и,
следовательно, построенное уравнение регрессии yˆ = a0 + a1 x может быть
использовано как модель связи между признаками Х и Y для генеральной
совокупности предприятий отрасли.
Вывод:
Рассчитанный уровень значимости αр индекса детерминации R2 есть
αр=……………… Так как он меньше(больше) заданного уровня значимости
α=0,05, то значение R2 признается типичным (случайным) и модель связи между
33
признаками Х и Y ŷ  ……………………применима (неприменима) для
генеральной совокупности предприятий отрасли в целом.
5.4.
Оценка погрешности регрессионной модели
Погрешность регрессионной модели можно оценить по величине
стандартной ошибки σ ε построенного линейного уравнения регрессии
yˆ = a0 + a1 x . Величина ошибки σ ε оценивается как среднее квадратическое
отклонение по совокупности отклонений (yi - yˆ i ) исходных (фактических)
значений yi признака Y от его теоретических значений ŷ i , рассчитанных по
построенной модели.
Погрешность регрессионной модели выражается в процентах и
σ
рассчитывается как величина ε  100 .
y
В адекватных моделях погрешность не должна превышать 12%-15%.
Значение σ ε приводится в выходной таблице "Регрессионная статистика"
(табл.2.5) в ячейке В81 (термин "Стандартная ошибка"), значение y – в
таблице описательных статистик (ЛР-1, Лист 1, табл.3, столбец 2).
Вывод:
Погрешность
линейной
регрессионной
модели
составляет
σε
 100 =___________ . 100 =…..…...%, что подтверждает (не подтверждает)
y
адекватность построенной модели ŷ = ……………………………
Задача 6. Дать экономическую интерпретацию:
1) коэффициента регрессии а1;
2) коэффициента эластичности КЭ;
3) остаточных величин  i.
6.1. Экономическая интерпретация коэффициента регрессии а1
В случае линейного уравнения регрессии ŷ x =a0+a1x величина
коэффициента регрессии a1 показывает, на сколько в среднем (в абсолютном
выражении) изменяется значение результативного признака Y при изменении
фактора Х на единицу его измерения. Знак при a1 показывает направление
этого изменения.
Вывод:
Коэффициент регрессии а1 =……………….. показывает, что при увеличении
факторного признака Среднегодовая стоимость основных производственных
фондов на 1 млн руб. значение результативного признака Выпуск продукции
увеличивается (уменьшается) в среднем на ……………..млн руб.
34
6.2. Экономическая интерпретация коэффициента эластичности.
С целью расширения возможностей экономического анализа явления
x
используется коэффициент эластичности К э  а1  , который измеряется в
y
процентах и показывает, на сколько процентов изменяется в среднем
результативный признак при изменении факторного признака на 1%.
Средние значения х и y приведены в таблице описательных статистик
(ЛР-1, Лист 1, табл.3).
Расчет коэффициента эластичности:
К э  а1  x =………._________ =………..%
y
Вывод:
Значение коэффициента эластичности Кэ=…………. показывает, что при
увеличении факторного признака Среднегодовая стоимость основных
производственных фондов на 1% значение результативного признака Выпуск
продукции увеличивается (уменьшается) в среднем на ……….%.
6.3. Экономическая интерпретация остаточных величин εi
Каждый их остатков εi = yi - yˆ i характеризует отклонение фактического
значения yi от теоретического значения ŷi , рассчитанного по построенной
регрессионной модели и определяющего, какого среднего значения yi следует
ожидать, когда фактор Х принимает значение xi.
Анализируя остатки, можно сделать ряд практических выводов,
касающихся выпуска продукции на рассматриваемых предприятиях отрасли.
Значения остатков  i (таблица остатков из диапазона А98:С128) имеют
как положительные, так и отрицательные отклонения от ожидаемого в среднем
объема выпуска продукции ŷi (которые в итоге уравновешиваются,
т.е. ∑εi = 0 ).
i
Экономический интерес представляют наибольшие расхождения между
фактическим объемом выпускаемой продукции yi и ожидаемым усредненным
объемом ŷ i .
Вывод:
Согласно таблице остатков максимальное превышение ожидаемого
среднего объема выпускаемой продукции ŷi имеют три предприятия - с
номерами……, ……, …….., а максимальные отрицательные отклонения - три
предприятия с номерами……, ……, …….. .Именно эти шесть предприятий
35
подлежат дальнейшему экономическому анализу для выяснения причин
наибольших отклонений объема выпускаемой ими продукции от ожидаемого
среднего объема и выявления резервов роста производства.
Задача 7. Нахождение наиболее адекватного нелинейного уравнения
регрессии с помощью средств инструмента Мастер диаграмм. Построение для
этого уравнения теоретической кривой регрессии.
Уравнения регрессии и их графики построены для 3-х видов нелинейной
зависимости между признаками и представлены на диаграмме 2.1 Рабочего
файла.
Уравнения регрессии и соответствующие им индексы детерминации R2
приведены в табл.2.10 (при заполнении данной таблицы коэффициенты
уравнений необходимо указывать не в компьютерном формате, а в
общепринятой десятичной форме чисел).
Таблица 2.10
Регрессионные модели связи
Вид уравнения
Полином 2-го порядка
Полином 3-го порядка
Степенная функция
Уравнение регрессии
Индекс
детерминации R2
ŷ 
ŷ 
ŷ 
Выбор наиболее адекватного уравнения регрессии определяется
максимальным значением индекса детерминации R2: чем ближе значение R2 к
единице, тем более точно регрессионная модель соответствует
фактическим данным.
Вывод:
Максимальное значение индекса детерминации R2 =…………............
Следовательно, наиболее адекватное исходным данным нелинейное уравнение
регрессии имеет вид ŷ  …………………………
Это уравнение регрессии и его график приведены на рис.2.2 Рабочего
файла.
36
Приложение
Результативные таблицы и графики
Распечатка Листа 2 Рабочего файла
37
Литература
1. Статистика. Компьютерные лабораторные работы: Методические
указания
к
лабораторной
работе
№2
"Автоматизированный
корреляционно-регрессионный анализ взаимосвязи статистических
данных в среде MS Excel". – М.: Вузовский учебник, 2006.
2. Статистика. Компьютерные лабораторные работы: Методические
указания к лабораторной работе №1 "Автоматизированный априорный
анализ статистической совокупности в среде MS Excel". – М.: Вузовский
учебник, 2005.
3. Статистика. Алгоритмы и формат отчета к лабораторной работе
"Автоматизированный априорный анализ статистической совокупности в
среде MS Excel": Учебно-методические материалы для преподавателей. –
М.: ВЗФЭИ, 2007.
4. Козлов А.Ю., Мхитарян В.С., Шишов В.Ф. Статистические функции MS
Excel в экономико-статистических расчетах: Учеб. пособие для вузов
/Под ред. проф. В.С. Мхитаряна. – М.: ЮНИТИ-ДАНА, 2003.
5. Козлов А.Ю., Шишов В.Ф. Пакет анализа MS Excel в экономикостатистических расчетах: Учеб. пособие для вузов / Под ред. проф. В.С.
Мхитаряна. – М.: ЮНИТИ-ДАНА, 2003.
6. Макарова Н.В., Трофимец В.Я. Статистика в Excel: Учеб. пособие. – М.:
Финансы и статистика, 2002.
7. Теория статистики: Учебник /Под ред. Шмойловой Р.А. – М.: Финансы и
статистика, 2004.
38
СОДЕРЖАНИЕ
I. Методические рекомендации для преподавателей по проведению
лабораторной работы……………………………………………………………….
1. Информационное обеспечение лабораторной работы………………………..
2. Структура лабораторной работы……………………………………………….
3. Алгоритмическое обеспечение лабораторной работы………………………..
4. Отчетность по лабораторной работе…………………………………………...
II. Алгоритмическое обеспечение лабораторной работы………………………
I. Подготовительный этап………………………………..………………………..
2. Этап выполнения статистических расчетов……………………………………
Задание 1. Построение аналитической группировки для выявления
корреляционной зависимости результативного признака от
факторного и оценка тесноты взаимосвязи
признаков…………………………………………………………….
Задание 2. Построение однофакторной линейной регрессионной модели
связи изучаемых признаков с помощью инструмента Регрессия
надстройки Пакет анализа…………………………………………
Задание 3. Построение однофакторных нелинейных регрессионных
моделей связи признаков с помощью инструмента Мастер
диаграмм и выбор наиболее адекватного нелинейного
уравнения регрессии...........................................................................
III. Стандартный формат отчета……………………………..…………….….......
1. Постановка задачи статистического исследования..……………………….....
2. Выводы по результатам выполнения лабораторной работы……………….....
3. Приложение………………………………………………………………………
Литература……………………………………………………………………………..
39
Download