Статистический анализ данных (SPSS)

advertisement
Правительство Российской Федерации
федеральное государственное автономное образовательное учреждение
высшего профессионального образования
"Национальный исследовательский университет
"Высшая школа экономики"
Факультет бизнес-информатики
Программа дисциплины
Статистический анализ данных (SPSS)
для направления 080500.62 название Менеджмент
Автор Л.В. Шестакова
Утверждена
Одобрена на заседании кафедры
Учебно-методическим Советом НИУ ВШЭ - Пермь
_________________________________
Председатель _____________Г.Е. Володина
Зав.кафедрой _______ О.Л. Викентьева
«_______» ______________________20___ г.
«_______» ________________20___ г.
Пермь, 2012г.
I. Пояснительная записка
1. Автор программы: к.ф.-м.н., доцент Шестакова Л.В.
2. Требования к студентам: Для успешного изучения данной дисциплины студенты должны
обладать знаниями, полученными в рамках курса теории вероятностей и математической
статистики.
3. Аннотация: Дисциплина предназначена для студентов четвертого курса направления
080500.62 Менеджмент.
Большим шагом вперед к развитию статистической науки послужило применение
экономико-математических методов и использование компьютерной техники в анализе
социально-экономических явлений.
Цель курса – овладение основными статистическими методами и приемами обработки
данных.
В процессе изучения курса развиваются два аспекта:
 Общеобразовательный, предполагающий развитие понятийного мышления, умения
анализировать социально-экономические явления и принципы организации данных, и на
этой основе создавать статистические информационные модели.
 Технологический, предполагающий формирование образовательного потенциала,
необходимого для эффективного использования современных информационных
технологий в сфере статистического анализа данных.
Программа курса предполагает проведение лекционных и лабораторных занятий в классе,
оборудованном IBM – совместимыми компьютерами. Обязательное программное
обеспечение, используемое при изучении данного курса: операционная система Microsoft
Windows, статистический пакет SPSS. SPSS – Statistical Package for the Social Science
является в настоящее время самой распространенной программой для обработки
статистической информации.
4. Учебная задача курса:
В результате изучения курса студент должен:
 знать основные понятия теории математической статистки, основные
статистические методы,
 уметь грамотно применить изученный математический аппарат при изучении
экономических дисциплин, при решении прикладных задач экономического
содержания, самостоятельно осваивать новые пакеты и технологии обработки и
анализа статистических данных на основе полученных знаний, интерпретировать
результаты проведенного статистического анализа,
 иметь представление о границах применимости аппарата статистического анализа
при обработке социально-экономических данных,
 обладать навыками работы в пакете статистического анализа SPSS.
5. Формы контроля:
 текущий контроль: выполнение лабораторных работ сопровождается проведением
контрольного опроса, согласно графику контрольных мероприятий проводятся
тематическая контрольная работа и домашнее задание, предполагающие
выполнение работы на компьютере.
 итоговый контроль: по завершению дисциплины проводится зачет в форме теста.
 итоговая оценка складывается:
 оценка работы на практических занятиях (20% результирующей оценки).
 оценка за контрольные мероприятия (40% результирующей оценки), вес
контрольной работы – 50%, вес домашнего задания – 50 %.
 оценка за итоговый контроль (40% результирующей оценки).
В НИУ ВШЭ – Пермь принята следующая система весов:
2
20% результирующей оценки – оценка за работу на семинарских занятиях;
40% результирующей оценки – взвешенная сумма оценок за контрольные мероприятия;
40% результирующей оценки – оценка за итоговый (или промежуточный контроль).
Таким образом, 60% результирующей оценки – это накопительная оценка и 40% – это оценка
за итоговый (или промежуточный контроль).
Результирующая оценка рассчитывается с помощью взвешенной суммы накопительной
оценки и оценки за экзамен (или зачет).
Накопительная оценка рассчитывается с помощью взвешенной суммы оценок за отдельные
формы текущего контроля. К формам текущего контроля относятся: работа на семинарских
занятиях, контрольные мероприятия (контрольные работы, эссе, коллоквиумы и пр.),
которые определены учебным планом.
Веса по контрольным мероприятиям дисциплины: контрольная работа – 50%, домашняя
работа – 50%
II. Содержание программы.
Раздел 1. Введение
Тема 1. Система SPSS, ее назначение.
Предмет и содержание курса, связь с другими дисциплинами. Классификация
основных методов статистического анализа данных, разработанных в рамках теории
математической статистики. Структура статистического программно-аналитического
комплекса SPSS, его назначение и возможности. Окна вывода, окно редактирования данных.
Панели инструментов. Характеристика диалоговых окон, их отличия, обусловленные
функциональной ролью, выполняемой в программе. Шкалы измерения.
Тема 2. Особенности подготовки данных для статистического анализа
Создание файла данных. Ввод данных через электронные таблицы, базы данных,
ASCII–файл. Определение переменной. Переменные и наблюдения, значение переменной в
конкретном наблюдении. Имя переменной, тип переменной, метка переменной и метки
значений. Пропущенные значения. Модификация и отбор данных: условный отбор данных и
случайная выборка, сортировка и группировка данных, перекодирование переменных,
вычисление новых переменных.
Раздел 2. Методы описательной статистики.
Тема 3. Описательная статистика для номинальных и порядковых шкал.
Построение частотных таблиц. Элементы частотных таблиц и их интерпретация.
Графическое представление поведения анализируемой переменной. Назначение таблиц
сопряженности. Структура и содержание элементов таблицы, ее итоговых показателей.
Особенности измерения связи для номинальных и порядковых шкал переменных.
Последовательность построения таблиц и получения статистических критериев проверки на
независимость.
Тема 4. Описательная статистика для количественных шкал.
Критерии нормальности распределения данных. Проверка однородности дисперсии в
группах. Сравнение средних значений различных выборок. Графический анализ данных
(ящичковая диаграмма, диаграмма "ствол-листья", график Q-Q Normal Probability Plot.
Расчет стандартизованных значений.
Раздел 3. Методы изучения взаимосвязей явлений и процессов.
Тема 5. Корреляционный анализ.
Исследование линейных корреляций по Пирсону, Спирману и Кендалу. Частные
корреляции.
Тема 6. Модели регрессионного анализа.
Простая и множественная линейные регрессии. Варианты поиска нарушения
предпосылок применения математического аппарата (остатки, мультиколинеарность,
взаимозависимость ошибок, нормальность). Процедура получения параметров, проверка
3
гипотез. Расчет доверительных интервалов, выбор параметров уравнений и анализ
сопутствующих статистических показателей: коэффициент R-квадрат, скорректированный
R-квадрат, анализ вариации. Разновидности регрессионных моделей в зависимости от уровня
измерения переменных.
Раздел 4. Исследование структуры данных.
Тема 7. Дискриминантный анализ.
Формулировка задачи дискриминантного анализа. Основная модель. Предположения,
лежащие в основе дискриминантного анализа. Рекомендации по применению.
Тема 8. Факторный анализ.
Факторный анализ. Принципы факторного анализа. Факторный анализ и метод главных
компонент. График «осыпь». Методы вращения. Интерпретация факторов.
Тема 9. Кластерный анализ.
Иерархические и неиерархические методы кластерного анализа. Меры расстояния и
меры сходства. Кластеризация при большом количестве наблюдений - метод k-средних.
Рекомендации по применению.
III. Учебно-методическое обеспечение дисциплины:
1. Литература:
Базовый учебник:
Крыштановский А.О., Анализ социологических данных с помощью пакета SPSS.-М.
Изд-во ГУ ВШЭ., 2006.
Основная:
Бююль А., Цефель П. SPSS: Искусство обработки информации. Platinum Edition –
Спб.: «ДиаСофтЮП», 2005.
Дополнительная:
1. Тюрин Ю.Н. , Анализ данных на компьютере, М.: ИНФРА-М, 2003.
2. Вуколов Э.А., Основы статистического анализа. Практикум по статистическим
методам и исследованию операций с использованием пактов STATISTICA и Excel.
– М.: ФОРУМ: ИНФРА-М, 2004.
2. Тематика заданий по различным формам текущего контроля:
Домашняя работа по теме «Регрессионный анализ».
Приложение 2. Вопросы для самоконтроля.
3. Методические рекомендации (материалы) преподавателю:
 Уделять внимание общим принципам построения курса «Статистический анализ
данных» как образца построения научной теории.
 Акцентировать внимание на применении методов «Статистического анализа
данных» для исследования экономических явлений и систем.
 На лабораторных занятиях используются следующие методы обучения и контроля
усвоения материала:
1. Выполнение лабораторных работ по тематике занятия сопровождается
контрольным опросом;
2. Обсуждение практических ситуаций;
3. Решение типовых расчетных задач.
 Домашнее задание направлено на проверку умения самостоятельно анализировать
социально-экономические данные и интерпретировать результаты статистического
анализа.
4
4. Методические указания студентам:
Студенту рекомендуется следующая схема подготовки к лабораторному занятию:
 проработать конспект лекций;
 проанализировать основную и дополнительную литературу, рекомендованную по
изучаемому разделу;
 при затруднениях сформулировать вопросы к преподавателю.
1. Рекомендации по использованию информационных технологий
При выполнении лабораторных работ и домашней работы используется пакет анализа данных
SPSS.
Автор программы __________________________ Шестакова Л.В.
5
IV. Тематический расчет часов
На 2011-2012 учебный год для направления 080500.62 Менеджмент
Аудиторные часы
№
п/п
Наименование разделов и тем
Самостоят. Всего
Семинар.
работа
часов
Лекции или практ. Всего
занятия
Раздел 1. Введение
1 Система SPSS, ее назначение
2
Особенности подготовки данных
для статистического анализа
1
1
2
2
4
1
1
2
2
4
Раздел 2. Методы описательной статистики
3
Описательная статистика для
номинальных и порядковых шкал
4
4
8
8
16
4
Описательная статистика для
количественных шкал
2
2
4
4
8
Раздел 3. Методы изучения взаимосвязей явлений и процессов
5 Корреляционный анализ
2
2
4
4
8
6 Регрессионный анализ
4
6
10
10
20
Раздел 4. Исследование структуры данных
7 Дискриминантный анализ
4
4
8
8
16
8 Факторный анализ
4
4
8
8
16
9 Кластерный анализ
4
4
8
8
16
26
28
54
54
108
ИТОГО:
Автор программы __________________________ Шестакова Л.В.
6
Приложение 1
Планы практических занятий
по дисциплине «Статистический анализ данных (SPSS)»
направление 080500.62 – «Менеджмент»
Одномерный описательный анализ.
Практическое
занятие 1, 2
Тема
Вопросы
Умения и навыки
Задания для
работы на
семинаре
Практическое
занятие 3
Тема
Вопросы
Умения и навыки
Задания для
работы на
семинаре
Практическое
занятие 4
Тема
Вопросы
Умения и навыки
Задания для
работы на
семинаре
Понятие единицы анализа и переменной.
Представление данных в пакете SPSS.
Построение и анализ частотных распределений с помощью пакета
SPSS.
4. Графическое
представление
поведения
анализируемой
переменной с помощью пакета SPSS.
Уметь
1. задавать метки переменных и метки значений
2. определять тип переменной
3. задавать шкалу измерений
4. фильтровать данные
5. уметь строить и анализировать частотные таблицы
Лабораторная работа №1
S:\Common\Кафедра Информационные технологии в
бизнесе\Менеджмент\Бакалавриат_Мен\Статистический анализ
данных\Методическое сопровождение
1.
2.
3.
Одномерный описательный анализ.
1. Получение статистических характеристик распределения
анализируемой переменной с помощью пакета SPSS.
2. Стандартизация показателей. Z-стандартизация в пакете SPSS.
3. Интервальное оценивание.
Уметь
1. вычислять различные меры средней тенденции для шкал различного
типа
2. вычислять процентили (квартили и т.д.)
3. вычислять меры разброса
4. вычислять характеристики распределений
5. осуществлять Z-стандартизацию значений переменных
6. вычислять доверительные интервалы для шкал различного типа
Лабораторная работа №2.
S:\Common\Кафедра Информационные технологии в
бизнесе\Менеджмент\Бакалавриат_Мен\Статистический анализ
данных\Методическое сопровождение
Взаимосвязь переменных
1. Построение и анализ диаграмм рассеяния в пакете программ SPSS.
2. Построение и анализ таблиц сопряженности в пакете программ
SPSS.
Уметь
1. строить и анализировать диаграммы рассеяния
2. строить и анализировать таблицы сопряженности различного вида
3. вычислять коэффициент ХИ-квадрат
Лабораторная работа №3.
S:\Common\Кафедра Информационные технологии в
бизнесе\Менеджмент\Бакалавриат_Мен\Статистический анализ
данных\Методическое сопровождение
7
Взаимосвязь переменных
Практическое
занятие 5
Тема
Вопросы
Умения и навыки
Задания для
работы на
семинаре
Практическое
занятие 6
Тема
Вопросы
Умения и навыки
Задания для
работы на
семинаре
Практическое
занятие 7
1. сравнение двух независимых выборок
2. сравнение двух зависимых (спаренных) выборок
3. сравнение более двух независимых выборок
Уметь
Выбирать инструмент для проведения сравнения средних
Лабораторная работа №5.
S:\Common\Кафедра Информационные технологии в
бизнесе\Менеджмент\Бакалавриат_Мен\Статистический анализ
данных\Методическое сопровождение
Методы регрессионного анализа
Тема
Вопросы
Умения и навыки
Задания для
работы на
семинаре
Практическое
занятие 8
1. Коэффициенты связи для номинальных переменных.
2. Коэффициенты связи для порядковых данных.
3. Коэффициенты связи для метрических данных.
Уметь
Выявлять связи между переменными с помощью вычисления и
анализа коэффициентов связи.
Лабораторная работа №4.
S:\Common\Кафедра Информационные технологии в
бизнесе\Менеджмент\Бакалавриат_Мен\Статистический анализ
данных\Методическое сопровождение
Сравнение средних
1. Простая линейная регрессия. Построение и анализ регрессионных
моделей в пакете SPSS.
2. Множественная регрессия. Построение и анализ регрессионных
моделей в пакете SPSS.
Уметь
1. выбирать
регрессионную модель в зависимости от уровня
измерения переменных.
2. строить и анализировать линейную регрессионную модель в пакете
SPSS.
3. интерпретировать коэффициенты регрессии.
4. анализировать качество модели линейной регрессии.
5. проверять статистические гипотезы о параметрах регрессии.
6. строить и анализировать модель множественной регрессии в пакете
SPSS.
7. проверять ограничения модели множественной регрессии.
Лабораторная работа №6.
S:\Common\Кафедра Информационные технологии в
бизнесе\Менеджмент\Бакалавриат_Мен\Статистический анализ
данных\Методическое сопровождение
Методы регрессионного анализа
Тема
Вопросы
1. Регрессионная модель с использованием фиктивных переменных.
Реализация в пакете SPSS.
2. Интерпретация коэффициентов регрессии при фиктивных
переменных.
3. Интерпретация доверительных интервалов и уровней значимости
для регрессионных коэффициентов при фиктивных переменных.
8
Умения и навыки
Уметь
1. интерпретировать коэффициенты регрессии при фиктивных
переменных
2. строить и интерпретировать доверительные интервалы и уровни
значимости для регрессионных коэффициентов при фиктивных
переменных.
Построение и анализ моделей множественной регрессии
Задания для
работы на
семинаре
Практическое
занятие 9
Тема
Исследование структуры данных
1. Иерархический кластерный анализ. Реализация в пакете SPSS.
Вопросы
Умения и навыки
Задания для
работы на
семинаре
Практическое
занятие 10
Тема
Вопросы
Умения и навыки
Задания для
работы на
семинаре
Практическое
занятие 11, 12
Тема
Уметь
1. Выполнять иерархический кластерный анализ
2. Анализировать протокол объединения
3. Анализировать дендрограмму
Лабораторная работа №8.
S:\Common\Кафедра Информационные технологии в
бизнесе\Менеджмент\Бакалавриат_Мен\Статистический анализ
данных\Методическое сопровождение
Исследование структуры данных
1. Факторный анализ. Реализация в пакете SPSS. Анализ матрицы
нагрузок.
2. Метод главных компонент
3. Интерпретация факторов
4. Проблема определения числа факторов.
Уметь
1. Выполнять факторный анализ
2. Определять число факторов
3. Интерпретировать матрицу нагрузок
Лабораторная работа №9. S:\Common\Кафедра Информационные
технологии в бизнесе\Менеджмент\Бакалавриат_Мен\Статистический
анализ данных\Методическое сопровождение
Дискриминантный анализ
1. Вычисление дискриминантной функции.
Вопросы
Умения и навыки
Задания для
работы на
семинаре
Уметь
1. Выполнять дискриминантный анализ
2. Инструменты проведения дискиминантного анализа в SPSS
3. Интерпретировать полученные результаты
Лабораторная работа №7.
S:\Common\Кафедра Информационные технологии в
бизнесе\Менеджмент\Бакалавриат_Мен\Статистический анализ
данных\Методическое сопровождение
9
Приложение 2
Перечень вопросов для самоконтроля по курсу
«Статистический анализ данных (SPSS)»
направление 080500.62 – «Менеджмент»
1. Виды статистических шкал.
2. Допустимые меры средней тенденции для шкал различного типа: номинальной,
порядковой, метрической.
3. Показатели качества среднего (дисперсия, стандартное отклонение, стандартная
ошибка среднего).
4. Частотные таблицы: валидный и кумулятивный процент.
5. Таблицы сопряженности.
6. Описательная статистика для количественных переменных.
7. Коэффициенты связи для номинальных переменных.
Коэффициент Хи-квадрат, ограничения использования коэффициента хи-квадрат;
Коэффициенты связи, основанные на хи-квадрате.
8. Коэффициенты связи для порядковых данных.
9. Отличие ранговых коэффициентов корреляции от коэффициентов связи, основанных
на χ2.
10. Коэффициенты связи для метрических данных.
11. Сравнение средних
12. Простая и множественная линейная регрессия.
13. Интерпретация коэффициентов регрессии.
14. Качество модели линейной регрессии.
15. Проверка статистических гипотез о параметрах регрессии.
16. Ограничения модели регрессии. Нормальность распределения остатков,
гомоскедастатичность, мультиколлинеарность.
17. Разновидности регрессионных моделей в зависимости от уровня измерения
переменных.
18. Дискриминантный анализ.
19. Стандартизация данных.
20. Факторный анализ. Определение числа факторов.
21. Методы кластерного анализа.
22. Меры расстояния.
10
Download