Высшая школа экономики Программа дисциплины «Методы анализа данных»

advertisement
Министерство экономического развития и торговли Российской Федерации
Государственный университет –
Высшая школа экономики
Факультет менеджмента
Программа дисциплины
«Методы анализа данных»
для направления 080500.68 - Менеджмент
подготовки магистра
Автор: доцент Темницкий Александр Лазаревич
Рекомендовано секцией УМС
Секция «Менеджмент»
Председатель
Одобрена на заседании кафедры
Управления человеческими ресурсами
Зав. кафедрой
С.Р. Филонович
«___» __________________ 2005 г.
А.Г. Эфендиев
«___» ____________________ 2005 г.
Утверждено УС факультета
менеджмента
Ученый секретарь
О.Н. Балаева
«___» __________________ 2005 г.
Москва, 2005
1
Тематический план учебной дисциплины
№
п/п
1.
2.
3.
3.
4.
5.
Наименование
разделов и тем
Всего
часов
Аудиторные часы
Самостоятельная работа
Итого
Методология
вторичного
анализа данных
Методы создания
новых
аналитических
переменных
17
Лекции
2
Сем. и
практ.занятия
2
19
2
4
13
Анализ данных с
помощью
описательной
статистики
и
таблиц
сопряженности
Методы проверки
выводных гипотез
на основе теста на
Хи – квадрат и
коэффициентов
симметричной и
ассиметричной
тесноты связи
Корреляционный
анализ
и
сравнение
средних значений
Многомерные
методы анализа
Зачет, реферат
19
2
4
13
17
2
2
13
17
2
2
13
19
2
4
13
108
12
18
78
13
Формы контроля:
Текущий контроль осуществляется в ходе семинарских занятий на основе
оценки активности студентов в ходе групповой и индивидуальной работы.
2
Промежуточный контроль осуществляется на основе выполнения реферата
Итоговый контроль: зачет.
Результирующая оценка итогового контроля складывается из оценки
выполнения реферата, работы на семинарских занятиях и оценки на зачете как
округленная средневзвешенная оценка с учетом следующих оценок относительной
важности:
Wреф.=0,3; Wсем.=0,2; Wзач.=0,5
Оср.(окр.)=Ореф.*W реф.(0,3)+Осем.*W реф.(0,2)+Озач.*W зач.(0,5)
Базовые учебники
1. Бююль А., Цефель П. SPSS: искусство обработки информации. Анализ
статистических данных и восстановление скрытых закономерностей. Москва,
Санкт-Петербург, Киев, 2002.
2. Наследов А.Д. SPSS. Компьютерный анализ данных в психологии и социальных
науках. СПб., 2005.
3. Пациорковский В.В., Петрова А.И., Пациорковская В.В. Использование SPSS в
социологии. Часть 1. Ввод и контроль данных. Часть 2. Анализ данных: общие
принципы, суммарные статистики и графики. Часть 3. Анализ данных: меры
сравнения, прогнозирование и моделирование. М.,2000- 2003.
4. Социальная информатика. Основания, методы, перспективы. Отв. ред. Лапин
Н.И. М., 2003.
5. Татарова Г.Г. Методология анализа данных. М., 1998.
6. Толстова Ю.Н. Анализ социологических данных. М., 2000.
7. Темницкий А.Л. Учебное исследование по эмпирической социологии. М., 2003.
Содержание программы
Тема 1. Методология вторичного анализа данных (2 ч.)
Первичные и вторичные социологические исследования. Вторичное
исследование и вторичный анализ данных. Цель и задачи вторичного исследования.
Архивы массивов данных социологических исследований. Массивы данных
социологических исследований организаций. Принципы и особенности работы с
массивами данных социологических исследований. Методологические образцы и
методические правила вторичного анализа социологической информации. Функции
вторичного исследования.
Особенности формулировки проблемы, вычленения объекта, определения цели и
задач, выдвижения гипотез при разработке вторичного исследования.
Порядок проведения вторичного анализа данных.
Знакомство с массивами данных, отобранных для вторичного анализа. Темы для
проведения вторичного анализа данных. Выбор тем.
Основная литература:
Социальная информатика. Основания, методы, перспективы. Отв. ред. Лапин Н.И.
М., 2003.
3
Темницкий А.Л. Учебное исследование по эмпирической социологии. М., 2003.
Дополнительная литература:
Горяинов В.П. Опыт проведения вторичного исследования по классификации
жизненных ценностей // Социология: 4М. 1996. №6.
Коржева Э.М. Некоторые методологические проблемы вторичного анализа
социологических данных // Государственное регулирование экономики и социальные
проблемы модернизации. Ч.2. М., 1997.
Сычева В.С. Метод вторичного анализа // Социологические исследования. 1995.
№11.
Погорецкий В.Г. Вторичный анализ: функциональное ядро архивов
социологической информации // Системные исследования. Методологические
проблемы. Ежегодник. Ч.2. М.,1998.
Тема 2. Методы создания новых аналитических переменных (2 ч.)
Принципы и методика перекодировки значений переменных. Особенности и
функции перекодировки значений в ту же переменную. Снижение размерности
значений переменных, измеренных по
порядковым и метрическим шкалам.
Назначение и особенности перекодировки значений в другую
переменную.
Использование диалогового окна Recode into Different Variables (Перекодировка в
другие переменные).
Метод логического квадрата при конструировании новых переменных. Создание
типологических переменных на основе ответов по двум и более различным
сопрягаемым вопросам. Построение новых переменных на основе метода суммарных
оценок значений переменных, измеренных по модифицированной шкале Лайкерта.
Использование диалогового окна Compute Variable (Вычислить переменную).
Ранговые переменные. Создание новых ранжированных переменных в
диалоговом окне Pank Cases (Ранжировать объекты).
Создание новых переменных с учетом поставленных задач вторичного
исследования (практическое задание).
Литература:
Бююль А., Цефель П. SPSS: искусство обработки информации. Анализ
статистических данных и восстановление скрытых закономерностей. Москва,
Санкт-Петербург, Киев, 2002.
Наследов А.Д. SPSS. Компьютерный анализ данных в психологии и социальных
науках. СПб., 2005.
Темницкий А.Л. Учебное исследование по эмпирической социологии. М., 2003.
Тема 3. Анализ данных с помощью описательной статистики и таблиц
сопряженности (2ч.)
Одномерные частотные распределения, их основные модели. Получение
одномерных распределений по альтернативным вопросам анкеты. Использование
диалогового окна Freguencies (Частоты). Меры центральной тенденции: среднее
4
значение, медиана, мода их использование при анализе данных. Основные
характеристики диапазона распределения: минимум, максимум, размах, сумма. Меры
изменчивости: дисперсия и стандартное отклонение. Получение одномерных
распределений по вопросам анкеты с множественным выбором. Использование
диалогового окна Multiple response (Множественные ответы).
Таблица сопряженности, ее свойства и назначение. Использование диалогового
окна Crosstabs (Таблица сопряженности). Поле строки (Rows) и поле колонки
(Columns). Дополнительные диалоговые окна процедуры Crosstabs: Проценты (Сells) и
Статистики (Statistics). Описание и интерпретация данных таблиц сопряженности.
Основные виды относительных частот. Выявление существенности процентных
различий сопрягаемых переменных.
Литература
Бююль А., Цефель П. SPSS: искусство обработки информации. Анализ
статистических данных и восстановление скрытых закономерностей. Москва,
Санкт-Петербург, Киев, 2002.
Наследов А.Д. SPSS. Компьютерный анализ данных в психологии и социальных
науках. СПб., 2005.
Татарова Г.Г. Методология анализа данных. М., 1998.
Толстова Ю.Н. Анализ социологических данных. М., 2000.
Темницкий А.Л. Учебное исследование по эмпирической социологии. М., 2003.
Тема 4. Методы проверки выводных гипотез на основе теста на Хи –
квадрат и коэффициентов симметричной и ассиметричной тесноты и
направленности связи (2ч.)
Анализ взаимосвязи переменных на основе метода нормированных остатков.
Понятия ожидаемых и наблюдаемых частот. Использование диалогового окна Crosstabs
(Таблица сопряженности) для рассмотрения метода нормированных остатков.
Проверка нулевой гипотезы с помощью критерия Хи- квадрат. Определение
степеней свободы таблицы. Асимптотическая значимость и допускаемая вероятность
ошибки (р- значимость).
Анализ взаимосвязи двух переменных с помощью
контрольного признака. Построение трехмерных таблиц сопряженности. Анализ
тесноты связи двух признаков с помощью коэффициента Крамера и направленности
связи с помощью коэффициента Гудмена - Краскала.
Проверка выводных гипотез вторичного исследования на основе теста на Хиквадрат и коэффициентов тесноты связи. Выявление устойчивости связи с помощью
введения контрольных переменных (практическое задание).
Литература
Бююль А., Цефель П. SPSS: искусство обработки информации. Анализ
статистических данных и восстановление скрытых закономерностей. Москва,
Санкт-Петербург, Киев, 2002.
Наследов А.Д. SPSS. Компьютерный анализ данных в психологии и социальных
науках. СПб., 2005.
5
Пациорковский В.В., Петрова А.И., Пациорковская В.В. Использование SPSS в
социологии. Часть 2. Анализ данных: общие принципы, суммарные статистики и
графики. М.,2000.
Темницкий А.Л. Учебное исследование по эмпирической социологии. М., 2003.
Татарова Г.Г. Методология анализа данных. М., 1998.
Толстова Ю.Н. Анализ социологических данных. М., 2000.
Тема 5. Корреляционный анализ и сравнение средних значений (2 ч.)
Понятие корреляции. Корреляции: функциональные и вероятностные,
положительные и отрицательные, сильные и слабые, линейные, криволинейные и
ранговые. Использование диалогового окна Bivariate Correlations (Двумерные
корреляции) для вычисления парных корреляций.
Корреляционная матрица и ее
структура.
Метод сравнения средних значений, его назначение и процедура использования.
Процедура Compare Means (Сравнение средних). Применение t- критерия для
выявления уровня значимости различий между двумя средними. Применение
t- критерия для одной и двух выборок.
Использование методов корреляционного анализа и сравнение средних во
вторичном исследовании (практическое задание)
Литература
Бююль А., Цефель П. SPSS: искусство обработки информации. Анализ
статистических данных и восстановление скрытых закономерностей. Москва,
Санкт-Петербург, Киев, 2002.
Наследов А.Д. SPSS. Компьютерный анализ данных в психологии и социальных
науках. СПб., 2005.
Тема 5. Многомерные методы анализа (2ч.)
Понятие «многомерный метод анализа», его основные виды: факторный,
кластерный и дискриминатный анализ.
Факторный анализ. Понятие «направленная переменная ». Основные этапы
факторного анализа: 1) получение матрицы корреляций, 2) извлечение факторов, 3)
вращение извлеченных факторов, 4) вычисление значений коэффициентов для каждого
фактора, его интерпретация и сохранение как отдельной переменной. Критерии
результативности факторного анализа. Основные требования к выполнению
факторного анализа.
Использование
диалогового
окна
Factor
Analysis
(Факторный анализ).
Кластерный анализ, его назначение и основные методы.
Результаты
корреляционного и факторного анализа как предпосылки кластерного анализа. Метод
иерархической кластеризации. Использование диалогового окна Hierarchical Cluster
Analysis (Иерархический кластерный анализ).
Дискриминантный анализ как прогностическая модель. Сходство и различия
между дискриминатным и кластерным методами анализа данных. Задачи
дискриминантного анализа. Критерии определения точности предсказания. Понятие
«предикторная переменная». Основания выбора переменных в качестве предиктора.
Этапы дискриминатного анализа: 1) выбор переменных – предикторов, 2) выбор
6
параметров, 3)
интерпретация результатов. Использование диалогового окна
Diskriminant Analysies (Дискриминантный анализ).
Использование методов многомерного анализа данных во вторичном
исследовании (практическое задание)
Литература
Бююль А., Цефель П. SPSS: искусство обработки информации. Анализ
статистических данных и восстановление скрытых закономерностей. Москва,
Санкт-Петербург, Киев, 2002.
Наследов А.Д. SPSS. Компьютерный анализ данных в психологии и социальных
науках. СПб., 2005.
Бессокирная Г.П. Факторный анализ: традиции использования и новые
возможности // Социология 4М. 2000.№12.
Тематика реферата:
Разработка программы вторичного исследования
Проведение вторичного исследования по одной из тем, предложенных
преподавателем.
Требования к написанию реферата:
Домашнее задание выполняется в форме аналитической справки по результатам
вторичного исследования. Примерные объем справки - 10 страниц машинописного
текста. Основные разделы справки: 1) методологическая часть, 2) аналитическая часть,
3) практические рекомендации.
Темы для вторичного анализа
по массиву “Наемные работники частных предприятий -2002”*
Темы
1. Удовлетворенность трудом и жизнью
Символические
имена основных
переменных по теме
B3.1-9, F1, H9
2. Трудовые взаимоотношения с руководителями и
удовлетворенность трудом
3. Условия труда и повышение квалификации
С1, С3, С4, С5, В3.19, F1
B1,B2,B4, D5,D6
4. Соответствие выполняемой работы образованию и
отношение к труду
5. Представления об идеальном руководителе и
удовлетворенность условиями труда
6. Удовлетворенность трудом и свободным временем
7. Оплата труда и отношение к труду
B2, D1-D10
8. Страх потери работы и удовлетворенность трудом
9. Справедливость в оплате труда и удовлетворенность
А7.3, F4.3, В3.1-9, F1
Е3-Е5, В3,F1
С2, В3, F1
В3.1-9, G1, G3, F1
Е1 -Е7, D1-D10
7
трудом
10. Отношение к труду в зависимости от возраста
D1-D10, L2
11. Отношения с руководством на предприятиях разного C1-C5, C8.1C8.2, P
типа
12. Образование как фактор отношения к труду
L3, D1-D10
13. Удовлетворенность заработной платой и
материальным положением
14. Удовлетворенность работой и жизнью
В3.4, Н1, Н2
15. Доверие в трудовых взаимоотношениях и в
повседневной жизни
16. Конкуренция и личная ответственность в работе как
факторы трудового поведения
17. Традиции и инновации в отношении к труду
молодежи
18. Соотношение традиционных и либеральных
ценностей в представлениях об идеальном месте работы
19.Мотивы труда и увольнения
С1, G5
20. Мотивы выбора предприятия и отношение к труду
21. Социальная политика предприятия и отношение к
труду
22. Вторичная занятость и отношение к труду
А5, D1-D10
С9, D1-D10
23. Отношение к трудовым нормам и взаимоотношения
с руководителями
24. Патерналистские и партнерские ориентации в
отношениях с руководством
25. Коллективистские и индивидуалистические
ориентации в труде
26.Ценности труда и свободного времени
F1, G1, H9
С6.8, D10.1, F4.4
L2, C6.1-11, D1, F4.110
F4.1-10
А7,F4, F2, F3
Н4-Н8, D1-D10
F2, E1, E7
С6, С7, С1-С5
С1, С3, С4, С5, С8
D1, D9, D10, F4.6-7,
C6.7-11
A7,G1.6G1.7G3
27. Удовлетворенность условиями быта и отношение к
труду
28. Семейное положение как фактор отношения к труду
29. Характеристики домохозяйства и их влияние на
трудовое поведение
30.Доходы семьи и интенсивность труда
G1.1-5,G2, D1-D10
31. Чувство усталости после работы и его влияние на
трудовое поведение
32. Круговая порука и личная безответственность в
работе как факторы трудового поведения
33. Справедливость в оплате труда и отношение к труду
34.Факторы повышения интенсивности труда
B4, D3,D5,D9,H4
L7, D1-D10
L5-L9,H3,H1,E7,
D3,D5,D9,H4
H1,H2, D3
С611, D1.3,F4.4
Е3-Е5, D1-D10
Е6 и блоки B,C,D,I
8
*Примечание.
Дается
предварительная
формулировка
темы.
Возможно
самостоятельная формулировка тема. Темы по массиву наемных работников могут
быть уточнены, переформулированы с учетом данных по массиву руководителей
московских предприятий, который также будет использоваться в данном курсе.
Приложение. Форма и структура аналитической справки
по результатам вторичного анализа данных
Государственный университет – Высшая школа экономики
Факультет менеджмента
Кафедра управления
человеческими ресурсами
Аналитическая справка по курсу «Методы анализа данных»» по результатам
вторичного социологического исследования
на тему:
Магистра _____ курса
Факультета ____________________
9
Москва –2005
Структура аналитической справки
по результатам социологического исследования
на основе вторичного анализа данных
1 Методологическая часть
1. Актуальность темы
2. Объект исследования
3. Предмет исследования
4. Ключевые понятия
5. Цель исследования
6. Исходная гипотеза
7. Следствия из исходной гипотезы (не менее 5)
8. Задачи исследования
2. Аналитическая часть
1. Характеристика используемых переменных
2. Описание задач и процедуры перекодировки данных (сжатие информации). (Какие
переменные и почему
были перекодированы? Вставить таблицы одномерных
распределений с перекодированными переменными).
3. Создание переменных, вычисляемых на основе ответов на различные вопросы
анкеты по методу логического квадрата - типологические переменные
(вставить таблицы одномерных распределений с типологическими переменными).
4. Построение таблиц сопряженности (двумерных, а при необходимости и
трехмерных) для проверки гипотез
4а. Анализ таблиц сопряженности, подтверждение, опровержение выдвинутых гипотез
(Выявления значимых связей по таблицам сопряженности проводится на основе
процентных распределений, теста на ХИ - квадрат, коэффициента тесноты связи
10
Крамера). (Каждой
сопряженности).
гипотезе
–
следствию
соответствует своя
таблица
5. Построение корреляционных матриц с используемыми переменными. Выявление
наиболее сильных связей (положительных и отрицательных) с помощью
коэффициентов корреляции.
6. Снижение размерности данных на основе факторного анализа. Проверка гипотез на
основе новых переменных, полученных в результате факторного анализа. Построение
новых таблиц сопряженности.
7. Выявление основных кластеров. Получение новых распределений данных с
выявленными кластерами. Подтверждение (опровержение) ране выдвинутых гипотез
на основе кластерного анализа.
8. Выявление предикторов на основе дискриминантного анализа. Построение таблиц,
отражающих иерархию выявленных предикторов. Уточнение обоснованности ранее
сделанных выводов по проверке гипотез с учетом результатов дискриминантного
анализа.
3. Выводы по исследованию и практические рекомендации
Какое количество следствий из исходной гипотезы подтвердилось? Можно ли на этом
основании утверждать, что и исходная гипотеза подтвердилась? Достигнута ли цель
исследования? Какие новые гипотезы можно было бы выдвинуть с учетом проверки
гипотезы и поставленной цели исследования?
Что можно было бы предложить с учетом выполненного вторичного анализа
администрации, менеджменту предприятий для улучшения трудовых отношений и
отношения к труду персонала, повышения его трудовой мотивации и
удовлетворенности трудом?
4.Приложение
1. Список использованной литературы
2. Дополнительные таблицы.
Автор программы
А.Л. Темницкий
11
Download