УМК_УЗ-500_Стат_анализ_соц_данных_Одинцов А.В

advertisement
ФГБОУ ВПО «Российская академия народного хозяйства и государственной
службы при Президенте Российской Федерации»
Волгоградский филиал
Кафедра социологии управления
Одинцов А.В., кандидат социологических наук,
Статистический анализ социологических данных
Рабочая программа для студентов направления подготовки
080504.65 ГМУ
Рассмотрено и утверждено на заседании
кафедры
Протокол № ……..от «…..»
.........................201_ г.
Подпись заведующего кафедрой
………………………………..
Волгоград 2011
Содержание
РАЗДЕЛ 1. РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ ................................... 3
1.1. ТРЕБОВАНИЯ ГОСУДАРСТВЕННОГО ОБРАЗОВАТЕЛЬНОГО СТАНДАРТА ПО УЧЕБНОЙ ДИСЦИПЛИНЕ
«СТАТИСТИЧЕСКИЙ АНАЛИЗ СОЦИОЛОГИЧЕСКИХ ДАННЫХ»..................................................................... 3
1.2. ЦЕЛИ И ЗАДАЧИ УЧЕБНОЙ ДИСЦИПЛИНЫ .............................................................................................. 3
1.3. ТРЕБОВАНИЯ К УРОВНЮ ОСВОЕНИЯ ДИСЦИПЛИНЫ .............................................................................. 3
1.4. ТЕМАТИЧЕСКИЙ ПЛАН КУРСА.................................................................................................... 4
1.5. УЧЕБНО-МЕТОДИЧЕСКОЕ ОБЕСПЕЧЕНИЕ УЧЕБНОЙ ДИСЦИПЛИНЫ ......................... 4
РАЗДЕЛ 2. МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО ИЗУЧЕНИЮ УЧЕБНОЙ
ДИСЦИПЛИНЫ ДЛЯ СТУДЕНТОВ ........................................................................................ 14
2.1. РЕКОМЕНДАЦИИ ПО ИСПОЛЬЗОВАНИЮ МАТЕРИАЛОВ УЧЕБНО-МЕТОДИЧЕСКОГО КОМПЛЕКСА..... 14
2.2. ПОЖЕЛАНИЯ К ИЗУЧЕНИЮ ОТДЕЛЬНЫХ ТЕМ КУРСА ........................................................................... 14
2.3. РЕКОМЕНДАЦИИ ПО РАБОТЕ С ЛИТЕРАТУРОЙ...................................................................................... 14
2.4. РАЗЪЯСНЕНИЯ ПО ПОВОДУ РАБОТЫ С ТЕСТОВОЙ СИСТЕМОЙ КУРСА И ПРАКТИЧЕСКИМИ
ЗАДАЧАМИ ..................................................................................................................................................... 14
2.5. СОВЕТЫ ПО ПОДГОТОВКЕ К ЗАЧЕТУ ..................................................................................................... 15
РАЗДЕЛ 3. МАТЕРИАЛЫ ТЕСТОВОЙ СИСТЕМЫ ИЛИ ПРАКТИКУМ ПО
РЕШЕНИЮ ЗАДАЧ ПО ТЕМАМ ЛЕКЦИЙ ........................................................................... 15
РАЗДЕЛ 4. СЛОВАРЬ ОСНОВНЫХ ТЕРМИНОВ (ГЛОССАРИЙ) ................................... 25
РАЗДЕЛ 5. МЕТОДИЧЕСКИЕ УКАЗАНИЯ ДЛЯ ВЫПОЛНЕНИЯ КОНТРОЛЬНЫХ,
КУРСОВЫХ И ВЫПУСКНЫХ КВАЛИФИКАЦИОННЫХ РАБОТ ................................. 32
РАЗДЕЛ 6. ДАННЫЕ О МУЛЬТИМЕДИЙНЫХ ЛЕКЦИЯХ .............................................. 32
2
РАЗДЕЛ 1. РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ
1.1. Требования государственного образовательного стандарта по учебной дисциплине
«Статистический анализ социологических данных»
«Статистический анализ социологических данных» является дисциплиной по выбору,
требований стандарта нет.
1.2. Цели и задачи учебной дисциплины
Основная цель курса «Статистический анализ социологических данных» – изучение
основных методов анализа экспериментальных данных социологического исследования с
помощью программы SPSS.
Задачами курса «Статистический анализ социологических данных» являются:

освоение теоретических сведений по применению программы SPSS для анализа
данных;

получение практических навыков работы по обработке анкетных данных на
компьютере с помощью программы SPSS.
Изучение дисциплины «Статистический анализ социологических данных» базируется
на
знаниях,
полученных
при
изучении
математики,
математической
статистики,
информатики, и обеспечивает успешное освоение специальных дисциплин, которые
предусмотрены учебными планами специальности «ГМУ».
Полученные
навыки
могут
использоваться
для
обработки
различных
экспериментальных данных при подготовке контрольных и курсовых работ по изучаемым
дисциплинам и выпускных квалификационных работ.
1.3. Требования к уровню освоения дисциплины
В результате изучения предмета «Статистический анализ социологических данных»
студент должен знать:

основные категории и понятия дисциплины;

методологию
и
методы
статистического
анализа
данных
социологического
исследования.
Студент, прошедший курс обучения, должен уметь реализовать различные виды
математико-статистического анализа в SPSS, делать выводы на основе результатов анализа.
Студент должен приобрести навыки:

определения структуры файла данных;

ввода данных анкетирования в компьютер;

задания метода обработки данных в соответствии с задачами исследования;

оформления результатов анализа в виде таблиц и диаграмм;
3

интерпретации результатов обработки данных социологического исследования.
1.4. ТЕМАТИЧЕСКИЙ ПЛАН КУРСА
«Статистический анализ социологических данных» (12 ч) для студентов УЗ-500
№
Наименование тем
п/п
1
Заочное
Лекции
Семинары
(ч)
(ч)
2
1
-
1
-
2
-
2
Факторный анализ. Кластерный анализ.
2
2
ИТОГО
4
8
Общий обзор SPSS. Создание и редактирование файлов данных.
Управление данными. Диаграммы Частоты. Описательные
статистики. Таблицы сопряженности и критерий 2
2
Средние значения. Сравнение двух средних, t–критерий
Стьюдента
3
Корреляционно-регрессионный анализ. Множественный
регрессионный анализ.
4
Однофакторный дисперсионный анализ. Многофакторный
дисперсионный анализ.
5
Форма контроля
Зачет
1.5. УЧЕБНО-МЕТОДИЧЕСКОЕ ОБЕСПЕЧЕНИЕ УЧЕБНОЙ ДИСЦИПЛИНЫ
Лекции
Лекция 1. Общий обзор SPSS. Создание и редактирование файлов данных.
Управление данными. Диаграммы. Частоты. Описательные статистики. Таблицы
сопряженности и критерий 2.
Запуск программы. Окна программы: главное окно, диалоговое окно открытия файла,
диалоговое окно процедуры обработки. Окно вывода. Печать результатов.
Структура файла данных. Имя переменной. Тип переменной. Дробная часть числа.
Ширина переменной. Метки переменных. Метки значений переменных. Пропуски. Столбцы.
Выравнивание. Шкала измерений. Ввод данных. Редактирование данных: изменение
содержимого ячейки, вставка нового объекта, вставка новой переменной, копирование и
вырезание содержимого ячеек, вставка ячеек, поиск данных.
Знакомство с возможностями управления данными. Получение сводки по данным.
Обработка пропущенных значений. Преобразование данных: вычисления, ранжирование.
Перекодировка в новую переменную. Перекодировка существующей переменной. Выбор
4
объектов для анализа. Сортировка объектов. Объединение данных разных файлов:
добавление объектов, добавление переменных. Печать результатов и выход из программы.
Таблицы сопряженности. Критерий 2. Пошаговый алгоритм вычислений. Печать
результатов и выход из программы. Представление результатов.
Основные понятия и категории: файл данных, переменные, тип переменной,
управление данными, таблица сопряженности, наблюдаемые частоты, ожидаемые
частоты.
Лекция 2. Факторный анализ. Кластерный анализ.
Вычисление корреляционной матрицы. Извлечение факторов. Выбор и вращение
факторов. Интерпретация факторов. Пошаговые алгоритмы вычислений. Печать результатов
и выход из программы. Представление результатов. Терминология, используемая при
выводе.
Сравнение кластерного и факторного анализов. Этапы кластерного анализа.
Пошаговые алгоритмы вычислений. Печать результатов и выход из программы.
Представление результатов.
Основные понятия: корреляционная матрица, фактор, извлечение факторов,
вращение факторов, кластер, кластерный анализ, расстояние между объектами.
Семинарские занятия
Семинар 1. Создание и редактирование файлов данных. Управление данными.
Диаграммы. Частоты. Описательные статистики. Таблицы сопряженности и критерий
2 .
Структура файла данных. Имя переменной. Тип переменной. Дробная часть числа.
Ширина переменной. Метки переменных. Метки значений переменных. Пропуски. Столбцы.
Выравнивание. Шкала измерений. Ввод данных. Редактирование данных: изменение
содержимого ячейки, вставка нового объекта, вставка новой переменной, копирование и
вырезание содержимого ячеек, вставка ячеек, поиск данных.
Знакомство с возможностями управления данными. Получение сводки по данным.
Обработка пропущенных значений. Преобразование данных: вычисления, ранжирование.
Перекодировка в новую переменную. Перекодировка существующей переменной. Выбор
объектов для анализа. Сортировка объектов. Объединение данных разных файлов:
добавление объектов, добавление переменных.
Графика в программе SPSS. Диалоговые окна команд построения графиков.
Редактирование графиков и диаграмм: процедура редактирования, команды редактирования.
Пошаговые алгоритмы вычислений. Частоты, столбиковые диаграммы, гистограммы,
5
описательные статистики и процентили. Представление результатов.
Меры центральной тенденции. Меры изменчивости. Характеристики диапазона
распределения. Характеристики формы распределения. Стандартная ошибка. Пошаговый
алгоритм вычислений. Представление результатов.
Таблицы сопряженности. Критерий 2. Пошаговый алгоритм вычислений. Печать
результатов
и
выход
из
программы.
Представление
результатов.
Терминология,
используемая при выводе.
Литература:
1. Бююль А. SPSS: искусство обработки информации. Анализ статистических данных
и восстановление скрытых закономерностей. Под ред. В. Е. Момота. 2002.
2. Наследов А.Д. SPSS: Компьютерный анализ данных в психологии и социальных
науках. – СПб.: Питер, 2007.
Семинар 2.
Корреляционно-регрессионный
анализ.
Множественный
регрессионный анализ.
Понятие корреляции. Линейная и криволинейная корреляция; ранговые корреляции;
значимость; частная корреляция. Пошаговые алгоритмы вычислений. Представление
результатов.
Простая линейная регрессия. Оценка криволинейности. Пошаговые алгоритмы
вычислений (простой регрессионный анализ, анализ криволинейных зависимостей).
Представление результатов.
Уравнение множественной регрессии. Коэффициенты регрессии. Коэффициент
детерминации и пошаговые методы. Условия получения приемлемых результатов анализа.
Пошаговые алгоритмы вычислений. Представление результатов.
Литература:
1. Бююль А. SPSS: искусство обработки информации. Анализ статистических данных
и восстановление скрытых закономерностей. Под ред. В. Е. Момота. 2002.
2. Наследов А.Д. SPSS: Компьютерный анализ данных в психологии и социальных
науках. – СПб.: Питер, 2007.
Семинар 3.
Однофакторный
дисперсионный
анализ.
Многофакторный
дисперсионный анализ.
Пошаговые алгоритмы вычислений (однофакторный дисперсионный анализ, парные
сравнения, контрасты). Представление результатов.
Дисперсионный анализ с двумя факторами. Дисперсионный анализ с тремя и более
факторами. Влияние ковариат. Пошаговые алгоритмы вычислений (двухфакторный
дисперсионный
анализ,
влияние
ковариаты,
6
графические
средства
интерпретации
взаимодействий). Представление результатов.
Литература:
1. Бююль А. SPSS: искусство обработки информации. Анализ статистических данных
и восстановление скрытых закономерностей. Под ред. В. Е. Момота. 2002.
2. Наследов А.Д. SPSS: Компьютерный анализ данных в психологии и социальных
науках. – СПб.: Питер, 2007.
Семинар 4. Факторный анализ. Кластерный анализ.
Вычисление корреляционной матрицы. Извлечение факторов. Выбор и вращение
факторов. Интерпретация факторов. Пошаговые алгоритмы вычислений. Печать результатов
и выход из программы. Представление результатов. Терминология, используемая при
выводе.
Сравнение кластерного и факторного анализов. Этапы кластерного анализа.
Пошаговые алгоритмы вычислений. Печать результатов и выход из программы.
Представление результатов.
Литература:
1. Бююль А. SPSS: искусство обработки информации. Анализ статистических данных
и восстановление скрытых закономерностей. Под ред. В. Е. Момота. 2002.
2. Наследов А.Д. SPSS: Компьютерный анализ данных в психологии и социальных
науках. – СПб.: Питер, 2007.
Организация самостоятельной работы студентов (СРС)
№
п/п
Тема
1
Анализ надежности
2
Дискриминантный
анализ
СК
Форма
контроля
СРС
Б, ОБС
Учебнометодическое
обеспечение
ОЛ 1, 2
СК
Б, ОБС
ОЛ 1, 2
Вопросы, выносимые на Содержание
СРС
СРС
1. Назначение анализа
надежности.
2. Показатели
надежности:
коэффициент ,
надежность
половинного
расщепления.
3. Обработка данных на
компьютере. Основные
результаты.
1. Назначение
дискриминантного
анализа.
2. Математикостатистические идеи
метода.
3. Исходные данные
для дискриминантного
7
3
Все темы
дисциплины,
рассматриваемые
на семинарах
анализа.
4. Основные
результаты
дискриминантного
анализа.
5. Обработка данных на
компьютере.
В соответствии с
планами семинаров
СМ, УМ,
ПКР
ОБС, КО
ОЛ 1-3,
ДЛ 1-3
Обозначения:
СМ – подготовка к семинарскому занятию;
УМ – изучение учебного материала;
СК – изучение учебного материала и составление конспекта;
ПКР – подготовка к контрольной работе;
Б – беседа индивидуальная или с группой;
КР – контрольная работа;
КО – контрольный опрос;
ОБС – обсуждение на занятиях результатов;
ОЛ – основная литература, ДЛ – дополнительная литература.
Вопросы к зачету
1. Запуск программы SPSS. Общий вид программы. Основное окно SPSS. Строка
меню, панель инструментов, строка ввода данных. Окно вывода.
2. Создание нового файла данных. Создание переменной. Имя переменной. Тип
переменной. Дробная часть числа. Ширина переменной. Метки переменных. Метки значений
переменных. Пропуски. Столбцы. Выравнивание. Шкала измерений. Ввод данных.
Сохранение данных.
3. Редактирование данных: изменение содержимого ячейки, вставка нового объекта,
вставка новой переменной, копирование и вырезание содержимого ячеек, вставка ячеек,
поиск данных.
4. Импорт данных в SPSS. Импорт таблиц из MS Excel. Объединение данных разных
файлов: добавление объектов, добавление переменных.
5. Возможности управления данными: получение сводки по данным, преобразование
данных (вычисления, ранжирование), перекодировка в новую переменную, перекодировка
существующей переменной, выбор объектов для анализа, сортировка объектов.
6. Виды диаграмм. Построение диаграмм, редактирование диаграмм.
7. Анализ данных в SPSS. Статистические возможности программы SPSS.
8. Описательные статистики. Частоты, процентные оценки, меры центральной
тенденции, меры изменчивости, особенности распределения.
9. Последовательность построения таблиц сопряженности.
8
10. Корреляционный анализ. Понятие корреляции. Линейная и криволинейная
корреляция, ранговая корреляция, частная корреляция.
11. Параметрические критерии достоверности различий. Сравнение средних, t –
критерий Стьюдента.
12. Однофакторный дисперсионный анализ, парные сравнения, контрасты.
13. Многофакторный дисперсионный анализ. Двухфакторный дисперсионный анализ.
Дисперсионный анализ с тремя и более факторами. Влияние ковариат.
14. Многомерный дисперсионный анализ.
15. Дисперсионный анализ с повторными измерениями.
16. Регрессионный анализ. Простая линейная регрессия. Анализ криволинейных
зависимостей.
17. Множественный регрессионный анализ. Уравнение множественной регрессии.
Коэффициенты регрессии. Коэффициент детерминации и пошаговые методы.
18. Анализ надежности. Коэффициент . Надежность половинного расщепления.
19. Факторный анализ. Вычисление корреляционной матрицы. Извлечение факторов.
Выбор и вращение факторов. Интерпретация факторов.
20. Кластерный анализ. Назначение кластерного анализа. Сравнение кластерного и
факторного анализов. Этапы кластерного анализа.
21. Дискриминантный анализ. Назначение. Исходные данные и основные результаты.
Этапы дискриминантного анализа.
Список рекомендуемой литературы
Основная литература:
1. Бююль А. SPSS: искусство обработки информации. Анализ статистических данных
и восстановление скрытых закономерностей. Под ред. В. Е. Момота. 2002.
2. Наследов А.Д. SPSS: Компьютерный анализ данных в психологии и социальных
науках. – СПб.: Питер, 2007.
3. Шуметов В.Г. Кластерный анализ в региональном управлении. Орл. регион. акад.
гос. службы (ОРАГС). 2001.
Дополнительная литература:
1. Агабекян Р. Л., Кириченко М. М., Усатиков С. В. Математические методы в
социологии. – Ростов н/Д: Феникс, 2005.
2. Гуц А.К., Фролова Ю.В. Математические методы в социологии: Синергетика: от
прошлого к будущему. – М.: URSS, 2010.
3. Кремер Н.Ш. Теория вероятностей и математическая статистика. – 2007.
Материалы текущего, промежуточного и итогового контроля
9
Итоговый тест по дисциплине
1. Что из перечисленного является именем переменной в SPSS:
а) уровень_тревожности
б) ур_трев.
в) тревожность
г) ур_трев
2. Выберите файл данных, созданный в SPSS:
а) анкета.sav
б) анкета.spo
в) анкета.xls
г) анкета.doc
3. Команды меню Transform (Преобразование) используются для:
а) открытия и сохранения файлов
б) для редактирования данных (копирования, вставки, замены и т.д.)
в) для модифицирования введенных и создания новых данных на основе существующих
г) изменения представления информации на экране
4. Вкладка Variable View редактора данных SPSS предназначена для:
а) создания структуры файла данных
б) редактирования данных
в) ввода значений в создаваемый файл данных
г) создания диаграмм
5. Для задания комментария к имени переменной используется параметр:
а) Name
б) Label
в) Type
г) Values
10
6. Переменная «Хобби» имеет три уровня: 1–спорт, 2–компьютер, 3–искусство. Какой
параметр позволяет управлять наименованиями уровней (категорий) этой переменной:
а) Label
б) Name
в) Type
г) Values
7. Для количественных типов данных, допускающих арифметические операции, выбирается
шкала:
а) для данного типа данных нет соответствующей шкалы
б) Scale (Метрическая)
в) Ordinal (Порядковая)
г) Nominal (Номинативная)
8. К описательным статистикам не относятся:
а) Среднее значение, мода, медиана
б) Дисперсия, стандартное отклонение
в) Столбиковые диаграммы, гистограммы
г) Минимум, максимум, размах
9. На четырех разных выборках проверялась гипотеза о связи креативности и тревожности.
При расчете в SPSS корреляций Пирсона были получены следующие результаты для каждой
выборки. В каком случае обнаружена статистически значимая связь между креативностью и
тревожностью:
а) r = 0,270; p = 0,11
б) r = 0,411; p = 0,04
в) r = 0,285; p = 0,08
г) r = 0,310; p = 0,09
10. Вариант t-критерия – Independent-Samples T Test (t-критерий для независимых выборок) –
позволит сравнить:
а) степень удовлетворенности жизнью холостяков и женатых
б) результаты первого и последнего экзаменов группы студентов
в) значения уровня тревожности до и после тренинга
г) время, показанное бегунами во время соревнования, с нормативной величиной
11. На рисунке представлены результаты однофакторного дисперсионного анализа. Какой
показатель позволит сделать вывод о статистической значимости различий:
Sum of Squares
df Mean Square
11
F
Sig.
Between Groups
82,969
2
Within Groups
613,781
97 6,328
Total
696,750
99
какого
анализа
а) F
б) df
в) Sig.
г) Mean Square
12.
С
помощью
41,484
было
6,556 ,002
получено
уравнение
y  5,3147  1,0328 x1  1,1676 x2  1,2569 x3 , связывающее переменную y с x1, x2 и x3:
а) корреляционный анализ
б) дисперсионный анализ
в) регрессионный анализ
г) факторный анализ
13. Результаты анализа данных в SPSS:
а) отображаются в специальном окне вывода
б) отображаются в окне редактора данных на вкладке Data View
в) отображаются в окне редактора синтаксиса
г) отображаются в окне редактора данных на вкладке Variable View
14. Окно редактора данных представляет собой электронную таблицу, в которой:
а) столбцы отражают переменные, строки – объекты
б) столбцы отражают переменные, строки – переменные
в) столбцы отражают объекты, строки – объекты
г) столбцы отражают объекты, строки – переменные
15. Наглядное представление о связи двух переменных дает:
а) круговая диаграмма
б) Парето-диаграмма
в) гистограмма
г) диаграмма рассеивания
16. После выполнения какой команды создается специальная переменная filter_$ (см. рисунок):
12
а) Data (Данные)–Sort Cases (Сортировка объектов)
б) Data (Данные)–Select Cases (Выбор объектов)
в) Data (Данные)–Merge Files (Слияние файлов)
г) Data (Данные)–Insert Case (Вставка объекта)
17. В диалоговых окнах всех процедур обработки в SPSS кнопкой, возвращающей параметры
к значениям по умолчанию, является:
а) Cancel
б) Reset
в) Paste
г) Help
18. Какой параметр позволяет задать максимальное количество знаков, которое может иметь
значение переменной, включая дробную часть:
а) Decimal (Дробная часть)
б) Columns (Столбцы)
в) Width (Ширина)
г) Values (Значения)
19. Группирующей переменной не является:
а) пол
б) увлечение
в) вуз
г) оценка
20. Метод, который используется при обработке больших массивов экспериментальных
данных с целью сокращения числа переменных и определения структуры взаимосвязей
между переменными:
а) метод контрастов
б) дисперсионный анализ
13
в) факторный анализ
г) дискриминантный анализ
РАЗДЕЛ 2. МЕТОДИЧЕСКИЕ РЕКОМЕНДАЦИИ ПО ИЗУЧЕНИЮ УЧЕБНОЙ
ДИСЦИПЛИНЫ ДЛЯ СТУДЕНТОВ
2.1. Рекомендации по использованию материалов учебно-методического комплекса
Учебно-методический
«Государственное
муниципального
и
комплекс
муниципальное
управления.
предназначен
управление»
Исследование
в
для
студентов
факультета
социологии
специальности
государственно-
предполагает
получение
результатов – обычно в виде чисел. Социологу необходимо умение организовать их,
обработать и проинтерпретировать, что невозможно без применения статистических методов
и современных компьютерных программ.
Учебно-методический комплекс может использоваться как ориентир, с помощью
которого можно самостоятельно освоить компьютерную технологию обработки данных.
Учебно-методический комплекс принесет максимальную пользу, если при работе с ним
придерживаться следующей последовательности действий:

ознакомьтесь с тематическим планом, рубриками «Лекции» и «Семинары», чтобы
составить общее представление о тематике предстоящей работы;

изучите материал
по
учебникам,
указанным в списке рекомендованной
литературы;

выполните практические работы для закрепления полученных знаний, для
контроля – итоговый тест.
2.2. Пожелания к изучению отдельных тем курса
При изучении тем «Факторный анализ», «Кластерный анализ», «Дискриминантный
анализ» особое внимание следует обратить на назначение и математико-статистические
идеи, сходство и различие этих методов, пошаговые алгоритмы компьютерной обработки,
представление и интерпретацию результатов, терминологию, используемую при выводе.
2.3. Рекомендации по работе с литературой
При изучении курса учебной дисциплины особое внимание следует обратить на
следующие литературные источники, в которых раскрывается назначение математикостатистических методов:
– Кремер Н.Ш. Теория вероятностей и математическая статистика. – 2007.
К основным (базовым) литературным источникам, описывающим пошаговые
инструкции анализа данных социологических исследований в программе SPSS, относится:
– Бююль А. SPSS: искусство обработки информации. Анализ статистических данных
14
и восстановление скрытых закономерностей. Под ред. В. Е. Момота. 2002.
– Наследов А.Д. SPSS: Компьютерный анализ данных в психологии и социальных
науках. – СПб.: Питер, 2007.
2.4. Разъяснения по поводу работы с тестовой системой курса и практическими
задачами
В разделе 1 настоящего комплекса приведен итоговый тест. Главная задача
тестирования – оценить уровень знаний студентов. Тестовые задания даны в закрытой
форме, т.е. каждый вопрос содержит несколько готовых вариантов ответов, из которых
правильным является только один.
Практикум состоит из работ, каждая работа посвящена изучению новых команд
программы SPSS в процессе выполнения заданий. В работе можно выделить логические
части: «задание», где описывается условие задания; «технология работы», где показывается,
как выполнить это задание на компьютере, используя программу SPSS.
2.5. Советы по подготовке к зачету
При подготовке к зачету внимательно изучите рекомендованную литературу,
повторите
учебный
материал
по конспекту, рассмотрите примеры с пошаговым
применением методов, выполните упражнения и задания; с помощью программы SPSS
самостоятельно проведите обработку данных, применив к ним подходящий метод,
проинтерпретируйте результаты по аналогии с примерами. Полезно воспользоваться
альтернативными методами и сравнить полученные с их помощью результаты.
РАЗДЕЛ 3. МАТЕРИАЛЫ ТЕСТОВОЙ СИСТЕМЫ ИЛИ ПРАКТИКУМ ПО
РЕШЕНИЮ ЗАДАЧ ПО ТЕМАМ ЛЕКЦИЙ
Практические задания к теме «Создание и редактирование файлов данных»
Задание 1.
1. Запустить программу SPSS.
2. Перейти в редактор данных, определить в соответствии с таблицей структуру файла
данных, который будет содержать информацию об учащихся трех классов:
Переменная
№
Идентификационный номер уч-ся
Описание
Пол
Пол ученика (1–жен, 2–муж)
Класс
Класс, в котором учится школьник (1 – «А», 2 – «Б», 3 – «В»)
Вуз
Предполагаемый для поступления вуз (1–гуманитарный; 2–экономический;
3–технический; 4–естественнонаучный)
Хобби
Внешкольные увлечения (1–спорт; 2–компьютер; 3–искусство)
15
Переменная
Тест1
Показатель теста «Счет в уме»
Описание
Тест2
Показатель теста «Числовые ряды»
Тест3
Показатель теста «Словарный запас»
Тест4
Показатель теста «Осведомленность»
Тест5
Показатель теста «Кратковременная вербальная память»
Отметка1
Средний балл отметок за 10-й класс
Отметка2
Средний балл отметок за 11-й класс
Определить тип всех переменных как Numeric (Числовой). Для переменных
Отметка1 и Отметка2 отведите 2 знака после запятой, для остальных переменных – 0.
Создать метки для переменных Тест1–Тест5, Отметка1, Отметка2 в соответствии с
описанием. Задать метки значений для переменных Пол, Вуз, Класс, Хобби в соответствии с
описанием. Задать выравнивание по правому краю. Ввести данные для 10 учащихся.
Сохранить файл под именем школа.sav.
Практические задания к теме «Управление данными»
1. Запустите программу SPSS.
2. Откройте для работы файл ex01.sav.
3. С помощью команды Analyze–Reports–Case Summaries (Анализ–Отчеты–Сводка по
данным) выведите значения всех переменных для первых 20 объектов (Limit cases to first),
при этом включив номера объектов в результат (Show case numbers). Результат сохраните в
виде файла результат1.spo.
4. С помощью команды Analyze–Reports–Case Summaries (Анализ–Отчеты–Сводка по
данным) выведите значения переменных №, вуз, хобби, сгруппированные по значениям
переменных класс и пол. Результат сохраните в виде файла результат2.spo.
5. С помощью команды Transform–Compute (Преобразование–Вычислить) создайте
новую переменную тест_ср (средний балл результатов тестирования каждого учащегося).
Выражение для новой переменной: (тест1+тест2+тест3+тест4+тест5)/5.
6. С
помощью
команды
Transform–Rank
Cases
(Преобразование–Ранжировать
объекты) проранжируйте переменную отметка2, присвоив ранг 1 наибольшему значению.
Поменяйте имя новой переменной на ранг_о2. Создайте метку переменной.
7. С помощью команды Data–Select Cases (Данные–Выбор объектов) выберите
девушек, задав условие пол=1; затем сделайте доступными все данные. Выберите всех
учащихся, занимающихся спортом, задав необходимое условие; сделайте доступными все
данные. Выберите учащихся, собирающихся поступать в экономические и технические вузы,
16
задав необходимое условие; сделайте доступными все данные. Выберите всех учащихся с
отметкой1 большей 4.
8. С помощью команды Data–Sort Cases (Данные–Сортировка объектов) упорядочите
данные файла по убыванию значения переменной отметка1. Произведите сортировку
учащихся по классам, полу и отметке2.
Практические задания к теме «Диаграммы. Частоты»
1. Откройте файл данных ex01.sav.
2. С
помощью
команды
Analyze–Descriptive
(Анализ–
Statistics–Frequencies
Описательные статистики–Частоты) вычислите частоты для переменных пол, класс и вуз.
Для интерпретации результатов используйте следующую трактовку терминов: Frequencies –
число объектов, соответствующих каждой категории переменной; Percent – процент от
общей численности; Valid – список уровней переменной; Total – итоговые значения.
Сохраните результаты вывода в виде файла частоты.spo.
3. С помощью команды Analyze–Descriptive Statistics–Frequencies–Charts постройте
столбиковые диаграммы (Bar charts) для частот переменных пол, класс, вуз. Сохраните
результаты вывода в виде файла диаграмма1.spo.
4. Для
переменной
отметка2
постройте
гистограмму распределения
частот
(Histograms) с нормальной кривой (With normal curve), вычислите среднее значение (Mean),
стандартное отклонение (Std. Deviation), асимметрию (Skewness) и эксцесс (Kurtosis)
распределения. Сохраните результаты вывода в виде файла диаграмма2.spo.
Практические задания к теме
«Описательные статистики. Таблицы сопряженности и критерий 2».
1. Запустите программу SPSS. Откройте для работы файл ex01.sav.
2. С
помощью
команды
Analyze–Descriptive
Statistics–Descriptives
(Анализ
–
Описательные статистики – Описательные статистики) для переменных тест1 – тест5
вычислите среднее значение (Mean), стандартное отклонение (Standard deviation), максимум
(maximum) и минимум (minimum), используя кнопку Options (Параметры). Проанализируйте
и сохраните результаты вывода в виде файла оп_стат1.spo.
3. С помощью команды Analyze–Descriptive Statistics–Descriptives для переменных
тест1 – тест5 вычислите, используя кнопку Options (Параметры), сумму (Sum), среднее
значение, дисперсию (Variance), эксцесс (Kurtosis), асимметрию (Skewness); выводимые
результаты отсортируйте по вычисленным средним значениям в порядке возрастания
(Ascending means). Проанализируйте и сохраните результаты вывода в виде файла
оп_стат2.spo.
17
4. С
помощью
команды
Analyze–Descriptive
Statistics–Frequencies
(Анализ–
Описательные статистики–Частоты) для переменных тест1 – тест5 вычислите, используя
кнопку Statistics
(Статистики), размах
(Range), моду (Mode) и
медиану(Median).
Проанализируйте и сохраните результаты вывода в виде файла оп_стат3.spo. Для
интерпретации результатов в таблице частот используйте следующую трактовку терминов:
Frequencies – частота; Percent – процент от общей численности; Cumulative percent –
накопленный процент; Valid – список уровней переменной; Total – итоговые значения.
5. С
помощью
команды
Analyze–Descriptive
Statistics–Crosstabs
(Анализ–
Описательные статистики – Таблицы сопряженности) создайте таблицу сопряженности
полхоббикласс (пол – Rows (Cтроки), хобби – Columns (Столбцы), класс – Layer 1 of 1
(Слой 1 из 1)). Проанализируйте и сохраните результат вывода в виде файла табл1.spo.
6. Создайте таблицу сопряженности полхобби, в ячейки которой включите
наблюдаемые и ожидаемые частоты, процент от суммы и нестандартизированный остаток,
т.е. разность между наблюдаемой и ожидаемой частотами (пол – Rows (Cтроки), хобби –
Columns (Столбцы); щелкните по кнопке Cells (Ячейки) и установите флажки Expected
(Ожидаемые), Total (Всего) и Unstandardized (Нестандартизированные); щелкните по кнопке
Continue (Продолжить), затем – по кнопке Ok). Проанализируйте и сохраните результат
вывода в виде файла табл2.spo.
7. Создайте таблицу сопряженности полхобби, в ячейки которой включите
наблюдаемые и ожидаемые частоты, нестандартизированный остаток, примените критерий
2 , вычислите коэффициенты  и V Крамера (пол – Rows (Cтроки), хобби – Columns
(Столбцы); щелкните по кнопке Cells (Ячейки) и установите флажки Expected (Ожидаемые),
Unstandardized (Нестандартизированные); щелкните по кнопке Statistics (Статистики),
установите флажки Chi-square (Хи-квадрат) и Phi and Cramer’s V (Фи и V Крамера);
щелкните по кнопке Continue (Продолжить), затем – по кнопке Ok). Проанализируйте и
сохраните результат вывода в виде файла табл3.spo.
8. Создайте таблицу сопряженности полхобби только для двух из трех градаций
переменной хобби: спорт и искусство (пол – Rows (Cтроки), хобби – Columns (Столбцы);
щелкните по кнопке Cells (Ячейки) и установите флажки Expected (Ожидаемые),
Unstandardized (Нестандартизированные); щелкните по кнопке Statistics (Статистики),
установите флажки Chi-square (Хи-квадрат) и Phi and Cramer’s V (Фи и V Крамера);
щелкните по кнопке Continue (Продолжить); в меню Data (Данные) выберите команду Select
Cases (Выбор объектов), установите переключатель If condition is satisfied (Если
удовлетворяет условию); щелкните по кнопке If (Если), задайте необходимое условие
18
хобби  2, щелкните по кнопке Continue (Продолжить), затем – по кнопке Ok).
Проанализируйте и сохраните результат вывода в виде файла табл4.spo.
Практические задания к теме «Средние значения. Сравнение двух средних, t-критерий»
1. Откройте файл данных ex01.sav.
2. В меню Analyze (Анализ) выберите команду Compare Means – Means (Сравнение
средних – Средние). Вычислить средние значения отметок для учащихся каждого из трех
классов. Для этого: щелкните сначала на переменной отметка2, чтобы выделить ее, а затем
— на верхней кнопке со стрелкой, чтобы переместить переменную в список Dependent List
(Зависимые переменные). Щелкните сначала на переменной класс, чтобы выделить ее, а
затем — на нижней кнопке со стрелкой, чтобы переместить переменную в список
Independent List (Независимые переменные). Щелкните на кнопке ОК, чтобы открыть окно
вывода.
3. Включите в процедуру дополнительную независимую переменную, например
пол, и постройте таблицу сопряженности. Для этого: щелкните сначала на переменной
отметка2, чтобы выделить ее, а затем — на верхней кнопке со стрелкой, чтобы переместить
переменную в список Dependent List (Зависимые переменные). Щелкните сначала на
переменной класс, чтобы выделить ее, а затем — на нижней кнопке со стрелкой, чтобы
переместить переменную в список Independent List (Независимые переменные). Щелчком на
кнопке Next (Следующая) освободите список Independent List (Независимые переменные) —
метка Layer 1 of 1 (Слой 1 из 1) изменится на Layer 2 of 2 (Слой 2 из 2). После этого
щелкните сначала на переменной пол, чтобы выделить ее, а затем — на нижней кнопке со
стрелкой, чтобы переместить переменную в список Independent List (Независимые
переменные). Щелкните на кнопке ОК, чтобы открыть окно вывода результатов.
4. В следующем примере вычислить средние значения и стандартные отклонения для
переменных отметка 1 и отметка2 с использованием таблицы сопряженности класспол.
5. Щелкните сначала на переменной отметка1, чтобы выделить ее, а затем — на
верхней кнопке со стрелкой, чтобы переместить переменную в список Dependent List
(Зависимые переменные). Повторите предыдущее действие для переменной отметка2.
Щелкните сначала на переменной класс, чтобы выделить ее, а затем — на нижней кнопке со
стрелкой, чтобы переместить переменную в список Independent List (Независимые
переменные). Щелчком на кнопке Next (Следующая) освободите список Independent List
(Независимые переменные) — метка Layer 1 of 1 (Слой 1 из 1) изменится на Layer 2 of 2
(Слой 2 из 2). После этого щелкните сначала на переменной пол, чтобы выделить ее, а затем
— на нижней кнопке со стрелкой, чтобы переместить переменную в список Independent List
19
(Независимые переменные). Щелкните на кнопке ОК, чтобы открыть окно вывода
результатов.
Практические задания к теме «Корреляции»
1. Откройте файл данных ex01.sav. В меню Analyze (Анализ) выберите команду
Correlate Bivariate (Корреляция Двумерная). Создайте корреляционную матрицу для
значений переменных тест1, ..., тест5, для чего дважды щелкните на переменной тест1,
чтобы переместить ее в список Variables (Переменные). Повторите предыдущее действие для
переменных тест2, ..., тест5. Щелкните на кнопке ОК, чтобы открыть окно вывода.
2. Создайте корреляционную матрицу Пирсона размером 15, предназначенную для
оценки степени зависимости переменной отметка2 от переменных тест1–тест5. В меню
File (Файл) выберите команду New Syntax (Новый Синтаксис). В открывшееся окно
редактора синтаксиса введите следующую команду: correlations variables тест1 тест2 тест3
тест4 тест5 with отметка2.
3. Выберите команду Run–All (Запустить–Все) или выделите всю команду левой
кнопкой мыши и щелкните на кнопке Run Current (Запуск команды) панели инструментов.
Команда будет выполнена и откроется окно вывода.
Практическое задание к теме «Простая линейная регрессия»
1. Откройте для работы файл exam.sav. Проведите регрессионный анализ. В меню
Analyze (Анализ) выберите команду Regression – Linear (Регрессия – Линейная регрессия)
(переменную тест переместите в поле Dependent (Зависимая переменная); переменную трев
переместите в список Independent(s) (Независимые переменные); щелкните на кнопке ОК).
2. Проведите проверку криволинейности. В меню Analyze (Анализ) выберите команду
Regression – Curve Estimation (Регрессия – Оценка криволинейности); переменную тест
переместите в список Dependent(s) (Зависимые переменные); переменную трев переместите
в поле Independent (Независимая переменная); установите флажок Quadratic (Квадратичная
зависимость); щелкните на кнопке ОК.
3. Создайте новую переменную трев2. Для этого в меню Transform (Преобразование)
выберите команду Compute (Вычислить). В поле Target Variable (Целевая переменная)
введите имя трев2. Щелкните сначала на переменной трев, чтобы выделить ее, а затем — на
кнопке со стрелкой, чтобы ввести переменную в условие отбора, составляемое в поле
Numeric Expression (Выражение). Следом за именем переменной в поле Numeric Expression
(Выражение) введите две звездочки (**), двойку (2) и щелкните на кнопке ОК.
4. В меню Analyze (Анализ) выберите команду Regression – Linear (Регрессия –
Линейная регрессия); переменную тест переместите переменную в поле Dependent
20
(Зависимая
переменная);
переменную
трев
переместите
в
список
Independent(s)
(Независимые переменные). Повторите предыдущее действие для переменной трев2.
Щелкните на кнопке ОК.
Практические задания к теме «Множественный регрессионный анализ»
1. Для работы используется файл данных help.sav. Проведите множественный
регрессионный анализ с участием зависимой переменной помощь и пяти предикторов
симпатия, проблема, эмпатия, польза, агрессия.
В меню Analyze (Анализ) выберите команду Regression – Linear (Регрессия –
Линейная регрессия). Переместите переменную помощь в поле Dependent (Зависимая
переменная). Переместите переменную симпатия в список Independent(s) (Независимые
переменные). Повторите предыдущее действие для переменных проблема, эмпатия, польза и
агрессия. В раскрывающемся списке Method (Метод) выберите пункт Forward (Прямой).
Щелкните на кнопке ОК. Проанализируйте результаты.
2. Проведите регрессионный анализ с использованием метода Stepwise (По шагам),
включите в результат статистики для коэффициентов В, описательные статистики и
характеристики модели, а также добавьте новую переменную и задайте пороговые значения
значимости включения и исключения предикторов.
В меню Analyze (Анализ) выберите команду Regression – Linear (Регрессия –
Линейная регрессия). Переместите переменную помощь в поле Dependent (Зависимая
переменная). Переместите переменную симпатия в список Independent(s) (Независимые
переменные). Повторите предыдущее действие для переменных проблема, эмпатия, польза и
агрессия. В раскрывающемся списке Method (Метод) выберите пункт Stepwise (По шагам).
Щелкните на кнопке Statistics (Статистики), установите флажок Descriptives (Описательные
статистики) и щелкните на кнопке Continue (Продолжить). Щелкните на кнопке Save
(Сохранение). Установите флажок Unstandardized (Нестандартизированные значения) и
щелкните на кнопке Continue (Продолжить). Щелкните на кнопке Options (Параметры). В
поле Entry (Включение) введите значение 0,1, нажмите клавишу Tab, в поле Removal
(Удаление) введите значение 0,2 и щелкните на кнопке Сontinue (Продолжить). Щелкните на
кнопке ОК. Проанализируйте результаты.
Практические задания к теме «Однофакторный дисперсионный анализ»
1. Откройте для работы файл ex01.sav.
2. Сравните между собой средние значения переменной тест1 для каждой из выборок
по уровням переменной хобби. В меню Analyze (Анализ) выберите команду Compare Means –
One-Way ANOVA (Сравнение средних – Однофакторный дисперсионный анализ): тест1 –
21
Dependent List (Зависимые переменные), хобби – Factor (Фактор). Проанализируйте
результаты.
3. Проведите
однофакторный
дисперсионный
анализ,
включив
описательные
статистики и критерий однородности дисперсии, построение графика средних; проведите
парное сравнение с помощью критерия Шеффе. В меню Analyze (Анализ) выберите команду
Compare Means – One-Way ANOVA (Сравнение средних – Однофакторный дисперсионный
анализ): тест1 – Dependent List (Зависимые переменные), хобби – Factor (Фактор); щелкните
на кнопке Options (Параметры), установите флажки Descriptive (Описательные статистики),
Homogeinity of variance test (Критерий однородности дисперсии), Means plot, а затем
щелкните кнопке Continue (Продолжить); щелкните на кнопке Post Hoc (Постфактум),
установите флажок Sсheffe (Шеффе) и щелкните на кнопке Continue (Продолжить); щелкните
на кнопке ОК. Проанализируйте результаты.
4. Примените
метод
контрастов
для
сравнения
учащихся,
увлекающихся
компьютером, с теми кто имеет другие увлечения, а также для сравнения увлекающихся
спортом с остальными учащимися (переменную тест1 переместите в список Dependent List
(Зависимые переменные); переменную хобби переместите в поле Factor (Фактор); щелкните
на кнопке Options (Параметры); установите флажки Descriptive (Описательные статистики) и
Homogeinity of variance test (Критерий однородности дисперсии), а затем щелкните на кнопке
Continue (Продолжить); щелкните на кнопке Post Hoc (Постфактум), установите флажок LSD
(Наименьшая значимая разность) и щелкните на кнопке Continue (Продолжить); щелкните на
кнопке Contrasts (Контрасты), в поле Coefficients (Коэффициенты) введите числа 1, -2 и 1,
затем, щелкнув на кнопке Next (Следующий), — введите числа -2, 1, 1, после чего щелкните
на кнопке Continue (Продолжить), щелкните на кнопке ОК.
Практические задания к теме «Многофакторный дисперсионный анализ»
В меню Analyze (Анализ) выберите команду General Linear Model – Univariate (Общие
линейные модели – Одномерный анализ). Переместите переменную отметка2 в поле
Dependent Variable (Зависимая переменная). Переместите переменную пол в список Fixed
Factor(s) (Постоянные факторы). Повторите предыдущее действие для переменной хобби.
Щелкните на кнопке Options (Параметры). Установите флажки Descriptive statistics
(Описательные статистики) и Estimates of effect size (Оценка величины эффекта), а затем
щелкните на кнопке Continue (Продолжить). Щелкните на кнопке ОК.
Влияние ковариаты
В меню Analyze (Анализ) выберите команду General Linear Model – Univariate (Общие
линейные модели – Одномерный анализ). Переместите переменную отметка2 в поле
22
Dependent Variable (Зависимая переменная). Переместите переменную пол в список Fixed
Factor(s) (Постоянные факторы). Повторите предыдущее действие для переменной хобби.
Переместите переменную тест_ср в список Covariates (Ковариаты). Щелкните на кнопке
Options (Параметры). Установите флажки Descriptive statistics (Описательные статистики) и
Estimates of effect size (Оценка величины эффекта), а затем щелкните на кнопке Continue
(Продолжить). Щелкните на кнопке ОК.
Графическая интерпретация взаимодействий
Построить
график
средних
значений,
позволяющий
интерпретировать
взаимодействие факторов пол и класс. Для этого в меню Analyze (Анализ) выберите
команду General Linear Model – Univariate (Общие линейные модели – Одномерный анализ).
Переместите переменную
отметка2 в поле Dependent Variable (Зависимая
переменная); переместите переменную пол в список Fixed Factor(s) (Постоянные факторы).
Повторите то же действие для переменной хобби. Переместите переменную тест_ср в список
Covariates (Ковариаты).
Задайте параметры результатов. Для этого щелкните на кнопке Options (Параметры),
установите флажки Descriptive statistics (Описательные статистики) и Estimates of effect size
(Оценка величины эффекта), а затем щелкните на кнопке Continue (Продолжить). Щелкните
на кнопке Plots (Графики). Перенесите переменную хобби в поле Horisontal Axis
(Горизонтальная ось).
Перенесите переменную пол в поле Separate Lines (Отдельные линии).
Подтвердите правильность введенных параметров щелчком на кнопке Add
(Добавление) — в нижнем поле появится строка хобби*пол, обозначающая тип графика
средних. Щелкните на кнопке Continue (Продолжить). Щелкните на кнопке ОК.
Практическое задание к теме «Факторный анализ»
1. Откройте файл TestIQ.sav.
2. Проведите факторный анализ с параметрами по умолчанию и вращением по методу
Varimax. В меню Analyze (Анализ) выберите команду Data Reduction – Factor (Сокращение
данных – Факторный анализ). Переместите переменные и1 – и11 в список Variables
(Переменные). Щелкните на кнопке Rotation (Вращение). В группе Method (Метод)
установите переключатель Varimax и щелкните на кнопке Continue. Щелкните на кнопке ОК.
Проанализируйте результаты.
3. Проведите факторный анализ, включив в вывод одномерные описательные
статистики, коэффициенты корреляции, применив критерии многомерной нормальности и
адекватности выборки. Для извлечения факторов использовать метод главных компонентов,
23
а для отображения — график собственных значений. Вращение факторов провести методом
Varimax, отобразить факторную структуру после вращения, отсортировать переменные по
величине их нагрузок по факторам:

В меню Analyze (Анализ) выберите команду Data Reduction – Factor (Сокращение
данных – Факторный анализ). Переместите переменные и1 – и11 в список Variables
(Переменные).

Щелкните на кнопке Descriptives (Описательные статистики). В группе Statistics
(Статистики) установите флажок Univariate Descriptives (Одномерные описательные
статистики), в группе Correlation matrix (Корреляционная матрица) — флажки
Coefficients (Коэффициенты) и КМО and Barlett's Test of sphericity (Критерии КМО и
сферичности Барлетта) и щелкните на кнопке Continue.

Щелкните на кнопке Extraction (Извлечение). Установите флажок Scree Plot (График
собственных значений) и щелкните на кнопке Continue.

Щелкните на кнопке Rotation (Вращение). В группе Method (Метод) установите
переключатель Varimax, в группе Display (Отображать) — флажок Loading plot(s)
(Диаграммы нагрузок) и щелкните на кнопке Continue.

Щелкните на кнопке Options (Параметры). Установите флажок Sorted by size
(Сортировать по величине) и щелкните на кнопке Continue.
Щелкните на кнопке ОК. Проанализируйте результаты вывода.
Практические задания к теме «Кластерный анализ»
1. Откройте файл данных cars.sav.
2. В меню Analyze (Анализ) выберите команду Classify – Hierarchical Cluster
(Классификация – Иерархическая кластеризация).
3. Щелкните сначала на переменной марка, чтобы выделить ее, а затем — на нижней
кнопке со стрелкой, чтобы переместить переменную в поле Label Cases by (Различать
объекты по). Нажмите кнопку мыши на переменной цена и, не отпуская кнопки, перетащите
указатель на переменную пробег, затем кнопку мыши отпустите. В результате окажутся
выделенными все оставшиеся в списке переменные. Щелкните на верхней кнопке со
стрелкой, чтобы переместить выделенные переменные в список Variable(s) (Переменные).
4. Щелкните на кнопке Plots (Диаграммы). Установите флажок Dendrogram
(Дендрограмма) и переключатель None (Нет) в группе Icicle (Диаграмма накопления).
Щелкните на кнопке Continue (Продолжить). Щелкните на кнопке Method (Метод),
5. В списке Cluster Method (Метод кластеризации) оставьте выбранным пункт
Between-groups linkage (Межгрупповое связывание), в списке Standardize (Стандартизация)
выберите пункт Z score (z-шкала) и щелкните на кнопке Continue (Продолжить), чтобы
24
вернуться в диалоговое окно Hierarchical Cluster Analysis (Иерархический кластерный
анализ).
6. Щелкните на кнопке Save (Сохранить), установите переключатель Single Solution
(Заданное число кластеров), введите в расположенное рядом поле значение 3 и щелкните на
кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Hierarchical Cluster
Analysis (Иерархический кластерный анализ). Щелкните на кнопке ОК, чтобы открыть окно
вывода.
7. Откройте файл TestIQ.sav. В меню Analyze (Анализ) выберите команду Classify –
Hierarchical Cluster (Классификация – Иерархическая кластеризация).
8. В
группе
Cluster
(Кластеризация)
установите
переключатель
Variables
(Переменные). Нажмите кнопку мыши на переменной и1 и, не отпуская кнопки, перетащите
указатель на переменную и11, затем кнопку мыши отпустите. В результате окажутся
выделенными все 11 переменных и1, и2,..., и11. Щелкните на верхней кнопке со стрелкой,
чтобы переместить выделенные переменные в список Variable(s) (Переменные).
9. Щелкните на кнопке Plots (Диаграммы). Установите флажок Dendrogram
(Дендрограмма) и переключатель None (Нет) в группе Icicle (Диаграмма накопления).
Щелкните на кнопке Continue (Продолжить), чтобы вернуться в диалоговое окно Hierarchical
Cluster Analysis (Иерархический кластерный анализ).
10. Щелкните на кнопке Method (Метод), в списке Interval (Интервал) выберите пункт
Pearson correlation(Корреляция Пирсона), а в группе Transofm Measures (Преобразование
значений) установите флажок Absolute values (Абсолютные значения). Щелкните на кнопке
Continue (Продолжить), чтобы вернуться в диалоговое окно Hierarchical Cluster Analysis
(Иерархический кластерный анализ).
11. Щелкните на кнопке ОК, чтобы открыть окно вывода.
РАЗДЕЛ 4. СЛОВАРЬ ОСНОВНЫХ ТЕРМИНОВ (ГЛОССАРИЙ)
F-критерий – в дисперсионном анализе отношение межгруппового среднего квадрата
к
внутригрупповому
среднему
квадрату.
Данная
величина
позволяет
сравнить
межгрупповую дисперсию с внутригрупповой дисперсией. В случае если первая окажется
значительно выше второй, это будет означать наличие значимого различия между группами.
Во множественном регрессионном анализе F-критерий позволяет определить значимость
множественной корреляции.
R – множественный коэффициент корреляции между зависимой переменной и двумя
или более независимыми переменными. Значение R лежит в пределах от 0 до 1 и
интерпретируется по аналогии с обычным (двухмерным) коэффициентом корреляции.
25
R2 – квадрат коэффициента множественной корреляции (коэффициент детерминации),
доля дисперсии зависимой переменной, обусловленная воздействием двух или более
независимых переменных.
S-стресс – в многомерном шкалировании мера степени соответствия модели исходной
матрице различий. Чем меньше это значение, тем лучше соответствие.
z-значения
–
стандартизованные
значения.
После
стандартизации
(или
z-
преобразования) значений переменной среднее равно 0, стандартное отклонение равно 1.
Асимметричная матрица – квадратная матрица, у которой хотя бы в одной паре
ячеек, симметрично расположенных относительно главной диагонали, значения различны.
Корреляционная матрица является типичным примером асимметричной матрицы.
Асимметрия – мера отклонения распределения от нормального, характеризующая
симметричность графика.
Взаимодействие – эффект совместного влияния на зависимую переменную двух и
более независимых переменных, который не сводится к их раздельному влиянию. В случае
двух независимых переменных проявляется в том, что эффект влияния одной из них
проявляется по-разному на разных уровнях другой переменной.
Внутригрупповая сумма квадратов – сумма квадратов отклонений наблюдаемых
значений от среднего для каждой группы.
Внутригрупповой многомерный дисперсионный анализ (MANOVA) – вид
дисперсионного анализа, в котором одна и та же группа объектов подвергается действию
каждого уровня независимой переменной.
Вращение – процедура, применяемая в факторном анализе для того, чтобы получить
более простую структуру факторов.
Выборка – подмножество объектов из некоторой генеральной совокупности,
выбранное для статистических выводов относительно свойств всей совокупности.
Гистограмма – столбиковая диаграмма для отображения распределения частот по
категориям (диапазонам значений) переменной. Горизонтальная ось графика соответствует
значениям переменной, а вертикальная — частотам.
Главный эффект – воздействие независимой переменной на зависимую переменную.
График собственных значений – диаграмма, позволяющая выбрать число факторов
в факторном анализе на основе критерия каменистой осыпи Р. Кеттелла.
Дендрограмма – диаграмма древовидной структуры, иллюстрирующая процесс
кластеризации в кластерном анализе.
26
Диаграмма последовательности слияния – графическая интерпретация пошаговой
процедуры кластеризации в кластерном анализе.
Диаграмма рассеивания – график для анализа связи между двумя переменными, на
котором каждый объект представляет собой точку. Положение точки задано парой значений
двух переменных для данного объекта.
Дискриминантный анализ – процедура создания формулы регрессии, на основе
которой производится разбиение объектов на группы, соответствующие категориям
зависимой переменной.
Дисперсионный анализ (ANOVA) – статистический анализ, устанавливающий
статистическую значимость различий между средними значениями для трех или более
выборок.
Дисперсия – характеристика выборочного распределения переменной, описывающая
разброс значений вокруг среднего и вычисляемая как отношение суммы квадратов
отклонений к объему выборки, уменьшенному на 1. Кроме того, дисперсия представляет
собой квадрат стандартного отклонения.
Доверительный интервал – диапазон, в котором находится большинство значений
выборки. Например, термин «доверительный интервал в 95 %» означает интервал, в который
любое случайное значение из выборки попадает с вероятностью 95 %.
Значимость (р-уровень) – мера случайности полученного результата, равная
вероятности того, что в генеральной совокупности этот результат (различия, связь)
отсутствует. Чем меньше эта вероятность (значение р-уровня), тем выше статистическая
значимость результата. Результат считается статистически достоверным (значимым), если руровень не превышает 0,05.
Итерация – стадия процесса формирования регрессионного (дискриминантного)
уравнения, на которой происходит включение или исключение очередной переменной.
Процесс продолжается до тех пор, пока не перестанет удовлетворяться заданный в
процедуре критерий.
Категориальная (номинативная) переменная – переменная, каждое значение
которой указывает на принадлежность объекта к определенной группе (категории).
Категориальная переменная не является количественной; она разделяет все объекты на
непересекающиеся группы по определенному признаку (пол, хобби, класс и пр.), но не
позволяет сравнивать объекты по уровню выраженности этого признака.
27
Квадрат евклидового расстояния – мера, используемая по умолчанию в кластерном
анализе для определения расстояния между объектами и кластерами и вычисляемая как
сумма квадратов разностей между значениями переменных двух объектов.
Квадратная матрица – матрица, строки и столбцы которой соответствуют одной и
той же последовательности элементов (переменных или объектов).
Кластерный анализ – процедура, на основе заданного правила объединяющая
объекты или переменные в группы, называемые кластерами.
Ковариата – количественная переменная, имеющая значительную корреляцию с
зависимой переменной и включаемая в анализ для более точной проверки воздействий
факторов на зависимую переменную.
Количественная переменная – переменная, значения которой (в отличие от
категориальной) отражают уровень выраженности у объектов соответствующего признака в
метрической или порядковой шкале.
Корреляция – мера степени и направления связи между значениями двух
переменных.
Корреляция между формами – в анализе надежности половинного расщепления
приближенное значение надежности измерения в предположении, что обе половины
содержат одинаковое число пунктов.
Корреляция между элементами – в анализе надежности это описательная
информация о корреляциях каждого пункта с суммой всех остальных пунктов.
Коэффициент корреляции – мера связи двух переменных, обозначаемая символом r
и принимающая значения от -1 до +1.
Коэффициенты регрессии – В-коэффициенты, то есть множители при переменных,
входящих в состав регрессионного уравнения, а также константа.
Левина критерий – критерий, предназначенный для проверки гипотезы о том, что
все распределения зависимой переменной для сравниваемых выборок имеют одинаковые
дисперсии.
Линия регрессии – прямая линия на графике двухмерного рассеивания, отражающая
наиболее точные прогнозируемые значения («линия наилучшего соответствия»).
Максимум – наибольшее наблюдаемое значение распределения переменной.
Матрица различий – матрица, каждое значение которой соответствует различию
между двумя объектами.
Медиана – значение переменной, делящее упорядоченное множество всех значений
выборки ровно пополам: у половины объектов выборки значения переменной больше, а у
другой половины меньше медианы.
28
Межгрупповая сумма квадратов – сумма квадратов разностей между главным
средним значением и средними значениями групп, умноженных на весовые коэффициенты,
равные числу объектов в соответствующих группах.
Метод главных компонентов – метод, применяемый SPSS по умолчанию в
факторном анализе для извлечения факторов.
Метод иерархического слияния – метод, используемый в кластерном анализе, при
выполнении которого объекты объединяются в кластеры по одному на каждом шаге до тех
пор, пока не будет образован единственный кластер, охватывающий все объекты.
Метрическая
переменная
–
количественная
переменная,
соответствующая
измерению признака в шкале интервалов или отношений. В отличие от ранговой
(порядковой) переменной, при сравнении объектов позволяет судить не только о том, больше
или меньше выражен признак, но и о том, насколько больше (меньше) он выражен.
Минимум – наименьшее наблюдаемое значение распределения переменной.
Многомерное шкалирование – метод, позволяющий на основе матрицы различий
между объектами построить одно-, двух- или трехмерное изображение, иллюстрирующее
удаленность этих объектов друг от друга.
Многомерные критерии значимости – в многомерном дисперсионном анализе
набор критериев, позволяющих определить влияние факторов и их взаимодействий на
совокупность зависимых переменных.
Многомерный
дисперсионный
анализ
(MANOVA).
Отличие
многомерного
дисперсионного анализа от одномерного (ANOVA) заключается в том, что число зависимых
переменных в нем может быть теоретически любым.
Многомерный дисперсионный анализ с повторными измерениями – вид
дисперсионного анализа, в котором одна и та же группа объектов подвергается действию
каждого уровня независимой переменной.
Многомерный
ковариационный
анализ
(MANCOVA)
–
многомерный
дисперсионный анализ с включением в анализ ковариат.
Множественный регрессионный анализ – метод, позволяющий спрогнозировать
значения зависимой переменной на основе известных значений независимых переменных.
Мода – наиболее часто повторяющееся значение распределения переменной.
Надежность половинного расщепления – мера надежности, для вычисления
которой все пункты шкалы делятся на две эквивалентные группы, а затем на основе
корреляции
между
двумя
половинами
шкалы
устанавливается
ее
внутренняя
согласованность.
Накопленная частота – суммарное число объектов, имеющих значение переменной,
не большее, чем указано.
29
Накопленный процент – процент объектов от общего числа, имеющих значение
переменной, не большее, чем указано.
Нелинейная
регрессия
–
процедура
вычисления
параметров
нелинейного
регрессионного уравнения.
Неортогональное вращение – процедура, используемая в факторном анализе,
допускающая результат, в котором угол между факторами отклоняется от прямого.
Непараметрические критерии – серия критериев, каждый из которых применяется
без
предварительных
допущений
относительно
нормальности
распределения.
Непараметрические критерии основаны на ранжировании, попарных сравнениях и других
средствах, не требующих нормальности распределения переменных.
Нормальное распределение – распределение частот (вероятностей), графически
представляемое в виде симметричной кривой, имеющий пик в центре и асимптотически
приближающееся к горизонтальной оси по краям. Идеальное нормальное распределение
характеризуется нулевыми значениями асимметрии и эксцесса.
Общая сумма квадратов – сумма квадратов отклонений всех значений от среднего
значения всего распределения.
Общность – в факторном анализе мера, характеризующая долю дисперсии
переменной, обусловленную воздействием всех факторов.
Ожидаемое значение – в регрессионном анализе термин «ожидаемое значение»
эквивалентен термину «прогнозируемое значение» и означает величину, получаемую для
каждого объекта в результате подстановки значений переменных для него в уравнение
регрессии.
Остаток – разность между наблюдаемым и ожидаемым значениями. Эта величина
относится к части дисперсии, которая не объясняется воздействием независимых
переменных.
Отклонение – расстояние и направление (отрицательное или положительное) между
средним и данным значениями.
Параметр – некоторая числовая характеристика генеральной совокупности.
Параметрические критерии – критерии, применяемые в предположении о
нормальном распределении переменных в генеральной совокупности.
Пошаговый выбор переменных – процедура, включающая и исключающая
переменные из дискриминантного или регрессионного уравнения в соответствии с
выбранными критериями.
Прямоугольная матрица – матрица, для которой строкам и столбцам соответствуют
разные последовательности элементов (объектов или переменных).
30
Размах – характеристика распределения, равная разности между минимумом и
максимумом распределения.
Ранговая (порядковая) переменная – количественная переменная, отражающая
измеренное качество на уровне порядка: в большей или меньшей степени оно выражено. В
отличие от метрической шкалы не позволяет судить о том, насколько больше или меньше
выражено качество, поэтому не допускает применения арифметических операций.
Распределение – статистическое понятие, обозначающее соотношение значений
признака и частот (вероятностей) их встречаемости. Распределение (вероятностей, частот)
может быть представлено в виде формулы для функции распределения вероятностей,
графика
распределения
частот
(гистограммы,
столбиковой
диаграммы),
таблицы
распределения частот.
Регрессионный анализ – инструмент статистики, позволяющий прогнозировать
значения зависимой переменной с помощью известных значений независимых переменных.
Регрессия – в множественном регрессионном анализе этим термином обозначается
статистика, отражающая влияние предикторов на зависимую переменную.
Симметричная матрица – квадратная матрица, для которой в каждой паре ячеек,
расположенных симметрично относительно главной диагонали, содержатся одинаковые
значения. Типичным примером симметричной матрицы является корреляционная матрица.
Собственное значение – в факторном анализе эта величина пропорциональна доле
дисперсии, обусловленной влиянием данного фактора; в дискриминантном анализе
отношение межгрупповой суммы квадратов к внутригрупповой сумме квадратов. Чем
больше собственное значение, тем выше точность дискриминантной функции.
Средний квадрат – отношение суммы квадратов к числу степеней свободы.
Стандартная ошибка – стандартное отклонение величины, получаемое в результате
ее многократного вычисления для случайных выборок. Как правило, стандартная ошибка
вычисляется для среднего значения распределения.
Стандартное отклонение – мера разброса значений распределения вокруг среднего.
Стандартное отклонение определяется как квадратный корень дисперсии.
Столбиковая диаграмма – график распределения частот по категориям (значениям)
переменной. Каждый столбец на графике соответствует одному значению признака, а его
высота пропорциональна частоте встречаемости этого значения.
Стресс – в многомерном шкалировании мера соответствия модели исходной матрице
различий. Чем меньше значение стресса, тем лучше соответствие модели.
31
Сумма квадратов – стандартная мера разброса, представляющая собой сумму
квадратов отклонений всех значений величины от среднего значения.
Таблица распределения (частот) – таблица, устанавливающая соотношение между
категориями (значениями) признака и частотами их встречаемости.
Таблица сопряженности (кросстабуляции) – таблица совместного распределения
частот для двух категориальных или дискретных переменных; строки соответствуют
категориям (значениям) одной, а столбцы — другой переменной.
Толерантность – мера линейной зависимости между одной переменной и набором
других переменных.
Фактор – в факторном анализе объединение нескольких переменных, чья взаимная
корреляция исчерпывает определенную долю общей дисперсии. После процедуры вращения
каждый фактор интерпретируется как некоторая общая причина взаимосвязи группы
переменных.
Факторный анализ – метод, позволяющий свести большое количество исходных
переменных к значительно меньшему числу факторов, каждый из которых объединяет
исходные переменные, имеющие сходный смысл.
Частота (абсолютная) – количество объектов в выборке, имеющих данное значение
признака.
Частота относительная – доля объектов в выборке, имеющих данное значение
признака; равна отношению абсолютной частоты к объему выборки.
Число степеней свободы (df) – количество возможных направлений изменчивости
статистического показателя, наряду с эмпирическим значением критерия служит для
определения р-уровня значимости.
Эксцесс – мера «сглаженности» («островершинности» или «плосковершинности»)
распределения. Если значение эксцесса близко к 0, это означает, что форма распределения
близка к нормальному виду.
РАЗДЕЛ 5. МЕТОДИЧЕСКИЕ УКАЗАНИЯ ДЛЯ ВЫПОЛНЕНИЯ КОНТРОЛЬНЫХ,
КУРСОВЫХ И ВЫПУСКНЫХ КВАЛИФИКАЦИОННЫХ РАБОТ
Выполнение контрольных, курсовых, выпускных квалификационных работ не
предусмотрено планом.
РАЗДЕЛ 6. ДАННЫЕ О МУЛЬТИМЕДИЙНЫХ ЛЕКЦИЯХ
Разработаны мультимедийные лекции:
32
№
Наименование
п/п
1.
Общий обзор SPSS. Создание и редактирование файлов данных. Управление данными.
Диаграммы Частоты. Описательные статистики. Таблицы сопряженности и критерий
2
2.
Факторный анализ. Кластерный анализ.
33
Download