это царица

advertisement
4
ВВЕДЕНИЕ
Принято считать, что математика – это царица наук и «зрелость науки
обычно определяется тем, в какой мере она использует математику»
(С.С.Стивенс). На стыке математических и психологических дисциплин возникла относительно новая дисциплина «Математические методы в психологии».
Благодаря проникновению математического аппарата в психологию
специалисты, работающие в данной сфере, смогли количественно описывать
и сравнивать наблюдаемые явления. Современному психологу владение математической статистикой необходимо прежде всего потому, что, используя
ее он сможет обосновать свои рассуждения и доказать закономерность выводов.
Владение математическими методами и правильное применение статистики позволяет психологу:
 в обобщенном виде описывать закономерности психологических явлений;
 доказывать правильность и обоснованность используемых методических приемов и методов;
 строго обосновывать экспериментальные планы;
 находить зависимости между экспериментальными данными;
 выявлять наличие существенных различий между группами испытуемых (экспериментальными и контрольными);
 строить статистические предсказания.
После изучения курса «Математические методы в психологии» студенты должны уметь:
 выдвигать и проверять статистические гипотезы;
 описывать экспериментальные результаты;
 измерять степень сопряженности психологических явлений;
 делать правильные психологические выводы на основе результатов
статистического анализа;
 понимать психологическую литературу, в которой представлена информация о статистической обработке экспериментальных данных.
Математическая статистика, как отмечает О.Ю.Ермолаев, «в руках
психолога может и должна быть мощным инструментом, позволяющим не
только успешно лавировать в море экспериментальных данных, но и, прежде
всего, способствовать становлению его объективного мышления».
5
Настоящее учебно-методическое пособие призвано дать студентам
представление об основных статистических процедурах и способах их применения.
Данное учебно-методическое пособие содержит четыре раздела. В первых трех разделах представлены информационно-справочные материалы по
основным дидактическим единицам государственного образовательного
стандарта ВПО (специальность 030301 «Психология»). В параграфах приведены примеры, которые позволят студентам научиться использовать математический инструментарий. Кроме того после первого и второго разделов
имеются задания для самостоятельной работы, которые позволят студентам
самостоятельно проводить первоначальную статистическую обработку данных экспериментальных исследований и формулировать статистически обоснованные выводы. В четвертом разделе учебно-методического пособие представлены материалы для самоконтроля (тестовые задания и вопросы для подготовки к зачету) по всему материалу курса.
В глоссарий включены основные понятия курса «Математические методы в психологии».
6
РАЗДЕЛ 1
ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ИЗМЕРЕНИЯ И КОЛИЧЕСТВЕННОГО
ОПИСАНИЯ ДАННЫХ
Тема 1
ПРОБЛЕМА ИЗМЕРЕНИЯ В ПСИХОЛОГИИ И ВИДЫ
ИЗМЕРИТЕЛЬНЫХ ШКАЛ
1.1. Измерение в психологии
Психологическое исследование начинается с некоторого предположения, которое требуется либо подтвердить, либо опровергнуть. Это предположение – гипотеза – формулируется в отношении связи явлений или свойств в
некоторой совокупности элементов.
Например. Исследователи (Л.П.Фридман, Б.В.Кулагина, 1991г.) предположили,
что школьная успеваемость – важнейший критерий для формирования самооценки у
большинства детей 6-11 лет. В этом исследовании ученых интересуют такие свойства,
как самооценка детей и их успеваемость. А совокупность элементов в данном случае –
это дети 6-1 лет.
Для проверки такого рода предположений исследователям нужно измерить соответствующие свойства у участников психологического исследования. Измерение – это приписывание числовых форм объектам или событиям в соответствии с определенными правилами (С.Стивенс).
В нашем примере нужно измерить самооценку детей в возрасте 6-11
лет и сравнить полученные данные с результатами успеваемости. Однако невозможно измерить самооценку у всех детей 6-11 лет. Поэтому ученые проводят изучение разных свойств и явлений на относительно небольших группах людей. В связи с этим в психологических исследованиях рассматриваются понятия генеральная совокупность и выборка.
Генеральная совокупность – это все множество элементов, в отношении которого формулируется предположение (гипотеза). Теоретически считается, что объем генеральной совокупности не ограничен.
Выборка – это любая группа элементов (испытуемых, респондентов),
выделенная из генеральной совокупности для проведения психологического
исследования.
7
Объем выборки, обычно обозначается буквой n, может быть любым, но
не меньшим чем два респондента. В статистике различают малую (n<30),
среднюю 30< n< 100 и большую выборку (n> 100). Следует отметить, что в
психологии известны исследования, в которых в качестве респондента выступал один человек (лонгитюдное наблюдение).
Основные критерии обоснованности выводов исследования – репрезентативность выборки и статистическая достоверность результатов.
Репрезентативная выборка – это такая выборка, в которой все основные признаки генеральной совокупности представлены приблизительно в
той же пропорции и с той же частотой, с которой данный признак встречается в генеральной совокупности. Первый и основной прием получения репрезентативной выборки – простой случайный отбор (рандомизация). Второй
метод получения репрезентативной выборки – стратифицированный случайный отбор.
Статистическая достоверность результатов исследования определяется
при помощи методов спастического вывода, которые предъявляют определенные требования к объему выборки.
Для разработки и адаптации диагностического инструментария требуемый объем выборки составляет от 200 до 1000-2500 человек. Если необходимо сравнить результаты, полученные в двух выборках, то их общая численность должна быть не менее 50 человек. Если изучается взаимосвязь между какими-либо свойствами, то объем выборки должен быть не менее 30-35
человек.
Различают зависимые (связные) и независимые (несвязные) выборки.
Выборки называются независимыми (несвязными), если процедура психологического исследования и полученные результаты измерения некоторого
свойства у испытуемых одной выборки не оказывают влияния на особенности протекания этого же исследования и результаты измерения этого же
свойства у испытуемых другой выборки. Зависимые (связные) выборки – выборки, если процедура исследования и полученные результаты измерения
некоторого свойства, проведенные на одной выборке, оказывают влияние на
другую.
Например. При изучении самооценки детей в возрасте 6-11 лет методом срезов
мы анализирует полученные данные в каждой возрастной группе 6-7-8-9-10-11 лет. В
этом случае группы респондентов 6-7-8-9-10-11 лет будут несвязными. Если же мы будем изучать динамику развития самооценки у детей 6-7-8-9-10-11 лет на протяжении
двух-трех лет, тогда группы респондентов будут связными.
8
1.2. Виды шкал
С.Стивенс предложил классификацию шкал из 4 типов шкал измерений: номинативная, или номинальная, или шкала наименований; порядковая, или ординарная шкала; интервальная шкала, или шкала интервалов;
шкала равных отношений.
Номинативная шкала – это шкала, основанием для классификации
в которой выступает nomen (лат.) – имя, название. Номинативная шкала не
характеризуется количественными показателями элементов, процедура измерения в номинативной шкале сводится к классификации свойств, группировке объектов, к объединению их в классы, группы при условии, что объекты,
принадлежащие к одному классу, идентичны.
Самая простая номинативная шкала называется дихотомической.
При измерениях по дихотомической шкале измеряемые признаки можно кодировать двумя символами или цифрами, например 0 и 1, или А и B, и т.д.
В номинативной шкале считают частоту встречаемости признака,
т.е. число испытуемых, явлений и т.п., попавших в данный класс (группу) и
обладающих данным свойством.
Например. В учебном классе насчитывается 25 человек. Из них у 15 человек
светлые волосы, а у 10 – темные. Это значит, всем ученикам со светлыми волосами мы
припишем символ «А», а всем темноволосым – «Б». Частота встречаемости признака
(оттенок волос: темный – светлый) в группе «А» равна 60% (15/25х100%), а в группе «Б»
- 40% (10/25х100%).
Для проверки статистической достоверности различий результатов,
полученных по номинативной шкале, можно применить следующие критерии: критерий Макнамары, критерий χ2 (хи-квадрат), угловое преобразование
Фишера «φ» и коэффициент корреляции «φ».
Интервальная шкала – шкала, классифицирующая элементы по
признаку «больше на несколько единиц и меньше на несколько единиц»
Каждое из возможных значений признака отстоит от другого на равном расстоянии.
Абсолютно
Абсолютно
не согласен
Не знаю
согласен
I------------I-----------I-----------I-----------I------------I------------I
9
Для измерения посредством шкалы интервалов устанавливаются специальные единицы измерения; в психологии это стены и стенайны. Важной
особенностью шкалы интервалов является то, что у нее нет естественной
точки отсчета (нуль условен и не указывает на отсутствие измеряемого свойства). К экспериментальным данным, полученным в данной шкале, применимо достаточно большое число статистических методов.
Шкала отношений – шкала, классифицирующая элементы пропорционально степени выраженности измеряемого свойства. В шкале отношений
существует твердо зафиксированный нуль. В физике абсолютная нулевая
точка отсчета встречается при измерении длин отрезков или физических объектов и при измерении температуры по шкале Кельвина с абсолютным нулем
температур. В психологии примерами шкал равных отношений являются
шкалы порогов абсолютной чувствительности (С.Стивенс).
Шкала отношений допускает любые математические операции и использование разнообразных статистических методов.
Порядковая шкала (ранговая, ординарная шкала) – это шкала, классифицирующая элементы по принципу «больше – меньше», «выше – ниже»,
«сильнее – слабее» и т.д. Использование шкалы порядка позволяет расположить по рангу все элементы множества от самого большого до самого маленького и наоборот. При кодировании порядковых переменных им можно
приписывать любые цифры (коды).
Пример. По методике Тейлора «тревожность» были получены результаты пяти
респондентов: 42; 30; 18; 50; 22. Указанные значения можно проранжировать двумя
способами (от большего значения к меньшему и наоборот) (таблицы 1.1 -1.2.).
значение
ранг
50
1
42
2
30
3
22
4
Таблица 1.1.
18
5
42
4
Таблица 1.2.
50
5
или
значение
ранг
18
1
22
2
30
3
Случай одинаковых рангов. При проведении психологических исследований могут быть получены одинаковые результаты, которые в дальнейшем необходимо проранжировать. В этом случае существуют особые правила ранжирования.
1. Наименьшему числовому значению приписывается ранг 1.
10
2. Наибольшему числовому значению приписывается ранг равный количеству ранжируемых величин.
3. Элементам, которые имеют равные числовые значения, приписываются
ранги равные средней величине тех рангов, которые эти величины получили
бы, если бы они стояли по порядку друг за другом и не были бы равны.
Пример. Психолог получил у 15 испытуемых следующие значения показателя вербального интеллекта: 113, 107, 123, 122, 117, 117, 105, 105, 105, 108, 114, 102, 113, 113,
113. Необходимо проранжировать полученные показатели.
1. Расположим показатели по возрастанию.
Таблица 1.3.
102 105 105 105 107 108 113 113 113 113 114 117 117 122 123
2. Проранжируем полученные показатели.
102
1
105
2
105
3
105
4
107
5
108
6
113
7
113
8
113
9
113
10
114
11
117
12
Таблица 1.4.
117 122 123
13
14
15
3. Рассчитаем ранги одинаковых значений показателя вербального интеллекта.
Значение 105 встречается три раза. Каждое значение в этом случае будет иметь ранг
равный (2+3+4)/3=3. Значение 113 встречается четыре раза. Каждое значение в этом
случае будет иметь ранг равный (7+8+9+10)/4=8,5. Значение 117 встречается два раза.
Каждое значение в этом случае будет иметь ранг равный (12+13)/2=12,5.
4. Итоговое распределение рангов будет иметь следующий вид.
102
1
105
3
105
3
105
3
107
5
108
6
113
8,5
113
8,5
113
8,5
113
8,5
114
11
Таблица 1.5.
117 117 122 123
15
12,5 12,5 14
Проверка правильности ранжирования. Если ранжируется N признаков, то проверить правильность ранжирования можно по формуле:
Сумма рангов = 1+2+3+…+ N= N(N +1)/2
Пример. Рассчитаем правильно ли мы проранжировали значения показателя вербального интеллекта в предыдущем примере. Множество показателя вербального интеллекта включает 15 значений. По формуле найдем исходную сумму рангов
Сумма рангов = 1+2+…+15=15(15+1)/2=120
Найдем сумму полученных нами рангов.
1+3+3+3+5+6+8,5+8,5+8,5+8,5+11+12,5+12,5+14+15=120
Полученные нами значения совпали (120=120). Значит ранжирование проведено верно.
11
1.3. Формы представления результатов психологического исследования
Для наглядного представления эмпирических данных используются
различные приемы. К таким приемам относятся таблицы, графики, гистограммы, диаграммы, ряды распределений. Перечисленные приемы используют для наглядного представления полученных результатов и для того, чтобы в явной форме можно было бы увидеть характерные особенности поведения исследуемых признаков (явлений свойств).
Полученные психологом эмпирические данные нуждаются в обработке. Обработка начинается с упорядочения и систематизации результатов, т.е.
объединение их в относительно однородные группы по некоторому признаку. Такая техническая процедура называется группировкой.
Наиболее распространенной формой представления эмпирических данных является статистические таблицы. Таблицы бывают простые и сложные.
Пример. Психолог проанализировал возрастной и половой состав 5-х классов в одной из школ. Получил следующие данные: мальчиков всего 26 человек, девочек – 34 человека. Из них в возрасте 10 лет – 28 человек, а в возрасте 11 лет – 32 человека.
Полученные данные можно представить в виде простой таблицы (таблица 1.6.).
Таблица 1.6.
10 лет
11 лет
сумма
Мальчики
14
12
26
Девочки
14
20
34
сумма
28
32
60
Примером сложной таблицы служит таблица, в которой представлены классические данные Ф.Гальтона, иллюстрирующие наличие положительной зависимости между
ростом родителей и их детей (таблица 1.7.).
Рост родителей
74
72
70
68
66
64
всего
60,7
1
1
1
2
5
62,7
64,7
2
15
15
7
39
1
21
56
19
10
107
Рост детей в дюймах
66,7
68,7
70,7
4
48
130
56
14
255
11
83
148
41
4
387
17
66
69
11
72,7
4
20
22
11
1
163
58
Таблица 1.7.
всего
74,7
4
6
62
8
251
430
144
37
14
928
12
Гистограмма распределения частот – это столбиковая диаграмма,
каждый столбец которой опирается на конкретное значение признака. Высота столбика пропорциональна частоте встречаемости соответствующего значения.
Пример. Психолог в группе юношей и девушек (60 человек) измерил тревожность
при помощи тестовой методики. Были получены следующие результаты выраженности
уровня тревожности (в %).
Таблица 1.8.
Низкий
Средний
Высокий
Юноши
10
60
30
Девушки
15
45
40
Гистограмма 1
Графики позволяют наглядно представить динамику изменения исследуемого признака.
Пример. Психолог разработал программу, направленную на развитие внимания у
младших школьников. Для оценки результативности программы он использует корректурную пробу. Психологом сделаны три измерения количества ошибок по методике
«корректурная проба»: до начала занятий, сразу после окончания программы и спустя
13
месяц после окончания занятий по программе. В коррекционной группе насчитывалось 2
человека. Результаты, полученные психологом, представлены на графике.
График 1
Следует уделять внимание при использовании таблиц, графиков, диаграмм и т.п. их названию. В названии должно быть очень понятно отражено
какие результаты представлены в таблицах, гистограммах, графиках и т.д.
Пример. В таблице 1.6. (с.10) представлены результаты, характеризующие выборку (реальные группы учеников, обучающихся в 5-х классах) по полу и возрасту. Название таблицы: «Характеристика параллели 5-х классов (по возрасту и полу)».
В таблице 1.7. (с.10) представлены данные, характеризующие взаимозависимость
между ростом детей и их родителей, поэтому название таблицы звучит так: «Взаимозависимость показателей, характеризующих рост детей и их родителей (в дюймах)».
В таблице 1.8. (с.11) и гистограмме 1 (с.11) представлены результаты, характеризующие выраженность тревожности юношей и девушек. Название таблицы и гистограммы: «Выраженность уровня тревожности среди юношей и девушек (в %)».
График 1 может иметь следующее название: «Динамика количества ошибок, которые допустили учащиеся при выполнении задания «корректурная проба» до и после
коррекционно-развивающих занятий».
14
Тема 2
ОПИСАТЕЛЬНЫЕ СТАТИСТИКИ
2.1. Меры центральной тенденции
Мера центральной тенденции – это число, характеризующее выборку
по уровню выраженности измеренного признака.
Существуют три способа определения «центральной тенденции», каждому из которых соответствует своя мера: мода, медиана и выборочное среднее.
Мода – это такое числовое значение, которое встречается в выборке
наиболее часто. Мода обозначается – Мо.
Пример. В ряду значений (12, 16, 16, 18, 19, 19, 19, 20) модой является 19, потому
что 19 встречается чаще любого другого числа. Обратите внимание, что мода представляет собой наиболее часто встречающееся значение (в данном примере это 19), а не
частоту встречаемости этого значения (в данном примере равную 3).
В ряду (5, 5, 6, 6, 7, 7) моды нет.
В выборке 1, 2, 2, 2, 5, 5, 5, 6 частоты рядом расположенных значений 2 и 5 совпадают и равняются 3. эта частота больше, чем частота других значений 1 и 6 (у которых она равна 1). Следовательно, модой этого ряда будет величина - (2+5) = 3,5
В ряду 10, 11, 11, 11, 12, 13, 14, 14, 14, 17 модами являются значения 11 и 14. В таком случае говорят, что выборка является бимодальной.
Медиана – это значение, которое делит упорядоченное (ранжированое)
множество данных пополам. Обозначается медиана как Х с волной или Md и
определяется как величина, по отношению к которой по крайней мере 50 %
выборочных значений меньше неё и по крайней мере 50 % - больше.
Пример. Найдем медиану выборки 7; 14; 12; 19;. 5; 9; 11. Сначала упорядочим выборку по величине входящих в неё значений. 5; 7; 9; 11; 12; 14; 19. Поскольку в выборке 7
элементов, то четвертый будет иметь значение большее, чем первые три, и меньшее,
чем последние три. Таким образом, медианой будет четвертый элемент – 11
Найдем медиану выборки 3; 7; 2; 6; 9; 11. Упорядочим выборку: 2; 3; 6; 7; 9; 11. Поскольку здесь имеется четное число элементов, то существует две «середины» 6 и 7. В
этом случае медиана определяется как среднее арифметическое этих значений.
Мd=(6+7)|2=6,5
Среднее – (Мх – выборочное среднее, среднее арифметическое) – определяется как сумма всех значений измеренного признака, деленная на коли-
15
чество суммированных значений (формула 1).
(1)
Пример. Психолог измерил уровень тревожности у учащихся 5-х классов в ситуации проверки знаний по Филипсу. Получил следующие результаты: 12; 27; 38; 26; 45; 32.
Для вычисления среднего результата по группе необходимо сложить все значения
12+27+38+26+45+32=180 и полученную сумму разделить на количество элементов (на
6). Мх=30.
2.2. Меры положения
В психологии используются помимо мер центральной тенденции меры
положения, которые называются квантилями распределения. Квантиль
распределения – это точка на числовой оси измеренного признака, которая
делит всю совокупность упорядоченных измерений на две группы с известным соотношением их численности.
Медиана – это значение, которое делит упорядоченное (ранжированое)
множество данных на две группы с равной численностью.
Процентиль – это 99 точек – значений признака (Р1, Р2, Р3, … Р99), которые делят упорядоченное (по возрастанию) множество наблюдений на 100
равных частей, равных по численности.
Квартили – это 3 точки – значения признака (Р25, Р50, Р75), которые делят упорядоченное (по возрастанию) множество наблюдений на 4 равные по
численности части. Первый квартиль соответствует 25 процентилю, второй –
50 процентилю и медиане, третий квартиль соответствует 75 процентилю.
2.3. Меры изменчивости
Меры изменчивости позволяют охарактеризовать выраженность индивидуальных различий испытуемых по измеренному признаку. Меры изменчивости применяются в психологии для численного выражения величины
межиндивидуальной вариации признака.
Размах (разброс) – разность между максимальной и минимальной величинами конкретного вариационного ряда, т.е.
R=Xmax – Xmin
16
Пример. Для определения размаха выборку необходимо упорядочить (по возрастанию). Нам дано множество данных: 4, 5, 6, 6, 7, 13, 13, 25, 25, 27, 30. Размах равен разности между наибольшим и наименьшим значениями, т.е. 30 – 4 = 26.
Дисперсия – это мера разброса данных относительно среднего значения. Дисперсия представляет собой наиболее часто использующуюся меру
рассеяния случайной величины (переменной).
(2)
n - объем выборки
i - индекс суммирования
Mx - среднее, вычисляемое по формуле (1)
Пример. Вычислим дисперсию ряда: 4, 6, 8, 10, 12.
1. Найдем среднее значение: (4+6+8+10+12)/5= 8
2. Вычислим величины
для каждого элемента: 4-8=-4; 6-8=-2;
8-8=0; 10-8=2; 12-8=4. Если сложить все полученные величины, то получиться 0,
а это значит, мы вычислили все верно.
3. Для того, чтобы избавиться от нуля, получаемого при сложении полученных величин, каждую величину возведем в квадрат.
= 16+4+0+4+16=40
4.
=10 – это и есть искомая дисперсия
Стандартное отклонение – (сигма, среднеквадратичное отклонение) –
положительное значение квадратного корня из дисперсии.
(3)
Пример. Для того, чтобы вычислить стандартное отклонение в предыдущем
примере, нам необходимо извлечь квадратный корень из величины дисперсии, а именно
=3,16
17
Тема 3
НОРМАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ
И ЕГО ПРИМЕНЕНИЕ
3.1. Понятие нормального распределения
Каждому психологическому свойству соответствует свое распределение генеральной совокупности. Нормальное распределение является одним
из важнейших в математической статистике, поскольку многие статистические методы предполагают, что, анализируемые с их помощью экспериментальные данные распределены нормально. Нормальное распределение
(называемое также распределением Гауса) характеризуется тем, что крайние
значения признака в нем встречаются достаточно редко, а значения, близкие
к средней величине, – часто.
Нормальное распределение имеет колоколообразную форму, значения
моды, медианы и среднего арифметического равны (рис. 1).
18
Рис. 1. Кривая нормального распределения с границами стандартных отклонений1
Эмпирическим путем было установлено, что многие биологические параметры распределены в соответствии с законом нормального распределения
(рост, вес и т.д.). Впоследствии психологи выяснили, что большинство психологических свойств (показатели IQ, темпераментные особенности и т.д.)
также распределены нормально.
Характерное свойство нормального распределения состоит в том, что
95,44% всех наблюдений лежат диапазоне ± 2σ (два стандартных отклонения) от среднего арифметического, т.е. в этом диапазоне располагаются значения, относящиеся к статистической норме.
3.2. Разработка тестовых шкал
В ходе выполнения психологических исследований экспериментатор
получает исходные тестовые оценки, т.е. количество ответов на те или иные
вопросы тестовых методик, время или количество решенных задач и т.д. Они
называются первичными, или «сырыми» баллами.
Для того, чтобы сравнить результаты, полученные в ходе диагностики
с использованием разных методик, необходимо провести процедуру стандартизации. Стандартизация или z – преобразование данных – это перевод
измерений в стандартную Z-шкалу (Мz=0, σz=1) (формула 4).
(4)
Различают множество стандартных тестовых шкал, основное назначение которых – представление индивидуальных результатов тестирования в
удобном для интерпретации виде.
Для того, чтобы избавиться от неизбежных отрицательных и дробных
значение мы рассмотрим некоторые шкалы: z-шкалу, шкалу стенов, шкалу
стенайнов, шкалу Векслера. Общим для них является соответствие нормальному распределению (рис. 2).
IQ – шкала имеет среднее 100 и сигму 15
1
Ермолаев, О.Ю. Математическая статистика для психологов: учебник /О.Ю.Ермолаев. – 4-е изд., испр. – М.:
Московский психолого-социальный институт: Флинта, 2006. – 336 с. – (Библиотека психолога). С. 53.
19
T–шкала имеет среднее 50 и сигму 10
Шкала стенов (стандартная 10) имеет среднее 5,5 и сигму 2
Шкала стенайнов (стандартная 9) имеет среднее 5 и сигму ≈2
Перевод в новую шкалу осуществляется по формуле 5.
(5)
Рис. 2 Нормальная кривая и тестовые шкалы2
2
Наследов, А.Д. Математические методы психологического исследования. Анализ и интерпретация данных.
Учебное пособие. /А.Д.Наследов. – СПб.: Речь, 2004. – 392 с. – С. 55.
20
ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ
К РАЗДЕЛУ 1
I.
Во взаимодействии детей 6-11 лет с предметами окружающего мира
имеются определенные различия между мальчиками и девочками
(М.В.Осорина).
 Назовите характерные различия между мальчиками и девочками в возрасте 6-11 лет во взаимоотношениях с предметами окружающего мира.
 Какие свойства могут интересовать исследователей?
 Какую совокупность элементов в этом случае нужно изучать?
 Какой объем выборки позволит сделать статистически обоснованный
вывод в данном исследовании?
 Какие выборки (связные или несвязные) различают в данном исследовании?
II.
Личные характеристики детей, которые служат основанием для взаимных выборов, с возрастом меняются (А.А.Реан, Я.Л.Коломинский).
 Назовите основания для взаимных выборов детей в 1-2-х классах и в
более старшем возрасте.
 Какие свойства могут интересовать исследователей?
 Какую совокупность элементов в этом случае нужно изучать?
 Какой объем выборки позволит сделать статистически обоснованный
вывод в данном исследовании?
 Какие выборки (связные или несвязные) различают в данном исследовании?
III.
В подростковом и юношеском возрасте продуктивность непроизвольного запоминания замедляется и одновременно с этим увеличивается продуктивность опосредованного запоминания (А.Н.Леонтьев).
 Какие свойства могут интересовать исследователей?
21
 Какую совокупность элементов в этом случае нужно изучать?
 Какой объем выборки позволит сделать статистически обоснованный
вывод в данном исследовании?
 Какие выборки (связные или несвязные) различают в данном исследовании?
IV.
Определите, в какой шкале представлено каждое из приведенных ниже
измерений: наименований, порядка, интервалов, абсолютной.
1) Порядковый номер испытуемого в списке (для его идентификации).
2) Количество вопросов в анкете как мера трудоемкости опроса.
3) Упорядочивание испытуемых по времени решения тестовой задачи.
4) Академический статус (ассистент, доцент, профессор) как указание на
принадлежность к соответствующей категории.
5) Академический статус (ассистент; доцент, профессор) как мера продвижения по службе.
6) Телефонные номера.
7) Время решения задачи.
8) Количество агрессивных реакций за рабочий день.
9) Количество агрессивных реакций за рабочий день как показатель
агрессивности.
V.
На трех разных, достаточно больших группах испытуемых изучалась
диагностическая ценность методики измерения креативности. Методика
представляла собой 10 заданий, которые испытуемые решали за определенный промежуток времени. Фиксировалось количество решенных заданий
(минимум – 0, максимум – 1). По результатам исследования была построена
таблица, позволяющая сравнить три группы по распределению относительных частот (в %) показателей креативности [Наследов, с. 37]
Решенные задания
0
1
2
3
4
5
6
7
8
Группа 1
1
4
5
10
20
30
20
5
3
Относительные частоты (%)
Группа 2
10
20
30
30
5
3
1
0
0
Группа 3
0
0
1
2
3
4
10
15
25
22
9
10
1
1
0
0
25
15
4. Для какой из групп задания были слишком легкие, а для какой – слишком трудные?
5. В какой группе наблюдается наибольшая, а в какой – наименьшая индивидуальная изменчивость результатов?
6. В отношении какой группы, на ваш взгляд, методика может иметь
наибольшую диагностическую ценность – точнее измерять индивидуальные
различия?
VI. Психолог протестировал две группы испытуемых по 5 человек в каждой по методике дифференциальной диагностики депрессивных состояний
В.А.Жмурова. результаты представлены в таблице.
№ испытуемых п/п
1
2
3
4
5
Группа 1
15
45
44
14
21
Группа 2
26
67
23
78
3
Проранжируйте результаты в обеих группах как в одной. Проверьте правильность ранжирования.
VII. Психолог провел традиционное тестирование интеллекта по тесту
Ржичана у 25 школьников. Сырые баллы по тесту оказались следующими: 6
9; 5; 7; 10; 8; 9; 10; 8; 11; 9; 12; 9; 8; 10; 11; 9; 10; 8; 10; 7; 9; 10; 9;
11. Представьте данный ряд значений в более компактной форме, используя
частоту встречаемости признака (fi).
VIII. Проранжируйте представленные в таблице качества в отношении образа «квалифицированный психолог» и в отношении образа «Я». Цифре 1 соответствует самое важное качество и т.д.
Образ
«квалифицированного
психолога»
Образ «Я»
Самостоятельность
Решительность
Настойчивость
23
Инициативность
Целеустремленность
Организованность
Открытость
Ответственность
Самообладание
Порядочность
Любознательность
Эмпатичность
IX.
Рассчитайте моду, медиану и среднее арифметическое множества элементов, характеризующих значения респондентов по субтестам «Осведомленность» и «Скрытые фигуры» (таблица 1 Приложения).
X.
Рассчитайте размах, дисперсию и стандартное отклонение (с точностью
до двух знаков после запятой) множества элементов, характеризующих значения респондентов по субтестам «Осведомленность», «Скрытые фигуры»
(таблица 1 Приложения).
XI. Рассчитайте размах, дисперсию и стандартное отклонение (с точностью
до двух знаков после запятой) множества элементов, характеризующих значения респондентов психологического исследования «Заучивание слов»
(таблица 1 Приложения).
XII.
Рассчитайте размах, дисперсию и стандартное отклонение (с точностью
до двух знаков после запятой) множества элементов, характеризующих значения респондентов по субтесту «Числовые ряды» (таблица 1 Приложения).
XIII.
Рассчитайте размах, дисперсию и стандартное отклонение (с точностью
до двух знаков после запятой) множества элементов, характеризующих значения респондентов по субтесту «Аналогии» (таблица 1 Приложения).
XIV.
Рассчитайте размах, дисперсию и стандартное отклонение (с точностью
до двух знаков после запятой) множества элементов, характеризующих значения респондентов по субтесту «Геометрическое сложение» (таблица 1
Приложения).
XV.
Рассчитайте размах, дисперсию и стандартное отклонение (с точностью
до двух знаков после запятой) множества элементов, характеризующих значения респондентов по субтесту «Умозаключения» (таблица 1 Приложения).
24
XVI.
Определите средний показатель роста студентов вашей группы и соответствующее стандартное отклонение. Какова должна быть высота дверного
проема, чтобы быть уверенным, что сквозь него, не нагибаясь, смогут пройти
99% студентов группы?
РАЗДЕЛ 2
МЕТОДЫ СТАТИСТИЧЕСКОГО ВЫВОДА
Тема 4
ОБЩИЕ ПРИНЦИПЫ ПРОВЕРКИ
СТАТИСТИЧЕСКИХ ГИПОТЕЗ
4.1. Статистические гипотезы
Полученные в экспериментах выборочные данные всегда ограничены и
носят случайный характер. Именно поэтому для анализа таких результатов
используют математическую статистику.
В психологических исследованиях невозможно учесть все возможные
влияния на элементы выборки, поэтому оценка параметров генеральной совокупности, сделанная на основании выборочных данных, как указывает
О.Ю.Ермолаев, всегда будет сопровождаться погрешностью, и поэтому подобного рода оценки должны рассматриваться как предположительные, а не
как окончательные утверждения. Такие предположения о свойствах и параметрах генеральной совокупности получили название статистических гипотез.
При проверки статистических гипотез используются два понятия: нулевая гипотеза и альтернативная гипотеза. Нулевая гипотеза (обозначение
Ho) – это гипотеза о сходстве, альтернативная гипотеза (обозначение H1) –
это гипотеза о различии.
Пример. Психолог измерил показатели IQ у детей из полных и неполных семей.
Статистические гипотезы мы формулируем следующим образом: Ho – Статистически
значимые различия в показателях IQ у детей из полных и неполных семей отсутствуют.
25
H1 – Существуют статистически значимые различия в показателях IQ у детей из полных и неполных семей.
4.2. Статистическая значимость
Уровень статистической значимости результата исследования (pуровень) – это количественно выраженная вероятность, свидельствующая о
том, что результаты достоверны. Уровнем значимости называется вероятность ошибочного отклонения нулевой гипотезы.
В психологии считается, что низшим уровнем статистической значимости является уровень p=0,05; достаточным – p=0,01; высшим – p=0,001.
Соотношение показателей p-уровня и степени значимости можно представить в виде таблицы 4.1. (по А.Д.Наследову)
Таблица 4.1.
Соотношение значимости и p-уровня (по А.Д.Наследову)
Уровень
значимости
p > 0,1
p ≤ 0,1
p ≤ 0,05
p ≤ 0,01
p ≤ 0,001
Возможный статистический вывод
Статистически достоверные различия не обнаружены
Различия обнаружены на уровне статистической тенденции
Обнаружены статистически достоверные (значимые) различия
Различия обнаружены на высоком уровне статистической значимости
Различия обнаружены на высшем уровне статистической значимости
Используя методы математической статистики, исследователь получает
так называемую эмпирическую статистику (Кэмп. – коэффициент эмп.). Кэмп –
это условное название. Полученную эмпирическую статистику необходимо
сравнить с двумя критическими величинами, которые соответствуют рассмотренным выше уровням статистической значимости. Критические величины для используемых коэффициентов находятся в специальных таблицах.
Пример. Психолог рассчитал Кэмп и нашел по таблицам Ккр.
26
Для сравнения эмпирического и критический значений используемого критерия
нужно воспользоваться «осью значимости».
«Ось значимости» представляет собой прямую, на левом конце которой
располагается 0, хотя он, как правило, не отмечается на самой этой прямой, и
слева направо идет увеличение числового ряда. Левая зона называется зоной
незначимости, правая – зона значимости, а промежуточная зоной неопределенности. Границами всех трех зон являются
для p = 0,05 и p = 0,01, как
это показано ниже на рисунке 3.
Ось значимости
Зона неопределенности
Зона незначимости
0,05
0,01
Зона значимости
Рисунок 3
Пример. Для принятия статистического решения нужно на оси значимости отметить эмпирическое значение коэффициента.
Зона неопределенности
Зона незначимости
Кэмп.
0,05
Кэмп.
0,01
Зона значимости
Кэмп
27
Если Кэмп. попало в зону незначимости, то принимается Н0. Если Кэмп. попало в зону
неопределенности то принимается Н1 на 5% уровне статистической значимости. Если
Кэмп. попало в зону значимости, то принимается Н1 на 1% уровне статистической значимости.
4.3. Этапы принятия статистического решения
О.Ю.Ермолаев предлагает для принятия статистического решения выделять следующие этапы.
1) Формулировка нулевой и альтернативной гипотез.
2) Определение объема выборки N.
3) Выбор соответствующего уровня значимости или вероятности отклонения нулевой гипотезы. Это может быть величина меньшая или равная 0,05
(5% уровень значимости). В зависимости от важности исследования можно
выбрать уровень значимости в 0,1% или даже в 0,001%.
4) Выбор статистического метода, который зависит от типа решаемой
психологической задачи.
5) Вычисление соответствующего эмпирического значения по экспериментальным данным, согласно выбранному статистическому методу.
6) Нахождение по таблице для выбранного статистического метода критических значений, соответствующих уровню значимости для Р=0,05 и для
Р=0,01.
7) Построение оси значимости и нанесение на нее табличных критических
значений и эмпирического значения. Для этого целесообразно пользоваться
каждый раз приведенными выше рисунками.
8) Формулировка принятия решения.
4.4. Классификации психологических задач
Е.В.Сидоренко и О.Ю.Ермолаев предложили следующую классификацию задач и методов их решения (таблица 4.2.) [с.34]
28
Таблица 4.2.
Задачи
1.
Выявление различий
в уровне исследуемого
признака
Условия
a) Две выборки испытуемых
b) Три и больше выборок
испытуемых
Задачи
2.
Оценка сдвига значений исследуемого признака
Условия
a) Два замера на одной и
той же выборке испытуемых
b) Три и более замеров на
одной и той же выборке
испытуемых
3.
Выявление различий
в распределении признака
a) При сопоставлении эмпирического распределения с теоретическим
b) При сопоставлении двух
эмпирических распределений
4. Выявление степени
согласованности изменений
a) Двух признаков
Методы
Критерий Макнамары
Q критерий Розенбаума
U критерий Манна-Уитни
φ - критерий (угловое преобразование Фишера)
S критерий Джонкира
H критерий КрускалаУоллиса
Методы
T критерий Вилкоксона
G критерий знаков
φ критерий (угловое преобразование Фишера)
t –критерий Стьюдента
критерий Фридмана
L критерий тенденций Пейджа
t –критерий Стьюдента
χ2 критерий Пирсона
λ критерий Колмогорова Смирнова
t –критерий Стьюдента
χ2 критерий Пирсона
λ критерий Колмогорова Смирнова
φ критерий (угловое преобразование Фишера)
φ коэффициент корреляции
Пирсона
η корреляционное отношение Пирсона
τ коэффициент корреляции
Кендела
ρ коэффициент ранговой
корреляции Спирмена
29
Тема 5
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ ДЛЯ СВЯЗНЫХ ВЫБОРОК
Непараметрические критерии – это критерии, которые не базируются
на предположении о типе распределения генеральной совокупности и не используют параметры этой совокупности (среднее, дисперсию и стандартное
отклонение).
Связные выборки – это выборки, элементы которых находятся в какойто зависимости.
5.1. Критерий знаков G
Критерий знаков G позволяет установить, насколько однонаправлено
изменяются значения признака при повторном изменении связанной, однородной выборки.
При вычислении критерия знаков G рассчитываются «сдвиги». Сдвиг –
это величина разности между показателями выраженности какого-либо признака одного и того же участника «после» и «до» какого-либо воздействия на
признак. В результате получаем нулевые, положительные и отрицательные
сдвиги. Отрицательные сдвиги не рассматриваются.
Для решения вопроса об изменении признака вводятся понятия типичного и нетипичного сдвига.
Типичный сдвиг – это сумма сдвигов, получившая наибольшее количество значений (отрицательных или положительных).
Нетипичный сдвиг – это сумма сдвигов, получившая наименьшее количество значений (отрицательных или положительных) и обозначается как
Gэмп.
30
Пример. Психолог проводит коррекционно-развивающие занятия с первоклассниками, направленными на развитие произвольного внимания. Его задача – выяснить будет
ли эффективным вариант коррекционно-развивающей программы для развития произвольного внимания. Для решения этой задачи психолог измерил по методике «корректурная проба» количество ошибок, которые допускали ученики до и после занятий по программе.
№ п/п
1
2
3
4
5
6
7
До
24 12 42 30 40 55 50
После
22 12 41 31 32 44 50
СДВИГ -2
0
-1
1
-8
-11 0
Общее число нулевых сдвигов –2;
Общее число положительных сдвигов – 3;
Общее число отрицательных сдвигов – 10.
8
52
32
-20
9
50
32
-18
10
22
21
-1
11
33
34
2
12
78
56
-22
13
79
78
-1
14
25
23
-2
15
12
18
6
Gэмп. = 3, так это наименьшее количество значений.
Оценка статистической достоверности различий по критерию знаков G производится по таблице критических значений для данного критерия.
Количество типичных сдвигов (n=10) показывает для какого n нужно искать критические значения критерия.
Отметим все полученные значения на оси значимости.
Зона незначимости
0,05
Gэмп =3
1
0,01
0
Полученное эмпирическое значение критерия знаков G попало в зону незначимости, следовательно, принимается нулевая гипотеза об отсутствии различий. А это значит, что вариант коррекционно-развивающей программы психолога не оказывает существенного влияния на развитие произвольного внимания и его необходимо доработать.
5.2. Парный критерий T–Вилкоксона
31
Критерий Т-Вилкоксона основан на ранжировании абсолютных величин разности между двумя рядами выборочных значений в первом и втором
измерении. Для нахождения числового значения критерия Т необходимо
помнить о типичных и нетипичных сдвигах.
Пример. Психолог разработал программу тренинга, направленного на снижение
тревожности. Его задача – выяснить будет ли данный вариант тренинговой программы
эффективен для снижения тревожности. Используя методику Тейлора, психолог измерил
уровень тревожности до и после программы тренинга у 19 участников.
-4
6
4
19
6,5
10,5
13,5
12
6,5
*
0
-6
2
1
6
0
2
-2
1
6
-1
22
13,5
-22
1
-1
1
6,5
*
13 14 15 16 17 18 19
79 25 28 16 17 12 25
78 23 22 12 16 18 25
6,5
18
2
-1
16
-18
20 18 1
17
11 0
15
-20
-11
8
0
0
-8
1
2
6,5
1
0
1
8 9 10 11 12
52 50 22 33 78
32 32 21 34 56
6,5
5 6 7
40 55 50
32 44 50
-1
3 4
42 30
41 31
2
2
12
12
-2
Ранг
абс. в.
сдвига
Абс.
вел.
сдвигов
1
24
22
10,5
Сдвиг
№ п/п
До
После
*
Общая сумма нетипичных сдвигов – 3. В таблице в последней строке они отмечены звездочкой.
Для вычисления критерия Т Вилкоксона нужно сложить ранги нетипичных сдвигов.
Tэмп. = 6,5 + 6,5 + 13,5 = 26,5
По таблице критических значений находим критические значения критерия Т.
0,05
0,01
53
Зона значимости
38
Tэмп. = 26,5
32
Полученное эмпирическое значение критерия Т Вилкоксона попало в зону значимости, следовательно, принимается альтернативная гипотеза о наличии различий. А это
значит, что вариант тренинговой программы психолога оказывает влияние на снижение
уровня тревожности участников.
К непараметрическим критериям для связных выборок относятся еще
критерий Фридмана; L критерий Пейджа и M критерий Макнамары
[С.82-95]
Тема 6
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ ДЛЯ НЕСВЯЗНЫХ ВЫБОРОК
6.1. Критерий U Вилкоксона - Манна - Уитни
Примером несвязных выборок служат экспериментальная и контрольная группы в формирующем эксперименте, т.е. характерной чертой несвязных выборок является то, что в них обязательно входят разные испытуемые.
При вычислении критерия U Вилкоксона - Манна – Уитни важны не
числовые значения данных, а порядок их расположения.
Если бы нам пришлось сравнивать два множества элементов, которые
расположены по возрастанию числовых величин и мы получили бы такой
вид:
ххххххх ууууууууууу, то такое расположение является идеальным, а две
выборки значимо различались бы между собой.
Критерий U Вилкоксона - Манна – Уитни основан на подсчете нарушений в расположении чисел в упорядоченном экспериментальном ряду по
сравнению с идеальным рядом. Любое нарушение порядка идеального ряда
называется инверсией. Одним нарушением (одной инверсией) считают такое
расположение чисел, когда перед некоторым числом первого ряда, стоит
только одно число второго ряда. Если перед некоторым числом первого ряда
стоят два числа второго ряда – то возникают две инверсии и т.д.
Пример. Психологом были получены следующие результаты времени решения тестовых заданий по методике Ржичана в двух группах. В состав первой группы входили
33
только мальчики, а в состав второй группы – только девочки. Психолога интересует вопрос, различается ли время затраченное на решение задач мальчиками и девочками.
В исследовании принимали участие 9 мальчиков и 11 девочек.
Время, затраченное на решение задач мальчиками: 16; 9; 11; 24; 48; 62; 52; 31; 44.
Время, затраченное на решение задач девочками: 12; 15; 64; 36; 42; 33; 15; 29; 42;
15; 33.
Упорядочим полученные результаты по возрастанию в каждой группе.
(Х): 9 11 16 24 31 44 48 52 62
(У): 12 15 15 15 29 33 33 36 42 42 64
9
х
11 12 15 15
х
у
у
у
15 16 24 29 31
у
х
х
у
х
33 33
у
у
36
у
42 42
у
у
44 48
х
х
52 62
х
х
Внесем полученные результаты в таблицу.
№1
№2
Мальчики (Х)
Девочки (У)
9
11
12
15
15
15
16
24
29
31
33
33
36
42
42
44
48
52
62
64
Сумма инверсий
№3
Инверсии (Х/У)
0
0
4
4
5
10
10
10
10
53
№4
Инверсии (У/Х)
2
2
2
2
4
Uэмп. = min (U(Х/У); U(У/Х)) = 46
Находим по таблице критических значений Uкр для n1=9 и n2=11..
5
5
5
5
5
9
46
64
у
34
Зона незначимости
Uэмп.=46
0,05
0,01
27
18
Значение попало в зону незначимости, значит, принимается нулевая гипотеза об
отсутствии различий. А это означает, что пол не оказывает влияние на время решения
тестовых заданий.
6.2. Q критерий Розенбаума
Критерий Q Розенбаума основан на сравнении двух упорядоченных, но
не обязательно равных по численности рядов наблюдений.
Работа с критерием Розенбаума предполагает подсчет так называемых
«хвостов». Потому этот критерий имеет также название – «критерий хвостов».
При рассмотрении критерия U – Вилкоксона – Манна – Уитни было
введено понятие идеального ряда:
ххххххх
ууууууууууу
(*)
Так как в расположении (*) между элементами обоих рядов нет пересечений (одинаковых элементов), то между этими рядами будет статистически значимые различия.
В том случае, если в сравниваемых рядах будут равные элементы, их
следует размещать точно друг под другом. В этом случае два сравниваемых
ряда можно расположить друг под другом следующими двумя эквивалентными способами (**) и (***):
xxxxx xxxxxxxxxx S
T yyyyyyyyyy yyyyy
(**)
35
T
nnnnnnnnnnn nnnnnnnnnnn
zzzzzz zzzzzzzzzzzzzzzzz
S
(***)
Q эмп. = T+S
После подсчета «хвостов» следует обратиться к таблице критических
значений критерия Розенбаума для уровня статистической значимости p≤0,05
и p≤0,01 в соответствии с количеством испытуемых в сравниваемых выборках.
Пример. Используя тест Равена психолог измерил показатели интеллекта у двух
групп учащихся из двух школ, территориально расположенных в разных районах города.
Его интересует вопрос – будут ли обнаружены статистически значимые различия в показателях интеллекта, если в одной выборке 11 школьников, а в другой – 12.
T
76, 82, 82, 84, 88,
96,100, 104, 104, 120, 120, 120, 120, 126, 130, 134
96, 100, 102, 104, 110, 118, 120,
S
Для решения задачи данные показателей интеллекта упорядочили и расположили
одно множество под другим. В этом случае Т=5, а S=3. Значит Q эмп = 5+3=8
Критические значения для критерия Q находим по таблице для n1=11 и n2=12.
Соответствующая ось значимости имеет вид:
зона незначимости
зона значимости
0,05
7
0,01
8
9
36
Полученное значение попало в зону неопределенности, а это значит, что мы принимаем альтернативную гипотезу на 5% уровне статистической значимости.
Таким образом, значения показателей интеллекта у учащихся, обучающихся в разных школах различаются на 5% уровне статистической значимости.
6.3. H критерий Крускала – Уоллиса
Критерий H применяется для оценки различий по степени выраженности анализируемого признака одновременно между тремя, четырьмя и более
выборками. Он позволяет выявить степень изменения признака в выборках,
не указывая, однако, на направление этих изменений.
Критерий основан на том принципе, что чем меньше взаимопересечение выборок, тем выше уровень значимости Hэмп. . Следует подчеркнуть, что
в выборках может быть разное количество испытуемых, хотя в приведенных
ниже задачах приводится равное число испытуемых в выборках.
Работа с данными начинается с того, что все выборки условно объединяются по порядку встречающихся величин в одну выборку и значениям этой
объединенной выборки проставляются ранги. Затем полученные ранги проставляются исходным выборочным данным, и по каждой выборке отдельно
подсчитывается сумма рангов. Критерий построен на следующей идее — если различия между выборками незначимы, то и суммы рангов не будут существенно отличаться одна от другой и наоборот.
Формула для расчета критерия Hэмп
Где
N – общее число элементов в обобщенной выборке
– число членов в каждой отдельной выборке
37
– квадраты сумм рангов по каждой i-ой выборке.
Пример. Четыре группы испытуемых выполнили тест интеллектуальной лабильности Козловой в разных условиях. Задача в том, чтобы установить – зависит ли эффективность выполнения теста от условий. В каждой группе четыре испытуемых.
Количество ошибок по тесту дано в таблице.
№ испытуемых
1 группа
2 группа
3 группа
4 группа
п/п
1
19
19
8
5
2
10
23
13
11
3
13
13
18
13
4
14
12
8
16
суммы
1. Необходимо выстроить все значения по порядку и присвоить каждому значению ранг.
5
1
1
8
2
2,5
8
3
2,5
10
4
4
11
5
5
12
6
6
13
7
8,5
13
8
8,5
13
9
8,5
13
10
8,5
14
11
11
16
12
12
18
13
13
19
19
23
14
15
16
14,5 14,5 16
2. Расставим полученные ранги в исходной таблице в соответствии с распределением на группы.
№ испыту1 групранги 2 групранги
3 групранги
ранги
4 групемых п/п
па
па
па
па
19
19
8
5
1
14,5
14,5
2,5
1
10
23
13
11
2
4
16
8,5
5
13
13
18
13
3
8,5
8,5
13
8,5
14
12
8
16
4
11
6
2,5
12
суммы
38
45
26,5
26,5
3.
Проверим правильность ранжирования.
38+45+26,5+26,5=136
и
Результаты равны, значит ранжирование проведено верно.
4.
По исходной формуле
ческое значение критерия Н Крускала – Уолиса.
рассчитаем эмпири-
38
5. При определении критических значений критерия Н применительно к четырем и
более выборкам используют таблицу критических значений критерия хи-квадрат.
6. Число степеней свободы γ = 4 - 1 = 3
7.
Строим ось значимости
Зона незначимости
2,61
Зона значимости
0,05
0,01
7,81
11,34
8. Полученное эмпирическое значение оказалось существенно меньше критического
значения для 5% уровня. Следовательно, принимаем нулевую гипотезу. А это значит, что
различий по показателю интеллектуальной лабильности по группам нет, т.е. условия не
оказывают влияние на прохождение испытания.
К непараметрическим критериям для несвязных выборок относится
еще, S критерий тенденций Джонкира.
Тема 7
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ РАЗЛИЧИЙ
7.1.
t-критерий Стьюдента
1. Случай несвязных выборок
Критерий t Стьюдента направлен на оценку различий величин средних
двух выборок Х и Y, которые распределены по нормальному закону.
Критерий может быть использован для выборок не равных по численности.
Формула (6) позволяет рассчитать t-критерий Стьюдента для равных по
численности выборок, т.е. n1 = n2 = n
39
=
(6)
В случае неравночисленных выборок, т.е. когда n1 ≠ n2, то рассчитывать t-критерий Стьюдента нужно по формуле (7).
=
(7)
Критические значения t-критерий Стьюдента находим по таблице.
2. Случай связных выборок
В случае связных выборок с равным числом измерений в каждой можно использовать формулу (8).
(8)
В свою очередь
рассчитывается по формуле (9).
(9)
7.2.
F-критерий Фишера
Критерий Фишера позволяет сравнивать величины выборочных дисперсий двух рядов наблюдений. Критерий Фишера рассчитывается по формуле (10). При вычислении критерия Фишера нужно помнить о том, что величина числителя должна всегда быть больше величины знаменателя.
40
Где
Пример. Психолог провел тестирование учащихся 4-х классов по методике
ТУРМШ. Психолог хочет проверить различаются средние величины выборок и есть ли
различия в степени однородности показателей умственного развития между классами.
Полученные результаты представлены в таблице.
№ п/п
1
2
3
4
5
суммы
средние
4-А
90
29
39
79
88
№ п/п
6
7
8
9
10
4-Б
41
49
56
64
72
4-А
53
34
40
75
79
606
60,6
4-Б
65
63
87
77
62
636
63,6
Решение представим в табличной форме.
1. Используя t-критерий Стьюдента сравним значения средних величин показателей
умственного развития учащихся 4-х классов.
№
1
2
Классы
4-А
(хi)
90
29
4-Б
(yi)
41
49
Отклонение
от среднего
90-60,6=29,4
29-60,6=-31,6
41-63,6=-22,6
49-63,6=-14,6
Квадраты отклонений
864,36
998,56
510,76
213,16
41
3
4
5
6
7
8
9
10
Сумма
среднее
39
79
88
53
34
40
75
79
606
60,6
56
64
72
65
63
87
77
62
636
63,6
39-60,6=-24,6
79-60,6=18,4
88-60,6=27,4
53-60,6=-7,6
34-60,6=-26,6
40-60,6=-20,6
75-60,6=14,4
79-60,6=18,4
56-63,6=-7,6
64-63,6=0,4
72-63,6=8,4
65-63,6=1,4
63-63,6=-0,6
87-63,6=23,4
77-63,6=13,4
62-63,6=-1,6
605,16
338,56
750,76
57,76
707,56
424,36
207,36
338,56
5293
57,76
0,16
70,56
1,96
0,36
547,56
179,56
2,56
1584,4
= 8,74
2. Число степеней свободы к=10+10-2=18
По таблице критических значений для данного числа степеней свободы находим
Зона незначимости
Зона значимости
3,43
2,1
3.
Полученное значение
2,88
3,92
попало в зону значимости на уровне
. Из этого
следует, что величины средних двух выборок значимо различаются. В терминах статистических гипотез вывод звучит следующим образом: нулевая гипотеза (об отсутствии
различий) отклоняется, а принимается альтернативная гипотеза (о наличии различий).
Таким образом, средние величины показателей умственного развития по методике
ТУРМШ у учащихся 4-х классов значимо различаются.
4. Используя F критерий Фишера, проверим, есть ли различия в степени однородности показателей умственного развития между классами.
42
По таблице критических значений для F критерия при степенях свободы к=10-1=9 находим Fкр.
Строим ось значимости:
Зона незначимости
Зона неопределенности
0,05
0,01
3,18
3,34
Зона значимости
5,35
Полученная величина F критерия Фишера попала в зону неопределенности, а это
значит, что на уровне 5% мы принимаем альтернативную гипотезу о наличии различий.
Психолог может утверждать, что по степени однородности такого показателя, как
умственное развитие, имеется различие между выборками из двух классов.
Тема 8
ИССЛЕДОВАНИЕ ВЗАИМОСВЯЗИ ПРИЗНАКОВ
43
8.1.
Корреляция
Корреляция – это согласованность изменения признаков. Корреляции
бывают линейные и нелинейные. Линейную корреляцию можно количественно измерить. Степень связи между признаками выражается величиной,
называющейся коэффициентом корреляции. Значения коэффициентов корреляции могут находиться в интервале [-1; +1].
По знаку коэффициент корреляции может быть положительным и отрицательным. Положительный коэффициент корреляции свидетельствует о
прямой зависимости, а отрицательный коэффициент корреляции – об обратной.
Коэффициенты корреляции характеризуются силой и значимостью.
Таблица 8.1.
Классификация коэффициентов корреляции по силе
Сильная
Средняя
Умеренная
Слабая
Очень слабая
r >0,70
0, 50 < r < 0,69
0,30 < r < 0,49
0,20< r < 0,29
r < 0,19
Таблица 8.2.
Классификация коэффициентов корреляции по значимости
Высокозначимая корреляция
Статистически значимая корреляция
Незначимая корреляция
8.2.
r соответствует уровню высокой статистической значимости p≤0,01
r соответствует уровню статистической
значимости p≤0,05
r не достигает уровня статистической
значимости p>0,1
Коэффициент линейной корреляции Пирсона
44
Формула коэффициента линейной корреляции Пирсона выглядит следующим образом (10):
(10)
Пример. Вычислим коэффициент корреляции между показателями роста (в см.) и
веса (в кг.) у представителей группы студентов.
Сформулирует нулевую и альтернативную гипотезы.
Н0 – корреляция между показателями роста и веса значимо не отличается от нуля (является случайной).
Н1 – корреляция между показателями роста и веса значимо отличается от нуля
(является неслучайной).
Решение представить в виде таблицы.
№
п/п
xi
1
159
2
160
3
172
4
160
5
171
6
163
7
164
8
166
9
175
10
170
n=10 Mx= 166
xi-Mx
-7
-6
6
-6
5
-3
-2
0
9
4
(xi-Mx)2
49
36
36
36
25
9
4
0
81
16
292
yi
47
49
65
57
68
50
59
68
63
54
My= 58
yi-My
-11
-9
7
-1
10
-8
1
10
5
-4
(yi-My)2
121
81
49
1
100
64
1
100
25
16
558
(xi-Mx) (yi-My)
77
54
42
6
50
24
-2
0
45
-16
280
Вывод: корреляционную связь между показателями веса и роста можно оценить
как сильную положительную.
8.3.
Ранговая корреляция
45
Вычисление ранговой корреляции помогает определить силу и направление корреляционной связи между двумя признаками, измеренными в ранговой шкале.
Вычисление ранговой корреляции по Спирмену
Коэффициент ранговой корреляции Спирмена подсчитывается по формуле (11):
(11)
Пример. Психологу необходимо рассчитать величину профессиональной самооценки методом ранговой корреляции Спирмена. Для этого студент дважды проранжировал качества: 1) в отношении образа «Я»; 2) в отношении образа «квалифицированный
психолог». Результаты представлены в таблице.
N
1
2
7
3
9
4
5
10
8
6
характеристики
Самостоятельность
Целеустремленность
Организованность
Ответственность
Инициативность
Любознательность
Эмпатия
Креативность
Рефлексивность
Решительность
Разряд
N1
3
1
10
9
8
7
6
5
4
2
d
2
-1
3
6
-1
3
1
-5
-4
-4
Сумма
d2
4
1
9
36
1
9
1
25
16
16
118
Вывод: корреляция между представлениями респондента в отношении образа «Я»
и образа «квалифицированного психолога» не случайны, а имеют сильную корреляционную
зависимость.
46
ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ
К РАЗДЕЛУ 2
I. Требуется сравнить уровень интеллекта мужчин и женщин. Сформулируйте нулевую и альтернативную гипотезы.
II. Требуется изучить влияние решения дополнительных тренинговых задач на развитие у детей 6-11 лет психических познавательных способностей.
Сформулируйте нулевую и альтернативную гипотезы.
III. Требуется сравнить показатели по тесту Равена у учащихся 5-х классов.
Сформулируйте нулевую и альтернативную гипотезы.
IV.
Приведите примеры связных и несвязных выборок.
V. Составьте диаграмму корреляционной зависимости между показателями веса и роста в группе студентов. Объем выборки должен быть не менее 15
человек. К диаграмме приложите таблицу значений.
VI. Составьте диаграмму корреляционной зависимости показателей субтестов «исключение изображений» и «аналогии» (таблица 1 Приложения) для
первых 12 человек.
47
VII. В группе учащихся (15 человек) исследовали силу связи между уровнем интеллекта и средними показателями школьной успеваемости. Выяснилось, что коэффициент Rxy = 0,65 при p=0,04. Как можно проинтерпретировать полученный результат.
VIII. На выборке из 7 человек было проведено сравнительное исследование
уровня интеллектуальной ригидности и уровня интеллекта. Данные представлены в таблице.
Вычислите коэффициент линейной корреляции и определите уровень
его статистической значимости. Проинтерпретируйте результаты.
Определите силу корреляционной связи и значимость полученного коэффициента (Е.В.Сидоренко).
Показатели интеллектуальной ригидности
22
28
39
33
31
34
15
Уровень интеллекта
120
110
112
115
118
104
116
IX. Проведите корреляционный анализ показателей субтестов «Числовые
ряды» и «Умозаключения» (таблица 1 Приложения).
X. Двум студентам было предложено проранжировать свои терминальные
ценности (по методике ценностных ориентаций Рокича). Насколько у данных
студентов совпадают цели-ценности?
№ п/п
1
2
3
4
5
Список ценностей
студента «А»
2
14
5
7
13
Список ценностей
студента «Б»
8
18
12
4
14
d
d2
48
6
7
8
9
10
1
12
13
14
15
16
17
18
1
4
6
16
15
12
17
11
8
3
18
10
9
1
6
5
17
11
10
16
3
9
3
15
8
7
Сумма
XI. Переведите показатели субтестов «Геометрическое сложение» и «Заучивание слов» (таблица 1 Приложения) в ранговые, вычислите коэффициент
ранговой корреляции Спирмена и его достоверность.
XII. Было проведено изучение предпочтений 38 студентов в отношении 4-х
напитков. Данные опроса были сведены в таблицу. Можно ли сказать, что
эти напитки одинаково предпочитаемы?
Pepsi cola
10
Coca cola
14
Sprite
6
Seven Up
8
XIII. Был проведен социологический опрос старшеклассников. Им было
предложено ответить, какое из трех возможных направлений обучения (математические, естественнонаучное, гуманитарное) они предпочтут в дальнейшем. В опросе принимали участие 34 девушки и 31 юноша. Результаты
опроса представлены в таблице. Можно ли утверждать, что юноши больше
предпочитают математическое направление, а девушки – гуманитарное?
Юноши
Девушки
Математика
18
10
Естественные науки
10
9
Гуманитарные науки
3
15
49
XIV. Психолог проводит групповой тренинг (в группе 15 человек). Его задача – выяснить будет ли эффективен данный конкретный вариант тренинга
для снижения уровня тревожности участников. Уровень тревожности психолог дважды (до и после тренинга) измеряет по методике Тейлора. Полученные результаты измерений представлены в таблице (Е.В.Сидоренко).
№ п/п 1
До
30
После 28
2
24
26
3
36
35
4
34
36
5
22
22
6
22
21
7
45
34
8
56
46
9
43
33
10
19
23
11
16
16
12
23
23
13
25
24
14
12
14
15
67
56
XV. Шести школьникам предъявляют тест Равена. Фиксируется время решения каждого задания. Выясняется вопрос – будут ли найдены статистически значимые различия между временем решения первых трех заданий теста?
Результаты представлены в таблице (О.Ю.Ермолаев)
№ испытуемых
1.
2.
3.
4.
5.
6.
Время решения пер- Время решения втового задания теста в рого задания теста в
сек.
сек.
8
3
4
15
6
23
3
6
7
12
15
24
Время решения третьего задания теста в
сек.
5
12
15
6
3
12
XVI. В выборке курсантов военного училища (юноши в возрасте от 18 до 20
лет) измерялась способность к удержанию физического волевого усилия на
динамометре. Сначала у испытуемых измерялась максимальная мышечная
сила каждой из рук, а на следующий день им предлагалось выдерживать на
динамометре с подвижной стрелкой мышечное усилие, равное ½ максимальной мышечной силе данной руки. Почувствовав усталость, испытуемый должен был сообщать об этом экспериментатору, но не прекращать опыт, преодолевая усталость и неприятные ощущения – «бороться пока воля не иссякнет». Опыт проводился дважды; вначале с обычной инструкцией, а затем после того как испытуемый заполнял опросник самооценки волевых качеств по
методике А.Ц.Пуни, ему предлагалось представить себе, что он уже добился
идеала в развитии волевых качеств, и продемонстрировать соответствующее
идеалу волевое усилие. Экспериментатор проверял гипотезу о том, что обра-
50
щение к идеалу способствует возрастанию волевого усилия. Данные представлены в таблице (Е.В.Сидоренко).
Код имени испытуемого
Длительность
до
удержания
усилия на динамометре до
и после измерения волевых после
качеств и обращения к
идеалу
1
Г.
64
2
В.
77
3
А.
74
4
Р.
95
5
И.
105
6
М.
83
7
Т.
73
8
Ф.
75
9
С.
101
10
П.
97
11
З.
78
25
50
77
76
67
75
77
71
63
122
60
XVII. Психолог провел исследование интеллектуальной настойчивости. Респонденты решали три анаграммы. Время решения анаграмм представлено в
таблице. Необходимо проверить, достоверны ли различия во времени решения испытуемыми анаграмм (Е.В.Сидоренко).
№ испытуемого
1
2
3
4
5
Анаграмма 1
5
7
2
2
35
Показатели времени решения анаграмм (сек.)
Анаграмма 2
Анаграмма 3
235
7
604
20
93
5
171
8
141
7
XVIII. Г.А.Бадасова изучала отношение родителей к наказаниям, которые совершают по отношению к их детям разные люди. В таблице представлены
оценки степени согласия с утверждениями о допустимости телесных наказаний до предъявления видеозаписи в экспериментальной группе. Можно ли
говорить о достоверной тенденции в оценках? (Е.В.Сидоренко)
Испытуемые
1
Условие 1:
"Я сам наказываю"
Условие 2:
Условие 3:
"Бабушка наказы- "Учительница
вает"
зывает"
4
2
1
нака-
51
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Суммы
1
5
4
3
4
3
5
6
2
6
5
7
5
5
6
71
1
4
3
3
5
3
5
5
2
3
3
5
5
5
6
60
1
4
2
2
1
1
3
3
2
2
4
4
2
4
4
40
XIX. Двенадцать участников комплексной программы тренинга партнерского общения, продолжавшегося 7 дней, дважды оценивали у себя уровень владения тремя важнейшими коммуникативными навыками. Первое измерение
производилось в первый день тренинга, второе - в последний. Участники
должны были также наметить для себя реально достижимый, с их точки зрения, индивидуальный идеал в развитии каждого из навыков. Все измерения
производились по 10-балльной шкале. Данные представлены в таблице
(Е.В.Сидоренко).
Оценки реального и идеального уровней развития коммуникативных
навыков (п=12)
№
п/
п
1
2
3
4
5
6
7
8
9
Активное
слушание
р
и
6
9
3
5
4
6
4
6
6
9
6
8
3
8
6
9
6
8
1 измерение
Снижение
эмоционального напряжения
р
5
1
4
4
4
5
5
5
5
и
8
3
6
5
9
8
10
8
9
Аргументация
р
5
4
5
5
4
3
2
3
5
и
8
5
8
7
8
6
6
7
9
Активное
слушание
р
и
7
10
5
7
8
10
6
7
4
10
8
9
7
8
5
8
7
8
2 измерение
Снижение
эмоционального напряжения
р
6
4
7
5
5
7
8
7
6
и
10
6
8
7
10
9
10
10
9
Аргументация
р
7
5
6
5
5
6
5
5
5
и
9
7
8
7
10
8
7
9
9
52
10
11
12
5
6
6
8
8
8
6
6
3
9
10
10
5
3
4
8
9
7
7
5
7
10
10
9
7
4
6
10
9
8
6
3
5
10
9
8
Вопросы:
1) Ощущаются ли участниками достоверные сдвиги в уровне владения
каждым из трех навыков после тренинга?
2) Произошли ли по трем группам навыков разные сдвиги, или эти сдвиги
для разных навыков примерно одинаковы?
3) Уменьшается ли расхождение между "идеальным" и реальным уровнями владения навыками после тренинга?
XX. Психолога интересует вопрос, различаются ли две группы студентов по
успешности решения новой экспериментальной задачи. В первой группе из
20 человек с нею справились 12 человек, а во второй выборке из 25 человек 10.
XXI. В выборке здоровых лиц мужского пола, студентов технических и военно-технических вузов в возрасте 19-22 лет, проводился тест Люшера в 8цветном варианте. Установлено, что желтый цвет предпочитается испытуемыми чаще, чем отвергается. Можно ли утверждать, что распределение желтого цвета 8-и позициям у здоровых испытуемых отличается от равномерного распределения? (Е.В.Сидоренко)
Разряды
Эмпирические
частоты
1
24
2
25
Позиция желтого цвета
3
4
5
6
13
8
15
10
Сумма
7
9
8
8
102
XXII. В исследовании моделирующем деятельность авиадиспетчера, группа
испытуемых (студентов) проходила подготовку перед началом работы на
тренажере. Испытуемые должны были решать задачи по выбору оптимального типа взлетно-посадочной полосы для заданного типа самолета. Связано ли
количество ошибок, допущенных испытуемыми в тренировочной сессии, с
показателями вербального и невербального интеллекта, измеренными по методике Векслера? (Е.В.Сидоренко)
Испытуемый
Количество ошибок
Показатель вербального интеллекта
Показатель невербального интеллекта
53
1
2
3
4
5
6
7
8
9
10
29
54
13
8
14
26
9
20
2
17
131
132
121
127
136
124
134
136
132
136
106
90
95
116
127
107
104
102
111
99
XXIII. М.Э.Рахова изучала отношение студентов к страхам, выделенным
Дж.Вольпе. Ее интересует вопрос, различаются ли значимо упорядоченные
перечни видов страхов в американской и отечественной выборках? Результаты ранжирования видов страха респондентами представлены в таблице.
(Е.В.Сидоренко)
Виды страха
1. Страх публичного выступления
2. Страх полета
3. Страх совершить ошибку
4. Страх неудачи
5. Страх неодобрения
6. Страх отвержения
7. Страх злых людей
8. Страх одиночества
9. Страх крови
10. Страх открытых ран
11. Страх дантиста
12. Страх уколов
13. Страх прохождения тестов
14. Страх полиции (милиции)
15. Страх высоты
16. Страх собак
17. Страх пауков
18. Страх искалеченных людей
19. Страх больниц
20. Страх темноты
Ранг в американской выборке
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Ранг в российской
выборке
7
12
10
6
9
2
5
1
16
13
3
19
20
17
4
11
18
8
15
14
XXIV. В исследовании С.К.Скаковского изучалась проблема психологических
барьеров при обращении в службу знакомств у мужчин и женщин. В эксперименте приняли участие 17 мужчин и 23 женщины в возрасте от 17 до 45
54
лет. Испытуемые должны были отметить на отрезке точку, соответствующую
интенсивности внутреннего сопротивления, которое им пришлось преодолеть, чтобы обратиться в службу знакомств. Длина отрезка, отражающая
максимально возможное сопротивление, составляла 100 мм. В таблице представлены показатели интенсивности сопротивления, выраженные в миллиметрах. Можно ли утверждать, что мужчинам приходится преодолевать
субъективно более мощное сопротивление? (Е.В.Сидоренко)
№ п/п
Показатель
внут. сопр.
№ п/п
Показатель
внут. сопр.
№ п/п
Показатель
внут. сопр.
№ п/п
Показатель
внут. сопр.
1.
81
2.
80
3.
73
4.
72
5.
72
6.
69
7.
69
Мужчины
8.
9.
65
65
10.
62
11.
60
12.
54
13.
54
14.
43
15.
0
16.
26
17.
26
1
70
2
66
3
66
4
63
5
63
6
61
7
60
8
54
9
47
10
43
14
38
15
38
16
35
17
30
18
27
19
25
20
23
21
17
22
10
23
9
Женщины
11
12
13
41
40
39
XXV. Выполните ранжирование представленных качеств в отношении эталонного профиля лидера и индивидуального профиля. Рассчитайте коэффициент ранговой корреляции Спирмена.
Наименование качеств
1. Ответственность
2. Порядочность
3. Умение общаться с людьми
4. Выдержка и самообладание
5. Общий уровень культуры
6. Энергия, активность
7. Логика
8. Самокритичность
9. Самостоятельность
10. Личностная зрелость
11. Целеустремленность
Ранг качества в эталонном профиле
лидера
Ранг качества в
индивидуальном
профиле
55
12. Обучаемость
13. Гуманизм
14. Терпимость к чужому мнению
15. Стойкость
16. Гибкость поведения
17. Способность производить благоприятное впечатление
18. Способность к творчеству нового
РАЗДЕЛ 3
МЕТОДЫ МНОГОМЕРНОГО СТАТИСТИЧЕСКОГО АНАЛИЗА
Тема 9
Дисперсионный анализ
Дисперсионный анализ – это анализ изменчивости признака под влиянием какого-либо фактора (или совокупности факторов). Метод основан на
разложении общей дисперсии (вариативности) на составляющие компоненты, сравнивая которые можно определить долю общей вариации изучаемого
признака, обусловленную действием на него как регулируемых, так и неучтенных в опыте факторов.
В основе дисперсионного анализа лежит предположение, что одни переменные могут рассматриваться как причины, а другие как следствия. При
этом в психологических исследованиях именно переменные, рассматриваемые как причины, считаются факторами (независимыми переменными), а
вторые переменные, рассматриваемые как следствия, – результативными
признаками (зависимыми переменными). Независимые переменные называют иногда регулируемыми факторами именно потому, что в эксперименте
психолог имеет возможность варьировать ими и анализировать получающийся результат.
56
Нулевая гипотеза сводится к предположению о равенстве межгрупповых средних и дисперсий (то есть считается, что никакого систематического
действия факторов на результативный признак нет, наблюдаемые различия в
групповых средних являются случайными).
Проведение дисперсионного анализа реализовано в программах
Statistica (только однофакторный вариант), SPSS и последних версиях Excel.
Вычисления по методу однофакторного дисперсионного анализа в ручную
достаточно трудоемко и требует пристального внимания, во избежание возможных ошибок.
Тема 10
Кластерный анализ
Кластерный (таксономический) анализ используется для упорядочивания объектов и объединения их в однородные разряды на основе
попарного сравнения этих объектов по предварительно определенным и измеренным критериям. В результате исходная выборка разделяется на группы
схожих между собой объектов, называемых кластерами. Кластер — это группа объектов, характеризующихся повышенной плотностью (сгущенность
внутри разряда) и дисперсией.
Однородность объектов определяется по расстоянию p(x1, x2). Объекты
считаются однородными, если p(x1, x2) < pпредельного. Расстояние р вычисляется
по формуле:
Результаты процедуры представляют в виде дендрограммы — древовидного графика.
Пример. На рисунке представлена дендограмма.
57
А.Д.Наследов3 выделяет ряд задач, при решении которых кластерный
анализ является более эффективным, чем другие многомерные методы.
1. Разбиение совокупности испытуемых на группы по измеренным признакам с целью дальнейшей проверки причин межгрупповых различий по
внешним критериям, например, проверка гипотез о том, проявляются ли типологические различия между испытуемыми по измеренным признакам.
2. Применение кластерного анализа как значительно более простого и
наглядного аналога факторного анализа, когда ставится только задача группировки признаков на основе их корреляции.
3. Классификация объектов на основе непосредственных оценок различий
между ними (например, исследование социальной структуры коллектива по
данным социометрии – по выполненным межличностным предпочтениям).
Несмотря на различие целей проведения кластерного анализа,
А.Д.Наследов выделяет общую последовательность в применении кластерного анализа, как ряд относительно самостоятельных шагов, играющих существенную роль в прикладном исследовании.
1. Отбор объектов для кластеризации. Объектами могут быть, в зависимости от цели исследования: а) испытуемые; б) объекты, которые оцениваются испытуемыми; в) признаки, измеренные на выборке испытуемых.
3
Наследов, А.Д. Математические методы психологического исследования. Анализ и интерпретация данных.
Учебное пособие. /А.Д.Наследов. – СПб.: Речь, 2004. – 392 с. – С.332.
58
2. Определение множества переменных, по которым будут различаться
объекты кластеризации. Для испытуемых – это набор измеренных признаков,
для оцениваемых объектов – субъекты оценки, для признаков – испытуемые.
Если в качестве исходных данных предполагается использовать результаты
попарного сравнения объектов, необходимо четко определить критерии этого
сравнения испытуемыми (экспертами).
3. Определение меры различия между объектами кластеризации. Это первая проблема, которая является специфичной для методов анализа различий:
многомерного шкалирования и кластерного анализа.
4. Выбор и применение метода классификации для создания групп сходных объектов. Это вторая и центральная проблема кластерного анализа. Ее
весомость связана с тем, что разные методы кластеризации порождают разные группировки для одних и тех же данных.
5. Проверка достоверности разбиения на классы.
Последний этап не всегда необходим.
Пример. В данном примере описано изучение мотивационной сферы респондентов
методом семантического дифференциала. Для анализа полученных результатов использован кластерный анализ. Исследование проведено во ВГИПУ, в нем приняли участие
студенты психологи 3-4-5 курсов очной формы обучения.
Метод семантического дифференциала, разработанный Ч.Осгудом, предназначен
для измерения количественных характеристик эмоционального отношения испытуемого
к объектам, выраженным в форме понятий.
Для изучения особенностей мотивационной сферы респондентов и исходя из задач
психологического исследования было обозначено двадцать пять понятий: мое будущее,
мое увлечение, достижение успеха, мое прошлое, неприятности, неудача, мое настоящее,
Я, моя работа, моя учеба, угроза, признание окружающих, общение с людьми, мое свободное время, материальное благополучие, моя профессия, выполнение обязанностей, моя
карьера, моя зарплата, творчество, рефлексия (самоанализ), практический психолог,
профессиональное становление, мои друзья, болезнь.
При подготовке стимульного материала в состав объектов были включены понятия, смысл которых отражает в сознании респондентов, их отношение к получаемой
профессии «психолог» (понятия-маркеры). Это понятия: моя профессия, моя работа и
практический психолог. Кроме того, выделены понятия, характеризующие временную
перспективу: мое прошлое, мое настоящее и мое будущее. Все эти понятия выступают в
роли ориентиров в семантическом пространстве, по отношению к которым респонденты определяли позиции остальных понятий.
Результаты, полученные в процессе изучения особенностей мотивационной сферы
респондентов, позволили охарактеризовать семантическое пространство, измерить семантические расстояния между обозначенными понятиями стимульного материала, выделить и проанализировать объединения понятий (кластеры).
59
На рисунках 1-2 представлены варианты дендрограмм, анализируя которые можно сделать следующие выводы:
 Рисунок 1. Понятие- маркер «практический психолог» входит в кластер «моя
профессия – профессиональное становление».
 Рисунок 2. Понятие- маркер «практический психолог» входит в кластер «моя карьера».
Анализ дендрограмм показал, какие понятия попали в один кластер с понятиямимаркерами, т.е. какие понятия испытуемые идентифицируют с ними. В таблице представлены сводные результаты кластерного анализа семантического пространства студентов-психологов. Обращает на себя внимание тот факт, что понятие «практический
психолог» не идентифицируется в сознании респондентов с понятиями «мое будущее» и
«Я». Только у 13,9% респондентов понятие «практический психолог» идентифицируется
с понятиями «моя работа» и «моя профессия», а у 37,2% респондентов рассматриваемые понятия-маркеры не имеют никаких идентификационных связей.
Рисунок 1
60
Рисунок 2
Таблица
Сводные результаты кластерного анализа семантического пространства
студентов-психологов (в %)
(понятия-маркеры: моя работа, моя профессия, практический психолог)
№
п/п
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
Понятия
Мое будущее
Мое увлечение
Достижение успеха
Мое прошлое
Неприятности
Неудача
Мое настоящее
Я
Моя работа
Моя учеба
Угроза
Признание окружающих
Общение с людьми
Мое свободное время
Материальное благополучие
Моя профессия
Выполнение обязанностей
Моя карьера
Моя зарплата
Моя работа
Моя профессия
2,3
2,3
6,98
11,6
4,6
2,3
4,6
2,3
4,6
2,3
6,98
4,6
9,3
4,6
6,98
11,6
9,3
4,6
4,6
4,6
9,3
4,6
6,98
4,6
6,98
4,6
Практический
психолог
6,98
4,6
2,3
6,98
6,98
2,3
6,98
2,3
6,98
9,3
4,6
2,3
11,6
61
20
21
22
23
24
25
Творчество
Рефлексия
Практический психолог
Профессиональное становление
Мои друзья
Болезнь
Связь не обнаружена
9,3
2,3
4,6
6,98
4,6
4,6
4,6
9,3
9,3
4,6
11,6
4,6
11,6
9,3
16,3
18,6
Понятие «практический психолог» идентифицируется с видом деятельности (моя
работа, моя учеба, общение с людьми, мое свободное время, моя профессия, рефлексия) у
32,5% респондентов, с потребностями и ценностями (мое увлечение, достижение успеха,
материальное благополучие, выполнение обязанностей, моя карьера, моя зарплата, творчество) у 48,7% респондентов и с этапами жизненного пути (мое прошлое, мое настоящее, профессиональное становление) у 27,8% респондентов.
Таким образом, изучение особенностей мотивационной сферы студентовпсихологов методом семантического дифференциала (модификация И.Л.Соломина), а
именно изучение скрытой мотивации, позволило нам установить тот факт, что у большинства студентов (86,1%), обучающихся по направлению «психология», понятиемаркер «практический психолог» не идентифицируется с понятиями «моя работа» или
«моя профессия», 95,7% респондентов не соотносят данное понятие с прошлым или
настоящим, и никто – с будущим.
Тема 11
Факторный анализ
Возникновение и развитие факторного анализа тесно связано с измерениями в психологии. Длительное время факторный анализ и воспринимался
как математическая модель в психологической теории интеллекта. Лишь
начиная с 50-х годов XX столетия, одновременно с разработкой математического обоснования факторного анализа, этот метод становится общенаучным.
К настоящему времени факторный анализ является неотъемлемой частью
любой серьезной статистической компьютерной программы и входит в основной инструментарий всех наук, имеющих дело с многопараметрическим
описанием изучаемых объектов, таких, как социология, экономика, биология,
медицина и другие.
Факторный анализ — статистический метод, который используется
при обработке больших массивов экспериментальных данных. Задачами факторного анализа являются: сокращение числа переменных (редукция данных)
и определение структуры взаимосвязей между переменными, т.е. классификация переменных, поэтому факторный анализ используется как метод сокращения данных или как метод структурной классификации.
62
Важное отличие факторного анализа от всех описанных выше методов
заключается в том, что его нельзя применять для обработки первичных, или,
как говорят, «сырых», экспериментальных данных, т.е. полученных непосредственно при обследовании испытуемых. Материалом для факторного
анализа служат корреляционные связи, а точнее — коэффициенты корреляции Пирсона, которые вычисляются между переменными (т.е. психологическими признаками), включенными в обследование. Иными словами, факторному анализу подвергают корреляционные матрицы, или, как их иначе
называют, матрицы интеркорреляций. Наименования столбцов и строк в этих
матрицах одинаковы, так как они представляют собой перечень переменных,
включенных в анализ. По этой причине матрицы интеркорреляций всегда
квадратные, т.е. число строк в них равно числу столбцов, и симметричные,
т.е. на симметричных местах относительно главной диагонали стоят одни и
те же коэффициенты корреляции.
Главное понятие факторного анализа — фактор. Это искусственный статистический показатель, возникающий в результате специальных преобразований таблицы коэффициентов корреляции между изучаемыми психологическими признаками, или матрицы интеркорреляций. Процедура извлечения
факторов из матрицы интеркорреляций называется факторизацией матрицы,
В результате факторизации из корреляционной матрицы может быть извлечено разное количество факторов вплоть до числа, равного количеству исходных переменных. Однако факторы, выделяемые в результате факторизации, как правило, неравноценны по своему значению. Формальным критерием качества проведения процедуры факторного анализа является процент
объединенной дисперсии исходных признаков.
В истории психологии факторный анализ связан с решением ряда теоретических задач в области исследования интеллекта. Ф.Гальтон, сформулировавший основные идеи метода, пытался при помощи его доказать, что высокий уровень мыслительных способностей является полностью врожденным. Ч. Спирмен, разработавший математическое обоснование данного метода, на основе анализа корреляций между результатами различных тестов
выдвинул идею единого генерального фактора, лежащего в основе успешности выполнения любых тестов, связанных с измерением интеллектуальных
свойств.
В настоящее время факторный анализ широко используется как для
решения исследовательских задач, так и при конструировании психодиагностических методик. Факторный анализ является важнейшим инструментом
63
для математического моделирования. Математическое моделирование
— это процедура описания различных процессов (экономических, биологических, социально-психологических) посредством математического аппарата.
Указанная процедура включает в себя выделение всех факторов процесса,
определение доли вклада каждого из факторов, выявление закономерностей
их функционирования и вероятностное предсказание протекания всего процесса в дальнейшем.
РАЗДЕЛ 4. ЗАДАНИЯ ДЛЯ САМОКОНТРОЛЯ
I.
Тестовые задания для самоконтроля
Распределение тестовых заданий по разделам учебного курса
№
Наименование раздела
раздела
I
Теоретические основы измерения и количественного описания данных
II
Методы статистического вывода
III
Методы многомерного статистического анализа
Количество
заданий
15
Номера заданий
10
5
16-25
26-30
1-15
Укажите правильный ответ
1) Какие эффекты сбора информации для анализа не влияют на ее качество:
a. генерализации;
b. реактивности;
64
c. лабильности.
2) Операционализация понятия приводит к …
a. его расширению;
b. его сужению и упрощению;
c. расчленению на составные части;
d. соотнесению с другими понятиями.
3) Для обеспечения адекватной генерализации полученных выводов обычно
используют:
a. стандартные психологические тесты;
b. организацию репрезентативной выборки;
c. экспертизу программы исследования;
d. валидизацию методик исследования.
4) В какой шкале представлено количество вопросов в анкете как мера трудоемкости опроса:
a. номинативная:
b. ранговая;
c. шкала отношений;
d. шкала интервалов.
5) В какой шкале представлено упорядочивание испытуемых по времени
решения тестовой задачи:
a. Номинативная шкала:
b. Ранговая шкала;
c. шкала отношений;
d. шкала интервалов.
6) В какой шкале представлен академический статус (ассистент, доцент,
профессор) как указание на принадлежность к соответствующей категории:
a. номинативная шкала;
b. Ранговая шкала;
c. шкала отношений;
d. шкала интервалов.
65
7) В какой шкале представлен академический статус (ассистент, доцент,
профессор) как мера продвижения по службе:
a. номинативная шкала;
b. ранговая шкала;
c. шкала отношений;
d. шкала интервалов.
8) К мерам центральной тенденции не относится:
a. мода;
b. медиана;
c. размах;
d. среднее арифметическое.
9) К мерам изменчивости относится:
a. среднее арифметическое;
b. дисперсия;
c. мода;
d. медиана.
10) К мерам положения не относится:
a. медиана;
b. процентиль;
c. квартиль;
d. нет правильного ответа.
11) Следующий показатель не предназначен для оценки среднего значения:
a. математическое ожидание;
b. мода;
c. медиана;
d. дисперсия.
12) Для оценки среднего значения используется показатель:
a. среднего квадратичного отклонения;
b. моды;
c. коэффициента вариации; дисперсии.
66
13) Медиана предназначена для оценки:
a. общего качества измерения;
b. среднего значения измеряемого показателя;
c. разброса значений показателя вокруг среднего значения;
d. объема выборки.
14) Оценка среднего значения интереса к работе (от очень сильного до отсутствия такового) производится с помощью показателя:
a. математического ожидания;
b. моды;
c. медианы;
d. квинтильного ранга.
15) Разброс доходов участников исследования требует применения показателя:
a. дисперсии;
b. моды;
c. медианы;
d. математического ожидания.
16) Принятие нулевой гипотезы при определении достоверности различий
исследуемого признака свидетельствует:
a. об отсутствии различий;
b. о существовании различий;
c. о существовании различий на уровне 5%;
d. о неверно выбранном критерии.
17) Принятие альтернативной гипотезы при определении достоверности
различий исследуемого признака свидетельствует:
a. об отсутствии различий;
b. о существовании различий;
c. о неверно выбранном критерии;
d. нет верного ответа.
18) Для анализа взаимосвязи пола (мужской, женский) и употребления алкоголя (да, нет) используется:
a. коэффициент корреляции Пирсона;
67
b. коэффициент корреляции Спирмена;
c. критерий Хи – квадрат;
d. критерий Стьюдента.
19) Для изучения взаимосвязи возраста (число полных лет) и нейротизма
(шкала Айзенка, в баллах) используют:
a. коэффициент корреляции Пирсона;
b. коэффициент корреляции Спирмена;
c. критерий Хи – квадрат;
d. критерий Стьюдента.
20) Выявление статистически-значимых различий двух распределений
признаков производится с помощью критерия
a. Стьюдента;
b. Фишера;
c. Манна-Уитни;
d. Хи-квадрат.
21) К непараметрическим статистическим критериям не относится:
a. критерий знаков G;
b. парный критерий Т-Вилкоксона;
c. критерий L-Пейджа;
d. t-критерий Стьюдента.
22) Выявление статистически-значимых различий в уровне исследуемого
признака (2 выборки испытуемых) производится с помощью критерия
a. Т-критерия Вилкоксона;
b. критерия знаков G;
c. Q-критерия Розенбаума;
d. χ2 критерия Пирсона.
23)
a.
b.
c.
d.
Для оценки сдвига значений исследуемого признака не используют:
Т-критерия Вилкоксона;
критерия знаков G;
Q-критерия Розенбаума;
χ2 критерия Пирсона.
68
24) Выявление статистически-значимых различий в степени согласованности изменений двух признаков не производится с помощью критерия:
a. коэффициента корреляции Пирсона;
b. коэффициента корреляции Кендела;
c. коэффициента ранговой корреляции Спирмена:
d. Т-критерия Вилкоксона.
25) Выявление статистически-значимых различий в распределении признака при сопоставлении двух эмпирических распределений производят с помощью критерия:
a. φ критерия (угловое преобразование Фишера);
b. Т-критерия Вилкоксона;
c. критерия знаков G;
d. Q-критерия Розенбаума;
26) Факторный анализ предназначен для:
a. прогноза интегрального показателя по его составным частям;
b. объединения исходных признаков в группе на основании их близости;
c. объединения объектов выборки в группы по степени близости;
d. прогноза принадлежности объекта к заранее выделенному классу объектов.
27) Формальным критерием качества проведения процедуры факторного
анализа является:
a. число выделенных факторов;
b. критерий Кайзера;
c. процент объединенной дисперсии исходных признаков;
d. объем исследовательской выборки.
28)
a.
b.
c.
Кластерный анализ используется для:
прогноза интегрального показателя по его составным частям;
объединения объектов выборки в группы по степени близости;
прогноза принадлежности объекта к заранее выделенному классу объектов.
29) Исходными данные для кластерного анализа могут быть:
69
a. нормальными;
b. любыми;
c. аномальными;
d. визуальными.
30) Завершающим этапом кластерного анализа является:
a. доклад на конференции;
b. интерпретация;
c. публикация в журнале;
d. выбор метрики.
Вопросы к зачету
Общая схема проверки статистических гипотез.
Измерение в психологии.
Виды измерительных шкал.
Формы представления результатов исследования.
Меры центральной тенденции: мода, медиана, среднее арифметическое.
6. Меры изменчивости: размах, дисперсия, стандартное отклонение.
7. Меры положения: медиана, процентили, квартили.
8. Понятие нормального распределения.
9. Разработка тестовых шкал: Z-шкала, T-шкала, шкала стенов, шкала
стенайнов, шкала Векслера.
10.Статистические гипотезы.
11.Уровни статистической значимости.
12.Ось значимости.
13.Непараметрические критерии.
14.Параметрические критерии.
15.Связные и несвязные выборки.
II.
1.
2.
3.
4.
5.
70
16.Корреляционный анализ.
17.Факторный анализ.
18.Кластерный анализ.
19.Дисперсионный анализ.
20.Многомерное шкалирование.
Литература
1. Анастази, А. Психологическое тестирование. /А.Анастази, С.Урбина. –
7-изд. – СПб.: Питер, 2005. – 688 с.: ил. – (Серия «Мастера Психологии»).
2. Ермолаев, О.Ю. Математическая статистика для психологов: учебник
/О.Ю.Ермолаев. – 4-е изд., испр. – М.: Московский психолого-социальный
институт: Флинта, 2006. – 336 с. (Библиотека психолога).
3. Исследование в психологии: методы и планирование. / Дж.Гудвин. – 3изд. – СПб.: Питер, 2004. – 558 с.: ил. – (Серия «Мастера психологии»).
4. Кутейников, А.Н. Математические методы в психологии. Учебное пособие / А.Н.Кутейников. – СПб.: Речь, 2008. – 172 с.
5. Лысенко, С.Н. Общая статистика: Учебное пособие /С.Н.Лысенко,
И.А.Дмитриева. – М.: Вузовский учебник, 2009. – 219 с.
6. Математические методы в психологии: Учебно-методический комплекс
дисциплины для студентов заочного и очно-заочного (вечернего) обучения.
Специальность: «Психология». Специализации: «Психология управления»,
«Акмеология». – М.: Изд.-во РАГС, 2008. – 74 с.
71
7. Наследов, А.Д. Математические методы психологического исследования. Анализ и интерпретация данных. Учебное пособие / А.Д.Наследов. –
СПб.: Речь, 2004. – 392 с.
8. Психология человека от рождения до смерти. Психологический атлас
человека / под ред. А.А.Реана. – М.: АСТ; СПб.: Прайм ЕВРОЗНАК, 2010. –
651, [5] с.
9. Сидоренко, Е.В. Методы математической обработки в психологии.
/Е.В.Сидоренко. – СПб.: Социально-психологический центр, 2006. – 352 с.
ГЛОССАРИЙ
АССИМЕТРИЯ – степень отклонения графика распределения частот от
симметричного вида относительно среднего значения.
Для симметричного распределения асимметрия равна нулю. Если чаще
встречаются значения меньше среднего, то говорят о левосторонней, или положительной асимметрии (As > 0). Если же чаще встречаются значения
больше среднего, то асимметрия – правосторонняя, или отрицательная (As <
0).
ВЫБОРКА – это ограниченная по численности группа объектов (в психологии испытуемых, респондентов), специально отбираемая из генеральной совокупности для изучения ее свойств.
72
ВЫБОРОЧНОЕ ИССЛЕДОВАНИЕ - изучение свойств генеральной совокупности на выборке испытуемых.
ГЕНЕРАЛЬНАЯ СОВОКУПНОСТЬ – это все множество объектов, в отношении которого формулируется исследовательская гипотеза.
ДИСПЕРСИЯ – мера изменчивости для метрических данных, пропорциональная сумме квадратов отклонений измеренных значений от их арифметического среднего:
ДИСПЕРСИОННЫЙ АНАЛИЗ – это анализ изменчивости признака под
влиянием какого-либо фактора (или совокупности факторов). Метод основан
на разложении общей дисперсии (вариативности) на составляющие компоненты, сравнивая которые можно определить долю общей вариации изучаемого признака, обусловленную действием на него как регулируемых, так и
неучтенных в опыте факторов.
ИЗМЕРЕНИЕ – это процедура, с помощью которой измеряемый объект
сравнивается с некоторым эталоном и получает численное выражение в
определенном масштабе или шкале.
ИЗМЕРИТЕЛЬНЫЕ ШКАЛЫ – шкалы, позволяющие описать значения
психологических признаков в психологических переменных. Согласно
С.Стивенсу (1951), различают четыре типа измерительных шкал: номинативная (номинальная, шкала наименований); порядковая (ранговая, ординарная); интервальная (шкала равных интервалов); шкала равных отношений (шкала отношений).
ИЗМЕРЕНИЕ ПО НОМИНАТИВНОЙ ШКАЛЕ состоит в присваивании
какому-либо свойству или признаку определенного обозначения или символа
(численного, буквенного и т.п.). измерение по этой шкале осуществляется
классификация или распределение объектов на непересекающиеся классы,
группы.
Пример.
Всех живущих на планете можно поделить на группы в соответствии с их:
73
 возрастом;
 полом;
 образованием и т.д.
ИЗМЕРЕНИЕ ПО РАНГОВОЙ ШКАЛЕ расчленяет всю совокупность измеренных признаков на такие множества, которые связаны между собой отношениями типа «больше – меньше»; «выше и ниже»; «сильнее – слабее» и
т.п.
Пример.
Присваиваем ранги от 1 до N учащимся 4 класса при ранжировании их по росту – 1-ый самому высокому и т.д.
ИЗМЕРЕНИЕ ПО ШКАЛЕ ИНТЕРВАЛОВ – это установление специальных единиц измерения, в психологии это стены и стенайны. Основная особенность шкалы интервалов является то, что у нее нет естественной точки
отсчета.
Пример.
|_____|_____|_____|_____|_____|_____|
-3
-2
-1
0
+1
+2
+3
-3 абсолютно не согласен
0 не знаю
+3 абсолютно согласен
ИЗМЕРЕНИЕ ПО ШКАЛЕ ОТНОШЕНИЙ. Как только в шкале интервалов фиксируется нуль, мы сразу получает шкалу равных отношений.
Пример. Шкала на термометре.
КВАНТИЛЬ – это точка на числовой оси измеренного признака, которая делит всю совокупность упорядоченных измерений на две группы с известным
соотношением их численности. Среди квантилей различают – медиану, процентили и квартили.
КВАРТИЛИ – это 3 точки – значения признака (P25; P50; P75), которые делят упорядоченное (по возрастанию) множество наблюдений на 4 равные по
численности части. Первый квартиль соответствует 25-му процентилю, второй – 50-му процентилю или медиане, третий квартиль соответствует 75-му
процентилю.
74
КЛАСТЕРНЫЙ АНАЛИЗ – это процедура упорядочивания объектов в
сравнительно однородные классы на основе попарного сравнения этих объектов по предварительно определенным и измеренным критериям. Кластерный анализ решает задачу построения классификации.
КОДИРОВАНИЕ – это такая операция, с помощью которой экспериментальным данным придается форма числового сообщения (кода).
КОРРЕЛЯЦИОННЫЙ АНАЛИЗ – это проверка гипотез о связях между
переменными с использованием коэффициентов корреляции.
КОЭФФИЦИЕНТ КОРРЕЛЯЦИИ – это мера прямой или обратной пропорциональности между двумя переменными.
КРИТЕРИЙ H- КРУСКАЛА-УОЛИСА применяется для оценки различий
по степени выраженности анализируемого признака одновременно между
тремя, четырьмя и более выборками. Критерий рассчитывается по формуле:
КРИТЕРИЙ ХИ-КВАДРАТ (другая форма записи – χ2 греческая буква
«хи») построен так, что при полном совпадении экспериментального и теоретического (или двух экспериментальных) распределений величина χ2=0, и
чем больше расхождение между сопоставляемыми распределениями, тем
больше величина эмпирического значения хи-квадрат. Критерий рассчитывается по формуле:
fэ – эмпирическая частота
fт – теоретическая частота
k – количество разрядов признака
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ — это процедура описания
различных процессов (экономических, биологических, социальнопсихологических) посредством математического аппарата. Указанная процедура включает в себя выделение всех факторов процесса, определение доли
75
вклада каждого из факторов, выявление закономерностей их функционирования и вероятностное предсказание протекания всего процесса в дальнейшем.
МЕДИАНА – это такое значение признака, которое делит упорядоченное
9ранжированное) множество данных пополам так, что одна половина всех
значений оказывается меньше медианы, а другая – больше.
МЕРА ИЗМЕНЧИВОСТИ применяется в психологии для численного выражения величины межиндивидуальной вариации признака. К мерам изменчивости относятся: размах, дисперсия, стандартное отклонение.
МЕРА ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ – это число, характеризующее выборку по уровню выраженности измеренного признака. Существуют три способа определения «центральной тенденции», каждому из которых соответствует своя мера: мода, медиана и выборочное среднее.
МНОГОМЕРНОЕ ШКАЛИРОВАНИЕ (МШ). Основная цель многомерного шкалирования – выявление структуры исследуемого множества объектов.
В психологии чаще всего исходными данными для многомерного шкалирования являются субъективные суждения испытуемых о различии или сходстве стимулов (объектов).
МНОЖЕСТВЕННЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ (МРА) предназначен для изучения взаимосвязи одной переменной (зависимой, результирующей) и нескольких других переменных (независимых, исходных). МРА может применяться как для решения прикладных задач, так и в исследовательских целях. Обычно МРА применяется для изучения возможности предсказания некоторого результата (обучения, деятельности) по ряду предварительно измеренных характеристик.
МОДА – это такое значение из множества измерений, которое встречается
наиболее часто. Моде, или модальному интервалу признака, соответствует
наибольший подъем (вершина) графика распределения частот. Если график
распределения частот имеет одну вершину, то такое распределение называется унимодальным.
НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ – симметричное распределение, у которого крайние значения встречаются редко и частота постепенно повышается к серединным значениям признака.
76
ОБЪЕМ ВЫБОРКИ – число испытуемых, участвующих в исследовании.
Рекомендации по комплектованию выборки:
 наибольший объем выборки необходим при разработке диагностического инструментария – от 200 до 1000-2500 человек;
 если необходимо сравнивать две выборки, их большая численность
должна быть не менее 50 человек; численность сравниваемых выборок
должна быть приблизительно одинаковой;
 если изучается взаимосвязь между какими-либо свойствами, то объем
выборки должен быть не меньше 30-35 человек;
 чем больше изменчивость изучаемого свойства, тем больше должен
быть объем выборки. Поэтому изменчивость можно уменьшить, увеличивая однородность выборки, например, по полу, возрасту и т.д. при
этом, естественно, уменьшаются возможности генерализации выводов.
ОСЬ ЗНАЧИМОСТИ представляет собой прямую, на которой выделено
три «зоны»: «зона значимости»; «зона незначимости»; «зона неопределенности». Границы всех трех зон являются критические значения искомого критерия для р=0,05 и р=0,01.
Зона неопределенности
Зона значимости
Зона незначимости
77
Ч кр 1
Ч кр 2
при р ≤ 0,05 при р≤0,01
ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ основаны на конкретном типе распределения генеральной совокупности (как правило, нормальном) или используют параметры этой совокупности (среднее, дисперсии и т.д.). Критерий
различия называют непараметрическим, если он не базируется на предположении о типе распределения генеральной совокупности и не использует
параметры этой совокупности.
ПРОВЕРКА ПРАВИЛЬНОСТИ РАНЖИРОВАНИЯ осуществляется по
формуле
1+2+3+ …+ N= N (N+1)/2, где N – количество ранжируемых признаков.
ПРОЦЕНТИЛИ – это 99 точек – значений признака (Р1, …, Р99), которые
делят упорядоченное (по возрастанию) множество наблюдений на 100 частей, равных по численности.
РАЗМАХ – разность максимального и минимального значений: R=Xmax Xmin
РЕПРЕЗЕНТАТИВНОСТЬ ВЫБОРКИ (ее представительность) – способность выборки представлять изучаемые явления достаточно полно с точки
зрения их изменчивости в генеральной совокупности.
РЕКОМЕНДАЦИИ К ВЫБОРУ КРИТЕРИЯ РАЗЛИЧИЙ:
1. Определить, является ли выборка связной (зависимой) или несвязной
(независимой).
2. Определить однородность выборки.
3. Оценить объем выборки и, зная ограничения каждого критерия по объему, выбрать соответствующий критерий.
4. Целесообразно начинать работу с выбора наименее трудоемкого критерия.
5. Если используемый критерий не выявил различий – следует применить
более мощный, но одновременно и более трудоемкий критерий.
78
6. При малом объеме выборки следует увеличить величину уровня значимости (не менее 1%).
СВЯЗНЫЕ (ЗАВИСИМЫЕ) ВЫБОРКИ - это выборки, если процедура
эксперимента и полученные результаты измерения некоторого свойства, проведенные на одной выборке, оказывают влияние на другую. Выборки называются несвязными (независимыми), если процедура эксперимента и полученные результаты измерения некоторого свойства у испытуемых одной выборки не оказывают влияния на особенности протекания этого же эксперимента и результаты измерения этого же свойства у испытуемых другой выборки.
СРЕДНЕЕ (Мх – выборочное среднее, среднее арифметическое) – определяется как сумма всех значений измеренного признака, деленная на количество
суммированных значений.
СТАНДАРТИЗАЦИЯ – или z-преобразование данных – это перевод измерений в стандартную Z-шкалу (M =0;  z=1). Для стандартизации используют
формулу
Тестовые шкалы разрабатываются для того, чтобы оценить индивидуальные
результат тестирования путем сопоставления его с тестовыми нормами, полученными на выборке стандартизации.
СТАНДАРТНОЕ ОТКЛОНЕНИЕ – величина, равная квадратному корню
из дисперсии.
СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ - формальное предположение о том,
что сходство (или различие) некоторых параметрических или функциональных характеристик случайно или, наоборот, неслучайно. Различают нульгипотезу (Н0) и альтернативную гипотезу (Н1). Н0 – свидетельствует об отсутствии различий. Н1 – свидетельствует о наличии различий.
79
СТАТИСТИЧЕСКАЯ ДОСТОВЕРНОСТЬ (статистическая значимость)
результатов исследования определяется при помощи методов статистического вывода.
СТЕПЕНЬ СВОБОДЫ – число свободно варьирующих единиц в составе
выборки.
k=n-1, n – общее число элементов ряда;
=(c-1) (n-1), c- число столбцов; n – число строк.
УРОВЕНЬ СТАТИСТИЧЕСКОЙ ЗНАЧИМОСТИ – это вероятность ошибочного отклонения нулевой гипотезы. В психологии используют три уровня
статистической значимости: р≤0,05; р≤0,01; р≤0,001.
ФАКТОРНЫЙ АНАЛИЗ – это общенаучный метод, цель которого уменьшение размерности исходных данных с целью их экономного описания при
условии минимальных потерь исходной информации. Результатом факторного анализа является переход от множества исходных переменных к существенно меньшему числу новых переменных – факторов. Фактор при этом
интерпретируется как причина совместной изменчивости нескольких исходных переменных.
ЧАСТОТА АБСОЛЮТНАЯ показывает сколько раз встречается каждое
значение признака.
ЧАСТОТА ОТНОСИТЕЛЬНАЯ указывает какова доля наблюдений, приходящихся на то или иное значение признака.
ЭТАПЫ ПРИНЯТИЯ СТАТИСТИЧЕСКОГО РЕШЕНИЯ:
1. Формулировка нулевой и альтернативной гипотез.
2. Определение объема выборки N.
3. Выбор соответствующего уровня значимости или вероятности отклонения нулевой гипотезы. Это может быть величина меньшая или равная 0,05 (5% уровень значимости). В зависимости от важности исследования можно выбрать уровень значимости в 1% (р≤0,01) или 0,1%
(р≤0,001).
4. Выбор статистического метода, который зависит от типа решаемой
психологической задачи.
80
5. Вычисление соответствующего эмпирического значения по экспериментальным данным, согласно выбранному статистическому методу.
6. Нахождение по таблица приложения для выбранного статистического
метода критических значений, соответствующих уровню значимости
для р=0,05 и для р=0,01.
7. Построение оси значимости и нанесение на нее табличных критических
значений и эмпирического значения.
8. Формулировка принятия решения (выбор соответствующей гипотезы
Н0 или Н1).
Приложение
пол
класс
Осведомленность
Скрытые фигур.
Пропущ. слова
Арифметика
Понятливость
Иключ. изобр.
Аналогии
Числовые ряды
Умозаключения
Геометр. слож.
Заучивание слов
Э/И
Нейротизм
ТАБЛИЦА 1
ДАННЫЕ ДЛЯ РЕШЕНИЯ ЗАДАЧ
Ж
Ж
М
Ж
Ж
Ж
М
Ж
Ж
Г
Г
М
Г
Г
Г
М
Г
Г
12
10
11
14
12
10
9
14
14
9
12
8
12
12
12
2
5
11
11
12
9
14
9
12
6
13
11
8
11
11
13
10
8
10
11
16
8
10
11
13
9
13
7
13
8
11
12
12
9
12
12
4
13
12
13
9
9
9
5
9
8
13
13
8
12
11
9
10
9
10
9
8
12
8
8
12
3
11
7
13
13
10
11
11
11
11
8
5
9
9
11
11
8
12
9
11
9
14
9
15
13
10
13
16
11
5
13
16
7
17
19
11
8
5
8
4
10
№
п\п
1
2
3
4
5
6
7
8
9
81
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Ж
Ж
М
Ж
Ж
М
Ж
М
Ж
М
М
Ж
Ж
М
Ж
Ж
М
М
Ж
М
Ж
Г
Г
Г
Г
Г
Г
Г
Г
Г
М
М
Г
Г
Г
М
М
Г
М
М
М
Г
15
13
9
16
14
11
7
13
8
12
14
11
11
11
10
9
10
9
10
11
9
14
7
8
14
12
6
7
12
9
11
9
12
16
11
12
12
10
14
5
7
12
11
3
7
15
11
9
15
15
9
10
11
12
10
11
10
8
9
10
8
12
7
11
9
12
11
10
9
11
9
8
13
13
12
7
12
14
13
11
16
7
13
10
12
8
14
11
10
9
9
11
12
11
12
11
7
8
12
12
10
8
6
7
12
12
7
12
11
12
7
9
7
12
8
13
12
8
14
9
6
12
7
13
7
7
14
7
7
10
10
14
10
8
9
10
13
14
10
10
13
14
13
10
15
16
15
11
6
6
10
11
8
8
12
9
10
14
9
5
10
12
12
10
12
10
11
10
12
8
8
12
13
11
12
15
15
10
13
12
12
14
12
18
12
11
14
12
14
11
3
13
12
14
6
8
11
13
14
11
10
9
11
12
12
13
9
12
16
12
16
9
11
12
12
11
10
11
9
11
11
11
9
10
10
6
7
8
9
9
6
13
11
17
14
20
15
19
14
20
10
10
13
14
12
11
14
8
5
15
11
12
11
11
12
10
15
9
6
16
12
15
15
9
11
12
21
9
22
15
14
14
15
Download