Лекция 11 Проверка гипотез в экспериментах (Statistica 5)

advertisement
Тема 11. Анализ результатов: проверка гипотез в экспериментах.
Лекционное занятие.
Вопросы.
1. Процедура дисперсионного анализа.
2. Проверка эффективности экспериментальных манипуляций.
3. Проверка гипотез.
Конспект.
Как проверяются гипотезы в экспериментах? Возьмем в качестве примера простейший экспериментальный план однофакторного межгруппового
эксперимента с двумя уровнями независимой переменной. Чтобы проверить,
влияло ли изменение уровней независимой переменной на оценки зависимой
переменной в двух экспериментальных группах, нужно рассчитать средние
оценки зависимой переменной в каждой группе, посмотреть, существуют ли
между ними значимые различия, и если да, то при каком уровне независимой
переменной они оказываются выше, а при какой ниже. Так, если мы провели
эксперимент, в котором повышали мотивацию в решении задач в одной
группе (высокий уровень независимой переменной) и снижали ее в другой
(низкий уровень независимой переменной), после чего обнаружили, что
между группами наблюдались значимые различия в количестве решенных
задач, при этом первая решила в среднем больше задач, чем вторая, это позволяет нам заключить, что мотивация влияла на количество решенных задач.
Наиболее адекватной статистической процедурой для проверки гипотез в однофакторных межгрупповых планах с двумя уровнями независимой переменной является Т-тест Стьюдента для независимых выборок (в случае внутригрупповых планов Т-тест Стьюдента для зависимых выборок). Однако такая процедура не годится, когда независимая переменная имеет больше двух
уровней (напр., 3), а также когда у нас имеется не одна, а несколько незави-
симых переменных (т.е., для многофакторных экспериментальных планов). В
таких случаях принято использовать процедуру дисперсионного анализа
(ANOVA, analysis of variance). Она позволяет рассчитывать и сравнивать
средние оценки зависимых переменных при любом количестве экспериментальных групп.
Поэтому мы начнем сегодняшнюю лекцию с того, что познакомимся с
этой процедурой на примере одного из самых распространенных экспериментальных планов – двухфакторного межгруппового плана с двумя уровнями независимых переменных (2 х 2), а затем расскажем о том, как она используется для проверки различных видов гипотез.
Требования к уровню
достижений со стороны руководителя
Привлекательность
достижений
Желаемый
уровень
достижений
Реальные
достижения
Рисунок 1. Модель достижений.
Для иллюстрации того, как работает дисперсионный анализ, воспользуемся исследованием, в котором изучались причины высокой и низкой производительности труда (Ребзуев, неопубликовано). Идея этого исследования
родилась из моих наблюдений во время армейской службы. Мне доводилось
наблюдать, как офицеры или старослужащие заставляли молодых солдат выполнять бессмысленную работу (напр., выкапывать, а потом закапывать яму).
И я видел, как плохо и медленно они выполняли эту работу, гораздо хуже и
медленнее, чем если бы ее выполнял обычный рабочий. При этом вопреки
тому, что я знал об этих солдатах, они производили впечатление ленивых и
не способных выполнять даже такую примитивную работу. И чем больше их
упрекали за нерадивость или грозили наказанием за ненадлежащее выполнение, тем бестолковее и нерасторопнее они действовали. По-видимому, это
было маской, за которой скрывался протест против выполнения бессмысленной работы. Рабский труд не бывает производительным. Когда я об этом
вспомнил, мне подумалось, а что если взглянуть на эту ситуацию шире? Не
может ли она являться одним из полюсов континуума, на одном конце которого человек ставит перед собой высокие цели (старается достичь как можно
лучших результатов), а на другом не ставит перед собой таких целей (выполняет работу лишь потому, что не может от нее отказаться)? В результате возникла модель (см. рис 1), описывающая механизм достижений (или производительности труда). Согласно этой модели индивид добивается высоких результатов (реальных достижений), если он ставит перед собой высокие цели
(желаемый уровень достижений). От чего зависит, насколько высокими будут такие цели? Очевидно, от их внутренней привлекательности (привлекательности достижений). Как на постановку целей будут влиять требования со
стороны руководителя? Если такие требования будут накладываться на высокую привлекательность достижений, последняя будет повышаться (поскольку в этом случае она будет получать дополнительную внешнюю поддержку). Однако если такие требования будут накладываться на низкую привлекательность достижений (напр., человек чувствует, что задание выполняется «для галочки» или за ним стоят личные интересы начальника, или он не
находит в нем никаких привлекательных сторон), последняя будет снижаться. Иными словами, приказы и требования будут снижать достижения индивида, если последние не обладают для него внутренним смыслом, единственной вещью, дающей энергию, без которой невозможно преодолеть трудности, встающие на пути к высоким целям.
Таким образом, модель на рисунке 1 рассматривает в качестве психологического механизма достижений выбор индивидом желаемого уровня достижений, в качестве предпосылки привлекательность таких достижений, а в
качестве условия то, какие требования к уровню достижений предъявляет
руководитель.
На основе этой модели формулировались три следующие гипотезы:
1. Реальные достижения индивида будут зависеть от степени их привлекательности (гипотеза о предпосылках).
2. Высокие требования со стороны руководителя будут усиливать влияние привлекательности достижений на реальные достижения, если такая привлекательность оказывается высокой, и ослаблять, если она оказывается низкой (гипотеза о модерировании).
3. Влияния привлекательности достижений и их взаимодействия с требованиями руководителя на реальные достижения будут опосредоваться
желаемым уровнем достижений (гипотеза об опосредовании).
Для их проверки был разработан двухфакторный лабораторный эксперимент 2 (высокая/низкая привлекательность достижений) х 2 (отсутствие/наличие высоких требований к уровню достижений). В качестве модели трудовой деятельности было выбрано моторное задание, связанное с
набрасыванием колец на крючок. Каждому участнику предлагалось совершить 100 бросков, разбивавшихся на 10 серий по 10 бросков. Такое задание
репрезентировало одну из наиболее распространенных ситуаций трудовой
деятельности. А именно, когда индивиду поручается выполнить определенную работу и устанавливаются ее сроки, в результате чего он сам планирует
как конечную цель (напр., какой объем работы он выполнит), так и промежуточные цели (напр., сколько работы он выполнит за текущий день). По результатам предварительной тренировки для каждого участника подбиралось
расстояние, с которого он совершал около 50% успешных бросков, которое
использовалось при выполнении экспериментального задания из 100 бросков. (Задача набрасывания колец с такого расстояния должна была восприниматься как не слишком легкая, но и не слишком трудная, т.е. представляла
наиболее распространенный тип задач, выполняемых работниками в организациях.)
Экспериментальные манипуляции производились за счет инструкций.
В условиях высокой привлекательности достижений участникам сообщалось
о связи результатов выполнения задания с такой личностной чертой, как потребность в достижении, а в условиях низкой привлекательности, что в данном исследовании изучается динамика работоспособности. В условиях высоких требований к уровню достижений от них требовалось совершить не менее 50 попаданий (что несколько превышало уровень их обычных возможностей), а в условиях отсутствия высоких требований количество попаданий не
оговаривалось. Реальные достижения оценивались по количеству попаданий
в каждой серии (впоследствии эти оценки суммировались). Желаемый уровень достижений оценивался перед каждой серией просьбой к участнику сказать, сколько успешных бросков ему хотелось бы совершить в данной серии
(эти оценки также суммировались).
Процедура запуска дисперсионного анализа в программе STATISTICA 5.5. Откройте файл
«Дисперсионный анализ (таблица)», в которой содержатся результаты описанного эксперимента. Устройство таблицы данных эксперимента отличается от таблицы данных опроса тем, что в ней, помимо столбцов с оценками измеряемых переменных, имеются столбцы, в которых обозначены уровни независимых переменных. В нашем случае два последних столбца (ЖУД и РД) содержат оценки двух зависимых переменных, желаемого уровня достижений и реальных достижений. Чтобы увидеть расшифровку этих переменных,
щелкните дважды левой кнопкой мышки на заголовках этих столбцов, и просмотрите информацию, которую я внес в нижнее поле раскрывшегося окна. Средний столбец (ОПД)
содержит оценки эффективности манипуляции привлекательностью достижений, о которых будет сказано позже. Два первых столбца (ПД и ТУД) содержат уровни первой и второй независимой переменной. Щелкнув мышкой на их заголовках, вы увидите, что два
уровня первой независимой переменной (ПД) обозначены цифрами 1 и 2 (высокая и низкая привлекательность достижений), а два уровня второй независимой переменной (ТУД)
цифрами 3 и 4 (отсутствие и наличие высоких требований). Эти цифры показывают, к какому экспериментальному условию относятся оценки из столбцов с зависимыми переменными, что позволяет рассчитывать и сравнивать между собой средние оценки зависимых
переменных из разных экспериментальных условий.
Чтобы запустить процедуру дисперсионного анализа, в меню Analysis (анализ), выберите
Startup Panel (Начальная панель), в появившемся списке дважды щелкните на ANOVA/MANOVA (Дисперсионный анализ/множественный дисперсионный анализ). Появится
окно, в котором нужно будет выбрать план дисперсионного анализа (см. рис. 2). Вспомним, что существуют различные планы экспериментов (см. лекцию 4): однофакторные и
многофакторные, межгрупповые и внутригрупповые, уровневые и смешанные и т.д. Для
каждого плана потребуется соответствующий план дисперсионного анализа (напр., для
однофакторного межгруппового плана потребуется однофакторный межгрупповой, а не,
скажем, однофакторный внутригрупповой план дисперсионного анализа). В нашем случае
эксперимент проводился с использованием двухфакторного межгруппового плана и нам
потребуется аналогичный план дисперсионного анализа.
Рисунок 2. Окно выбора плана дисперсионного анализа.
В левой части окна (см. рис. 2) имеются кнопки, при помощи которых выбирается нужный
план. Мы видим, что сейчас нам доступны лишь две верхние кнопки (Variables и Covariates). Поэтому мы начнем выбирать план с них. Нажмите первую кнопку Variables (переменные). Появится окно с двумя белыми полями, в которых содержатся названия столбцов нашей таблицы. Левое поле используется для выбора независимых переменных, правое для выбора зависимой переменной. Отметьте мышкой в левом поле независимые переменные ПД (привлекательность достижений) и ТУД (требования к уровню достижений), а в правом зависимую переменную РД (реальные достижения), как показано на рисунке 3. Нажмите ОК.
Рисунок 3. Окно выбора независимых и зависимых переменных.
Рисунок 4. Окно процедуры дисперсионного анализа после выделения независимых
и зависимых переменных.
Заметьте, что прежнее окно изменилось (сравни рис. 2 и 4). Теперь под двумя верхними
кнопками напротив Independent (factors) (Независимые переменные (факторы)) появились
названия отмеченных нами независимых переменных ПД и ТУД; напротив Dependent (Зависимая переменная) название зависимой переменной РД, а напротив Covariates (Ковариаты) none (ничего), поскольку мы не пользовались кнопкой Covariates. (О том, для чего
нужна эта кнопка, будет сказано позже при обсуждении процедур проверки различных
гипотез.) Ниже стали доступными три новые кнопки, которые используются, если требуется уточнить выбранный план. Кнопка Codes for between-group factors (Обозначения
межсубъектных факторов) используется, когда мы хотим включить в дисперсионный анализ лишь некоторые из уровней независимых переменных (для этого нужно пометить интересующие нас уровни, которых должно быть не меньше двух, поэтому такая кнопка
может использоваться, когда независимая переменная имеет не менее трех уровней).
Кнопка Random factors (Случайные факторы) используется для планов со случайными
эффектами, и если ее не трогать, программа по умолчанию будет рассматривать наш план
как план с фиксированными эффектами. Кнопка Isolated control group (Изолированная
контрольная группа), используется, когда в эксперименте имеется дополнительная контрольная группа участников, которая не подвергалась никаким экспериментальным воздействиям. (Более подробно о существующих разновидностях экспериментальных планов
см. файлы «Одномерная GLM, ANOVA и ANCOVA в SPSS» и «Дисперсионный анализ в
STATISTICA»).
Когда мы отмечали независимые и зависимую переменную, мы показали программе, что
выбираем двухфакторный (поскольку мы отметили две независимые переменные) межгрупповой (поскольку обе переменные являются межсубъектными факторами) план дисперсионного анализа. Именно такой план нам и был нужен, он не нуждается в уточнении
и поэтому нам не потребуются появившиеся кнопки.
Если бы мы использовали не двухфакторный межгрупповой, а двухфакторный смешанный план, где одна из независимых переменных, скажем, ПД, являлась внутрисубъектным
фактором, наша таблица выглядела бы несколько иначе. В таком случае в ней бы отсутствовал столбец ПД, а вместо столбца РД появились два новых столбца РД1 и РД2 (с
оценками количества попаданий в цель тех же самых участников в условиях высокой
(РД1) и низкой (РД2) привлекательности достижений). Тогда после нажатия кнопки Variables мы бы отметили в левом поле независимую переменную ТУД (межсубъектный фактор), а в правом поле столбцы РД1 и РД2. Чтобы программа трактовала РД1 и РД2 не как
две отдельные зависимые переменные, а как два уровня внутрисубъектного фактора РД,
после нажатия кнопки ОК потребовалось бы нажать кнопку Repeated measures (within SS)
design (С повторными измерениями (внутрисубъектный) план), ввести в левое верхнее поле цифру 2 (два уровня внутрисубъектного фактора), а в правое поле название фактора
(РД) и нажать ОК. После этого напротив кнопки Repeated measures (within SS) design высветится надпись 1 repeated measures factor (1 внутрисубъектный фактор). Это будет означать, что мы выбрали двухфакторный смешанный план дисперсионного анализа, в котором РД будет рассматриваться как внутрисубъектный, а ТУД как межсубъектный фактор.
После того, как мы выбрали план, можно запустить процедуру дисперсионного анализа.
Нажмите ОК, после чего появится окно ANOVA Results (Результаты дисперсионного анализа) с различными сведениями (см. рис. 5)..
Рисунок 5. Окно результатов дисперсионного анализа.
Они позволяют проверить, правильно ли программа учла наши пожелания в отношении
плана дисперсионного анализа. Верхняя часть таблицы показывает, что программа использовала двухфакторный план дисперсионного анализа с фиксированными эффектами.
Нижняя часть показывает, что он включал одну зависимую переменную (РД), два межсубъектных фактора (ПД и ТУД), каждый из которых рассматривался на двух уровнях,
обозначавшихся как 1 и 2 и 3 и 4, соответственно, и не включал внутрисубъектных факторов. Это отвечает нашим намерениям и позволяет перейти к результатам дисперсионного
анализа, для выведения которых используются кнопки из нижней части окна.
Однако перед тем как перейти к результатам, следует ненадолго прерваться, чтобы разобраться с тем, как работает дисперсионный анализ. Проиллюстрируем это на нашем примере с независимыми переменными ПД и
ТУД и зависимой переменной РД. Дисперсионный анализ начинает с того,
что рассчитывает средние оценки зависимой переменной по каждому из экспериментальных условий (в нашем случае имелись четыре условия, образованные разными сочетаниями двух уровней независимых переменных ПД и
ТУД, в которые распределялись участники эксперимента) (см. рис. 6(а)).
ТУД
Отсутствие Наличие
(3)
(4)
Высокая
(1)
РД13
РД14
Низкая
(2)
РД23
РД24
ПД
(а) Средние оценки зависимой переменной (РД) в 4-х экспериментальных условиях.
РД13
РД14
РД13
РД14
РД13
РД14
РД23
РД24
РД23
РД24
РД23
РД24
(б) Основной
эффект ПД.
(в) Основной
эффект ТУД.
(РД13 + РД14)/2
против
(РД23 + РД24)/2
(РД13 + РД23)/2
против
(РД14 + РД24)/2
(г) Эффект
взаимодействия ПД и ТУД
(РД23 + РД14)/2
против
(РД13 + РД24)/2
Рисунок 6. Два типа эффектов, оцениваемых в дисперсионном анализе.
После этого он оценивает два типа влияний, или эффектов:
1) влияет ли каждый из двух факторов, ПД и ТУД, на оценки зависимой
переменной РД (такой тип влияния называется основным эффектом,
количество основных эффектов зависит от числа факторов, поэтому в
нашем случае будут оцениваться два основных эффекта, ПД и ТУД); и
2) влияет ли каждый из факторов на оценки зависимой переменной РД
независимо друг от друга или влияние одного фактора зависит от другого фактора (такой тип влияния называется эффектом взаимодействия, количество эффектов взаимодействия также зависит от числа
факторов, при наличии двух факторов, как в нашем случае, будет оцениваться только один эффект взаимодействия, ПД и ТУД).
Для выявления основного эффекта ПД программа рассчитывает усредненные оценки по двум группам участников из условий высокой привлекательности достижений (высокая ПД) и по двум группам участников из условий низкой привлекательности достижений (низкая ПД) (см. рис. 6(б)). Если
такие оценки значимо различаются, она констатирует присутствие значимого
основного эффекта ПД. Аналогичная процедура применяется для выявления
основного эффекта ТУД (см. рис. 6(в)). Для выявления эффекта взаимодействия ПД и ТУД программа рассчитывает и сравнивает усредненные оценки
по группам участников из противоположных экспериментальных условий
(см. рис. 6(г)). Психологическая интерпретация основных эффектов и эффектов взаимодействия зависит от характера переменных и от того, какая из
усредненных оценок оказывается выше другой (см. также Гудвин, 2004).
А теперь вернемся к нашему окну в программе STATISTICA 5.5 (см.
рис. 5) и просмотрим результаты дисперсионного анализа переменной РД.
Для этого используются три кнопки из нижней части окна. Кнопка All effects
(Все эффекты) выводит таблицу со сведениями обо всех обнаруженных и не
обнаруженных эффектах. Кнопка Specific effect/Means/Graphs (Специфический эффект/Средние/Графики) выводит более подробные сведение о каждом
эффекте в табличной форме. Кнопка Means/Graphs (Средние/Графики) выводит те же самые сведения в графической форме. При просмотре результатов
сначала анализируются сведения обо всех эффектах в целом, а затем сведения по каждому значимому эффекту в табличной и графической форме.
Анализ сведений обо всех эффектах. После нажатия кнопки All effects на экране появится
следующая таблица (см. рис. 7):
Рисунок 7. Сводные результаты по всем эффектам.
Каждая строка этой таблицы содержит сведения по каждому эффекту. В первом столбце
обозначены основные эффекты первого и второго фактора (в данном случае, ПД и ТУД,
при выборе номеров программа ориентируется на порядок следования факторов в таблице
первичных данных), а также эффект их взаимодействия. В четырех следующих столбцах
приводятся сведения, использовавшиеся программой при расчете F-теста, в двух последних – эмпирическое значение F-теста и уровень его значимости. Мы видим, что первая и
последняя строки (основного эффекта ПД и эффекта взаимодействия ПД и ТУД) красного
цвета. Это означает, что эти эффекты являются значимыми на уровне p < .05 (см. последний столбец таблицы). Основной эффект ТУД оказался незначимым.
Иными словами, дисперсионный анализ обнаружил, что привлекательность достижений
(ПД) влияла на реальные достижения (РД), которые, напомним, измерялись количеством
попаданий кольца на крючок. Он также обнаружил, что влияние привлекательности достижений (ПД) на реальные достижения (РД) зависело от того, предъявлялись или не
предъявлялись высокие требования к уровню достижений участников (т.е., от ТУД). Однако данные на рисунке 7 не говорят нам о направлении таких влияний. Например, мы
узнали, что ПД влияет на РД, но мы пока не знаем, увеличивает привлекательность достижений количество успешных бросков или, наоборот, снижает. Точно также мы не знаем, при каких условиях, в присутствии или в отсутствии высоких требований к уровню
достижений, она увеличивает (или, наоборот, снижает) количество успешных бросков,.
Чтобы на них ответить, нам нужны сведения об усредненных оценках.
Анализ сведений о специфических эффектах. Сначала просмотрим сведения об основном
эффекте ПД. Нажмите кнопку Specific effect/Means/Graphs, отметьте мышкой в открывшемся окне фактор ПД (привлекательность достижений) и нажмите ОК, На экране появятся две следующие таблицы (см. рис.. 8):
Рисунок 8. Табличная иллюстрация основного эффекта ПД.
Верхняя таблица не добавляет почти ничего нового и воспроизводит сведения об основном эффекте ПД из рисунка 7. Однако нижняя таблица показывает, что в условиях высокой привлекательности достижений участники совершали больше успешных бросков (в
среднем 51), чем в условиях низкой привлекательности (в среднем около 46). (Вспомним,
что в таблице первичных данных цифрой 1 обозначалась высокая, а цифрой 2 низкая привлекательность достижений). Следовательно, высокая привлекательность достижений повышает количество успешных бросков, тогда как низкая, наоборот, снижает.
Для большей наглядности воспользуемся графической иллюстрацией основного эффекта
ПД. Нажмите кнопку Means/Graphs, отметьте мышкой в открывшемся окне верхнюю
строку таблицы с фактором ПД и нажмите ОК, На экране появится рисунок (см. рис.. 9):
Plot of Means (unweighted)
ÏÄ Main Effect
F(1,48)=5,92; p<,0188
52
51
Variable: ÐÄ
50
49
48
47
46
45
G_1:1
G_2:2
ÏÄ
Рисунок 9. Графическая иллюстрация основного эффекта ПД.
На этом рисунке на горизонтальной оси отмечены два уровня ПД (слева – высокая, справа
– низкая привлекательность достижений). На вертикальной оси – оценки зависимой переменной РД (количество успешных бросков). Вверху приведены сведения о значимости основного эффекта ПД. Левая и правая точки на графике соответствуют количеству успешных бросков в условиях высокой и низкой привлекательности достижений (51,23 и 45,92,
соответственно, см. нижнюю таблицу на рисунке 8). Теперь мы можем наглядно увидеть,
как именно привлекательность достижений (ПД) влияет на реальные достижения (РД).
Поскольку основной эффект ТУД оказался незначимым, просматривать сведения о нем не
имеет смысла. Поэтому сразу перейдем к эффекту взаимодействия ПД и ТУД. Нажмите
кнопку Continue (Продолжить), а затем кнопку Cancel (Отменить). Снова нажмите кнопку
Specific effect/Means/Graphs, отметьте мышкой в открывшемся окне оба фактора, ПД и
ТУД, и нажмите ОК. На экране появятся две следующие таблицы (см. рис. 10):
Рисунок 10. Табличная иллюстрация эффекта взаимодействия ПД и ТУД.
Верхняя таблица (см. рис. 10) приводит сведения об эффекте взаимодействия, уже известные нам по рисунку 7. Нижняя таблица показывает, что оценки в двух средних строках
оказываются несколько более высокими по сравнению с оценками в крайних строках (см.
иллюстрацию расчета эффекта взаимодействия на рис. 6(г)). Однако в отличие от предыдущего случая с основным эффектом ПД из этого пока трудно составить представление о
характере такого взаимодействия, поэтому для большей наглядности воспользуемся его
графической иллюстрацией.
Нажмите кнопку Means/Graphs, отметьте мышкой в открывшемся окне нижнюю строку
таблицы с эффектом взаимодействия. В появившемся окне (см. верхнюю часть рис. 11) по
умолчанию первая и вторая независимые переменные (ПД и ТУД) будут отмечены в левом и правом поле, соответственно. Такая разметка дает программе указание, чтобы в будущем графике на горизонтальной оси показывались уровни второй независимой переменной (ТУД). [Если бы нам захотелось, чтобы на горизонтальной оси показывались
уровни ПД, а не ТУД, можно было бы изменить разметку переменных по умолчанию, однако в данном случае этого делать не нужно, поскольку переменную-условие, а у нас это
ТУД, всегда лучше для наглядности изображать на горизонтальной оси Х.]
Нажмите ОК и еще раз ОК. На экране появится следующий график (см. нижнюю часть
рис.. 11):
Plot of Means
2-way interaction
F(1,48)=4,78; p<,0337
56
54
Variable: ÐÄ
52
50
48
46
44
42
G_1:3
G_2:4
ÏÄ:
G_1:1
ÏÄ:
G_2:2
ÒÓÄ
Рисунок 11. Графическая иллюстрация эффекта взаимодействия ПД и ТУД.
Устройство этого рисунка сходно с предыдущим (см. рис. 9), за исключением того, что в
данном случае на горизонтальной оси отмечены два уровня ТУД (слева – отсутствие,
справа – наличие высоких требований к уровню достижений, которые в таблице первичных данных обозначались цифрами 3 и 4, соответственно), а цветами линий обозначены
уровни ПД (синий – высокая, а красный – низкая привлекательность достижений). При
построении таких графиков переменную, представляющую условие (в данном случае, это
ТУД), при котором целевая переменная (в данном случае, это ПД) влияет на зависимую
переменную, обычно помещают на горизонтальной оси. А различные уровни целевой переменной обозначают цветами и/или сплошной и пунктирными линиями. Крайние точки
на графике показывают количество успешных бросков в четырех экспериментальных
условиях (см. нижнюю таблицу из рис. 10).
До сих пор мы знали лишь то, что ПД взаимодействует с ТУД, т.е., что его влияние на РД
(количество успешных бросков) при разных уровнях ТУД значимо различается. Однако
нам не было известно, как именно высокая и низкая привлекательность достижений влияет на количество успешных бросков в отсутствии и присутствии высоких требований к
уровню достижений. Предыдущий основной эффект ПД показал нам, что как таковая высокая привлекательность достижений повышала реальные достижения, а низкая, наоборот, снижала. Однако значимый эффект взаимодействия добавляет к этому еще один важный факт. Позитивное влияние высокой привлекательности достижений на результаты
достижений еще больше усиливается в присутствии высоких требований со стороны руководителя к уровню достижений. При этом высокие требования ровно таким же образом
усиливают негативное влияние низкой привлекательности достижений на результаты достижений. Наличие или отсутствие требований само по себе никак не влияет на результаты достижений (этот основной эффект оказался незначимым), оно всего лишь усиливает
позитивное влияние высокой ПД и негативное влияние низкой ПД на РД.
Подведем итоги нашему обсуждению процедуры дисперсионного анализа. Процедура дисперсионного анализа позволяет:
 рассчитывать и сравнивать средние оценки зависимой переменной в
разных экспериментальных условиях (для сравнения любой отдельно
взятой пары средних оценок можно использовать не рассматривавшуюся нами кнопку Planned comparisons (Планируемые сравнения));
 выявлять основные эффекты и эффекты взаимодействия независимых
переменных;
 представлять полученные результаты не только в табличной, но и в
графической форме, которая облегчает их интерпретацию (особенно
интерпретацию эффектов взаимодействия).
В завершение скажем о трех основных ограничениях дисперсионного
анализа (см. также файл «Одномерная GLM, ANOVA и ANCOVA в SPSS»).
1. В качестве независимых переменных в дисперсионном анализе могут
использоваться только категориальные переменные, каждое значение
которых отражает тот или иной уровень независимой переменной.
Именно это обстоятельство делает дисперсионный анализ пригодным
для проверки гипотез в экспериментальных исследованиях, где независимые переменные не измеряются, а подвергаются манипуляциям с последующим присвоением каждому экспериментальному условию своей
категории, обозначаемой цифрами 1, 2, 3 и т.д.
2. В обычный дисперсионный анализ можно включать только одну зависимую переменную. Однако модуль ANOVA программы STATISTICA
5.5 позволяет реализовывать кроме обычного ANOVA другую его
форму, называющуюся множественным дисперсионным анализом
(multiple analysis of variance, MANOVA). Если отметить в поле с зависимыми переменными несколько переменных, программа реализует
MANOVA, при этом она рассчитает искусственную среднюю оценку
(называющуюся центроидом) по всем зависимым переменным и проведет с ними стандартный ANOVA. MANOVA бывает полезен в случаях,
когда одна и та же зависимая переменная измеряется разными способами. Например, продуктивность решения задач можно измерять по
числу решенных задач, количеству времени, затраченного на их решение, количеству допущенных ошибок и т.п. MANOVA позволяет проанализировать, как независимые переменные влияют на эти показатели, взятые вместе, а также оценить их влияние на каждый отдельный
показатель (см. файл «Многомерная GLM, MANOVA и MANCOVA в
SPSS»).
3. В качестве зависимой переменной в дисперсионном анализе можно использовать только интервальные переменные (т.е., измеряющиеся интервальными шкалами, допускаются также порядковые шкалы, но не
ниже, чем с 5-балльным форматом выбора ответов). В остальных случаях (т.е., в случае категориальных и дихотомических зависимых переменных) вместо него используются обобщенные линейные модели
(GZLM) (см. файл «Обобщенные линейные модели в SPSS»).
Перед тем, как перейти к описанию процедур проверки различных видов гипотез в экспериментах, хочу напомнить, что некоторые эксперименты
предусматривают оценку эффективности манипуляций независимыми переменными (см. лекцию 8). В таких случаях проверка гипотез предваряется
проверкой эффективности экспериментальных манипуляций. Как она производится?
Иногда для проверки успешности манипуляций специфической независимой переменной используется T-тест Стьюдента для независимых выборок
(при двух уровнях независимой переменной) или однофакторный дисперсионный анализ (при большем количестве уровней). В таких случаях в качестве
зависимой переменной в T-тест или в однофакторный ANOVA включаются
оценки эффективности манипуляции, а в качестве группирующей (в Т-тесте)
или независимой (в однофакторном ANOVA) соответствующая независимая
переменная. Если обнаруживается значимый основной эффект такой независимой переменной и направление связи отвечает ожиданиям, делается вывод
об успешности манипуляции. Если проверяется эффективность двух манипуляций, для каждой проводится отдельный Т-тест или однофакторный ANOVA. Однако такой способ оказывается не совсем чистым, поскольку недостаточно показать, что манипуляция специфической независимой переменной
была успешной, необходимо также показать, что она при этом не влияла на
другую независимую переменную (переменные). Поэтому для проверки манипуляций традиционно рекомендуется использовать дисперсионный анализ,
в который включается не только рассматриваемая независимая переменная,
но и все остальные независимые переменные.
Возьмем в качестве примера наш эксперимент. В нем оценивалась эффективность только
одной манипуляции, привлекательностью достижений. Для этого участникам после получения инструкций и перед выполнением задания предлагалось оценить степень интереса к
его результатам по 10-балльной шкале от 1 (совершенно не интересны) до 10 (чрезвычайно интересны). Откройте файл «Дисперсионный анализ (таблица), в котором содержатся
результаты эксперимента. Соответствующие оценки участников приведены в столбце
ОПД. Зайдите в модуль ANOVA/MANOVA, нажмите Variables, отметьте в левом окне независимые переменные ПД и ТУД, а в правом зависимую переменную ОПД, нажмите ОК
и еще раз ОК, Нажмите All effects. Из таблицы в верхней части рисунка 12 видно, что значимым оказывается только основной эффект ПД, т.е. именно той переменной, эффективность манипуляции которой мы проверяли. Теперь нужно удостовериться, что направление связи соответствует нашим ожиданиям. Нажмите Continue, затем Specific
effect/Means/Graphs, отметьте в появившемся окне ПД и нажмите ОК. Из появившейся
таблицы (см. нижнюю часть рис. 12) видно, что оценки интереса участников (ОПД) в
условиях высокой привлекательности достижений (8,15) превышают соответствующие
оценки в условиях низкой привлекательности (5,73). Т.е., манипуляция ПД повышала интерес участников. Такая связь отвечает нашим ожиданиям. Следовательно, манипуляция
оказалась успешной. Если бы в этом исследовании оценивалась манипуляция уровнями
требований (ТУД), для ее проверки потребовалось бы провести еще один дисперсионный
анализ, на этот раз с оценками эффективности манипуляции ТУД И здесь также должен
был бы в идеале обнаружиться только один значимый эффект, основной эффект ТУД.
Рисунок 12. Сводные результаты по всем эффектам.
Если обнаруживается значимый основной эффект другой независимой
переменной, это не всегда означает, что ваша манипуляция была недостаточно «чистой». Может оказаться, что независимые переменные просто коррелируют между собой, и тогда любое изменение в одной будет неизбежно вызывать изменения в другой. Это является недостатком лишь тогда, когда вы
предполагали, что такого не должно быть.
Теперь можно перейти к процедурам проверки гипотез в экспериментах. Они не отличаются от тех, что рассматривались применительно к опросам, за исключением того, что прежде они иллюстрировались на примере регрессионного анализа, а теперь они будут иллюстрироваться на примере
ANOVA. Как и в предыдущей лекции, мы обсудим процедуры проверки трех
видов гипотез: об опосредовании, о предпосылках и следствиях, и о модерировании (см. там же соображения, лежащие в основе таких процедур).
Гипотезы об опосредовании. Как уже говорилось, такие гипотезы проверяют модели, подобные изображенной на рисунке 13, и в общей формулировке звучат как Г опосредует влияния А и Б на Д (см. также табл. 1, лекция 5
с учетом замены термина «связи» на «влияния» в случае эксперимента).
А
Г
Д
Б
Примечания. Д – изучаемое явление; А и Б – предпосылки Д; Г – механизм Д.
Рисунок 13. Модель механизма.
Процедура проверки таких гипотез опирается на трехшаговую процедуру Барена и Кенни (см. лекцию 10 и файл «Барен и Кенни (1986)») в переложении на дисперсионный анализ. Опишем ее применительно к модели на
рисунке 14. При проверке гипотезы об опосредовании потребуется показать,
что:
1) А и Б значимо влияют на Д (для этого реализуется ANOVA с независимыми переменными А и Б и зависимой переменной Д с последующей оценкой основных эффектов А и Б);
2) А и Б значимо влияют на Г (для этого реализуется ANOVA с независимыми переменными А и Б и зависимой переменной Г с последующей оценкой основных эффектов А и Б);
3) после включения в ANOVA с А, Б и Д переменной Г в качестве ковариата ранее значимые основные эффекты А и Б в отношении Д
утратят свою значимость.
Гипотеза получает поддержку, если выполняются все три условия. Если первое условие полностью не выполняется (ни А, ни Б не влияют на Д),
проверка остальных шагов теряет смысл. При этом допускается частичное
выполнение третьего условия. А именно, когда ранее значимые основные
эффекты А и Б сохраняют свою значимость, но при этом она заметно снижается (напр., с .001 до .01 или с .01 до .05). В таком случае можно говорить о
частичной поддержке гипотезы.
В связи с тем, что при проверке третьего условия гипотезы об опосредовании переменная Г используется в качестве ковариата, хочу напомнить,
что ранее при знакомстве с процедурой ANOVA мы отложили обсуждение
кнопки Covariates (Ковариаты) (см. рис. 2). Теперь будет уместно сказать о
ней несколько слов. Она служит для введения дополнительных независимых
переменных, которые рассматриваются в качестве ковариатов. В предыдущей лекции отмечалось, что функцию ковариата может выполнять любая,
дополняющая рассматриваемый набор независимых переменных, независимая переменная, предположительно связанная с зависимой переменной. Эффекты ковариата в отношении зависимой переменной могут различаться в
зависимости от того, насколько он связан с независимой и с зависимой переменной. Однако в целом существует следующее «правило большого пальца»:
чем сильнее связь ковариата с независимой и с зависимой переменной, тем
больше он будет ослаблять влияние независимой на зависимую переменную,
и наоборот. Как и в регрессионном анализе, где в качестве ковариатов допускается использовать дихотомические переменные (напр., пол), в GLM ковариатами теоретически могут быть не только непрерывные переменные (т.е.,
измеряемые на основе интервальных или, как минимум, порядковых шкал),
но и дихотомические. Тем не менее, если есть такая возможность, в качестве
ковариатов все же лучше использовать непрерывные переменные, Поскольку
другие независимые переменные в GLM чаще всего также являются дихотомическими (или, при наличии у них более двух уровней, категориальными),
использование дихотомической переменной в роли ковариата может вызывать иллюзорные связи между ковариатом и независимыми переменными
(дихотомические переменные склонны коррелировать друг с другом независимо от их смыслового содержания). (См. также обсуждение ковариатов в
файлах «Одномерная GLM, ANOVA и ANCOVA в SPSS» и «Дисперсионный
анализ в STATISTICA».)
Если ранее при проверке связей контролируемых переменных с зависимыми переменными (в нашем примере, с Г и Д) обнаружилось, что какаято из них значимо коррелировала хотя бы с одной из зависимых переменных,
она включается во все три анализа в роли ковариата. Если после включения в
процедуру ANOVA ковариата прежде значимые основные эффекты сохранили свою значимость, делается вывод, что контролируемая переменная не
влияла на результаты проверки гипотезы. Если же они утратили значимость,
делается вывод, что хотя независимые переменные и влияли на зависимую,
их влияние было слабее, чем влияние такой переменной. В таких случаях
можно говорить лишь о частичной поддержке гипотезы. Как уже говорилось,
в качестве ковариатов в ANOVA рекомендуется использовать непрерывные
переменные. Если контролируемая переменная является дихотомической
(напр., пол), ее лучше включать в ANOVA в качестве обычной независимой
переменной в дополнение к остальным независимым переменным. Об отсутствии влияния такой переменной на зависимую можно говорить лишь при
отсутствии значимого основного эффекта и/или значимых эффектов взаимодействия этой переменной с остальными независимыми переменными.
Иллюстрация проверки гипотезы об опосредовании. Хотя проверявшаяся в нашем эксперименте модель (см. рис. 1) несколько отличается от той, которая изображена на рисунке
13, третья из гипотез, формулировавшихся для ее проверки, представляет собой вариант
гипотезы об опосредовании: «влияния привлекательности достижений и их взаимодействия с требованиями руководителя на реальные достижения будут опосредоваться
желаемым уровнем достижений». Для ее проверки потребуется провести три дисперсионных анализа: с ПД, ТУД и РД, с ПД, ТУД и ЖУД, с ПД, ТУД и РД с включением в последний анализ ЖУД в роли ковариата. Единственное отличие от описанной выше трехшаговой процедуры будет состоять в том, что в данном случае потребуется оценивать не
два основных эффекта ПД и ТУД, а основной эффект ПД и эффект взаимодействия ПД и
ТУД. Проведя эти анализы, вы увидите, что гипотеза получает поддержку.
Гипотезы о предпосылках и следствиях. Такие гипотезы проверяют модели, подобные изображенной на рисунке 14, и в своей общей формулировке
звучат как А и Б влияют на Д, а Д влияет на Е (см. табл. 1, лекция 5 с учетом
замены термина «связи» на «влияния» в случае эксперимента).
А
Д
Е
Б
Примечания. Д – изучаемое явление; А и Б – предпосылки Д; Е – следствие Д.
Рисунок 14. Модель предпосылок и следствий.
Как говорилось в предыдущей лекции, для проверки таких гипотез
нужно показать, что:
1) А и Б значимо влияют на Д (для этого реализуется MANOVA/MANCOVA с категориальными независимыми переменными А
и Б и зависимой переменной Д с последующей оценкой основных
эффектов А и Б);
2) Д
значимо
влияет
на
Е
(для
этого
реализуется
MANO-
VA/MANCOVA с непрерывной независимой переменной Д и зависимой переменной Е с последующей оценкой основного эффекта Д);
3) после реализации MANOVA/MANCOVA с категориальными независимыми переменными А и Б, непрерывной независимой переменной Д и зависимой переменной Е ранее значимый основной эффект
Д не будет утрачивать своей значимости.
Подобная гипотеза получает поддержку только при выполнении всех
условий, в остальных случаях (за исключением случая, когда не выполняются все три условия), можно говорить лишь о ее частичной поддержке. При
этом, конечно, следует учитывать не только значимость основных эффектов,
но и их направление (соответствуют они ожиданиям или нет, т.е. действительно ли средние оценки зависимой переменной оказывались выше в тех
группах, в которых это ожидалось, и наоборот).
Как вы заметили, для проверки этой гипотезы процедуру ANOVA придется заменить процедурой MANOVA/MANCOVA, поскольку ANOVA не
приспособлена изучать отдельное влияние непрерывной независимой переменной (т.е., в отсутствие других, категориальных независимых переменных)
на зависимую, что требуется при проверке второго условия.
Процедура запуска MANOVA/MANCOVA в программе STATISTICA 5.5. Откройте файл
«Дисперсионный анализ (таблица)». В меню Analysis выберите Startup Panel, прокрутите
появившийся список вниз и дважды щелкните на General Linear Model (общая линейная
модель). В появившемся окне по умолчанию будет отмечена опция General MANCOVA
/MANOVA (общий множественный дисперсионный/множественный ковариационный
анализ). Нажмите ОК. После нажатия на кнопку Variables появятся окно, разделенное на
три белых поля: левое для зависимых переменных, среднее для категориальных независимых переменных (факторов) и правое для непрерывных независимых переменных (ковариатов). Как и в случае с ANOVA, основная информация об основных эффектах и взаимодействиях выводится после нажатия кнопки All effects. Нажатие вкладки Means (средние)
позволяет рассчитать средние групповые оценки в различных экспериментальных условиях, а вкладки Plot (график) построить графики, иллюстрирующие основной эффект для
любой выбранной независимой переменной или эффект взаимодействия двух выбранных
независимых переменных. В остальном работа с этой процедурой мало чем отличается от
работы с обычным ANOVA.
Если ранее при проверке связей контролируемых переменных с зависимыми переменными (в нашем примере, с Д и Е) обнаружилось, что какаято из них (напр., возраст) значимо коррелировала хотя бы с одной из зависимых переменных (напр., с Е), она включается во все анализы в качестве ковариата (непрерывной независимой переменной). Процедура проверки влияния
таких переменных уже описывалась в предыдущей гипотезе.
В завершение обсуждения гипотезы о предпосылках следует вспомнить, что она является обобщением двух других моделей (см. лекцию 5), которые также можно проверять в исследованиях. Речь идет о модели предпосылок и модели следствий. Формулировки гипотез для той и другой модели
соответствуют первой и второй частям гипотезы о предпосылках и следствиях (см. выше). Процедуры их проверки достаточно просты. Так, при проверке
гипотезы о предпосылках реализуется обычный ANOVA, куда в качестве независимых переменных включаются все предпосылки.
Иллюстрация проверки гипотезы о предпосылках. Хотя проверявшаяся в нашем эксперименте модель (см. рис. 1) несколько отличается от той, что изображена на рисунке 14,
первая из гипотез, формулировавшихся для ее проверки, представляет собой вариант гипотезы о предпосылках: «реальные достижения индивида будут зависеть от степени их
привлекательности». Для ее проверки потребуется показать наличие значимого основного эффекта ПД в отношении РД (что мы уже делали на примере дисперсионного анализа,
см. рис. 7, 8 и 9). (См. также примеры проверки такой гипотезы у Ребзуева, 2012.)
Для проверки гипотезы о следствиях также используется процедура
MANOVA/MANCOVA, так как она позволяет изучать отдельное влияние непрерывной независимой переменной (т.е., в отсутствие других, категориальных независимых переменных) не только на одну, но и сразу на несколько
зависимых переменных (см. файл «Дисперсионный анализ в STATISTICA».).
Гипотезы о модерировании. Такие гипотезы проверяют модели, подобные изображенным на рисунке 15, и звучат как В модерирует влияние А на Д
или В модерирует влияние А на Г (см. табл. 1, лекция 5 с учетом замены термина «связь» на «влияние» в случае эксперимента).
В
В
или
А
Д
А
Г
Примечания. Д – изучаемое явление; А – предпосылка Д; Г – механизм Д; В – условие (внутреннее или внешнее), которое гасит или усиливает влияние А на Д или Г.
Рисунок 15. Модель условий.
В более специфических формулировках такие гипотезы могут звучать
как В будет усиливать влияние А на Д или В будет ослаблять влияние А на Д.
Или в присутствии В влияние А на Д будет усиливаться или в присутствии
В влияние А на Д будет ослабляться. То же самое, если в исследовании помимо явления также изучается его механизм (Г) (в последнем случае условие
В переносится на Г).
Для проверки таких гипотез реализуется ANOVA с независимыми переменными А и В и зависимой переменной Д (или Г) с последующей оценкой
эффекта взаимодействия А и В (сравните последний с «членом взаимодействия» А и В, который для проверки таких гипотез в регрессионном анализе
приходится создавать искусственным путем).
Как и с предыдущими гипотезами, если какая-то контролируемая переменная значимо коррелирует с зависимой переменной, она включается в такой анализ в роли ковариата (или дополнительной независимой переменной,
в случае пола).
Иллюстрация проверки гипотезы о модерировании. Вторая из гипотез, формулировавшихся для проверки модели, изображенной на рисунке 1, представляла собой вариант гипотезы о модерировании и звучала как «высокие требования со стороны руководителя
будут усиливать влияние привлекательности достижений на реальные достижения, если
такая привлекательность оказывается высокой, и ослаблять, если она оказывается низкой». Она соответствует левой модели на рисунке 15. Для ее проверки потребуется провести дисперсионный анализ с независимыми переменными ПД и ТУД и зависимой переменной РД. Поскольку формулировка гипотезы предполагает значимое влияние ПД на РД
и взаимодействие ПД с ТУД и не предполагает значимого влияния ТУД на РД, ее проверка будет сводиться к оценке значимости основного эффекта ПД и эффекта взаимодействия. Вспомним, что мы уже реализовали такую проверку, когда обсуждали то, как работает процедура дисперсионного анализа (см. рис. 7, 10 и 11). Ее результаты согласуются с
прогнозами второй гипотезы.
Эту лекцию мы начали с обсуждения наиболее распространенной процедуры, использующейся для проверки гипотез в экспериментах, дисперсионного анализа (ANOVA), к которой затем добавили (при описании проверки
гипотезы о предпосылках и следствиях) процедуру MANOVA/MANCOVA,
позволяющую реализовывать такой анализ в ситуациях, когда в качестве
единственной независимой переменной используется непрерывная переменная (ковариат). К настоящему моменту то, что вы узнали о регрессионном
анализе и ANOVA, могло вас навести на мысль о смысловом сходстве некоторых статистических показателей регрессионного анализа и ANOVA. Так,
F-тесты, оценивающие значимость основных эффектов в ANOVA, выполняют ту же функцию, что и t-тесты, оценивающие значимость бетакоэффициентов независимых переменных в регрессионном уравнении. Более
того, эффекты взаимодействия в ANOVA и GLM по своей функции ничем не
отличаются от членов взаимодействия в регрессионном уравнении. [Может
быть, поэтому при описании результатов регрессионного анализа исследователи часто называют связи независимых переменных с зависимой переменной «основными эффектами», а связи членов взаимодействия с зависимой
переменной «эффектами взаимодействия».] Отсюда может возникнуть вопрос: а нельзя ли для проверки гипотез в экспериментах использовать обычный регрессионный анализ? Например, включить в регрессионное уравнение
в роли независимых категориальные переменные, отражающие уровни факторов (если они не являются дихотомическими, их предварительно потребуется преобразовать в искусственные переменные, см. файл «Множественная
регрессия в SPSS»), дополнить их членом взаимодействия, после чего рассматривать значимость бета-коэффициентов этих переменных в роли показателей основных эффектов и эффекта взаимодействия? Можно, но вместо регрессионного анализа для проверки экспериментальных гипотез все же лучше использовать ANOVA. В отличие от регрессионного анализа, процедура
ANOVA лучше приспособлена к проверке именно экспериментальных гипотез, поскольку она допускает прямое использование категориальных независимых переменных, автоматически рассчитывает эффекты взаимодействия,
средние оценки зависимой переменной по разным экспериментальным условиям и проверяет значимость основных эффектов и эффектов взаимодействия. Кроме того, у ANOVA есть еще одно серьезное преимущество над
обычным регрессионным анализом. Как таковой, регрессионный анализ
предполагает линейные связи между изучаемыми переменными. И если связь
между независимой и зависимой переменной по каким-то причинам окажется
нелинейной, регрессионный анализ не сможет ее зафиксировать, даже если
она будет значимой. Для ANOVA же характер связей не имеет значения. Если связь действительно значима, ANOVA зафиксирует ее независимо от того,
линейная она или нет. Поэтому для проверки экспериментальных гипотез
вместо регрессионного анализа по возможности следует использовать ANOVA.
Литература
Файл «Дисперсионный анализ (таблица)».
Файл «Барен и Кенни (1986)».
Файл «Обобщенные линейные модели в SPSS».
Файл «Одномерная GLM, ANOVA и ANCOVA в SPSS».
Файл «Многомерная GLM, MANOVA и MANCOVA в SPSS».
Файл «Множественная регрессия в SPSS».
Файл «Дисперсионный анализ в STATISTICA».
Гудвин Дж. Исследование в психологии: методы и планирование. СПб.: Питер, 2004 (3-е изд.) (глава 8).
Ребзуев Б.Г. Импульсивное покупательское поведение в условиях ограниченности когнитивных ресурсов // Психологический журнал. 2012. Т. 33. №
2. С. 88-100.
Download