Виды эксперимента

advertisement
Виды эксперимента.
Э. в узком и широком смысле (строгий э. и квазиэксперимент).
Существенные признаки строгого эксперимента: повторяемость изучаемого
явления;
контролируемость
экспериментальный
(воспроизводимость).
объект;
основных
условий;
варьирование
Каузальный
характер
активное
воздействие
воздействий;
строгого
на
проверяемость
эксперимента
(о
непосредственных и косвенных причинах; условность их разделения, особенно в
психологическом контексте; дискретность научного знания).
Атрибутивный эксперимент: выявление неизвестных свойств психического
явления (напр., ассоциативной динамики); здесь нет речи о каузальности.
В нестрогом эксперименте отсутствует один или несколько из этих
признаков: единичный случай, эксп. post factum. Об этом – позже.
Пилотажный (предварительный) э. – есть все признаки строгого э., но не
соблюдены некоторые формальные требования к планированию и процедуре
проведения э. Цель – определить состав и диапазон НП и ЗП, испытуемых.
Что не относится к эксперименту? – Тестирование (психодиагностика), опрос,
наблюдение. Это – неэкспериментальные (но необходимые и важные!) методы.
Строгий эксперимент – это не начало, а окончательный итог долгого и
сложного пути экспериментатора в его движении от идейного замысла к его
воплощению. Поэтому описание эксперимента (в статье или докладе) не следует
отождествлять с реальным ходом экспериментального исследования.
Общая структура эксперимента.
(Рис.) Тема.
Цель (конкретизация темы) и задача (конкретизация цели). Напр.:
тема – индивидуальные различия в структуре сознания; цель – изучение
семантических пространств у студентов Х1, Х2, Х3., в которых представлены их
сокурсники; задача - сравнить индивидуальные данные для студентов, полученные
с помощью методики семантического дифференциала.
Важность
экспериментальной
эрудиции
для
решения
этих
задач.
Ограниченность эксперимента: не всякая идея поддаётся экспериментальной
2
разработке. Напр., нельзя заранее установить условия, при которых будет иметь
место экстрасенсорное восприятие (не ввыполняются требования повторяемости и
воспроизводимости);
некоторые
интересующие
нас
явления
ненаблюдаемы
(«Одинаковы ли ощущения цвета у разных людей?»); некоторые вопросы находятся
вне компетенции психолога: можно ли женщинам носить короткие юбки? (это
вопрос моды и этики). {Проблема границ психологического знания и его
применения}. Социологический опрос мнений – это ещё не психология и тем более
не эксперимент. (Деятельность как психологическая категория – это составная часть
жизни индивида, а не вся его жизнь: мы не называем деятельностью обыденный
завтрак, покупку вещей в магазине; поэтому здесь неуместно экспериментирование
с применением методов теории деятельности).
Формализация эксперимента:
Выбор экспериментальной парадигмы. Состав экспер. парадигмы.
Цель э. – выяснить соотношение НП и ЗП. Разнообразие: восприятие насилия
– агрессивность поведения; режим заучивания
– объём воспроизведения;
когнитивный стиль – время решения задачи; объём заучиваемого материала –
скорость воспроизведения; режим подкрепления – скорость образования навыка…
Качественные и количественные соотношения. В э. – и то, и другое. Отсюда –
задача сбора и обработки количественных данных (измерение). Что необходимо?
Метод и методика. Не всегда различаются. Метод – концептуальное орудие,
теоретический инструмент эксперимента (не всегда осознаётся или эксплицируется
автором). М.: интроспекции, психофизический, инструментальный, генетический,
поэтапного формирования, микроструктурный, семантического дифференциала. (Не
путать с методами обработки!)
Методика – операциональная схема эксперимента, определяемая его целью и
конкретными условиями проведения; м.: тахистоскопии, времени реакции,
заучивания бессмысленных слогов, ассоциации, окулографии, ЭЭГ.
Методов немного; методик – много, особенно их модификаций (контактные и
бесконтактные методики регистрации движений глаз, методики для изучения
3
различных
свойств
памяти,
внимания,
мышления,
эмоций,
двигательных
действий…).
Метод и методика находятся в свободных отношениях.
Гипотеза – ожидаемый результат. Для формулирования г. нужны достаточные
основания, полученные теоретическим путём при нализе исходных данных. К
исходным данным относятся как материалы из литературных источников, так и
собственные данные, полученные в предыдущих исследованиях. В поисковых э. (не
путать с пилотажными э.) гипотеза может отсутствовать. Такие э. проводятся для
добывания новых, недостающих для обоснования гипотезы данных.
Из Корниловой:
5.1. Система гипотез, проверяемых в психологическом эксперименте
"Владение нормативами экспериментального рассуждения предполагает
умение ориентироваться в системе гипотез, проверяемых в психологическом
эксперименте: в соотношении теоретической и экспериментальной гипотез,
экспериментальных и статистических гипотез, исходных и «конкурирующих»
объяснений.
Цель эксперимента – проверить исследовательскую, или «рабочую», по словам Б.
Теплова, гипотезу, которая направлена на правдоподобное объяснение возможности
видеть в управляемом факторе «воздействие», детерминирующее изменения
зависимой переменной. Такое понимание соотношения рабочей гипотезы и
собственно экспериментальной гипотезы фиксирует различие исторического и
логического способов изложения результатов экспериментального исследования.
То, что эксперимент может проводиться для сбора новых данных, относительно
которых еще не сложилось схем их психологических интерпретаций, фиксируется в
понятии рабочей гипотезы. Гипотеза как догадка о закономерности, лежащей в
основе взаимосвязи НП и ЗП, может появиться и после получения результатов
опытов. Однако при логическом способе построения отчета об экспериментальных
данных последние рассматриваются в контексте вопроса, для ответа на который
4
проводился эксперимент. В таком случае гипотеза является уже не просто догадкой,
а утверждением о виде эмпирической зависимости и возможном ее объяснении.
Теоретическая и экспериментальная гипотезы. Гипотеза как высказывание,
истинность или ложность которого заранее неизвестны, но может быть установлена
опытным путем, направляет построение любого исследования. Выполняется ли это
исследование методом наблюдения или эксперимента, зависит от типа утверждения
о
психологической
закономерности.
Гипотезы,
включающие
утверждения
каузального типа, проверяются только в экспериментальном исследовании.
Рассматриваемые
далее
соотношения
между
уровнями
теоретической
и
экспериментальной гипотез касаются предположений именно о каузальных
закономерностях.
С одной стороны, каузальная гипотеза как догадка представлена утверждением «X
воздействует на Y так, что...», т.е. является описанием отношения между НП и ЗП. С
другой стороны, это утверждение устанавливает законообразность или причинный
характер названного отношения, а значит, рассматривается как проявление
истинности другого высказывания – теоретической гипотезы. Для экспериментов с
научными целями характерна направленность на проверку эмпирических гипотез
ради пополнения теоретического знания. При проведении экспериментов с
практическими целями гипотетическое объяснение и теоретическая гипотеза могут
не иметь места, но это не значит, что не должны быть сформулированы доводы о
возможностях обобщения экспериментальных данных. Если целью организации
экспериментов в практических целях является прогноз на реальные виды
деятельности, ситуации и т.д., то обобщение, направленное в будущее, занимает
свое место в выводах.
Итак, при логическом представлении экспериментальных данных, получаемых с
познавательной (или исследовательской) целью, началом рассмотрения является не
рабочая гипотеза, а теоретическая, благодаря которой по принципу организации
условного суждения «если... то...» эксплицируется экспериментальная гипотеза.
Являясь утверждением о каузальной зависимости, экспериментальная гипотеза
5
автоматически
порождает
высказывание,
противопоставляющее
ей
противоположное утверждение.
Эксперимент может сравниваться с игрой, а в игре есть возможность выигрыша и
проигрыша. Контргипотеза, противоположная по содержанию экспериментальной,
есть проигрыш, но проигрыш этот может также служить цели прибавления знания,
как
и
выигрыш.
Если
экспериментальной
нет
гипотезы
возможности
с
точки
сформулировать
зрения
опровержение
возможности
получить
противоречащие ей опытные данные, значит, сформулированное высказывание не
может иметь статус гипотезы. Известно, что гипотеза – это утверждение, истинность
или ложность которого не известны, но могут быть проверены опытным путем.
Формулирование экспериментальной гипотезы и контргипотезы определяет, в каких
направлениях могут рассматриваться ожидаемые эмпирические данные.
Экспериментальная гипотеза ставится в такие критические условия проверки, чтобы
равными были шансы получить данные как «за», так и «против» предполагаемой в
ней эмпирической закономерности. На этом уровне подразумевается (или
формулируется)
одновременно
и
проверка
контргипотезы
как
отрицания
предполагаемой каузальной зависимости, следующего из получения данных против
исходной гипотезы. Полученные данные должны рассматриваться в первую очередь
под этим углом зрения – какая из двух зависимостей установлена эмпирически.
Кроме того, одна и та же эмпирическая закономерность может допускать разные
причинные интерпретации исходя из разных теоретических посылок или
переосмысления «технических» условий проверки гипотезы. Эти другие объяснения
называются третьей (по отношению к экспериментальной и контргипотезе)
конкурирующей гипотезой. Понятно, что этих «третьих» может быть более чем
одна. Однако статистически оцениваются шансы именно экспериментальной и
контргипотезы. Тот факт, что поля оцениваемых экспериментально гипотез и
возможных других интерпретационных гипотез не тождественны, выступает в
качестве одного из «парадоксов К. Поппера» [45].
Психологические и статистические гипотезы. Уровень статистических гипотез
–
это
необходимый
компонент
проверки
психологических
гипотез,
если
6
исследователь претендует на признание полученных результатов в качестве
достоверных или значимых и готов количественно оценить вероятность ошибок при
принятии решений об экспериментальных фактах. Это решения о том, имело ли
место различие между показателями ЗП в разных экспериментальных условиях и
какие конкретно различия можно описать на уровне статистически значимых
закономерностей. В статистических гипотезах уже нет утверждения о каузальном
характере влияния НП. Статистические гипотезы – это гипотезы о выборочных
значениях фиксируемых показателей. Такие гипотезы основаны на представлениях
о распределении вероятностей в некотором «выборочном пространстве» событий.
Статистическая проверка гипотезы состоит в выяснении того, насколько совместима
эта гипотеза с имеющимся (наблюдаемым) результатом «случайного выбора».
Уровень значимости (р) есть вероятность отвергнуть статистическую гипотезу Н0,
когда она верна. Выбор уровня значимости произволен. Однако есть ряд правил для
ориентировки в степени возможного произвола. Уровень значимости связан с
оценкой количества опытов или величиной выборок. Обычно указывается
минимальный уровень значимости, на котором можно отвергнуть гипотезу. С этим
уровнем связано установление того минимального экспериментального эффекта,
который будет признан экспериментатором достаточным для суждения: «в
экспериментальном и контрольном условиях наблюдалось такое-то различие между
выборочными значениями переменной». Различают формулировки нуль-гипотезы
(Н0) как гипотезы об отсутствии различий и направленной гипотезы (Н 1) о наличии
значимых различий. Утверждение об отвержении нуль-гипотезы служит одним из
оснований такой оценки эмпирических данных, что они свидетельствуют в пользу
принятия выдвинутого в экспериментальной гипотезе предположения.
Сама экспериментальная гипотеза не может считаться «доказанной». Она остается
открытой для дальнейшей проверки – в других исследованиях, другими
методическими средствами или на основе переформулирования входящих в нее
гипотетических конструктов. Однако она может быть отвергнута на основании того,
что не отвергнутой – на выбранном уровне значимости – осталась нуль-гипотеза.
Возможно также получение результатов, когда уровень значимости недостаточен
7
для суждения о том, можно или нет отвергнуть нуль-гипотезу. Этот случай
рассматривается как требование искать третье объяснение (т.е. рассматривать
влияние НП за рамками контекста экспериментальной и контргипотезы). Р.
Готтсданкер в главе 6 своего учебника приводит пример того, как связаны области
отвержения и неотвержения статистической гипотезы с областями принятия
экспериментальной или конкурирующей гипотезы и непринятия ни одной из них.
Статистические решения основаны на вероятностных суждениях. С этим связан
один из парадоксов развития экспериментального метода: детерминистски
сформулированные
утверждения
о
каузальных
зависимостях
оцениваются
вероятностно. Это еще один из «парадоксов К. Поппера». В отношении к проверке
психологических
гипотез
он
также
специально
обсуждается
[82].
Экспериментальная гипотеза включает обычно детерминистски сформулированное
объяснение отношения между НП и ЗП при определенном уровне других –
дополнительных – переменных. Предполагается, что в реальных условиях
устанавливаемая зависимость должна «пробить себе дорогу» сквозь цепь
случайностей или незапланированных влияний со стороны побочных переменных.
Вероятностно оценивается не само отношение между переменными и не истинность
психологического объяснения, а достоверность того, что ожидаемая зависимость
эмпирически установлена.
Специальная фиксация на постоянном уровне «третьих» переменных по отношению
к НП и ЗП имеет следующую функцию, важную в психологическом исследовании.
Они задают или ограничивают широту распространения выводов из эксперимента
на другие ситуации, в которых новый уровень «третьей» переменной (например,
мотивации людей) вызовет изменение отношения между Х и Y. Такие переменные
входят обычно в гипотезу в качестве условий, для которых сохраняется
зависимость, и называются дополнительными (ДП). Статистически влияние этих
дополнительных переменных не оценивается, если только они не рассматриваются в
факторных схемах в качестве самостоятельной НП.
Обратим внимание на то, что выборочные значения показателей в формулировках
статистических гипотез не являются психологическими переменными. Применение
8
статистических критериев также реализуемо и для других – непсихологических
переменных."
Состав методики:
- стимульный материал (…);
- задача испытуемого (…);
- аппаратное и программное обеспечение (для аппаратурных методик);
- независимые переменные (постоянные и варьируемые; для последних указать
диапазон, шаг и способ варьирования);
- план эксперимента (описание серий);
- процедура (проба, сеанс, блок, серия, их продолжительность, интервалы отдыха);
- зависимые переменные (речевой ответ, двигательный ответ, физиол. процесс,
время выполнения задания, количество правильных ответов и/или ошибок);
- регистрация данных (что и как регистрировалось);
- способ обработки данных;
- сведения об испытуемых (только релевантные и без указания ФИО!); обязательно
указывается пол, возраст, профессия, объём и состав выборки.
Идеальный и реальный эксперимент.
Требования идеального эксперимента:
-- варьирование только одной независимой переменной;
-- постоянство экспериментальной ситуации на протяжении всего эксперимента;
-- неизменность фонового состояния испытуемого, добровольность его участия в
эксперименте,
сотрудничество с экспериментатором, понимание инструкции и
строгое следование ей;
-- минимальное общение экспериментатора с испытуемым во время проведения
эксперимента;
-- бесконечная продолжительность эксперимента;
-- полное соответствие реальному прототипу.
Уязвимость реального эксперимента:
9
-- одновременное варьирование нескольких переменных и
возникающие в
результате взаимодействия вызванных ими эффектов;
-- включенность экспериментатора в экспериментальную ситуацию; (цит.3);
-- наличие неконтролируемых независимых переменных;
-- непредсказуемая изменчивость экспериментальной ситуации;
--
непостоянство
фонового
состояния
испытуемого
(или
состава
группы
испытуемых);
-- утомление, научение, колебания внимания;
-- отношение
испытуемого к экспериментатору и к содержанию эксперимента;
вынужденное участие испытуемого в эксперименте; (цит.4);
-- неэквивалентность испытуемых в группе или экспериментальных групп; (цит.5);
-- инструментальные
ошибки:
неадекватность методики,
зависимой переменной, неисправности аппаратуры.
(См. также Гудвин, с.227-236; это для семинара)
нечувствительность
10
Подбор испытуемых.
Кто? - определяется темой и задачами исследования.
Количественный состав. (Рис.) Популяция (может быть очень большая) и выборка.
ПОПУЛЯЦИЯ
1 2
3
Выборка
4
1, 2, 3, 4 – экспер. группы
Репрезентативная и нерепрезентативная
в. Относительность этих понятий.
Требования к репр. в.: 1) часть должна обладать свойствами целого; 2) разумный
объём. Репр. в. позволяет обобщать экспер. данные на всю популяцию (разница
между муж. и жен., образующими репр. в., сохраняется для всех м. и ж.). Примеры:
р.в. – для изучения мотивации студентов к уч. деят-ти - м. и ж., проживающие в
общежитии и дома, с разным матер. обеспечением, успевающие и неуспевающие.
Нерепр. в. – успевающие студенты.
Виды выборок: случайная (Гудвин, 147-148):
«Основной вид вероятностной выборки — простая случайная выборка. По сути, она
означает, что каждый член популяции с равной вероятностью может попасть в выборку. Например, чтобы сделать случайную выборку из 100 студентов вашего учебного заведения, вы можете сложить бумажки с именами всех студентов в большую
шляпу, а затем достать из нее 100 бумажек. В действительности процедура немного
более сложнее и обычно проводится с использованием таблицы случайных чисел
(Рис).
Простая случайная выборка — эффективный практический способ построения
репрезентативной выборки. Иногда его также используют по этическим причинам.
В случае если только небольшая группа людей может получить выгоду или понести
издержки и нет других разумных оснований для принятия решения, лучше всего
использовать метод случайной выборки. Известный пример такой выборки — лотерея для отбора людей, призывавшихся на военную службу, проводившаяся в 1969 г.
в разгар Вьетнамской войны. Чтобы все было честно, 365 дней года должны были
иметь равную вероятность стать первым, вторым, третьим и т. д. К сожалению, действительная процедура имела некоторые недостатки (Kolata, 1986). В большой барабан поместили капсулы, соответствующие каждому из дней года, при этом одновременно опускали все капсулы одного месяца. Первыми опустили январские кап-
11
сулы, затем февральские и т. д. Барабан прокрутили, чтобы перемешать капсулы, но,
по-видимому, не очень тщательно, потому что когда стали выбирать дни, капсулы,
опущенные последними, в большинстве своем выбирались первыми. В то время
лучше было не отмечать свой день рождения в декабре.
Простая случайная выборка имеет два недостатка. Во-первых, вам может понадобиться отразить в выборке определенные особенности популяции, а во-вторых, процедуру может быть невозможно применить на практике в случае, если популяция
очень велика. Сможете ли вы получить список всех людей, проживающих в
Соединенных Штатах, если вам потребуется сделать простую случайную выборку
североамериканцев? Первую проблему решает расслоенная выборка, а вторую —
гнездовая.»
стратометрическая (расслоенная) – отображается соотношение подгрупп в
популяции (напр.: популяция – 4000 мужчин и 1000 женщин; здесь неприменима
случайная выборка; выборка – 100 чел. = 80м.+20ж.); признак подгруппы может
быть любым, их может быть несколько; важно отбирать наиболее существенные;
кластерная – применяется в случае больших популяций; случайным образом
выбирается группа людей по какому-либо критерию (Гудвин,149);
«Метод расслоенной выборки весьма эффективен, но он не решает проблему
построения выборки из большой популяции, для которой обычно невозможно
получить полный список членов. Эту проблему решает кластерная выборка,
которую часто используют национальные службы опроса общественного мнения. С
помощью этого подхода исследователи случайным образом выбирают группу людей
(кластер), имеющих определенную особенность. Используя этот метод, можно
проводить опрос в кампусе большого университета. Если исследователь хочет
получить репрезентативную выборку студентов, а применить расслоенную выборку
невозможно, то альтернативой будет список базовых предметов данного учебного
заведения. Студенты разных специальностей, посещающие занятия по одному
предмету, образуют группу. Если в вузе преподают 40 базовых предметов,
исследователь может выбрать 10 из них, а затем провести опрос всех студентов,
посещающих эти курсы.
Если выбранные группы слишком велики, исследователь может выбрать из
них более мелкие подгруппы. Предположим, вы хотите узнать, нравится ли
студентам жить в многоэтажных общежитиях вашего кампуса, которые вы
операционально определили как любые общежития, имеющие восемь этажей и
более. Допустим, в вашем кампусе есть 15 таких зданий, в которых проживают в
общей сложности 6000 студентов. Воспользовавшись методом кластерной выборки,
сначала можно выбрать шесть зданий (каждое здание = группа), а затем для каждого
здания случайным образом выбрать три этажа и включить в выборку всех
проживающих на выбранных этажах в выбранных общежитиях (предположим,
около 40 человек па этаже). Таким образом, общее число выборки будет 720 человек
12
(40 х 3 х 6). Обратите внимание, что в данном случае можно также использовать
некоторые элементы расслоенной выборки. Если из 15 общежитий 10 женских и 5
мужских, то можно составить группу, отражающую это соотношение: 4 женских
общежития и 2 мужских.»
простая – в каузальных экспериментах, где очевидна репрезентативность выборки
(в психофизических э., в когнитивных исследованиях…); это – любая группа исп.
Построение экспериментальных планов.
1.Выбор зависимых и независимых переменных.
Задание независимых переменных. В любом эксперименте изучается влияние А на
Б. Тогда А – это независимая переменная. Она полностью контролируется
экспериментатором. НП имеет минимум два значения (уровня), которые определяют
экспериментальную ситуацию (экспериментальное условие). При одном значении
имеем воздействие, а это ещё не эксперимент (см. существенные признаки э.).
Пример: изучить влияние мышечной нагрузки на время точностного движения.
Мыш. нагр. – НП; в данном случае она может либо отсутствовать (фоновая серия),
либо иметь место (основная серия); или же можно варьировать интенсивность
нагрузки (например, её продолжительность).
Виды независимых переменных. Ситуативные НП: особенности окружения
(ситуации), создаваемого для испытуемого. Пример: изучается готовность человека
оказать помощь пострадавшему в ситуации с разным количеством окружающих его
наблюдателей... Это количество и есть ситуативная НП, и она может принимать
несколько значений: 0, 3, 6...
Стимульные НП: изменяются параметры стимульного материала: количество
запоминаемых знаков, яркость световой вспышки, частота звучащего тона,
количество альтернатив для реакции выбора...
Рабочие НП (пременная задания, task variable): варьируется вид задачи,
выполняемой испытуемым: перцептивные задачи в исследованиях зрительного
восприятия (обнаружение, различение, поиск, узнавание), мыслительные задачи в
исследованиях мышления, мнемические установки в исследованиях памяти...
Инструктивные НП: изучается влияние разных по содержанию инструкций
13
испытуемому на параметры выполняемой им деятельности (работать безошибочно
или медленно...).
Особая разновидность – субъектные НП. В отличие от предыдущих, они не
управляются экспериментатором, а выбираются из уже имеющегося материала. Это
такая хар-ка испытуемого, которую нельзя изменить, она не подвластна контролю
экспериментатора: IQ, тревожность, авторитарность, пол, расовая принадлежность.
Пример: для изучения влияния авторитарности (НП) испытуемого на его
способность к формированию понятий (ЗП) можно создать две или несколько групп
с разными показателями авторитарности (здесь полезны соответствующие тестовые
методики); то же – в экспериментах с тревожностью. (Здесь полная аналогия с
естественно-научным экспериментом, напр., когда Павлов отбирал особей с
определёнными типами ВНД).
Уязвимость экспериментов с субектными НП:
группы испытуемых, отобранные по одному критерию (напр., уровню самооценки),
могут оказаться неоднородными по какому-либо другому критерию (напр., по
степени
компетентности
в
экспериментальном
задании,
опыту
публичных
выступлений...).
Подкрепление (вознаграждение) как НП (опыты Скиннера; платёжная матрица в
экспериментах с обнаружением сигнала; манипулирование обратной связью в
экспериментах с двигательными действиями).
Раскрытие содержания НП. Интуитивная ясность некоторых НП: величина стимула;
длительность экспозиции; величина IQ (умств.возраст/физич.возраст х 100%);
возраст... Здесь нет проблем и с количественной оценкой значений НП. Но чем
более психологично содержание НП, тем менее его можно считать определённым и
и однозначным: уровень мотивации, показатель самооценки, степень агрессивности,
когнитивный стиль, эмоциональность, впечатлительность. Всё это – не физические
предметы, а абстракции, теоретические конструкты. Отсюда – угроза строгости
эксперимента: два исследователя, использующие "одну и ту же" НП (напр., средний
уровень мотивации), получают разные (вплоть до противоположных) результаты.
Эксперименты оказываются неповторимыми. Для предотвращения такой ситуации
применяются
"рабочие",
или
операциональные,
определения
НП:
точно
14
оговаривается, какие операции входят в определение НП в данных конкретных
условиях (гарвардский физик Перси Бриджмэн, "Логика современной физики",
1927г.). Напр., в опытах с животными опр. вида НП голод определяется как время,
истекшее после последнего кормления.
Примеры операциональных определений НП (Мартин, 200).
"Телепрограммы со сценами насилия" -? Операции:
вариант 1 - случайный подбор 100 чел; просмотр передачи; ответы на вопрос о
содержании насилия; если 75% ответов – "да", то программа считается содержащей
насилие;
вариант 2 – после просмотра каждому "эксперту" даётся список из 10 вопросов (был
ли нанесён вред человеку? имело ли место унижение одного человека другим? были
ли случаи убийства? и т.д.); если 2 ответа – "да", то программа считается
содержащей насилие.
Вопросы, которые требуют операциональных определений выделенных терминов:
"Становятся ли более благополучными супругами (ЗП) люди, имевшие ласковых
родителей
(НП)?;
"Влияет
ли
моральный
настрой
(НП)
работника
на
производительность (ЗП) его труда?
Выбор
размаха
(диапазона)
НП.
Поскольку
НП
имеет,
как
правило,
количественный аспект, этот выбор приобретает важное значение. Размах – это
разница между наибольшим и наименьшим уровнем выбранной НП.
Пример с выбором диапазона стимулов в психофизическом методе констант. Для
неадекватного диапазона невозможно построить психометрическую функцию.
Пример с оценкой телепрограмм:
1) есть насилие, если 100% опрошенных отвечают "да";
нет насилия, если все отвечают "нет".
2) есть насилие, если более 50% отвечают "да";
нет насилия, если менее 50% отвечают "да".
Здесь - максимальный
размах (как в Думе).
Здесь – много меньший
размах.
Рекомендации к выбору диапазона: придерживаться реализма (не допускать
"сокрушительных" эффектов, ибо они практически мало применимы; пример с
дозировкой марихуаны); диапазон должен демонстрировать эффеект (влияние t0 на
15
ловкость рук: 23-250 – нет, 15-250 – есть). Здесь очень помогает пилотажный
эксперимент.
Зависимые переменные. Требования к ЗП: чувствительность и устойчивость
(при выборе физиологических индикаторов); адекватность.
Виды ЗП:
Непосредственно наблюдаемые (двигательный ответ, КГР) и косвенные ЗП
(заучивание → нулевое воспроизведение, тест на узнавание; или повторное
заучивание со сбережением времени; физиологические индикаторы). Пример с
ездой на велосипеде: одна группа исп. умела ездить на велосипеде в далёком
прошлом, другая – нет (НП – прошлый опыт езды); чтобы проехать на велосипеде,
не касаясь земли ногами, в течение 1мин. первой группе понадобилось 7 попыток, а
второй – 14. Процент сбережения (ЗП) = (14-7):14х100 = 50%. (Очень косвенные ЗП
– IQ).
Одиночные и множественные ЗП. ВР при нажатии на кнопку – одиночная ЗП.
Иногда необходимо иметь несколько ЗП. Пример с зеркальным рисованием
(обведение контура звезды); здесь недостаточно измерять только количество
пересечений маршрута движения с заданным контуром: оно может оказаться
одинаковым в начале и середине упражнений и скрыть эффект явного улучшения;
нужно ввести дополнительные ЗП: время, общая длина маршрута, площадь участков
выхода за фигуру. Пример с временем реакции выбора (НП – количество
альтернатив, ЗП - время и точность; функция обмена времени на точность).
Проблема побочной (третьей) переменной.
Из Корниловой:
4.3.2. Дополнительные переменные
"Кроме управления НП и измерения ЗП, исследователь согласно гипотезе
должен учитывать еще одну переменную – дополнительную, уровень которой
определяет возможность последующих обобщений на изучаемый вид деятельности,
популяции, ситуации и т.д. В отличие от побочных переменных дополнительная
переменная входит в формулировку экспериментальной гипотезы как уточнение
условий, при которых ожидается действие НП.
Экскурс 4.7
Приведем пример дополнительной переменной, рассматриваемой с целью
расширения рамок обобщения об исследуемой зависимости. В лабораторных
исследованиях поведения в условиях риска на материале выбора лотерей, где
16
испытуемые производили гипотетические платежи в условиях возможного
выигрыша и проигрыша так называемых условных денег, выявлялись функции
полезности, фиксирующие изменения принятия решений о выборе лотереи, в
частности, с точки зрения субъективно ожидаемой вероятности исходов [70]. Деньги
в таких исследованиях были не настоящими, а условными, поскольку испытуемый
реально не выкладывал их из собственного кошелька. Такое существенное
обстоятельство, как отсутствие угрозы реального риска денежных потерь, ставило
вопрос о том, может ли выявленная в лабораторных условиях закономерность
предсказывать поведение человека в условиях реальных платежей, т.е. когда
человек несет материальную ответственность за принятое решение.
Исследователи восприятия риска С. Лихтенштейн и П. Словик выбрали в
качестве дополнительной переменной условия наблюдения за поведением игроков в
реальной жизни, а именно: проследили за реальными ставками игроков в ЛасВегасе. Принятие решения игроками в условиях реальных платежей, как оказалось,
соответствовало тем же закономерностям, которые обнаруживали студентыиспытуемые в лабораторной ситуации с условными деньгами.
На основании этого примера можно поставить вопрос: в какой степени
платежи в условиях игровой деятельности – будь то игра в лаборатории или игра в
казино – можно рассматривать в плане соответствия другим видам платежей
(например, в условиях реальных покупок)? Исследования в области экономической
психологии дают множество описаний регуляции такого поведения, включающего
ориентировку субъекта на факторы ожидаемой полезности результата сделанного
выбора. На данном примере важно показать, что исследователь всегда выбирает тот
критерий, по отношению к которому экспериментально установленную зависимость
можно переносить на другие виды реальности. Выбранные уровни дополнительной
переменной всегда будут ограничивать эти возможности переноса, делая, однако, их
более доказательными." (Здесь доп. переменная – субъективно ожидаемая
вероятность исхода).
2. Межгрупповые и внутригрупповые планы. (Рис).
Определения.
Синонимы: межсубъектный и внутрисубъектный планы.
17
Пример
простого
внутригруппового
плана
(Рис.):
влияние
задержки
воспроизведения (НП) на объём заученного материала (ЗП).
Здесь: нельзя предъявлять один и тот же материал; необходимо контролировать
эквивалентность внешних пер. (напр., характер запоминаемого материала должен
быть сходным в разных экспер. условиях). Доп. пер. – скорость предъявления.
Пример простого межгруппового плана (Рис.): дегустация вин. Технология
изменения цвета вина без изменения его вкуса. Как влияет цвет вина (НП) на его
предпочтение потребителем (ЗП)? Оценка предпочтения по 5-б. шкале: 1невкусное, 2- скорее непрятное, 3 – среднее на вкус, 4 – скорее приятное, 5 – очень
вкусное. Схема (в скобках приводятся индивидуальные оценки вкуса вина):
(Сравнение значимости различий между средними показателями по критерию
Стьюдента).
18
Межгрупповой план – единственно возможный, когда НП – субъектная пер.
Если сравниваются экстра- и иннтроверты, применяют межгрупповой план, так как
интроверт не может быть одновременно и экстравертом. Исключения: когда
субъектная переменная – возраст; здесь одни и те же люди участвуют в разные
периоды своей жизни (внутригрупповой план); другой случай, - когда субъектной
пер. является семейное положение (до и после развода).
Межгрупповой план применяется, когда исп. одной группы не могут участвовать в
двух условиях эксперимента вследствие приобретения опыта при прохождении
первого из условий (социальные эксперименты, опыты с мистификацией).
Пример: изучение влияния привлекательности "подсудимой" на срок
выносимого приговора. Две контролируемые НП: 1) вид преступления (квартирное
ограбление с похищением $2000, либо мошеничество в виде соблазнения холостяка
и убеждения его вложить $2000 в несуществующую фирму; 2) физическая
привлекательность преступницы (использовались фотографии одной и той же
женщины, выглядевшей либо как привлекательная, либо как непривлекательная).
Рис.: схема межгруппового плана:
Вывод: привлекательность "преступницы" оказывает разное влияние на решение
"судей": если привлекательность используется в корыстных целях (мошеничество),
то её эффект (больший срок осуждения) противоположен тому, который имеет
место в случае "непрагматической" привлекательности (меньший срок осуждения
при ограблении). Здесь опыт участия в одном условии (привлекательная воровка)
19
может повлиять на решение, принимаемое при другом условии (непривлекательная
мошеница), поэтому требуется межгрупповой план. Заметим, что если бы была
только одна НП (ограбление-мошеничество), то эффект привлекательности в разных
случаях (напр., при проведении эксперимента разными авторами с использованием
либо
ситуации
"ограбление",
либо
ситуации
"мошеничество")
был
бы
неодинаковым.
Сравнение внутри- и межгруппового планов по разным критериям показывает
преимущества и недостатки каждого (см. также Мартин, табл.8.7, с.252) (Рис.):
Критерии сравнения
Экспериментальный Колич. Порядок
исп.
условий
план
Внутрилучше
хуже
групповой
Межхуже
лучше
групповой
Разброс
данных
Единичн.
случай
Индивид.
различия
меньше
пригоден
лучше
больше непригоден
хуже
Кол-во исп. меньше во внутригрупповых планах.
Влияние предыдущего опыта может быть как положительным, так и
отрицательным, и оно может стать "внешней" переменной; во внутригрупповом
плане оно более вероятно.
В экспериментах со "специальными" испытуемыми (единичный случай), которых,
как правило, небольшое число, более пригоден внутригрупповой план.
В межгрупповом плане индивидуальные различия могут оказаться "внешней"
переменной. Поэтому здесь нужно позаботиться об эквивалентности
экспериментальных групп.
Эквивалентные группы – равные друг другу во всём, кроме значения НП. Способы
создания экв. групп Рис.): случайное распределение, блоковая рандомизация и
уравнивание.
20
Случ. распределение нужно отличать от случайного отбора (см. выше в
разделе о подборе исп.). Случ. распр.
–
метод
разделения
участников
на
доброволец
имеет
отобранных
группы:
каждый
равные
шансы
попасть в ту или иную экспер. группу.
Равномерно распределяются факторы
инд. различий (Рис., Гудвин, табл.,
стр.208).
Не обязательно, чтобы число исп. с
одинаковыми субъектными показателями (напр., тревожности) было одинаковым в
разных группах. Правило: чем больше количество испытуемых, тем больше
вероятность, что этим способом будут созданы эквивалентные группы.
Если нужно создать группы с одинаковым кол-вом испытуемых, то нужно
применять
блоковую
рандомизацию
(Рис.,
Гудвин,
Табл.6.1., стр. 209-210).
Здесь
последовательность
экспериментальных
условий
(напр., таких условий 4, это и
есть
кол-во
определяется
экспер.
по
групп)
таблице
случайных чисел. Для каждого
условия нужно набрать, напр., 20 замеров (по одному на каждого исп.). Тогда N
(кол-во исп.) = 4 х 20 = 80.
Схема блоковой рандомизации:
21
Здесь: выделенные числа 1-4 – блоки
условий, составленные по таблице
случ. чисел;
* - испытуемые;
------- замеры, относящиеся к одному
экспер. условию.
4 условия эксперимента группируются по блокам, как показано на верхней
строчке. Внутри каждого блока они чередуются случайно. В каждом условии
участвует один испытуемый. Данные для одного и того же условия суммируются, и вычисляется их среднее значение. Затем проверяется значимость
различий между средними.
Далее – по Гудвину, табл.6, с.209:
«Ниже представлена блоковая рандомизация, проведенная для исследования, в
котором сравнивается влияние четырех скоростей показа слов на их запоминание.
Шаг 1. Определите, сколько людей вы будете обследовать. Если вы хотите изучать
равное количество людей при каждом из условий, общее количество получается умножением этого значения на количество условий (в данном случае четыре). Предположим, вам нужно 80 человек, по 20 для каждой скорости показа.
Шаг 2. Пронумеруйте четыре условия от 1 до 4. Каждый блок будет содержать
случайную последовательность этих чисел.
Шаг 3. Обратитесь к таблице случайных чисел (Рис.), просмотрите ее по рядам или
столбцам и выберите числа от 1 до 4.
Шаг 4. Запишите все последовательности в таблицу. (Никогда не обследуйте
участников, пока не создана таблица, в которой точно указано, как каждый из них
должен обследоваться.)
По окончании обследования каждого из участников вычеркивайте один из 80
номеров таблицы. После того как вы преобразуете числа из таблицы случайных
чисел в числа, обозначающие четыре условия эксперимента, и обследуете шесть
участников, участок построенной вами таблицы будет иметь следующий вид:
Блок 1 1 3 4 2
Блок 2 4 3 2 4
Блок 3 3 2 1 4
……………………
Блок 20 2 4 3 1
22
При небольших выборках
испытуемых
случайное
распределение их по группам не
всегда
помогает
эквивалентные
группы.
Случайное
"случайно"
создать
распределение
может
создать
неэквивалентные группы (Рис.,
Гудвин, с.211). В результате
получаются разные выводы: в отличие от предыдущего случая, здесь скорость
предъявления слов не влияет на запоминание (тревожность снижает запоминание).
Проблема решается с помощью процедуры уравнивания.
Уравнивание
(уравновешивание).
Исп.
группируются
по
принципу
обладания какими-либо особенностями (тревожность, агрессивность, пол...),
которые оцениваются с помощью адекватных тестов или методик. Эта особенность
наз. переменной уравнивания. Алгоритм уравнивания для двух экспериментальных
групп состоит из 4 шагов (Рис. , Гудвин, с.212-213).
Иногда одинаковые или очень
близкие значения уравниваемой
переменной отсутствуют. Тогда
нужно
оценок:
выбирать
все
интервалы
значения,
попадающие в этот интервал,
относят к одной группе (напр,
IQ = 140-130; 129-120; 119110....).
Но иногда и это невозможно. Пример:
Нужно создать две группы (для двух НП) из 8 крыс с разными показателями
активности (ПА). ПА измерялся по времени выхода крысы из стартовой камеры в
23
последней из 5 попыток. Результаты (в сек.): (Рис.) С помощью свободной
процедуры уравнивания (попарный подбор ad lib) образованы две группы:
Группа А Группа Б
20,5
8,0
7,2
3,2
Ср. 9,72
17,2
10,7
6,5
4.3
Ср. 9,67
Эти группы эквивалентны: по средним значениям; в обеих есть высокие и низкие
оценки.
Синоним создания эквивалентных групп – попарный подбор.
Условия уравнивания. 1)Переменная уравнивания должна быть существенно
связана с зависимой переменной (тревожность ухудшает запоминание); при низкой
корреляции эффект уравнивания может вообще отсутствовать. 2)Необходимо
пользоваться адекватным способом определения значения переменной уравнивания;
3) Количество уравниваемых переменных должно быть минимальным (в идеале – не
больше одной); 4)Если нет возможности уравнять экспериментальные группы, то
нужно увеличивать объём выборки испытуемых.
Особенности внутригруппового планирования.
Эффект последовательности – возникает в результате научения или утомления;
(пример с двумя типами клавиатуры, см. Мартин, с.233; критерий научения –
печатание со скоростью 30 слов в мин. Одна группа испытуемых. 45 часов
тренировки на клавиатуре QWERTY и 2 часа - на новой. Но это не значит, что новая
клавиатура лучше! Здесь – эффект тренировки ).
Способы компенсации (Рис.).
Частичное или полное уравновешивание.(Речь идёт не об устранении
вмешивающейся переменной, а о равномерном её распределении по всем уровням
НП!).
Примеры полного уравновешивания:
для двух уровней НП (А, В) последовательность условий будет АВ, ВА: А, В –
исп.1; В, А – исп.2; А, В – исп.3; В, А – исп.4, и т.д.
для трёх уровней НП (А, В, С):
24
А, В, С – исп.1;
А, С, В – исп.2;
В, С, А – исп.3;
В, А, С – исп.4;
С, А, В – исп.5;
С, В, А – исп.6.
Здесь каждый из исп. проходит через все условия эксперимента, но при
разном порядке чередования условий. Данные по каждому одноимённому условию
усредняются.
При
полном
уравновешивании
количество
разных
последовательностей равно Х!, где Х – количество уровней НП (условий); при Х = 3
Х! =1х2х3=6; при Х = 4 Х!=1х2х3х4=24. Понятно, что даже при среднем
количестве уровней НП (4-6) эксперимент оказывается в этом случае очень
громоздким. Избежать этого можно с помощью плана латинского квадрата.
Латинский квадрат (частичное уравновешивание). (Рис.). Пример (4 читателя,
НП - 4 шрифта; время чтения текста - ЗП):
Порядок чередования условий
Исп.
1
2
3
4
1 Чикаго Курьер Женева Таймс
2
Курьер Таймс Чикаго Женева
3
Таймс Женева Курьер Чикаго
4
Женева Чикаго Таймс Курьер
Это – сбалансированный лат. кв. 4х4. Свойства: а)каждое условие появляется во
всём эксперименте с одинаковой частотой (здесь – по 4 раза); б)каждому условию
предшествует, а также следует за ним каждое другое условие строго один раз, то
есть для каждого исп. непосредственное окружение, в котором находится данное
условие, является иным. Данные, относящиеся к одному и тому же условию,
объединяются и вычисляется среднее значение.
Алгоритм построения латинского квадрата (Гудвин, с.220).
«В правильном латинском квадрате каждое экспериментальное условие в каждой
последовательной позиции встречается одинаково часто и каждому условию
предшествует, а также следует за ним каждое другое условие строго один раз. Ниже
показано, как построить квадрат размером 6x6 для условий А, В, С, D, E, F.
Шаг 1.
Постройте первый ряд в соответствии со следующим правилом:
А В «X» С «Х-1» D «Х-2» Е «Х-3» F.
где А означает первое экспериментальное условие, а «X» — последнее. Для построения квадрата размером 6 х 6 в первом ряду будут сделаны следующие замены:
X = шестая буква алфавита → F;
Х-1 = пятая буква → Е.
Х-2 = четвёртая буква →D
Х-3 = третья буква → С
Таким образом, первый ряд будет состоять из следующих 6 букв:
25
А В F (заменяя «X») С Е (заменяя «Х-1») D, т.е. A B F C E D.
Шаг 2.
Постройте второй ряд. Прямо под каждой буквой первого ряда во втором
ряду поместите следующую по алфавиту букву, единственное исключение — буква
F (последняя). Дойдя до нее, вернитесь к началу ряда (буква А) и поместите под ней
эту букву. Получится следующее:
АВFСЕD
ВСADFЕ
Шаг 3.
Постройте оставшиеся четыре ряда следуя правилу, изложенному на шаге
2. Таким образом, конечный квадрат размером 6x6 будет:
АВFСЕD
ВСADFЕ
СDВЕAF
DЕСFВА
ЕFDАСВ
FАЕВDС
Шаг 4. Чтобы задать действительную последовательность условий для каждого
ряда, случайным образом поставьте в соответствие буквам от А до F шесть
экспериментальных условий. Для каждого ряда выделите одинаковое количество
участников.
А В F С Е D
В С А D F Е
С D В Е А F
D Е С F В А
E F D А С В
F A Е В D С
Здесь жирным шрифтом выделено условие А, чтобы показать вам, как латинский
квадрат выполняет два условия, указанные выше. Во-первых, условие А появляется
в каждой из шести последовательных позиций (первым в первом ряду, третьим во
втором и т. д.). Во-вторых, за A каждая другая буква следует строго один раз. Это
верно и для всех остальных букв.»
NB: количество испытуемых должно быть кратно количеству рядов квадрата,
т.е. в данном случае – 6, 12, 18, 24 ...
Часто необходимо, чтобы исп. несколько раз повторял задания при одном и
том же наборе условий (а не один раз, как в схеме лат. кв.). Это – эксперименты с
повторными испытаниями. Здесь возможны две процедуры:
обратное позиционное уравнивание (АВСD, DCBA, ABCD, DCBA и т.д. сколько
угодно раз); пример с иллюзией М.-Л. – зависимость степени выраженности
иллюзии от угла наклона линий (гориз., верт., 45о , 135о .). НП – угол поворота (4
уровня), ЗП – разница между видимыми длинами линий, измеряемая методом
установки;
блочная рандомизация: все условия используются по одному разу, прежде чем
любое из них встретится во второй раз. В пределах каждого блока порядок
расположения условий случайный, что предотвращает возможность угадывания
26
испытуемым предстоящего хода событий (эта проблема может возникнуть при
обратном позиционном уравновешивании).
Пример 1 (Солсо, с. 171): группа испытуемых из 5 чел.; каждому исп.
предъявляются по 7 стимулов (напр., изображений лиц или цветов), которые он
должен оценить (приятные – неприятные). По каждому стимулу от каждого исп.
нужно получить по 10 оценочных суждений. Вначале исп. предъявляется
последовательность стимулов 1, 2, 3, 4, 5, 6, 7 (блок1), затем – та же семёрка в
другом случайном порядке (блок2), и так 10 раз. Эта процедура повторяется с
каждым из 5 испытуемых.
Пример 2 (Гудвин, с.223-224).
«Способность людей определять местонахождение источника
звуков известна с давних пор: в обычных условиях мы довольно
легко определяем направление, откуда приходит звук. Карелло и ее
исследовательская группа заинтересовались вопросом, могут ли
люди определить размер объекта по звуку, издаваемому им при
падении на пол. Для изучения данного вопроса был разработан аппарат, изображенный на Рис. Испытуемые слышали, как деревянная рейка падала на пол, и
пытались определить ее длину. В качестве ответа участники за одну пробу изменяли
расстояние между краем стола, за которым они сидели, и подвижной вертикальной
поверхностью. Пробой называлось падение одной и той же рейки с определенной
высоты пять раз подряд. Слушая звук падений, участники передвигали стенку
вперед и назад, пока расстояние между ней и столом не становилось равным длине
рейки. В первом из двух экспериментов независимой переменной была длина рейки.
Она принимала семь значений: 30, 45, 60, 75, 90, 105 и 120 см. Каждый участник
определял длину каждой рейки три раза. Как и следовало ожидать,
экспериментаторы провели позиционное уравнивание последовательности длин
реек и сделали это с помощью блоковой рандомизации. Таким образом, семь реек
разной длины использовались в одном случайном порядке (1-я проба), затем в
другом (2-я проба) и, наконец, в третьем (3-я проба). Еще раз обратите внимание на
важную особенность блоковой рандомизации: каждая длина использовалась по
одному разу, прежде чем одна из них использовалась повторно, и по два раза,
прежде чем какая-либо из них была использована в третий раз.
Услышав звук падения рейки, испытуемый изменял расстояние между краем стола,
за которым сидел, и обращенной к нему лицом вертикальной поверхностью так,
чтобы оно равнялось длине рейки [Не очень понятен такой выбор].
Хотя задание на определение длины рейки может показаться очень сложным,
испытуемые справились с ним на удивление легко. Результаты второго эксперимента, который повторял первый, но с более короткими рейками (от 10 до 40 см),
были даже выше, чем результаты первого (рейки от 30 до 120 см). Стоит отметить
еще две особенности этих экспериментов. Во-первых, они представляют собой хороший пример стратегии, обычно используемой при исследовании восприятия:
внутригрупповой план, который требует небольшого количества испытуемых и
большого числа попыток. В первом эксперименте участвовали восемь студентов, а
во втором — шесть, причем каждый из них выполнял задание 21 раз (7 длин х 3
пробы). Во-вторых, цель таких исследований — испытание экспериментальной
27
процедуры и изменение ее в случае обнаружения затруднений. Нечто подобное
произошло и в обсуждаемом нами исследовании, хотя первый эксперимент в
действительности не был пробным. Одна из особенностей процедуры первого
эксперимента привела к изменениям во втором эксперименте. В первом случае
рейки падали на пол, а во втором — на приподнятую поверхность. Но почему? По
словам Карелло, Андерсон и Канкер-Пек, причина была весьма практической (читая
между строк, заметим, что аспиранты, собирающие данные, были очень благодарны
устранению этого фактора): изменение процедуры помогло «снизить нагрузку на
колени и спину экспериментаторов».
Проблемы позиционного уравновешивания. Пример с простым (П) и сложным (С)
лабиринтами (Гудвин, с.224). Внутригрупповой план. Позиц. уравновешивание:
одна подгруппа П – С, другая С – П. ( NB: отличие внутригруппового плана от
межгруппового состоитв том, что в первом случае подгруппы испытуемых
участвуют в одних и тех же экспериментальных условиях, тогда как во втором
случае эти условия для каждой группы разные.) Длительный экспер. (1 час)
вызывает усталость (или скуку), поэтому результаты прохождения второго лабир.
могут ухудшиться. Предполагается, что нарастание утомления проходит линейно от
попытки к попытке, поэтому поз. уравновешив. (каждый лабир. исследуется
испытуемым одинаковое количество раз первым и вторым по счёту) должно
компенсировать его ухудшающий эффект. Пусть утомление (ВП) вносит
дополнительно 3 ошибки. Результаты (Рис., верхняя таблица):
Порядок
Причины ошибок Σ ошибок
следования
сложность скука
1подгруппа П
10
0
10
С
15
+3
18
2 подгруппа С
П
15
10
0
+3
15
13
Здесь утомление одинаково повлияло на прохождение обоих лабиринтов; поэтому
разница в средних показателях для С [(18+15)/2 = 16,5] и П [(10+13)/2] = 11,5 будет
обусловлена только сложностью, т.е. действием НП. Применение поз.
уравновешивания в этом случае оказалось эффективным.
Но в этом эксперименте возможна ещё одна вмешивающаяся переменная – перенос
научения с одного условия на другое, причём он может оказаться асимметричным.
Пусть в том же примере опыт, приобретённый в первой подгруппе в условии П,
положительно повлиял на последующее условие С, и сложный лабиринт оказался не
таким уж сложным. А во второй подгруппе опыт, приобретённый в первом условии
(С) оказался незначительным и не повлиял поэтому на последующее условие П (в
этом состоит асимметричность переноса). Результаты (Рис., нижняя таблица):
28
Порядок
Причины ошибок
Σ ошибок
следования
сложность перенос скука
1подгруппа П
10
0
10
С
15
- 10
+3
8
2 подгруппа С
П
15
10
0
0
+3
15
13
Здесь утомление (скука) уравновешивается (+3 и +3), а перенос –нет (-10 и 0), в
результате чего средние для условий С и П оказываются одинаковыми
[(8+15)/2=11,5; и (10+13)/2=11,5]. В результате никаких различий между
лабиринтами не будет обнаружено.
Об асимметричности переноса эффекта с одной последовательности на
другую (Мартин, с.240-241, Шум-тишина); там же – опыт с влиянием алкоголя на
двиг. навык (с.241-242):
«Изучалось влияние шума на выполнение задания. Испытуемым предъявляли
триграмму (слог) согласная-гласная-согласная (например, СИЖ), которую они
должны были далее помнить в течение 16 секунд. Во время выполнения этого
задания они также слушали серию звуков «Бэ», произносимых через каждую
секунду, выявляя при этом случайные «Пэ». В условии с шумом также раздавался
громкий, продолжительный шипящий звук. Чтобы уравновесить эффекты
последовательности, одна группа выполняла серию попыток без шума, за которым
следовала серия попыток с шумом (АВ), тогда как второй группе был предложен
обратный порядок (ВА).
На Рис. представлены результаты эксперимента.
Члены группы, начавшей с серии без
шума (красный пунктир), показали
сначала
хорошие
результаты
в
запоминании триграмм. Однако при
переходе к условиям с шумом их
показатели резко ухудшились. Как и
ожидалось, члены другой группы
(чёрная
линия)
показали
слабые
результаты в шумных условиях. Однако
заметьте, что при переходе к тихим
условиям их показатели улучшились лишь незначительно. Величина эффекта
составила 31% для группы, находившейся сначала в тихих условиях, и 10% — для
группы, находившейся сначала в шумных условиях В случае симметричного
переноса мы могли бы ожидать одинаковую величину эффекта. Почему же был
выявлен асимметричный перенос?
Очевидно, две группы научились выполнять задание различными способами
Вероятно, группа, находившаяся сначала в тихих условиях, научилась использовагь
29
эхо-сохранение (echoic store), удерживая в памяти слова. Эхо-сохранение — это
своего рода эхо в голове, которое автоматически реверберирует в течение короткого
времени, после того как прекращается действие звукового стимула. (Эхо-сохранение
— это то, к чему прибегает муж для активизации памяти, когда читает газету, а его
жена говорит «Ты слышал, что я только что сказала?»). Но, как и в случае эхо,
последующий громкий звуковой стимул может его подавить. Хотя эхо-стратегия
хорошо срабатывает в тихих условиях, вероятно, группе, помещенной сначала в
тихие условия, пришлось прибегнуть к новой стратегии, когда добавился шум,
воспользовавшись артикуляционным сохранением (articulatory store). В этом случае
они повторяли триграмму про себя или, по крайней мере, активизировали
программу, которая приводит в движение мышцы, необходимые для артикуляции.
После перехода к этой стратегии их показатели ухудшились. Очевидно, члены
группы, находившейся сначала в шумных условиях, освоили задание, используя
артикуляционную стратегию. Оказавшись в тихих условиях, они, вероятно,
сохранили эту менее эффективную стратегию, и их показатели немного
улучшились.
Один дополнительный пример может помочь вам понять асимметричный
перенос. Предположим, что вас интересует влияние потребления алкоголя на
выполнение сложного моторного задания, например, управления гоночным
автомобилем в компьютерной видеоигре. Вы просите членов одной группы выпить
эквивалент трех порций спиртного во время каждого из первых трех одночасовых
сеансов управления гоночным автомобилем. Затем, в ходе следующих трех сеансов,
они управляют автомобилем в трезвом состоянии. Чтобы проконтролировать
последовательность, вы просите вторую группу проделать обратное: управлять
автомобилем сначала в трезвом состоянии, а затем - в опьяненном. Вы ожидаете, что
каждая группа наберет в видеоигре меньше очков, находясь под воздействием
алкоголя. Возможно, при определенных условиях гонки вы удивитесь, обнаружив,
что в действительности показатели членов группы, сначала потреблявшей алкоголь,
ухудшаются в тот момент, когда они оказываются в трезвом состоянии, и что
алкоголь не сказывается на них в той мере, в какой он влияет на членов другой
группы. Подобный результат является примером асимметричного переноса за счет
научения, которое зависит от состояния. Когда мы усваиваем навык, находясь в
определенном состоянии (например, трезвом или опьяненном), то, как правило,
показываем наилучшие результаты именно в этом состоянии. Может быть, вы
знаете человека, который играет в бильярд лучше после пары кружек пива; это и
есть научение, зависящее от состояния. В нашем эксперименте научение, зависящее
от состояния, могло обусловить эффекты асимметричного переноса, как и в
предыдущих примерах. Когда вы получаете подобный асимметричный перенос,
внутригрупповой план не спасет никакая форма уравновешивания".
30
Экспериментальные планы.
Однофакторный план. (Гудвин, Гл.7).
В предыдущих разделах мы останавливались на вопросах выбора зависимых и
независимых переменных (1) и формирования экспериметальных групп (2). В этом
разделе будут рассмотрены однофакторные планы – такие схемы эксперимента, в
которых применяется только одна НП с двумя или несколькими уровнями.
История эксп. психол. начиналась с однофакторных планов (Мартин, 255):
изучался не столько подробный характер связей между НП и ЗП, сколько сама
возможность такой связи. Преимущества:
- быстрый ответ на вопрос: стоит ли изучать данную НП?
- лёгкость анализа и интерпретации (да-нет);
- применимость для сопоставления двух противоположных гипотез (двух
терапевтических процедур, двух методов обучения и т.д.).
Межгрупповой однофакторный план (Рис.).
- Однофакторный план с независимыми группами.
1). (Гудвин, с.245). Влияние приобретаемого опыта на развитие зрительного
восприятия. Исп. – двухнедельные котята. НП – зрительное окружение:
вертикальные либо горизонтальные полосы (здесь нельзя применять одну группу
исп.). Цилиндр с прозрачной площадкой, на которую помещали кота; широкий
воротник на шее (для ограничения угла обзора). 5 часов в день - в цилиндре,
остальное время – в темноте. Группы формировались случайно. ЗП – поведенческие
пробы после нескольких месяцев эксперимента. Через 10 час. после начала
пребывания в нормальных условиях коты уже оправились от депривации (могли
легко прыгать со стула на пол). Но гориз. и верт. стимулы вызывали проблемы у
разноимённых групп: игра с вертикальной и горизонтальной рейкой.
2). Из соцпсихологич. исследований (Солсо): какое влияние оказывает первая
информация на мнение, вызванное последующей? 1-я группа – чтение
характеризующих человека прилагательных в одном порядке (от положит. до
отрицат.); 2-я гр. – то же, но в обратном порядке:
знающий
+
завистливый
-трудолюбивый +
упрямый
-инициативный +
придирчивый
-придирчивый
-инициативный +
упрямый
-трудолюбивый +
завистливый
-знающий
+
Исп. описывали общее впечатление о характеризуемом человеке. Группы
формировались случайно. Ответы 1-й группы – "способный с некоторыми
недостатками"; ответы 2-й группы – "проблемный, реализация способностей
затруднена". Вывод: важны первые впечатления. Здесь НП – порядок предъявления
31
качеств, ЗП – впечатление о человеке. {В жизни бывает и наоборот, иначе не было
бы брачных разводов; можно дополнить эксп. предъявлением разных портретов или
видеосюжетов о характеризуемом человеке).
- Однофакторный план с эквивалентными группами.
1.) (Гудвин, с.246) Может ли депривация сна повлиять на ответы, получаемые от
человека в ходе допроса? Две группы студентов: одна подвергалась депривации (в
лабораторных условиях), другая – нет (спали дома). Переменная уравнивания при
отборе испытуемых – обычная продолжительность сна (от 8,1 до 8,5 час.).
Тестирование на внушаемость (прослушивание рассказа, ответы на наводящие
вопросы, отрицательная оценка ответов экспериментатором, повторение ответов на
те же вопросы. ЗП – изменение ответов во втором случае). Результат: после
депривации вопросы действовали сильнее, и исп. чаще меняли свои ответы.
- Однофакторный план с неэквивалентными группами. Вопрос: успешнее ли
одарённые дети помимо познавательных задач решают социальные и
эмоциональные проблемы в сравнении с обычными детьми? НП – степень
одарённости (операц. определение – IQ выше 130). Сравнивались две группы: 1 –
ср.IQ = 136 и 2 – ср.IQ = 103; частичное уравнивание: обе группы – только
шестиклассники. Проводился тест, оценивающий качество решений межличностных
(социальных) и личностных (эмоциональных) проблем. У одарённых детей
показатели были выше, что свидетельствовало о развитии у них социальных
навыков. Вывод: у одарённых и неодарённых детей способности к решению
подобных проблем различаются (здесь нельзя делать вывод о причинной связи
между одарённостью и социальными навыками у детей).
Внутригрупповой 1-факторный план (Рис.).
(Три свойства: а) меньше испытуемых; б) более чувствительный к небольшим
различиям в среднеарифметическом показателе; в) использование позиционного
уравнивания для компенсации проблем последовательности).
Вариант с полным позиционным уравниванием (для последовательностей из двух
условий): одна половина испытуемых – при условии А, затем В, а вторая половина –
при условии В, затем А. Пример для дегустации вин (N = 10 чел.) (Рис.):
сначала натур. цвет (А)
исп.1 - .......
исп.2 - .......
исп.3 - .......
исп.4 - .......
исп.5 - .......
потом – искусств. цвет (В)
исп.1 - .......
исп.2 - .......
исп.3 - .......
исп.4 - .......
исп.5 - .......
сначала искусств. цвет (В)
исп.6 - .......
исп.7 - .......
исп.8 - .......
исп.9 - .......
исп.10- ......
Средн. 1-10 (В)
потом – натур. цвет (А)
исп.6 - .......
исп.7 - .......
исп.8 - .......
исп.9 - .......
исп.10-.......
Средн. 1-10 (А)
Первая
половина
Вторая
половина
32
Вариант с обратным позиционным уравниванием (для последовательностей из более
двух условий). Эксперимент Струпа (1935г.) – пример одной из экспериментальных
парадигм для изучения избирательности произвольного внимания, позднее – для
диагностики когнитивного стиля (М.А.Холодная, Когнитивные стили, с.56-57) .
Сенсорная форма и семантическое содержание слова. Стереотипный навык –
выделение значения слова независимо от его сенсорной формы (примат семантики).
В эксперименте С. нужно было делать обратное: обращать внимание на сенсорную
форму независимо от значения слова. При этом, возможны были две ситуации:
совпадение сенс. формы и значения (С = З; напр., слово "красный" написано
красными чернилами) и их несовпадение (С ≠ З; напр., слово "красный" написано
зелёными чернилами). (Далее – Рис.). Смысл экспер. 1 и 2: показать исходный
уровень навыка чтения слов и его независимость от сенсорной формы слова. Смысл
экспер. 3 и 4: показать исходный уровень восприятия цветов и нарушение навыка
чтения слов при несовпадении сенсорной формы и значения слова.
Позиционное уравнивание с простым чередованием условий (повторные
измерения). (АВАВАВ...). Применяется при ограниченном наборе условий. Опыт с
сохранением равновесия в движущейся среде (дети от 13 до 16 мес.). Гипотеза: при
движении экспериментальной комнаты вперёд должен возникнуть "оптический
поток", стимулирующий компенсаторное движение корпуса вперёд (Дж.Гибсон).
Здесь можно применить внутригрупповой однофакторный план с повторными
измерениями. НП – движение комнаты вперёд либо назад (2 уровня). ЗП – наклон
тела (вплоть до падения). 20 проб с чередованием направления движения комнаты.
У одних детей последовательность начиналась с движения комнаты вперёд, у
других – с движения назад. Реакции детей записывались тремя независимыми
наблюдателями (!). Потеря равновесия в предсказанном гипотезой направлении
наблюдалась в 82% всех попыток. Были выделены три типа потери равновесия:
качание (26%), шатание (23%), и падение (33%).
Нелостаток этой процедуры – предсказуемость чередования условий. Но
применительно к малым детям это маловероятно.
Сколько уровней НП должно быть в однофакторном эксперименте?
О преимуществах 2-уровневого экспер.: нужно ли изучать данную пер.?, лёгкая
интерпретация и анализ; достаточный для проверки конкурирующих гипотез.
Недостатки. Прямая, проведенная между двумя точками (соответственно двум
уровням НП), - не единственная форма связи между ними.
Пример с чтением шрифта: какой шрифт читается быстрее – 10 или 16? Получаем
зависимость:
t
Здесь нельзя ответить на вопрос, какой из шрифтов
наилучший. К тому же между двумя точками можно
провести разные кривые.
10
16
высота шрифта
33
Пример с дозировкой кофеина (1 и 3 мг). В последнем случае ВР уменьшается
линейно. Сравним эти результаты с многоуровневым экспер. (четыре дозы 1, 2, 3, 4
мг.). Возможные результаты:
ВР
1
2
3
4
дозировка, мг.
Вывод: кофеин снижает ВР только в определённом диапазоне (2-3мг.), а затем
увеличивает её. Пунктиром показан линейный эффект для двухуровневого плана;
сплошная линия – нелинейный эффект для четырёхуровневого плана.
Примеры с мотивацией, тревожностью (закон Йеркса-Додсона).
Поэтому в случае двухуровневого эксперимента нельзя интерполировать или
экстраполировать данные за пределы уровней, которые были в эксперименте. Иначе
мы попадём не на чердак или в подвал, а в настоящий переплёт! (Мартин, 259).
О диапазоне НП. Потолочный эффект: ЗП достигает уровня, которого нельзя
превысить (100%-ная точность ответов; вероятность ответной реакции = 1.;
ограниченность объёма КП). Донный эффект: ЗП не может принимать меньшие
значения. ВР не может быть меньше 100мс; нельзя реагировать реже, чем ни разу.
Нужно разумно ограничивать количество уровней.
Контрольные группы.
Необходимость контрольных групп. Явление спонтанной ремиссии –
улучшение состояния без применения терапевтических воздействий. Для оценки
эффективности терапевтического метода важно знать истинную причину изменения
состояния пациента.
Овладевая сознанием, идея способна влиять на тело. Некоторые идеи
появляются в сознании благодаря внушению или самовнушению. Этот факт имеет
важное значение, поскольку НП действует на испытуемого через его сознание. (См.
также тему об идеомоторной тренировке). Вопрос о том, что же именно
воздействует на испытуемого – условие, создаваемое экспериментатором, или
мысль испытуемого по поводу этого условия – решается с помощью контрольной
группы или контрольного условия. Контр. гр. – условия те же, но нет экспер.
воздействия.
Пример 1. Опыт с избеганием столкновений с препятствиями у слепых
(Солсо, с.62-63). Две гипотезы: а)"лицевое зрение" – реакция на мин. изменения
34
давления воздуха на открытые участки кожи; б) улавливание слабых (отражённых)
звуковых сигналов. Проверка:
Исп. свободно ходили по комнате с различными препятствиями (экраны). Три
условия: 1) войлочная маска на лице и перчатки на руках (1-я экспер. группа;
исключение фактора кожной чувствительности); 2) в уши исп. вставлялись
звукопоглощающие пробки (2-я экспер. гр.; исключение фактора слухового
восприятия); 3) слепые просто ходили по комнате в обычных условиях (контр. гр.).
НП – ограничение модальности (либо кожной, либо слуховой); ЗП – реакция на
ограничение (кол-во столкновений с препятствиями). Результат: 1-я экспер. и контр.
группы успешно обходили препятствия, а 2-я экспер. гр. – гораздо менее успешно.
Вывод: у слепых – тонкая чувствительность к звуковым сигналам, а не только
"лицевое зрение". Здесь функция контр. гр. – выяснить, как влияют сами по себе
экспер. воздействия: улучшают или ухудшают способность обходить препятствия; в
данном случае они оказались нейтральными, поскольку между 1-й и контр.
группами сущ. различий не обнаружено.
(О слепой чемпионке Америки по верховой езде).
Пример 2. Контр. группа плацебо (Гудвин, с.252-258). П. – фармакологически
неактивный препарат, не оказывающий никакого реального действия на организм
(пустышка). Если человек не знает, что ему дают плацебо, но он знает, что эта
таблетка должна на него подействовать, то эффект действительно может иметь
место. В экспериментах испытуемые контрольной группы плацебо думают, что
подвергаются воздействиям, но на самом деле к ним эти воздействия не
применяются.
Эксперимент с действием алкоголя на ВР. Три группы (Рис.):
- экспериментальная (получала дозу алкоголя); ВР = 0,32с.
- группа плацебо (получала ту же, но безалкогольную дозу); ВР = 0,22с.
- обычная контр. группа (ничего не получавшая); ВР = 0,16с.
Если нет группы плацебо, то вывод о влиянии алкоголя будет сомнительным:
возможно, что не сам алкоголь, а только знание, что он вредно действует на
организм, привело к замедлению реакции.
Вывод: ожидание людей по поводу действия алкоголя несколько замедляет скорость
реакции (с 0,16 до 0,22с., эффект = 0,06с), но и сам алкоголь оказывает влияние (с
0,22 до 0,32с, эффект = 0,1с).
Пример.3. Несколько контрольных групп (Рис.). Лечение речевой фобии разными
методами (Р.Солсо, с.135-136). 1-я гр. – поведенческая терапия; 2-я гр. –
рациональная терапия; 3-я гр. (контр.) – таблетки плацебо; 4-я гр. (контр.) – никаких
воздействий, но исп. отвечали на те же вопросы, что и исп. экспериментальных
групп. Определение "фона": каждый исп. произносил речь "до" и "после". НП –
виды терапии; ЗП – кол-во улучшений (по сравнению с фоном; определялось
экспертами, не знавшими о целях эксперимента). Результаты:
1 гр. (экспер., НП1) – улучшение на 100%;
2гр. (экспер., НП2) – улучшение на 60 %;
3 гр. (контр.,плацебо) – улучшение на 73%;
4 гр. (обычн. контр.) – улучшение на 32%.
35
Вывод: рац. терапия мало эффективна и действует в качестве плацебо (без 3 гр.
такой вывод сделать нельзя.). Можно вычислить влияние самой по себе
терапевтической процедуры: 1гр. 100% - 73% = 27%; 2 гр. 60% - 73% = -13%.
ВСТАВКА 7.2 (Гудвин)
Этика — кто войдет в контрольную группу?
При проведении исследования памяти, в котором экспериментальную группу
просят формировать визуальные образы, тогда как контрольная группа просто
заучивает список слов, вопрос о том, кто должен быть в контрольной группе, не
создает этической дилеммы. Однако если эксперимент разрабатывается для оценки
некоторой социальной программы или терапевтического воздействия, которое
может принести заметную пользу людям или даже продлить их жизнь, то этот
вопрос решить нелегко. Например, в известном исследовании влияния личного
контроля на здоровье (Langer & Rodin, 1976) нескольким людям, живущим в доме
для престарелых, позволили самим планировать свой день, тогда как члены
контрольной группы пользовались (в основном) распорядком, установленным для
них персоналом. Когда авторы через 18 месяцев вернулись и провели повторное
исследование, они обнаружили, что в среднем в сравнении с контрольной группой
члены первой группы были более психически и физически здоровы и большее
количество из них были живы (Rodin & Langer, 1977). Если бы вы узнали, что один
из ваших родственников попал в контрольную группу, вы бы обеспокоились?
Точно так же возникли споры с распределением участников по группам в
исследовании с больными раком пациентами (Adler, 1992). В ходе исследования
изучалось влияние групп поддержки на психологическое и физическое состояние
женщин, страдающих раком груди. Было обнаружено, что женщины в группах
поддержки быстрее выздоравливали и даже жили дольше, чем другие (т. е.
распределенные в контрольную группу). Некоторые исследователи утверждали, что
результаты отражают не пользу, приносимую группами поддержки, а вред,
нанесенный членам контрольной группы, которые могли почувствовать себя
обделенными или отвергнутыми. Такие чувства могли вызвать стресс, а как
известно, стресс неблагоприятно влияет на иммунную систему, что приводит к
разнообразным проблемам со здоровьем. Так есть ли в этом упрёке хоть доля
правды? Может ли участие в контрольной группе убить кого-либо?
Защитники использования контрольных групп при оценке социальных
программ имеют три сильных apгумента.
Во-первых, они отмечают, что легко оценивать прошедшие события и
говорить уже после свершившегося факта, что «программа, настолько эффективная,
как этa, должна быть доступна для всех». Проблема в том, что "до свершившегося
факта" далеко не так очевидно то, что программа будет эффективной. Единственный
способ узнать это – провести исследование. Например, до начала эксперимента
Лэнгера и Родена в доме для престарелых можно было легко предположить, что
участники эксперимента испытают ненужный стресс от того, что должны сами о
себе заботиться, и быстрее умрут. Точно так же защитники исследования рака
указывают, что в начале исследования довольно мало женщин имели предпочтения
по поводу распределения по группам, а несколько из них просто не захотели
36
присоединиться к группе поддержки (Adler, 1992). Следовательно, неверно, что
члены контрольной группы чувствовали себя отвергнутыми или обделенными.
Во-вторых, экспериментаторы указывают, что в исследованиях по оценке
новых программ или способов терапии редко сравниваются новый способ
воздействия и отсутствие воздействия - обычно проводится сравнение нового
метода воздействия со старым. Таким образом, членам контрольной группы
доступны методы лечения, которые нормально применяются, и, соответственно они
получают обычную помощь. Более того, если исследование показывает наличие
положительного эффекта от экспериментального воздействия, члены контрольной
группы обычно получают возможность испытать его на себе.
В-третьих, лечение обходится дорого и стоит потратить деньги на лучшее из
возможного. Однако нельзя определить без подробно разработанного исследования
эффективности программы, какой метод лучше. Программы, эмпирически
подтвердившие свою эффективность, служат на благо всем людям и нередко могут
сохранить или продлить им жизнь.
Использование контрольных групп плацебо и листа ожидания в одном
исследовании (Гудвин)
Помните, как в главе 1 обсуждался вопрос псевдонауки и приводился в связи с
ним пример «бессознательно воспринимаемых аудиозаписей»? Как мы узнали, было
проведено обширное исследование, показавшее, что положительное влияние этих
записей возникает в результате ожидания их эффективности.
Ожидания нередко выявляются путём использования контрольных групп
плацебо. Можно также одновременно использовать и группы плацебо, и группы
листа ожидания.
Один из самых распространенных вариантов использования "бессознательно
воспринимаемых аудиозаписей» — это использование их с цслью снижения веса.
Эта область предоставляет очень хорошие возможности для продажи подобной
продукции. Американцы, к примеру, чтобы сбросить вес, испытывают на себе
всевозможные приемы, от диеты с ограниченным потреблением жиров до
xирургического вмешательства. Особенно привлекательными для людей
оказываются методы, требующие минимальных усилий (!! Здесь нелишне
вспомнить о наших обманутых вкладчиках), а именно это и является отличительной
чертой «бессознательно воспринимаемых аудиозаписей» — просто вставьте кассету,
и очень скоро ваше бессознательное начнет руководить вашим поведением и
неизбежно приведет к потере веса. Для изучения эффективности таких записей в
деле снижения веса Мерикл и Скеннс (Merikle & Skancs, 1992) провели
исследование, в котором использовали и контрольные группы плацебо, и группы
листа ожидания. Дав объявление в газеты, они набрали 47 женщин и случайным
образом распределили их в три группы. Члены экспериментальной группы (N= 15)
получили коммерческую «аудиозапись бессознательного действия», которая, по
мнению производителей, должна была помочь слушателям сбросить вес. Члены
контрольной группы плацебо (N=15) думали, что получили аудиозаписи,
37
специально разработанные для снижения веса, но в действительности им выдали
записи для снижения страха лечения зубов (исследователи обладали чувством
юмора). Для обычных слушателей эти две записи были неразличимы. Членам
контрольной группы листа ожидания (N=17) сказали, «что в исследовании уже
принимает участие максимальное количество испытуемых и что... их поставят на
лист ожидания». Участников из экспериментальной группы и группы плацебо
попросили прослушивать записи 1-3 часа в день; при этом, членов всех трех групп
на протяжении пяти недель еженедельно взвешивали. Каковы были результаты?
Потеря веса у членов экспериментальной группы была весьма скромной, но столько
же сбросили члены контрольной группы плацебо. Это обычный результат для
подобного
типа
исследований,
показывающий,
что
«бессознательно
воспринимаемые аудиозаписи» сами по себе не имеют никакого эффекта. Однако
интересно, что контрольная группа листа ожидания также потеряла в весе, и
примерно столько же, сколько остальные две группы. На основании этого Мерикл и
Скейнс заключили, что «бессознательно воспринимаемые записи» дают
предполагаемый результат не просто из-за наличия эффекта плацебо. Если бы все
дело было в эффекте плацебо, то члены группы плацебо, думая, что на их разум
оказано воздействие, сбросили бы вес, а вес испытуемых из группы листа ожидания,
которые еще не слушали записи, не изменился бы. Полученные результаты привели
авторов к выводу, что воздействие записей заключалось в концентрации внимания
людей на существующей проблеме, в данном случае на снижении веса. Испытуемые
во всех трех группах «могли потерять вес просто потому, что участие в
исследовании увеличило вероятность того, что в ходе эксперимента они станут
внимательно относиться к вопросам, связанным со снижением веса». В данном
исследовании группа листа ожидания позволила оценить силу эффекта
плацебо и получить альтернативное объяснение популярности "бессознательно
воспринимаемых записей".
Эквивалентные контрольные группы
Третий вид контрольных групп — эквивалентные контрольные группы. Их
используют, если члены экспериментальной группы по какой-либо причине
участвуют в эксперименте разное количество времени или включены в разные
события, происходящие в ходе исследования. Каждый участник из контрольной
группы уравнен, или «сцеплен», с одним из членов экспериментальной группы,
таким образом для групп в целом затраченное участниками время, а также
разновидности событий, с которыми они встречаются, поддерживаются
постоянными. Приведенный ниже пример поможет вам лучше понять идею
эквивалентных и контрольных групп.
Эквивалентные контрольные группы и стресс
Хороший пример эквивалентной контрольной группы можно найти в
исследовании Вейсса (Weiss, 1968), посвященном изучению взаимосвязей между
38
управлением стрессорами и здоровьем. К хвостам крыс в ходе эксперимента в
случайном порядке посылали слабые электрические разряды. Крысы экспер. группы
могли выключить ток (т. е. управлять им) или избежать его воздействия, вращая
лапами небольшое колесо (Рис.). Контрольная группа крыс (крайняя справа) не
подвергалась шоку. Крысы, находящиеся в центральной части аппарата,
принадлежали к сцепленной контрольной группе. Каждая из них была сцеплена
(имела парой) с крысой из экспериментальной группы и получала такое же
количество электрических разрядов, но не могла управлять ими. Каждая попытка
начиналась с сигнала, который слышали все три животных. У крысы из
экспериментальной группы было 10 секунд, чтобы повернуть колесо, выключив тем
самым ток. Если она не делала этого, то к ее хвосту посылался электрический
разряд. При этом сцепленная крыса также получала разряд (вне зависимости от того,
что она делала в это время). Таким образом, крысы в экспериментальной и
сцепленной контрольной группах получали абсолютно одинаковое количество
раздражителей, вызывающих отрицательную реакцию (т. е. одинаковое количество
электрических разрядов), но отличались по возможности контроля за ситуацией.
Вейсс заключил, что возможность управлять поступлением тока помогла крысам
избежать некоторых разрушительных для здоровья последствий стресса: у крыс из
сцепленной группы вероятность развития язвы и потери веса была выше, чем у крыс
из экспериментальной и контрольной групп, на которых подобный опыт не оказал
почти никакого влияния.
Многоуровневые планы.
Межгрупповой многоуровневый план. Влияние контекста на понимание.
Текст: "Если шарики лопнут, звук не сможет быть услышан, поскольку это
произойдёт слишком далеко от нужного этажа. Закрытое окно также не даст
возможности распространиться звуку, так как большинство зданий обладает весьма
неплохой звукоизоляцией. Поскольку вся процедура зависит от равномерного
потока электричества, разрыв провода также может вызвать проблемы. Конечно,
человек может кричать, но человеческий голос недостаточно силён, чтобы
разнестись так далеко. Дополнительная проблема состоит в том, что у инструмента
может порваться струна. Тогда сообщение останется без аккомпанемента. Очевидно,
что чем меньше будет растояние, тем лучше. Тем самым будет меньше
потенциальных проблем. При личном контакте возможностей потерпеть неудачу
будет гораздо меньше." (Гудвин, 261).
(Рис.) 5 уровней НП (контекст): отсутствие контекста, 1 прочтение; отсутствие
контекста, 2 прочтения; контекст до чтения текста, прочтение и пересказ текста;
чтение текста, контекст после прочтения текста, пересказ; частичный контекст до
прочтения текста, затем пересказ. ЗП – количество воспроизведенных идей
(предложений).
Результаты: контекст должен предшествовать тексту; частичный контекст не
помогает пониманию (Гудвин, 262-263).
Внутригрупповой многоуровневый план. Проверка "эффекта Моцарта"
(улучшение умственных способностей под влиянием музыки Моцарта; сайт,
39
посвящённый этому эффекту). Три условия (три уровня НП): прослушивание М. в
течение 10 мин.; прослушивание успокаивающей музыки природы в течение 10
мин.; пребывание в полной тишине для расслабления (10 мин.). Вместо полного
позиционного уравнивания (3!=6 условий; соответственно 6 подгрупп испытуемых)
была применена схема латинского квадрата: три группы исп. х три условия. [Ещё
раз о различии межгруппового и внутригруппового планов: в первом случае каждая
группа участвует при условиях, отличающихся от условий других групп; во втором
случае каждая подгруппа испытуемых участвует при одинаковых условиях]. (Обман
исп.: влияние релаксации на запоминание). ЗП – точность воспроизведения чисел в
обратном порядке (напр., предъявлено 6-8-3-1-7, правильное воспроизведение – 7-13-8-6); давалось по 9 чисел, всего нужно было сделать три задания (если вся
последовательность воспроизводилась правильно, давалось 9 очков; если все числа
стояли не на своих местах – 0 очков; макс. кол-во очков = 3 х 9 = 27). Результаты:
ср. кол-во правильно запомненных чисел практически было одинаковым во всех
условиях. Моцарта слушать полезно, но не для развития ума; здесь возможно лишь
косвенное влияние.
ФАКТОРНЫЕ ПЛАНЫ
(Не путать с факторным анализом).
Факторный план – применение более чем одной независимой переменной.
(В многоуровневом плане – одна НП)
Преимущества: вместо нескольких независимых экспериментов проводится
один, более концентрированный. Создаётся более высокая неопределённость для
испытуемого (неожидаемость каждого условия), что приближает ф.п. к более
естественным ситуациям. Возможно изучение взаимодействия
одновременного
воздействия нескольких условий, которое не всегда равно механической сумме этих
воздействий. Напр., можно отдельно измерять чувствительность зрительной и
слуховой модальности, но при этом не будет оснований предполагать, что
одновременное действие зрительного и слухового стимулов приведёт к возрастанию
чувствительности в зрительной модальности.
Система нумерации. 1) количество НП; 2) количество уровней для каждой НП.
Напр., 2×3 означает: две НП (= количеству сомножителей), первая имеет 2 уровня,
вторая – 3. Пример 4×2×5: три НП, перваяНП – 4 уровня, вторая – 2, третья – 5.
40
Условия эксперимента. В отличие от однофакторных планов, где количество
условий совпадало с количеством уровней НП, в многофакторных планах колич.
условий = произведению сомножителей: 2×3×2 = 12 условий.
Условия представляются в виде факторной матрицы (Рис.):
Фактор В
Уровень В1
Уровень В2
Уровень А1
Условие А1В1
Условие А1В2
Уровень А2
Условие А2В1
Условие А2В2
Фактор А
Клетки внутри матрицы наз. ячейками. В каждой ячейке – одно условие.
Факторные планы могут быть внутригрупповыми (во всех условиях участвует одна
группа испытуемых), межгрупповыми (с разными группами) и смешанными (напр.,
по горизонтали – одна группа, а по вертикали – разные).
Матрицы с 3 факторами будут рассмотрены дальше.
Пример плана 2×2 (Солсо, 93-95). Влияние специальных знаний на
запоминание материала. НП1 – возраст (два уровня - дети и взрослые); НП2 –
запоминаемый материал (два уровня – числа и расположение шахматных фигур).
Дети – до 10 лет, хорошо играли в шахматы; взрослые – новички в этой игре.
Задания:
1)
запомнить
расположение
фигур;
последовательность чисел.
Схема эксперимента (Рис.) и результаты (Рис.):
2)
запомнить
стандартную
41
Возраст (В)
Взрослые (В1)
Дети (В2)
Взрослые/шахматы
Дети/шахматы
А1В1
А1В2
Взрослые/числа
Дети/числа
А2В1
А2В2
шахматы (А1)
Задача (А)
числа (А2)
Результаты:
N
10 -- •
8 --
• Числа
6 -- •
• Шахматы
4 -2 -0
│
│
Дети
Взрослые
4 условия – 4 точки на графике.
Здесь
видно
сильное
взаимодействие
переменных,
обусловленное
специальными знаниями: хорошо играя в шахматы, дети лучше запоминают
расположение фигур, чем последовательность чисел, в которых они ещё не очень
искушены. Обратная картина у взрослых: они мало знакомы с шахматами, по
сравнению с числами, которые запоминают лучше.
Более сложный пример (судебная практика защиты преступника): изменение
убеждений за деньги (Солсо, 89-91). Два противоположных подхода.
Теория подкрепления: деньги – поощрение; чем больше вознаграждается защита
взглядов, с которыми человек не согласен, тем больше подкрепляется изменение
позиции (адвокаты, деловые споры...), тем сильнее соблазн.
42
Теория диссонанса (Фестингер, 1957) (терзания души): д. возникает, когда человек
отстаивает взгляды, с которыми он не согласен; чем меньше вознаграждение, тем
сильнее д. (из-за недостаточного "оправдания" защиты противоположных взглядов).
Компенсация диссонанса достигается изменением позиции, которая теперь
воспринимается как собственная. То есть, сильный диссонанс (при малом
вознаграждении) должен вызвать более существенное изменение позиции, чем
слабый (при крупном вознаграждении). Гипотеза: теория подкрепления применима
тогда, когда у человека нет выбора (защищать или не защищать противоположный
взгляд), а теория диссонанса, - когда есть выбор (можно и не защищать чужую
позицию). Основание: внутренний диссонанс возникает только тогда, когда у
человека есть выбор – делать или не делать то, с чем он не согласен, а не тогда,
когда к этому вынуждают обстоятельства (типично рационалистическая логика).
План 2×2. Студентам предлагалось написать сочинение в поддержку закона об
ограничении самоуправления в колледжах (они все были против).
НП1 – сочинение (2 уровня: обязательно или по желанию);
НП2 – вознаграждение (два уровня: 5р. и 50р.).
Для каждого условия – случайный выбор студентов по 10 чел. Рис.
ЗП – степень изменения отношения студентов к данному закону. Оценка – по шкале
степени одобрения: ------1----------0----------+1----- (+ - в сторону одобрения, -- - в
сторону ещё большего несогласия).
Результаты (Рис., табл.):
Влияние поощрения
Влияние
Условие
выбора
выбора
Поощрение
5 руб.
Ср.
50 руб.
Нет выбора -0,05
+0,63
0,29
Есть выбор +1,25
- 0,07
0,59
Ср.
+0,60
+0,28
43
График (Рис.)
Сравнение двух средних значений для каждой переменной (поощрения и выбора)
позволяет судить о наличии основного эффекта. В данном случае их два: эффект
поощрения (0,60 >0,28) и эффект выбора (0,59 > 0,29).
Основной эффект. (Синоним – главный эффект). Характеризует общее
влияние НП для всех её уровней. Кол-во основных эффектов – не более числа НП.
Осн. эффект вычисляется как разница между средними значениями для одной НП,
полученными при всех значениях другой НП; при этом, должна быть установлена
статистическая значимость различий между средними.
Пример для плана 2×2 (Гудвин, с.277-279). Два основных эффекта.
Запоминание списка из 30 слов. НП1 – способ запоминания (2 уровня: образы, мех.
повторение); НП2 – скорость предъявления (2 уровня: 2с/слово, 4с/слово).
Результаты (Рис.):
Скорость предъявления
2 с/сл.
Образы
Способ
запоминания
17
4с/сл.
+
+
Повторение
Среднее
12
Среднее
23 = 40:2 = 20
+
+
18
=29:2
=41:2
14,5
20,5
= 30:2=
15
Верт. стрелка – основной эффект НП1 (способа запоминания); 20>15, стат. значимо;
Гориз. стрелка – основной эффект НП2 (скорости предъявления); 20,5>14,5, стат.
значимо.
Пример для плана 2×2. Один основной эффект (Гудвин, с.279-280). Роль
образов в запоминании. Два фактора: необычность образов и возможность
объединения запоминаемых элементов в один образ. Для запоминания давались
пары слов (пианино-сигара); при воспроизведении показывалось только первое
слово (метод парных ассоциаций), нужно было ответить вторым. Пара слов
44
сопровождалась
одним
рисунком.
НП1
–
два
уровня:
объединённые
и
необъединённые рисунки; НП2 – два уровня: причудливые и обычные картинки.
Описание рисунков (Рис.). ЗП – число правильно воспроизведенных ассоциативных
пар. Межгрупповой план. Уравнивание групп по количеству запомненных слов из
стандартного списка (напр., 30 слов).
Результаты: Среднее число пар слов, запомненных в каждом из четырёх условий
(максимальное число – 9).
Причудливые Обычные Средн.
Объединённые
6,7
6,6
6,6
Необъединённые
3,1
3.5
3,3
Средн.
4,9
5,0
Фактор причудливости оказался незначимым: в обоих случаях средние значения
практически одинаковы (4,9 и 5,0). Т.о., один основной эффект отсутствует. В то же
время другой основной эффект оказался значимым (6,6 и 3,3). (Построить график,
с.281).
Взаимодействие без основных эффектов. Идея: воспроизведение лучше, если
оно осуществляется в тех же условиях, что и запоминание. Исп. (все – из клуба
ныряльщиков) запоминали список из 36 слов, а затем воспроизводили его в тех же
или в других условиях. НП1 – место, где проходило заучивание слов; два уровня: на
земле и под водой. НП2 – место, где происходило воспроизведение слов; два уровня:
на земле и под водой (10м.). Факторный план 2×2. Внутригрупповой план с
повторными измерениями. ЗП – количество запомненных слов при каждом из
условий.
Результаты: Среднее количество запомненных слов (Рис.).
НП1
НП2
Запоминание
Воспроизведение
На земле Под водой
Средн.
45
На земле
13,5
8,6
11,1
Под водой
8,4
14,4
11,4
Средн.
10,9
11,5
Средние по строкам (11,1 и 11,4) и по столбцам (10,9 и 11,5) практически не
отличаются (различия статистически незначимы). Это говорит об отсутствии
основных эффектов. Но есть взаимодействия: запоминание и воспроизведение были
наиболее успешными, когда они происходили в одних и тех же условиях (13,5 и
14,4). Взаимодействие между НП1 и НП2 выражается в том, что показатели для НП1
существенно и по-разному изменяются под влиянием других значений НП2.
Сочетания основных эффектов и взаимодействия. (Гудвин, с.284-287). 8 возможных
результатов для плана 2×2 (обозначения: О – наличие осн. эффекта; ↔ - наличие
взаимодействия) (Рис.):
АО; ВО; АО + ВО; АО + ↔; ВО + ↔; АО + ВО + ↔; ↔ ; нет ничего.
Рассмотрим некоторые варианты для эксперимента с запоминанием (НП1 – способ
запоминания; НП2 – скорость предъявления).
Далее – по слайдам:
Вариант 1,2,3,4 – задача на запоминание.
Вариант 5 – изучалось влияние эмоционального состояния человека на оценку
вероятности аварии, которая могла быть обусловлена или человеческим фактором
(плохим навыком вождения, лихачеством...), или объективными обстоятельствами
(плохая дорога, туман, гололёд...). НП1 – эмоциональное состояние исп. (два уровня:
грустные, злые); НП2 – информация о возможной причине аварии (два уровня:
человеческий фактор и объективные обстоятельства); ЗП – оценка вероятности
аварии. Здесь – один основной эффект и взаимодействие. Грустные исп. считают,
что вероятность аварии по причине обстоятельств выше, чем по вине человека. В
состоянии же злости картина противоположная.
Варианты 6 и 7 – снова задача на запоминание.
Вообще, взаимодействие всегда имеет приоритет над осн. эффектами.
46
Когда нет ни основных эффектов, ни взаимодействия, – это изображается
одной прямой, параллельной оси Х.
Важное
замечание:
результаты
факторных
экспериментов
обычно
иллюстрируются с помощью линейных графиков даже в случаях дискретных НП.
Отклонение от параллельности линий и особенно их пересечение является
наглядным признаком взаимодействия между переменными. Но нужно иметь в
виду, что по этим линиям нельзя ни интерполировать, ни экстраполировать
экспериментальные данные.
Субъектные и несубъектные переменные в факторных планах. Среди
различных вариантов факторных планов, которые создаются при различных
сочетаниях внутригрупповых и межгрупповых схем, экспериментальных и
контрольных групп, позиционного и блочного уравнивания, особый статус
занимают факторные планы с субъектными НП [так наз. Р×Е, сокр. от англ. person ×
environment; К.Левин (1890-1947): В=f(P×E), т.е. поведение является функцией от
личности и среды]. Если обнаруживается основной эффект только для фактора Р, то
это говорит о том, что два различных типа людей в сходных условиях действуют поразному. С другой стороны, значимый основной эффект только для фактора Е
означает, что он достаточно силён, чтобы повлиять на разных людей (Рис.).
Примеры: Количество решённых задач в разных условиях.
1. Один основной эффект (Рис.):
Маленькая комната
Большая комната
Ср.
Интроверты
12
12
12
Экстраверты
18
18
18
Ср.
15
15
Здесь осн. эффект – только для типов личности (Ср. 12 и 18), остальные отсутствуют
(на графике будет одна наклонная линия). Т.е. экстраверты выполняют задание
лучше независимо от условий.
2. Другие данные (Рис.):
Маленькая комната
Большая комната
Ср.
47
Интроверты
12
18
15
Экстраверты
12
18
15
Ср.
12
18
Здесь осн. эффект – для фактора среды (Ср. 12 и 18), остальные отсутствуют. Т.е.
независимо от типа личности в тесноте задание выполняется хуже.
Возможно также наличие двух основных эффектов – для Р и Е (рассмотреть
самостоятельно). [И - 6, 10; Э – 12,18].
3. Пример взаимодействия при отсутствии основных эффектов:
Маленькая комната
Большая комната
Ср.
Интроверты
18
12
15
Экстраверты
12
18
15
Ср.
15
15
Здесь нет основных эффектов, но есть взаимодействие: на экстравертов среда влияет
иначе, чем на интравертов (на графике будут две симметричные пересекающиеся
прямые).
Факторные планы Р×Е неоценимы в психотерапии. Пример: переменной Р
был "локус контроля"; переменная Е – вид психотерапии.
Внешний локус
(экстерналы) – мнение, что всё в моей жизни зависит от внешних обстоятельств;
внутренний локус (интерналы) – мнение, что события моей личной жизни зависят от
меня самого.
В исследовании люди с внешним локусом показали лучшие
результаты при директивной терапии (задаётся направление их деятельности), по
сравнению с недирективной (возлагающей на пациента больше ответственности за
прогресс в достижениях). Результаты для людей с внутренним локусом были
обратными.
Сложные факторные планы.
- 2×4 (Солсо, с.95-99). Роль
временной отсрочки обратной связи (в обучении, формировании двиг. навыков).
Смысл: какая форма проверки знаний более эффективна – опрос, письм. работа,
48
экзамен или дистанционное тестирование; в одном случае оценки становятся
известны не сразу, в другом – сразу же. Немедленная и отсроченная обр. связь. Исп.
– школьники 8 кл. Процедура: 1) чтение статьи о флетчерах (около 1200 слов); 2)
после прочтения – проверка знаний материала (по анкете из 20 вопросов; 1 вопрос –
1 балл).
НП1 – время сообщения результата проверки, или задержка обр. связи (4 уровня:
сразу, через 1ч., через 2дня, через 4дня). НП2 – повторная проверка после сообщения
оценок (2 уровня: сразу, через 3 дня). ЗП – кол-во баллов после повторной проверки.
Межгрупповой план.
Результаты – среднее кол. баллов после повторной проверки (Рис.):
Повторная
проверка
Задержка
связи
0
1ч.
Немедленная 15 17
Отсроченная 13 15
Средн.
14 16
обратной
Ср.
2д.
17
16
16,5
4д.
17
14,5
16
16,5
14,6
Выводы: 1)обр. связь без задержки хуже при любых условиях (узнал оценку –
забыл); 2) отср. проверка хуже (забывание со временем); 3) при немедл. проверке
меньше сказывается забывание (16,5 против 14,6); 4) умеренная задержка обр. связи
(2ч. – 1д.) в обоих случаях даёт более высокие результаты.
Важность
нескольких
уровней
НП.
План
2×3×4
эффективности работы группы (Рис.; Мартин, с.264-266).
уровня:
в
исследовании
НП: лидерство (два
есть лидер в группе или нет); пол (три уровня: мужчины, женщины,
смешанный состав); численность группы (4 уровня: 3, 6, 10, 20 чел.).
Время решения
макс.-
20
НП1 – пол
10
НП2 - лидер
49
6
3
6
10
20
3
мин.-
НП3 – численность
‫׀‬
лидер
‫׀‬
без лидера
Выводы:
1. НП1 – гендерный состав группы оказался незначимым;
2. НП2 – при минимальном составе группы лидерство не играет роли (линия 3); чем
больше состав группы, тем сильнее влияние лидерства (макс. – линия 20);
3. НП3 – увеличение численности группы приводит к снижению эффективности
группы во всех случаях (время решения увеличивается).
4. Непараллельность линий свидетельствует о взаимодействии НП2 и НП3 , то есть
эффект совместного действия нескольких факторов ≠ сумме эффектов при их
раздельном действии.
5. Применение нескольких НП повышает точность и возможность обобщения
результатов.
Ещё один пример из области когнитивной психологии: План 3×3×2.
Исследование скорости кодирования информации на разных уровнях переработки
(Солсо, с.99-102; или в Когн. психол. с 184). Тахистоскопическая методика (метод
хронометрии). Процедура: S1 → Δt → S2 → R. Первый стимул – всегда цветной
квадрат. Второй стимул – либо цветной квадрат (физический, или сенсорный код –
С-С), либо название цвета (вербальный код – C-W), либо ассоциируемое слово
(концептуальный код – C-A) . (Ещё раз об операциональных определениях.) (Рис.)
1 проба:
красный квадрат – Δt - красный
(стимул – название) Кн1
2 проба:
красный квадрат – Δt - кровь
(стимул – ассоциация) Кн1
3 проба:
зелёный квадрат – Δt - синий квадрат
(несоответств. стимулы) Кн2
4 проба:
белый квадрат – Δt - снег
(стимул – ассоциация) Кн1
5 проба:
жёлтый квадрат – Δt - жёлтый квадрат
(стимул – стимул) Кн.1
и т.д.
50
(Рис.)
НП1 – 3 уровня типа кодирования: цвет – цвет; цвет – название; цвет – ассоциация.
НП2 – 3 уровня Δt: 0, 500, 1500 мс. НП3 – 2 уровня: соответствие-несоответствие
между двумя стимулами (напр., красный – кровь; красный – синий). ЗП – ВР, мс.
При соответствующих стимулах нужно было нажимать на одну кнопку, а при
несоответствующих – на другую.
Внутригрупповой план. Результаты (Рис.).
Выводы:
1. Два основных эффекта: уровень кодирования (скорость кодирования наибольшая
для физического кода (цвет-цвет) и наименьшая для концептуального (цветассоциация) при всех условиях эксперимента). 2. С увеличением межстимульного
интервала различие между уровнями кодирования значительно снижается. 3. На
интервале 500-1500 мс. наблюдается взаимодействие между уровнями кодирования
и межстимульной задержкой.
Решение проблем со множеством НП.
1). Превращение плана 4×5×3×6×4×5 в планы 4×5, 3×6, 4×5. Особенно в случае,
когда НП никак не связаны между собой.
2) Ограничение чувствительности: исключение ячеек, где ожидаются минимальные
или максимальные значения ЗП.
3) Сходящиеся серии экспериментов (Мартин, с.274; Солсо, с.144).
О феномене перцептивной защиты
Следующий эксперимент базируется на гипотезе о том, что в области
человеческого бессознательного существует некий процесс, определяющий,
вызывает ли конкретное слово ощущение тревоги. Узнавание такого слова на
сознательном уровне не происходит или, по крайней мере, замедляется. Этот
процесс обозначается как перцептивная защита, и на его основе можно строить
далеко идущие выводы о поведении людей.
Долгое время считалось, что человек обладает определенными механизмами,
51
которые защищают его от восприятия провоцирующих тревогу стимулов. Один из
таких механизмов носит название «перцептивная защита». Был спланирован
эксперимент для проверки гипотезы о существовании перцептивной защиты. Для
этого испытуемым на экране тахистоскопа предъявлялись нейтральные и
табуированные (относящиеся к ненормативной лексике) слова. Экспериментатор
строил свои предположения на том, что запретные слова вызывают тревогу и, хотя
испытуемый может узнавать их на бессознательном уровне, механизм перцептивной
защиты замедляет их восприятие на сознательном уровне. На этой основе была
построена гипотеза, что для узнавания табуированных слов необходима более
долгая экспозиция предъявления, чем для нейтральных слов. Испытуемыми были
восемь мужчин и восемь женщин — студентов колледжа. Каждый участник
тестировался индивидуально дважды: отдельно с экспериментатором-мужчиной и
экспериментатором-женщиной.
Испытуемым
предъявлялись
одиннадцать
нейтральных слов (например, «яблоко», «рынок»), и семь непристойных слов
(например, «шлюха», «сука») в заранее установленном порядке. Для того чтобы
точно определить время, необходимое для распознавания слова, использовался
метод предельного порога. В этом методе для каждого слова сначала устанавливается очень невысокое время экспозиции (0,01 с), и экспозиция постепенно
удлиняется до тех пор, пока человек не называет слово точно. Этот процесс
повторялся для каждого из 18 слов.
Временной порог для узнавания нейтральных слов был установлен в среднем
на отметке 0,053 с, а значение порога для узнавания ненормативных слов в среднем
было 0,098 с. Различие между двумя значениями было статистически достоверным.
Так как для опознания непристойных слов требовалась большая экспозиция (пороги
выше), экспериментатор заключил, что гипотеза перцептивной защиты подтвердилась.
Критические замечания со стороны других исследователей в адрес данного
экспериментального плана не заставили себя долго ждать. Хаус и Соломон (Howes,
Solomon, 1950) обозначили два критических методологических пункта. Во-первых,
они обратили внимание научной общественности на то предположение, что ре-
52
зультаты могли быть вызваны нежеланием человека произносить табуированное
слово до полной уверенности в том, что он его правильно узнал. Испытуемые могли
быть особенно нерасположены вербализовать эти слова перед экспериментатором
противоположного пола. Вторым методологическим замечанием было то, что
нейтральные слова намного более часто встречаются в печати, чем термины
ненормативной лексики, и поэтому более быстрое узнавание нейтральных слов
испытуемыми может быть вызвано их большей привычностью. В доработанном
эксперименте Хаус и Соломон (1951) продемонстрировали состоятельность
гипотезы о частоте встречаемости слов. Был получен частотный список
встречаемости в печати около 30 000 слов. Затем были выбраны 60 слов различной
частоты встречаемости (все они были словами нормативной лексики) и определены
пороги узнавания для каждого слова с использованием процедуры, подобной
применявшейся в первоначальном эксперименте. Была обнаружена высокая
отрицательная корреляция (примерно —0,79) между частотой, с которой слово
встречаегся в печати, и временным порогом его узнавания, то есть чем чаще слово
встречается в печати, тем ниже порог узнавания для него. При этом хотя данный
эксперимент продемонстрировал, что частота слов является правдоподобным
объяснением результатов оригинального эксперимента, все еще не отбрасывается
возможность доказательства того, что непристойные слова требуют более высокого
порога узнавания, даже при условии контроля частоты встречаемости.
Постман, Бронсон и Гроппер (Postman, Bronson and Gropper, 1952) провели
более строгий эксперимент с целью проверки гипотез о частоте встречаемости и
перцептивной защиты. Для этого было определена частота, с которой конкретные
ненормативные слова встречаются в печати, а затем каждому слову была подобрана
пара из нейтральных слов, появляющихся в печати с той же частотой. Список слов
был представлен испытуемым при помощи экспериментальной процедуры,
подобной использованной в оригинальном эксперименте. Полученные результаты
никоим образом не поддерживают гипотезу перцептивной защиты. Фактически
было обнаружено, что порог узнавания для непристойных слов был значительно
ниже, чем для нейтральных слов. Это, вероятно, связано с занижением частоты
53
встречаемости табуированных слов.
Сходящиеся операции на примере феномена перцептивной защиты
Более интригующим является тот тип экспериментальных планов, который
используют для проверки психологических теорий путем сведения их к
единственной экспериментальной гипотезе, объясняющей наблюдаемое поведение.
Этот вид экспериментирования называют приближением путем сходящихся
операций (Garner, Hake & Eriksen, 1956). Мы начинаем нашу серию экспериментов с
нескольких возможных гипотез, которые могут объяснить изучаемое поведение.
Каждый проводимый нами эксперимент помогает отбросить одну или несколько из
наших исходных гипотез, пока в конце серии не останется одна гипотеза, которая
может объяснить факты.
Чтобы проиллюстрировать прием сходящихся операций, давайте рассмотрим
эксперимент, в котором выясняется, требуется ли людям больше времени на
восприятие вульгарных слов по сравнению с невульгарными. Предположим, что
экспериментатор демонстрирует слова, используя тахистоскоп — аппарат, который
экспонирует визуальный материал в течение очень коротких экспозиций.
Экспериментатор демонстрирует четыре слова, два вульгарных и два невульгарных,
и просит участников произнести слова вслух, как только они их узнают.
Экспериментатор обнаруживает, что участникам для произнесения вульгарных слов
требуется более длительная экспозиция, и заключает, что этот результат
подтверждает гипотезу, согласно которой люди неосознанно подавляют восприятие
вульгарного материала. Эта гипотеза перцептивной защиты утверждает, что для
преодоления подобного подавления требуется более длительная экспозиция.
Можно выдвинуть ряд других гипотез, которые позволят объяснить этот же
результат. Во-первых, специфические особенности слов могли обеспечить более
легкую читаемость невульгарных слов при коротких экспозициях. Во-вторых,
участники могли воспринять все четыре слова одинаково точно, но непроизвольно
подавлять свою реакцию на вульгарные слова до тех пор, пока они могли
уклоняться от нее. В-третьих, участники могли узнать слова и осознавать, как им
следует отреагировать, но произвольно задерживали реакцию до тех пор, пока у них
54
не появлялась уверенность в том, что они не ошиблись. Тем самым мы имеем по
меньшей мере четыре возможные гипотезы, которые могут объяснить результаты
эксперимента (Рис.).
Последовательное исключение гипотез в экспериментах
со сходящимися операциями
Гипотезы до эксперимента 1:
Характеристика слова
Перцептивная защита
Непроизвольное подавление реакции
Произвольное подавление реакции
Гипотезы после эксперимента 1:
Перцептивная защита
Непроизвольное подавление реакции
Произвольное подавление реакции
Гипотезы после эксперимента 2:
Непроизвольное подавление реакции
Произвольное подавление реакции
Экспер.1: используем другие нейтральные и вульгарные слова.
Экспер.2: применяем регистрацию КГР.
Экспер.3: пол экспериментатора и испытуемого (разный или тот же)
Гипотеза после эксперимента 3:
Произвольное подавление реакции
Теперь нам необходимо провести ряд экспериментов, которые сведут все эти
гипотезы к одной, исключив остальные.
Первый эксперимент, который вы можете провести, разграничивает гипотезу
специфики слова и остальные три. Вы можете повторить первоначальный
эксперимент, используя два других вульгарных и невульгарных слова. Если вы
снова обнаруживаете, что вульгарные слова требуют более длительных
экспозиций, вы на пути к тому, чтобы отбросить гипотезу о специфике слова.
55
Если же для произнесения вульгарных слов большее время экспозиции не
потребовалось, возрастает ваша уверенность в гипотезе характеристики слова.
Предполагая, что после экспер.1 гипотеза о специфике слова отброшена, вы
должны теперь разграничить остальные три гипотезы. В эксперименте 2 мы можем
попытаться определить, воспринимают ли участники вульгарные слова при более
коротких экспозициях, чем те, о которых они сообщают. Мы помним, что кожногальваническая реакция (КГР) человека является индикатором его эмоциональной
реакции на стимулы. Поэтому мы решаем измерить КГР участников во время
демонстрации
вульгарных
слов,
чтобы
выяснить,
какой
должна
быть
продолжительность экспозиции слов для их восприятия. КГР может показать,
воспринимают ли участники слово, пусть даже они произвольно или непроизвольно
подавляют свою реакцию. (Можно взять в качестве индикатора ВП – вызванный
потенциал...)
Если вы выясняете, что КГР меняется во время экспозиции вульгарных слов,
по сравнению с невульгарными, гипотеза перцептивной защиты получает определенное подтверждение. Однако если КГР показывает, что вульгарные слова
воспринимаются при тех же самых экспозициях, что и не вульгарные, должна быть
справедлива одна из оставшихся гипотез и нужно провести экспер.3
Чтобы разграничить произвольное и непроизвольное подавление реакции, вы
можете выбрать операцию, которая заставляет людей произвольно менять
интенсивность подавления. Вы можете ожидать, что когда пол экспериментатора и
участника различен, произвольное подавление увеличится, по сравнению с
ситуацией, когда пол обоих одинаков. Таким образом, в эксперименте 3 вы
пытаетесь определить, меньше ли различие во времени экспозиции, необходимом
для распознания вульгарных и невульгарных слов, в том случае, когда экспериментатор и участник одного пола. Если это так, подтверждается гипотеза
произвольного подавления реакции. Если нет, по-видимому, более вероятна
гипотеза непроизвольного подавления реакции.
Вы можете видеть, как сходящиеся операции позволили нам в этом примере
исключить все гипотезы, кроме одной. Операции, которые мы использовали, чтобы
56
принять одну гипотезу, были различными: манипуляция стимулом, измерение
физиологической реакции и манипуляция межличностными отношениями. Мы
можем выбрать и другие операции, но если допущения, лежащие в основе наших
операций, верны, все прочие операции должны привести нас к принятию той же
самой гипотезы. Каждый раз, когда новая операция приводит к той же гипотезе,
наша уверенность в этой гипотезе возрастает.
В действительности, это обсуждение было несколько идеализированным.
Редки случаи, когда вы можете спокойно сесть перед проведением сходящейся
последовательности экспериментов и детализировать каждую возможную гипотезу
и каждую операцию для разграничения гипотез. Если вы подобны большинству
экспериментаторов, то сосредоточитесь на каком-то одном эксперименте. Лишь
после изучения результатов этого эксперимента вы определите новую операцию,
которая приблизит вас к принятию верной гипотезы.
По мере завершения все большего количества экспериментов в серии вы
можете также обнаружить, что количество гипотез возрастает, а не убывает. Хотя
вы отбрасываете некоторые из старых гипотез, появляются новые, когда вы
начинаете лучше понимать экспериментальную проблему. В этот момент может
показаться, что ряд проводимых вами экспериментов расходится, а не сходится! На
самом деле этот ряд по-прежнему сходится, просто потенциальных гипотез оказалось гораздо больше, чем первоначально предполагалось.
Преимущества
Большинство преимуществ подхода сходящихся серий вполне очевидно. Он
более
гибкий,
чем
крупномасштабный
факторный
эксперимент.
В
крупномасштабном факторном эксперименте вы должны определить факторы и
уровни факторов до начала эксперимента, а затем оказываетесь связанными этим
заранее определенным планом. Одна ошибка при выборе может свести на нет огромные затраты времени и средств. В случае же сходящейся серии вы имеете
несколько поворотных точек. В каждой из этих точек вы можете выбирать новые
независимые переменные или уровни. Вы можете также добиться намного большей
57
эффективности, поскольку вам не нужно тратить время на исследование факторов и
уровней факторов, которые оказывают незначительное влияние на зависимую
переменную.
Кроме того, план сходящейся серии экспериментов заключает в себе
возможности воспроизведения результата. Каждый раз, когда вы демонстрируете
повторяемость экспериментального результата, он приобретает дополнительный вес
в глазах научного сообщества. Если вы провели все три эксперимента в нашем
примере с вульгарными словами, вы трижды воспроизвели, или повторили,
основной экспериментальный результат, состоящий в том, что вульгарные слова
требуют более длительных экспозиций, тем самым убедительно доказав надежность
этого результата.
Недостатки
Планы сходящихся серий имеют и ряд небольших недостатков. Иногда бывает
трудно или невозможно определить, как взаимодействуют переменные, если ими
манипулируют в различных экспериментах. При определенных обстоятельствах вы
можете объединить два эксперимента из сходящейся серии, с тем чтобы
проанализировать их как одиночный межгрупповой факторный эксперимент. Однако если вас действительно интересуют эффекты взаимодействия, вам придется
провести факторный эксперимент.
Второй недостаток состоит в том, что сравнивая результаты независимых
экспериментов в серии, вы всегда проводите межгрупповое сравнение со всеми
сопутствующими недостатками межгрупповых планов.
Наконец, используя план сходящейся серии, вы должны проанализировать и
проинтерпретировать результаты каждого эксперимента, прежде чем сможете
начать следующий. Чтобы завершить подобный анализ, часто требуется несколько
недель, а иногда и месяцев. По этой причине многие исследователи работают
одновременно более чем с одной серией, с тем чтобы можно было проводить
эксперимент из одной серии, анализируя при этом эксперимент из другой.
Рассматривая преимущества и недостатки планов сходящихся серий, легко
58
понять, почему этот подход приобрел в последние годы такую популярность. Он
позволяет
эффективно
и
гибко
изучить
проблемы
и
прикладного,
и
фундаментального исследования.
Основные преимущества и недостатки экспериментальных планов:
двухуровневого, многоуровневого, факторного и плана сходящейся серии.
Планы
Двухуровневый эксперимент
Преимущества: Эффективен для определения того, оказывает ли переменная какоето влияние. Результаты легко интерпретировать. Приемлем для проверки некоторых
теорий. Полезен при сравнениях в прикладных целях.
Недостатки: Нельзя сделать вывод о виде функции. Интерполяция и экстраполяция
рискованны. Трудно проверить сложные теории.
и анализировать
Многоуровневый эксперимент
Преимущества: Можно определить вид функции. Не столь важен размах
независимой переменной.
Недостатки: Требует больше участников и времени. Более громоздкие схемы
уравновешивания. Трудность статистических вычислений.
Факторный эксперимент
Преимущества: Можно исследовать взаимодействия. Добавление факторов
уменьшает изменчивость, тем самым увеличивая статистическую чувствительность.
Повышает обобщаемость, не понижая при этом точность.
Недостатки: С добавлением факторов эксперименты становятся более
громоздкими.
Трудность
статистических
вычислений.
Иногда
трудно
интерпретировать взаимодействия более высокого порядка.
Сходящиеся серии экспериментов
Преимущества: Обеспечивают большую гибкость, чем факторные эксперименты.
Заключают в себе возможности воспроизведения результата.
Недостатки: Трудно оценить взаимодействия. Межэкспериментальные сравнения
становятся также межгрупповыми, с сопутствующими трудностями. Необходимость
анализа результатов предшествующего эксперимента перед проведением
следующего.
59
Виды зависимостей в психологических экспериментах
Сбор, классификация и обработка данных.
1.Отсутствие зависимости (показать график).
2. Монотонно возрастающая или убывающая функция; частный случай – линейная
зависимость (временная суммация на критическом интервале, ВР выбора;
уменьшение диаметра зрачка при увеличении интенсивности света). Параметры.
3.U-образная зависимость (парасаккадическое подавление, позиционная кривая).
4.∩-образная зависимость (размер группы и эффективность совместной работы,
тревожность и эффективность работы, экз.балл и тревожность).
5.Экспоненциальная функция (+ и -)
Эмпирические и апроксимированные данные. (Рис.)
Корреляционные исследования. (Гудвин, Гл.9).
Статистическая связь вместо причинной (время отлёта птиц и время
выпадения снега; строение тела и характер; сезонные колебания цен в экономике).
К. = соотношение; позволяет выдвинуть гипотезу о прич.-следств. связи. Отсутствие
К. не даёт основание для выдвижения гипотезы.
Отличительная особенность: ни одна из переменных не управляется
экспериментатором!
Основания для проведения корреляционных исследований (P.Cozby, Psych
240):
- когда невозможно или неэтично манипулировать переменными, представляющими
интерес;
- когда главная цель исследования связана с субъектной переменной;
- когда нужно выяснить состав переменных и их возможные соотношения (на
предварительной стадии исследования);
60
- когда целью исследования является предсказание будущего поведения; изучается
связь между предикторной (predictor) и критериальной (criterion) переменными.
Виды: 1) прямая, 2) косвенная, 3) случайная.
1. А – R – B (полный – добрый, синий – холодный).
2. A –R - B (cкорость опознания слова – словарный запас; уровень интеллекта –
уровень дохода).
A- R - B
C - cкрытая переменная (интеллект или социальная структура).
Проблема "третьей" переменной в психологическом эксперименте.
Типы К.:
- положительная (личностная тревожность – язва желудка; время, затраченное на
учёбу, - оценка успеваемости): с увеличением (уменьшением) одного фактора
увеличивается (уменьшается) другой; (график);
- отрицательная (чем боязливее, тем меньше шансов стать лидером; бесполезно
потраченное время – средний балл успеваемости): с увеличением одного фактора
уменьшается другой (и наоборот); (график);
- нулевая (не путать со случайной); (график);
- линейная (чем полнее, тем добрее), нелинейная (закон Йеркса-Додсона);
- слабая, сильная; коэффициент корреляции (1, -1, 0, 0,5, -0,5).
Уровень
значимости:
сильная
корреляция
может
оказаться
статистически
незначимой, а слабая – значимой. Определяется по таблице (нужно знать кол-во
степеней свободы; см. Гудвин, Приложение, с.485).
Гальтон:
наследуемость
способностей
внутри
одной
семьи
–
это
статистическая закономерность (не всегда в семье гения наследник будет гением).
Рост родителей и рост детей. Организация коррелирующих данных (матрица X×Y; в
ячейках – частота встречаемости данного сочетания X и Y). Пример матрицы рост
родителей – рост детей. Наибольшие числа располагаются в центре и по диагонали
матрицы, то есть при близком соответствии роста родителей и детей. (Аналог совр.
графика рассеяния). Феномен "регрессии к среднему":
61
выше
средний рост
ниже
если у родителей рост выше среднего, то у их детей рост был высоким, но не
настолько, как у родителей: рост детей имеет тенденцию регрессировать
(смещаться) в сторону среднего значения (то же и в случае с ростом ниже среднего).
Пример построения графика рассеяния (Рис.):
Время для учёбы
(часов/неделю)
42
23
31
35
16
26
39
19
Средний балл
(0 – 4)
3,3
2,9
3,2
3,2
1,9
2.4
3,7
2,5
r = 0,88
На графике рассеяния точки никогда не соединяются линиями! Признаками
корреляции являются: густота распределения точек (напр, вокруг линии или
кривой), наклон линии регрессии (положит. или отрицат.).
Уравнение линии регрессии: Y = a + bX. Зная величину коэффициента
корреляции, станд. откл. для коррелирующих перменных и их средние значения,
можно по величине Х предсказывать Y. Так, на основании значимой корреляции
между курением и сердечными заболеваниями, можно судить о вероятности
сердечных заболеваний у курящих; на основании портрета "жестокого супруга"
можно судить о вероятности такого поведения у безработного.
Диапазон одной или обеих переменных: чем он шире, тем выше и значимее
корреляция.
Представление данных эксперимента (Гудвин, 265-268).
Способы представления: протокольный, отчёты испытуемых, текстовый,
табличный,
графический.
Злоупотребление
протоколами
(особенно
в
62
патопсихологии) и отчётами. Текстовое описание достаточно только при небольшом
количестве НП или её уровней. Таблицы необходимы для количественного анализа
данных. Они должны быть в меру подробными и отражать суть исследуемой
зависимости. Например, далеко не всегда нужно приводить индивидуальные данные
всех испытуемых. Построение таблицы должно отражать часть или весь
экспериментальный план. Оформление таблицы: нумерация, название, разделы и
подразделы, разрядность чисел, выделение шапки и разделов, объём таблицы.
Графики (рисунки) – для отображения качественных зависимостей: линейные,
гистограммы, трёхмерные, секторные (см. современные статистические пакеты).
Правило: для непрерывных НП (дозы лекарства, уровень тревожности, IQ, время)
можно использовать разные типы, для дискретных (наличие или отсутствие
контекста, реагирование правой или левой рукой, конкретные или абстрактные
слова, связный или бессвязный текст) НП – только гистограммы. Обман с помощью
графики ("Ого-график"; Гудвин, 159). Обозначения на графиках.
Этика психологических экспериментов.
Опрос как исследование (Мартин, с.308-323).
Цель опроса – на основе данных выборки судить о популяции.
В опросе содержится информация, которую нельзя получить с помощью измерения
(мнения, мотивы, ожидания). "...узнать не только, что люди делают, но и почему они
это делают".
Способы опроса. Почтовый (респонденты); плюс: отдалённые места, анонимность;
минус: низкий уровень реагирования (20-30%) – погрешность нереагирования; это
нельзя компенсировать увеличением кол-ва опросных листов из-за угрозы
репрезентативности выборки. Здесь нужно уделять внимание содержанию письма
(минимум
формальности
и
шаблонов;
символическое
вознаграждение;
предварительный разговор по телефону; повторное послание писем). В почтовом
опросе главное – проверять репрезентативность итоговой выборки.
63
Телефонный опрос. Более личный характер, по сравнению с почтовым.
Проблемы: нежелание или неумение говорить по телефону; занятость другими
делами. Рекомендации; краткость вопросоов, их небольшое число.
Групповой опрос. Быстрый сбор большого количества данных. Трудность
обеспечить полную конфиденциальность (из-за рядом сидящих).
Интервью. Структурированное (по заранее написанному сценарию) и
неструктурированное; смешанное.
Интерент-опрос.
Составление опросника (если нет готового!). Вопросы: открытые, закрытые
(да-нет), многоальтернативные (выбор одного ответа из нескольких предложенных).
Проблема превращения ответов в числа. Формулировка вопроса: исключение
неоднозначности, понятность для респондента (лексика должна соответствовать
выборке), избегание вопросов в отрицательной форме. Использование рейтинговых
шкал. Шкала Ликерта (с.319).
Недостатки метода опроса. Большое количество данных и трудность их
статистической
обработки.
Это
–
корреляционные
исследования,
а
не
экспериментальные. Возможная неправдивость ответов (из-за желания защитить
себя, привлечь внимание к своей группе, ориентации на социально-приемлемые
нормы. Поэтому необходимо смягчать выводы опросов.
Планирование нетрадиционных исследований
(Файл Designing designe; Мартин, с. 282-308).
Три
вида
эмпирических
исследований:
рандомизированный
(строгий)
э.,
квазиэксперимент, неэксперимент. (Рис.). Общий формат обозначений, состоящий
из 4 частей.
4 составные части экспериментального плана (Рис.):
- Протекание во времени (причина предшествует следствию) передаётся в виде
определённого расположения элементов в пространстве (слева направо и сверху
вниз); [Об отображении времени на пространство]
64
- Предполагаемая причина (воздействие лекарством, социальная программа, метод
обучения); обозначается через Х ( эквивалентно НП); если программ несколько – Х1
, Х2 и т.д.; к контрольной (сравниваемой) группе Х не применяется;
- Наблюдение (измерение) – обозначается буквой О (от англ. observation); оно
может быть одно и то же на всём интервале исследования или в разные моменты
проводятся разные измерения, и тогда они обозначаются индексами О1, О2 и т.д.;
- Группы испытуемых; при наличии нескольких групп каждая обозначается на
отдельной строке; в начале строки ставится символ, обозначающий способ
формирования группы: R – случайный; N – неслучайный (неэквивалентные группы,
когорты); в общем случае неэквивалентная группа – "это группа, полученная путём
иного механизма отбора, нежели тот, который применялся для группы,
подвергаемой воздействию" (Мартин, с.286); С – отбор в группу по критической
оценке, или переменной уравнивания (IQ от 90 до 120).
Примеры:
План с однократным итоговым тестированием на одной группе.
"Допустим, автор нового метода обучения желает показать его преимущества на
одной академической группе. Часто педагогические «эксперименты» выглядят
именно так. В этом случае исследователь, конечно, сравнивает результаты данной
экспериментальной группы с «обычными» результатами, т.е. с известными
показателями ЗП (или О), или с другими мыслимыми группами, в которых ситуация
обучения является традиционной. Если он не использует никаких форм
экспериментального контроля (в первую очередь как сравнение реализованных
условий с разными уровнями НП), то выводы могут не выдержать критики с точки
зрения конкурирующих объяснений. Приведем часть возможных возражений,
ставящих под сомнение достоверность таких результатов: (Корнилова Т.В.)

возможно, в выбранной (и единственной) группе изначально были более
сильные студенты;

возможно, само понимание учащимися, что с ними экспериментируют,
заставило их заниматься более усердно;
65

возможно, более высокий результат обучения нужно связывать с личностью
преподавателя: он как энтузиаст «выкладывается» в большей степени, чем
коллеги, в частности, вследствие искренней веры в успех своего метода и т.д."
Если вы оцениваете поведение какой-то группы, которая подвергалась воздействию
только одного уровня независимой переменной, то используете план с однократным
итоговым тестированием на одной группе. В нашей системе обозначения этот план
выглядит следующим образом (1):
R
(1)
(подразумевается)
Когда у вас нет другой информации, дополняющей результат эксперимента, этот
план, в сущности, бесполезен для определения того, какое влияние оказало
воздействие. [Не совсем; напр., если нужно решить, не наносит ли вред
применяемое воздействие]
Например, предположим, что телевизионная компания показывает программу,
посвященную массовому уничтожению евреев фашистами — Холокосту (X), и вас
интересует, как передача повлияла на осведомленность населения об этом событии
(О). Вы посылаете группе людей вопросник и обнаруживаете, что теперь 76% знают
о том, что произошло во время Холокоста. Что же вам известно о влиянии
телепередачи?
понижению
Способствовала
осведомленности?
ли
она повышению осведомленности?
Если
вы
не
знаете,
каким
был
Или
уровень
осведомленности до передачи или каков уровень для эквивалентной группы, не
смотревшей передачу, ваш результат бесполезен при ответе на эти вопросы.
Этот план подобен изучению отдельного случая. Однако есть и некоторые
важные отличия, которые делают этот план полезным. При изучении отдельного
случая исследователь, как правило, знает очень много о контексте, в котором
наблюдает поведение. По этой причине, хотя и не проводится непосредственная
оценка того, каким было поведение до воздействия и наблюдения, его часто удается
вывести. Вдобавок, обычно наблюдают более чем одну модель поведения. Эти
66
модели поведения могут образовывать паттерн, который обеспечивает намного
больше информации, чем дает ее одиночная зависимая переменная, оцениваемая в
более стерильной лабораторной обстановке.
План с однократным итоговым тестированием неэквивалентных групп.
Если мы добавим к плану, который только что обсудили, итоговый тест с
неэквивалентной контрольной группой, то получим следующий план (2):
Смотрели передачу
(2)
Не смотрели
(контр. группа)
Предположим, в нашем примере с Холокостом мы обнаружили, что из-за игры
местной футбольной команды телепередача не была показана в Майами. Мы можем
использовать рандомизированную выборку из Майами в качестве неэквивалентной
группы и послать ей вопросник. Если мы теперь обнаружим какое-то различие
между группами (в контрольной группе показатель осведомлённости о холокосте
меньше), можем ли мы приписать его телепередаче? Едва ли, потому что в Майами
живет
много
евреев,
а
еврейское
происхождение
может
повлиять
на
осведомленность о Холокосте.
Основная проблема в случае плана с однократным итоговым тестированием
неэквивалентных групп состоит в том, что любое наблюдаемое различие могло быть
обусловлено как воздействием, так и различиями в отборе групп. Чем более сходны
группы (напр., по национальному составу), тем убедительнее заключение.
Один из способов повышения надежности заключения при отсутствии формального
предварительного тестирования — получить предварительную информацию,
позволяющую сравнить две группы. Эта предварительная информация тем полезнее,
чем сильнее она коррелирует с зависимой переменной. Например, мы можем
сравнить две наши выборки по таким характеристикам, как возраст, пол, социальный класс, этническая принадлежность и вероисповедание. Это сравнение может
дать нам представление о том, насколько эквивалентны группы. Однако базовый
67
план по-прежнему ненадежен, и необходимо быть очень осторожным при
интерпретации результатов любого плана с однократным итоговым тестированием
для неэквивалентных групп.
План с предварительным и итоговым тестированием на одной группе.
Снова взяв за основу план с итоговым тестированием на одной группе, посмотрите,
что получится, если мы также проведем с этой группой предварительное
тестирование. Этот план имеет следующий вид (3):
(3)
Этот план широко используется в прикладных полевых исследованиях и
представляет собой улучшение плана для неэквивалентных групп с точки зрения
отбора. Очевидно, что для обоих наблюдений отбирают одних и тех же участников
(внутригрупповой план). Однако за это улучшение нам приходится платить
определенную цену, поскольку нас могут подстерегать другие угрозы внутренней
валидности.
Возвращаясь, например, к Холокосту, какое влияние, на ваш взгляд, окажет
предварительное тестирование (в котором спрашивают о том, знают ли люди об
этом событии) на завершающее тестирование, оценивающее осведомленность о
событии? Вы можете видеть, что в этом случае угрозой является само
предварительное тестирование (...). Если мы решили минимизировать проблемы
тестирования, проведя предварительный тест задолго до воздействия — скажем, за
год до него, — мы можем столкнуться с другими угрозами. Против нас может
сыграть фон: осведомленность группы способна изменить какое-то иное, связанное
с
Холокостом
событие,
помимо
телепередачи,
например
арест
военного
преступника. Или же, особенно если наши участники — школьники, может оказать
влияние созревание (изменения, связанные с временем). Таким образом, хотя план с
предварительным
тестированием
может
решить
проблему
отбора,
при
интерпретации необходимо проявлять крайнюю осторожность из-за других угроз
внутренней валидности.
68
Корнилова Т.М.: "Этот план также находит широкое применение в
педагогических и психологических исследованиях. Он лучше рассмотренного ранее
плана, так как учитывает величину изменения зависимой переменной от первого ко
второму измерению, т.е. имеет место контроль ЗП на уровнях «до» и «после»
воздействия (схема О'ХО"). Достоверность выводов и при таком плане очень мала.
Укажем некоторые причины.
Нет возможности развести факторы «фон» и «естественное развитие» от
влияния собственно экспериментального воздействия.
Допустим,
в
качестве
экспериментального
фактора
продолжает
рассматриваться новый метод обучения. Показатели академической успеваемости
изменяются к концу семестра (и началу экзаменационной сессии) сразу по
нескольким причинам. Кроме воздействия обучения, вмешиваются побочные
переменные. Так, «тревожность» как пример фактора «фон» обычно возрастает у
студентов к началу экзаменационной сессии. Возможно, именно это является
причиной больших усилий студентов в учебном процессе, а не воздействие нового
метода обучения. В результате повышение показателей эффективности учения к
концу семестра «естественно» и без эффекта введения нового метода.
К переменным фона может быть отнесена также переменная, называемая
«экспериментальная
изоляция».
Например,
в
качестве
экспериментальной
исследуется группа в учреждении, пансионате и т.п. Члены этой группы
оказываются вне влияний со стороны общения с другими аналогичными выборками
– коллег, сверстников из других групп и т.п. Понятно, что в таких условиях
возможно изменение установок, развитие (или даже искажение) мотивации учения и
работы, т.е. появляются источники конкурирующих гипотез относительно причин
изменений ЗП (О-измерений).
К
факторам
естественного
развития
относятся
все
те
процессы
(психического, экономического, социального и биологического характера), которые
систематически изменяются независимо от конкретных внешних событий, просто с
течением времени.
69
Так, испытуемые от момента измерения О' к измерению О" могли стать
старше, устать, подвергнуться каким-то социальным воздействиям, в качестве
которых выступают изменения в обществе. Наконец, ситуация в стране могла
измениться так, что «естественно» изменилось отношение людей к тем или иным
аспектам реальности или к собственной деятельности.
Далее, при такой схеме нет возможности оценить «эффект тестирования».
Хорошо известно, что при тестировании, например, интеллекта или уровня знаний
повторное проведение теста, пусть и по другой, альтернативной форме, вызывает
эффект тренировки.
Неучаствовавшие ранее в процедуре тестирования люди обычно показывают
худшие результаты по тестам, чем уже получившие опыт знакомства с
тестированием. Возможен и обратный эффект. Например, при тестировании
предубежденности по отношению к национальным меньшинствам повторное
измерение может продемонстрировать большую величину эффекта, чем он есть в
действительности. На результаты оказывает влияние повышение осведомленности
людей (в группе, популяции) относительно «желаемого», т.е. ожидаемого от них,
эффекта. При анонимных опросниках это может быть связано, в частности, с тем,
что в суждениях, выражающих враждебность или отрицательное отношение,
испытуемые
изменяют
свои
представления,
принимая
установку
большей
враждебности. Этот факт, кстати, полностью применим и к обоснованию
неадекватности опросников, выясняющих отношение к преподавателю, если в
анкету заведомо включаются «отрицательные» шкалы.
«Реактивность» испытуемых – еще одно конкурирующее объяснение при
исследованиях по плану О'ХО". Так, сама по себе процедура измерения переменных
может выступать стимулом для изменения поведения, оценок или мыслей
студентов.
Группа, подвергнутая тестированию, может начать демонстрировать иные
формы поведения в силу возникновения у ее членов новых установок, связанных с
реакцией на него. Известно, например, что появление в классе наблюдателя само по
себе
может
изменить
стиль
общения
преподавателя
с
учащимися.
Для
70
экспериментальных ситуаций эффекты реактивности принимают форму эффектов
экспериментатора...". (Корнилова Т.В.)
Три рассмотренные плана называют неэкспериментальными, поскольку когда
они используются, нет возможности оценить многие из угроз внутренней
валидности. Планы, обсуждаемые ниже, называют квазиэкспериментальными,
поскольку, хотя они не отвечают строгим требованиям базовой экспериментальной
модели, мы обычно можем оценить большую часть угроз.
План с неэквивалентной контрольной группой, с предварительным и
итоговым
тестированием.
В
первом
типе
плана
используется,
кроме
экспериментальной группы, неэквивалентная контрольная группа, не подвергаемая
воздействию. С каждой группой проводятся и предварительный, и итоговый тесты.
Этот план обозначают следующим образом (4):
(4)
Этот план наиболее широко используется в полевых исследованиях в
социальных науках. Он позволяет нам оценить большинство явных угроз
внутренней валидности.
В какой степени нам следует побеспокоиться о тех или иных угрозах, зависит
в некоторой степени от исхода конкретного эксперимента. Если в результатах,
показанных двумя группами в предварительном тесте, нет существенных различий,
мы можем иметь определенную уверенность в том, что группы относительно
эквивалентны и возможность угрозы со стороны отбора минимизирована. Если
показатели контрольной группы одинаковы и в предварительном, и в итоговом
тестах, минимизированы угрозы со стороны фона и созревания. Поскольку с обеими
группами проводят один и тот же тест, различия во влиянии самого тестирования
должны также быть минимальными. Если из двух групп между предварительным и
итоговым тестированием выбывает различное число участников, проблемой может
71
быть отсев участников. Однако план позволяет оценить эту угрозу, поскольку в
предварительном тестировании мы получили информацию о выбывших участниках.
Наиболее серьезная потенциальная проблема при использовании плана этого типа
— наличие угрозы, которая взаимодействует с отбором групп. Опять же, если две
группы показывают одинаковые результаты в предварительном тесте, угроза
взаимодействия с отбором уменьшается, но все-таки возможна. Например, если
школа А подвергается определенному воздействию, а школа Б — нет, в школе А при
этом может работать новый директор, который требует от учителей выполнения
новых стандартов. Это взаимодействие фон-отбор может являться угрозой для
наших заключений.
Мы должны еще больше побеспокоиться о взаимодействиях с отбором, когда
две группы имеют совершенно разные показатели предварительного тестирования.
Например,
предположим,
что
мы
хотим
определить,
повышает
ли
производительность труда сдельная форма оплаты работников, занятых на
сборочном конвейере. Нам нужны добровольцы, которые будут иметь более низкий
оклад, но будут получать надбавку за сдельную (поштучную) работу. Предварительное тестирование показало, что добровольцы работают более производительно, но
мы полагаем, что можем сравнить величину этого первичного различия с величиной
различия при итоговом тестировании. Действительно, при итоговом тестировании
различие
стало
еще
более
заметным.
Обе
группы
повысили
свою
производительность, но группа сдельщиков повысила ее в большей степени. Мы
заключаем, что сдельная оплата повышает производительность. Правы ли мы?
Поскольку
предварительное
тестирование
показало
различие
в
производительности, добровольцы в экспериментальной группе не только могли
быть лучше на тот момент, но могли также «созревать» (научаться, приобретать
опыт) более быстрыми темпами. Работники редко отличаются стабильностью, и мы
знаем, что не отличались ею и эти работники, так как даже контрольная группа
улучшила свои показатели. Когда прогрессируют все, мы не должны удивляться,
что более умелые работники прогрессируют быстрее. Базовый план не позволяет
нам определить величину этого потенциального взаимодействия созревание—отбор.
72
Мы можем разделить экспериментальную группу (подвергающуюся воздействию)
по результатам предварительного тестирования, чтобы получить некоторое
представление об эффекте. То есть мы ожидаем, что менее способные работники из
экспериментальной группы будут прогрессировать медленнее, чем более способные.
Однако тогда мы будем иметь иной план. Суть здесь в том, что даже когда вы
используете план с неэквивалентной контрольной группой и предварительным и
итоговым тестированием, ваши результаты все равно могут подвергаться угрозам,
подобным взаимодействию с отбором.
Варианты. Иногда, когда невозможно или нецелесообразно использовать
один и тот же тест во время предварительного и итогового тестирования,
применяют замещающее предварительное тестирование. То есть предварительное
тестирование измеряет некоторую переменную или переменные, которые должны
коррелировать с данными итогового тестирования. Например, если вы желаете оценить эффекты какого-то нового метода преподавания алгебры, то можете применить
в одном классе новый метод, а второй класс учить по традиционной методике.
Вместо того чтобы проводить предварительный тест, оценивающий успехи в
алгебре, с классами, которым еще предстоит изучать алгебру, вы можете
предложить
им
замещающий
предварительный
тест,
оценивающий
общие
математические способности.
Замещающий предварительный тест можно использовать, если невозможно
провести предварительное тестирование, например, когда экспериментальное
воздействие состоит из какого-то непредсказуемого фонового события, влияющего
на часть совокупности. Или же, когда все-таки возможно провести предварительный
тест, тестирование может являться угрозой внутренней валидности, и замещающее
тестирование можно проводить для того, чтобы не использовать тест, который будет
применен в качестве итогового. В других случаях, когда формируется новое
поведение, использование того же самого теста в качестве и предварительного, и
итогового может оказаться бессмысленным. Например, едва ли разумно проводить
итоговый экзамен по курсу общей психологии в двух учебных группах, прежде чем
они прослушают этот курс.
73
Если угрозой является тестирование, мы можем использовать независимые
выборки (т.е. разные группы испытуемых) для предварительного и итогового
тестирования. Вместо того чтобы для каждой группы проводить и предварительный,
и завершающий тесты на одних и тех же участниках, мы получаем по две
подвыборки для каждой группы, одну — для предварительного теста, а другую —
для итогового. Например, если какую-то образовательную программу вводят в
одном классе, но не в другом, два класса можно разделить случайным образом, так
что с одной половиной каждого класса будут проводить предварительный тест, а с
другой половиной — позже итоговый. Очевидным недостатком этого варианта
плана является то, что он полностью зависит от возможности сравнения подгрупп
предварительного и итогового тестирования. Если вы считаете, что группы могут
различаться по какому-то параметру, связанному с воздействием, тогда план имеет
значительные изъяны.
Другой способ усовершенствования базового типа плана с неэквивалентной
контрольной группой и предварительным и итоговым тестированием — более чем
однократное предварительное тестирование (5):
(5)
это план с измерением исходного уровня. Если второе предтестовое измерение
отличается от первого, то можно ожидать, что послетестовое измерение также будет
отличаться от него даже при отсутствии Х. Если же дотестовые измерения не
отличаются, то можно с уверенностью считать, что послетестовое изменение
произошло в результате Х. Можно производить дополнительные измерения после
воздействия. Это позволит судить о последействии программы, о том, как
ослабляется её эффект, или же о задержке в появлении эффекта.
Добавление одного или нескольких предварительных тестов может помочь
нам оценить эффекты двух возможных угроз. Вспомним наше обсуждение того, как
«способные становятся еще более способными» и как это обстоятельство может
74
привести к взаимодействию созревание—отбор? Если бы мы провели еще более
ранний предварительный тест, то могли бы определить, соответствуют ли
результаты этого теста тренду для каждой группы. Если они соответствуют, у нас
есть веские основания заключить, что различие в завершающем тесте вызвано
взаимодействием созревание—отбор, а не экспериментальным воздействием. То
есть два предварительных теста обозначили бы тренд созревания, а итоги
завершающего тестирования можно было бы интерпретировать всего лишь как
продолжение этого тренда (Рис.).
Планы временных серий.
Второй основной класс квазиэкспериментальных планов называют планами
временных серий. Исходный тип плана временных серий требует, чтобы одиночную
группу наблюдали множество раз до экспериментального воздействия, а затем
множество раз после воздействия. Обозначение одного из таких планов выглядит
следующим образом (6):
О1 О2 О3 О4 О5 Х О6 О7 О8 О9 О10
(6)
Исходом, который легче всего интерпретировать для плана подобного типа,
является скачкообразный переход горизонтальной линии на новый уровень.
Например, если мы вводим новую систему оплаты труда для работников и
обнаруживаем немедленное 10% увеличение производительности, причем это
изменение сохраняется в течение всего времени исследования, то можем быть
вполне уверены в том, что изменение вызвано новой системой оплаты. Однако даже
при этом идеальном исходе нам по прежнему необходимо помнить о возможных
угрозах, таких как фон или созревание. С экспериментальным воздействием могло
совпасть какое-то фоновое событие (слух о возможной премии). Также возможно,
но, скорее всего, маловероятно, что именно в то самое время, когда производилось
воздействие, какое-то неизвестное событие привело к тому, что ряд плохо
работающих или отрицательно влияющих на коллектив участников выбыл из
исследования.
75
Используя планы временных серий, можно устранить или оценить
и
другие потенциальные угрозы внутренней валидности. Например, перестают быть
проблемами отбор и взаимодействия с отбором, поскольку на протяжении всего
эксперимента используют одну и ту же группу. Любые эффекты тестирования
должны исчезнуть до начала экспериментального воздействия. Как правило, мы
должны также суметь устранить проблему созревания (естественного развития),
поскольку эффекты созревания обычно проявляются медленно; следовательно, мы
ожидали бы увидеть тренд, а не дискретное изменение.
Когда изменение зависимой переменной отсрочено, носит временный
характер или отражено в наклоне возрастающего или убывающего тренда, а не в
общем уровне горизонтальной линии (т.е. её дискретным скачком), мы обычно
делаем свое заключение с меньшей уверенностью. В этом случае мы иногда можем
выявить эффекты воздействия с помощью более сложных статистических приемов.
Варианты. Как и в случае плана первого типа, возможны варианты простого
плана временной серии. Один из вариантов, который увеличивает обоснованность
выводов, — добавление во временную серию неэквивалентной контрольной группы,
не подвергающейся воздействию. То есть вторую неэквивалентную группу
оценивают на каждом интервале наблюдения, но экспериментальное воздействие на
нее не производится. Контрольная группа позволяет нам оценивать эффекты фона
как угрозу валидности, поскольку фоновое событие, вероятно, повлияет на обе
группы одинаковым образом. Если две группы отбирают различным образом, может
иметь место взаимодействие фон-отбор. Однако эта угроза превращается в
проблему лишь в том маловероятном случае, когда какое-то уникальное фоновое
событие совпадает с моментом воздействия и только для экспериментальной
группы.
Когда ожидается, что эффекты воздействия будут обратимыми, можно
использовать временную серию с устранением воздействия. После того как
исходный план завершен, воздействие устраняется и производится еще один ряд
наблюдений. Фактически этот план представляет собой частично совпадающую
комбинацию двух исходных планов временных серий, в одной серии главным усло-
76
вием является наличие воздействия, а в другой — его отсутствие. Вы можете
добавлять или устранять воздействие столько раз, сколько раз вы хотите повторить
результат. Каждое повторение повышает вашу уверенность в причинном эффекте
воздействия.
Еще
один
способ
включения
в
план
повторений
—
использовать
неэквивалентные группы, но оказывать воздействие па разных этапах серии
наблюдений для двух групп. Подобный план называют временными сериями с
чередованием повторений. Этот план дает возможность нейтрализовать или учесть
большинство источников угроз внутренней валидности, например фон и созревание.
При этом, благодаря тому что включенные в план повторения производятся на
выборке из другой совокупности, план повышает внешнюю валидность результата
эксперимента. В табл. 10.2 сведены планы временных серий.
Можно применять или прекращать воздействия несколько раз на протяжении
(7)
длительного периода: этот план (7) особенно эффективен против "исторической"
угрозы, так как при повторении программы маловероятно, что результат
воздействия будет зависеть от какого-либо уникального случая.
Несколько уровней воздействия (8):
(8)
При изучении действия лекарства на поведение можно применять постепенно
увеличивающиеся дозы. Здесь не указаны типы групп; это значит, что можно
применять любой тип. Это типичная стратегия исследования "чувствительности"
методики (или параметрического иссследования), когда основное внимание
уделяется одному из эффектов, вызванных разными уровнями воздействий. Если Х1
77
и Х2 – разные или даже противоположные методики (обучения), для каждой из
которых берётся отдельная группа испытуемых, то этот план позволяет судить о
том, что применённые измерения достаточно чувствительны для того, чтобы
провести разграничение между двумя разными методиками.
ТАБЛИЦА 10.2
Способы реализации различных планов временных серий. Заметьте, что участники распределялись в
группы 1, 2 иЗ случайным образом и, следовательно, эти группы считаются неэквивалентными.
Момент 1
Момент 2
Момент3
Момент 4
Момент 5
Момент 6
Момент 7
Тест
группы 1
Тест
группы 1
Тест
группы 1
Исходный план
временных серий
Тест
группы 1
Тест
группы 1
Тест
группы 1
Воздействие
С добавлением неэквивалентной контрольной группы,
не подвергающейся воздействию
Тест
группы 1
Тест
группы 2
Тест
группы 1
Тест
группы 2
Тест
группы 1
Тест
группы 2
Воздействие
Отсутствие
воздействия
Тест
группы 1
Тест
группы 2
Тест
группы 1
Тест
группы 2
Тест
группы 1
Тест
группы 2
Тест
группы 1
Устранение Тест
воздействия группы 1
С устранением
воздействия
Тест
группы 1
Тест
группы 1
Воздействие
Тест
группы 1
С чередованием
повторений
Тест
группы 1
Воздействие
группы 1
Тест
группы 1
Тест
группы 1
Тест
группы 1
Тест
группы 1
Тест
Тест
группы 2
Тест
группы 2
Тест
группы 2
Воздействие
Тест
группы 2
Тест
группы 2
Тест
группы 2
Тест
группы 3
Тест
группы 3
Тест
группы 3
Тест
группы 3
Тест
группы 3
Воздействие Тест
группы 3
Расширение наблюдений за счёт применения разнообразных методик измерения.
Применение нескольких адекватных для данных воздействий методик повышает
надёжность каузального вывода.
78
Другой путь расширения наблюдений – использование проксиизмерений: если
нужно оценить эффективность новой программы обучения, но предварительные
измерения не сделаны, то можно использовать данные стандартного теста
достижений,
полученные
в
посттестовый
период,
и
сравнить
их
со
среднесеместровыми средними оценками, полученными учащимся до введения
новой методики. При отсутствии информации о предтестовом периоде можно
попросить испытуемых вспомнить, что они чувствовали и как вели себя в этот
период, и эту информацию использовать для предтестовых оценок. Хотя
достоинство разных методик неодинаково, но всё же лучше не полагаться только на
одну методику измерения.
Применение разных групп испытуемых как средство повышения надёжности
данных эксперимента.
(9)
Пусть в этом плане (9) две группы R набираются из лиц, работающих в одном
учреждении, а воздействия применяются для каждой группы в разное время. Тогда
общение между участниками разных групп может очень навредить строгости
каузального вывода. В этом случае нужно создать ещё одну неэквивалентную
группу (из другого учреждения), которая не могла бы общаться с остальными
участниками (10):
(10)
Преимущества квазиэкспериментальных планов
Основное преимущество квазиэкспериментов в том, что они позволяют нам
проводить
исследования,
которые
раньше
были
просто
невозможны,
79
Квазиэкспериментированис обеспечило набором новых средств тех психологов,
которые
интересуются
социальными
вопросами,
клинической
оценкой
и
образовательными программами и хотят исследовать эти вопросы в реальной
обстановке. И хотя нужно проявлять осторожность при определении источников
угроз внутренней валидиости, мы по крайней мере знаем, что
угрозу, и рассмотренные планы позволяют оценить, что
может представлять
именно является
проблемой.
Недостатки
Чтобы
предупредить
неумеренный
восторг
в
отношении
квазиэкспериментирования, отмечу, что оно имеет и определенные недостатки.
Несмотря на все наши усилия, мы не всегда можем обнаружить источники угрозы
внутренней валидиости. Хотя верно, что мы обычно можем выявлять их по мере
появления, тем не менее появление подобной угрозы заметно обесценивает наши
результаты. Например, если мы используем исходный план с неэквивалентной
контрольной группой и предварительным и итоговым тестированием (4) и
обнаруживаем различие в предварительном и итоговом тесте для контрольной
группы, интерпретация любого изменения в экспериментальной группе в лучшем
случае сомнительна. Вторая проблема состоит в том, что эти планы, по сравнению с
традиционным экспериментом, несомненно, отличаются большей сложностью и
часто требуют больше времени и усилий для своего осуществления. Измерения
приходится проводить многократно, вместо однократного измерения для каждого
условия. И, как я упоминал, хотя теперь и существуют статистические методы
проверки для квазиэкспериментальных планов, проводить их труднее и они обычно
не входят в программу базового учебного курса.
Учитывая как раз эти недостатки, поведенческие науки часто критиковали
либо за проведение тщательных исследований по простым и маловажным
проблемам, либо за проведение поверхностных исследований по сложным и
важным проблемам. Усовершенствование квазиэкспериментального плана сделало
80
возможным проведение тщательных исследований по сложным и важным
проблемам.
Планы с исходным уровнем, с одним испытуемым или с малым N
(Мартин, с.298-308)
Индивидуальные или групповые данные?
Некоторые исследователи утверждают, что манера эксперимеитирования
большинства психологов в лучшем случае вводит в заблуждение, а в худшем
бессмысленна. Самым радикальным в этой группе является Сидман (Sidrnan, 1960),
который заявляет, что тот тип традиционных экспериментов, с которым вы
знакомились, мало что говорит нам об индивидуальном поведении. Сидман
указывает, что эксперименты обычно дают нам сведения о поведении некоего
воображаемого среднего участника, который не является точным отражением ни
одного из реально существующих участников. Он утверждает, что большинство
экспериментаторов используют группы и делают вид, что индивидуальное
поведение и группе напоминает среднее поведение группы. Он доказывает, что в
отдельные моменты времени индивидуальное поведение в группе может не иметь
ничего общего со средним поведением группы.
Для иллюстрации этой точки зрения рассмотрим эксперимент по изучению
скорости усвоения человеком простых аналогий с помощью примеров. Первым
вопросом может быть такой: edit относится к tide так, как recap к___. Ответ: pacer,
поскольку pacer — это слово recap, написанное задом наперед. Следующим
вопросом может быть: pets относится к step так, как tool к _____. Опять же, ответом
будет слово tool, написанное задом наперед, или loot. Мы даем каждому участнику
три секунды на решение каждого вопроса. Мы можем ожидать, что научение будет
происходить но принципу «все или ничего». То есть мы предполагаем, что в какойто момент участник воскликнет «Ага!» или «Эврика!» и далее будет давать только
81
правильные ответы.
На рис. (см.) показаны вымышленные индивидуальные результаты для десяти
людей; на другом рис. (см.) изображена групповая кривая, относящаяся к среднему
человеку. Вы можете видеть, что групповая кривая не соответствует ни одной из
индивидуальных кривых. Групповая кривая наводит на мысль, что люди
приходят к решению постепенно; однако в действительности каждый человек
всего за одну попытку перешел от незнания ответов ни на один из вопросов к
решению всех вопросов. Из-за подобных несоответствий, полагает Сидман, редки
случаи, когда групповые показатели могут сказать нам многое об индивидуальном
поведении. Вы можете вспомнить, что Поултон (PoulLon, 1973) занимал совершенно
иную позицию по этому вопросу и даже утверждал, что все впутригрунповые
планы, в сущности, содержат изъяны и что легко поддаются интерпретации только
межгрушювые манипуляции, в которых используются разные группы. Психологи
предпочитают использовать группы прежде всего из-за изменчивости индивидуального поведения, потому что вариация поведения какого-либо участника, вероятнее
всего, уравновесится другими участниками, поведение которых будет меняться в
противоположном
направлении.
изменчивости — не в самом
проконтролировать
Однако
Сидман
говорит,
что
причина
участнике, а в неспособности экспериментатора
все влияющие на этого участника переменные. Как только
экспериментаторы добьются адекватного поведенческого контроля, у них более не
будет необходимости использовать большие группы. Экспериментаторы могут
продемонстрировать, что они добились этого контроля, проведя эксперимент с
исходным уровнем.
Процедуры с исходным уровнем
Чтобы проиллюстрировать предлагаемый Сидманом эксперимент с исходным
уровнем, рассмотрим эксперимент, изучающий возможность применять наказание
для изменения поведения человека с церебральным параличом. Предположим, что
терапевт работает с клиентом, страдающим церебральным параличом, который
хочет улучшить свои навыки собеседования. Люди с церебральным параличом часто
имеют проблемы с контролем движений головы и поэтому, как правило, они не
82
способны поддерживать контакт глаз. Пытаясь повысить степень контакта глаз,
являющегося одним из аспектов успешного собеседования, терапевт решает
применить процедуру, в ходе которой клиент получает легкие удары током каждый
раз, когда контакт глаз нарушается. Клиент, стремящийся улучшить свои
социальные навыки, соглашается па эту процедуру.
Первый шаг в этом типе эксперимента — установить исходный уровень, т. е.
устойчивое состояние, при котором интенсивность реакции меняется очень
незначительно. Одной из неприятных проблем в экспериментах с исходным
уровнем является определение того, что понимать под выражением «очень
незначительно». Методы определения того, достиг ли исходный уровень
устойчивого состояния, варьируются от такого статистического критерия, как «не
более чем 3%-ное изменение в интенсивности реакции от одного сеанса к другому»,
до простой визуальной оценки данных на предмет явных флуктуации или трендов.
Как
только
исходный
уровень
установлен,
экспериментатор
начинает
экспериментальную манипуляцию.
В нашем примере терапевт может попросить клиента являться каждый день
для получасового сымитированного собеседования. Во время собеседования
терапевт незаметно нажимает на переключатель всякий раз, когда клиент прерывает
контакт глаз. Переключатель соединен с часами, благодаря чему можно определить
общее время контакта глаз в ходе каждого получасового сеанса. После нескольких
сеансов, когда терапевт убеждается, что достигнуты стабильные исходные
показатели (т. е. примерно одинаковое время контакта глаз в течение сеанса), он
начинает процедуру с ударами током. Всякий раз, когда клиент прерывает контакт
глаз и экспериментатор нажимает на переключатель, клиент получает короткий удар
током в предплечье. Затем экспериментатор пытается определить, меняется ли
степень контакта глаз относительно исходного уровня.
На рис. (см.) показан возможный результат этого эксперимента. Терапевт
решил, что стабильный исходный уровень был достигнут к сеансу 5, и начал
использовать удары током в ходе сеанса 6. Как только начались удары током, время
контакта глаз клиента резко возросло. К сеансу 10 контакт глаз достиг переходного
83
устойчивого состояния, и экспериментатор прекратил удары током. К сеансам 12-14
поведение клиента вернулось к исходному уровню.
Экспериментатор должен провести каждую из описанных операций,
чтобы иметь подлинный эксперимент с исходным уровнем: установить
стабильный исходный уровень; произвести экспериментальную манипуляцию
и установить стабильное переходное состояние; затем продемонстрировать
обратимость,
восстановив
исходный
уровень
после
прекращения
экспериментальной манипуляции.
Логика этого метода заключается в том, что как только получен исходный
уровень, маловероятно, что какая-то неконтролируемая вмешивающаяся переменная
начнет внезапно влиять на поведение в ходе той же самой попытки, в которой
производится экспериментальная манипуляция. Даже если это маловероятное
событие произойдет, шансы, что вмешивающаяся переменная загем перестанет оказывать влияние в ходе той же самой попытки, в которой прекращают
экспериментальную манипуляцию, крайне невелики.
Чтобы быть еще более убедительным, экспериментатор может провести
индивидуальное повторение (intrasubject replication), повторив процедуру с тем же
самым участником один или несколько раз. То есть экспериментатор может снова
подвергнуть клиента ударам током в ходе сеанса 15, продолжать их до тех пор, пока
не будет достигнуто стабильное переходное состояние, прекратить удары током и
восстановить исходный уровень. Каждый раз, когда эффект удается повторить,
растет наша уверенность в том, что изменение в поведении было вызвано
экспериментальной
манипуляцией,
а
не
какой-то
неконтролируемой
вмешивающейся переменной. Несмотря на то, что это план с одним испытуемым,
нашу уверенность в результате также повышает межиндивидуальное повторение
(intersubject replication), т. е. повторение эксперимента с несколькими другими
участниками.
Мы
индивидуальные,
по-прежнему
а
не
на
будем
групповые
оценивать
данные.
результаты,
Однако
глядя
на
способность
продемонстрировать подобное межиндивидуалыюе повторение делает наше
заключение более весомым.
84
Преимущества
Основное преимущество эксперимента с исходным уровнем в том, что он
предоставляет нам эффективный способ наблюдения индивидуального поведения.
Например, если бы результаты, показанные на предыдущем рисунке, являлись
реальными данными, они бы практически убедили меня в том, что контакт глаз
можно контролировать неожиданными ударами током. Они бы убедили и вас, не так
ли?
Результаты также легко интерпретировать. Фактически их интерпретировать
настолько легко, что в экспериментах с исходным уровнем не используют методы
статистической проверки. Исследователи, пользующиеся планами с исходным
уровнем, утверждают, что если вам необходима статистическая проверка для
убеждения других экспериментаторов в реальности и неслучайности обнаруженного
вами эффекта, значит, либо эффект недостаточно выражен и на него не стоит
обращать внимание, либо вам нужно усовершенствовать свои приемы, чтобы
добиться
лучшего
контроля
над
поведением
(устранить
нежелательную
изменчивость).
В традиционном групповом эксперименте, если вы используете большое
число участников в каждой группе, то можете обнаружить
эффект, который
статистически достоверен, но имеет небольшое практическое значение. То есть вы
могли выбрать независимую переменную, которая влияет на поведение, но это
влияние может быть мало по сравнению с другими, более важными переменными.
Однако процедура эксперимента с исходным уровнем нечувствительна к подобным
маловажным
эффектам.
Изменчивость,
обусловленная
более
важными
независимыми переменными, маскирует подобные реальные, но незначительные
эффекты. Тем самым процедура с исходным уровнем гарантирует, что любой
обнаруженный эффект будет достаточно большим и, следовательно, потенциально
важным. Другим преимуществом процедуры с исходным уровнем является
гибкость, которую она обеспечивает при определении того, когда вводить какой-то
уровень
независимой
переменной
и
какой
уровень
использовать.
Перед
проведением стандартного эксперимента исследователь должен определить, сколько
85
попыток следует использовать и какие уровни независимой переменной ему
выбрать. Поскольку большинство методов статистической проверки требуют этого,
исследователь должен затем собрать равное количество единиц наблюдений для
каждого уровня независимой переменной. Однако исследователи, которые
используют планы с исходным уровнем, могут решить в любой момент
эксперимента увеличить число наблюдений на данном уровне или перейти к новому
уровню. Так, если в нашем эксперименте терапевту потребуется больше данных для
условия с ударами тока, гибкость эксперимента позволяет продлить это условие в
течение большего количество сеансов, прежде чем пытаться вернуться к исходному
уровню.
Терапевт также может решить использовать дополнительный уровень
независимой переменной после начала эксперимента. Предположим, что изменение
в поведении оказалось не особенно убедительным при выбранной интенсивности
ударов током. После восстановления исходного уровня и достижения устойчивых
показателей поведения исследователь может попробовать более интенсивные (но не
убийственные) удары в течение следующей серии попыток. Тем самым
исследователю не требуется использовать какие-то заранее определенные уровни
независимой переменной.
Кроме легкой интерпретации, исключения методов статистической проверки,
гарантии
обнаружения
лишь
достаточно
весомых
эффектов
и
гибкости
эксперименты с исходным уровнем имеют еще одно преимущество: их можно
использовать с единственным участником. Терапевты, у которых только один
клиент с церебральным параличом, или экспериментаторы, которые работают с
одиночными участниками, имеющими необычные расстройства, подготовку или
талант, не могут использовать традиционный экспериментальный план для их
изучения. Однако они могут использовать процедуру с исходным уровнем.
Недостатки
Хотя эксперименты с исходным уровнем имеют столь много преимуществ,
большинство
экспериментаторов
по-прежнему
верны
традиционным
экспериментальным групповым планам, поскольку не могут обеспечить требования
86
экспериментов
с
исходным
уровнем.
Например,
требование
обратимости
экспериментальных эффектов подразумевает, что в конце эксперимента участник
возвращается к первоначальному уровню поведения. Ранее мы видели, что при
использовании
внутригруппового
плана
многие
потенциальные
эффекты
последовательности или упорядочения требуют уравновешивания. Эксперимент с
исходным уровнем — это особый вид внутригруппового плана, в котором
эффективное уравновешивание невозможно. То есть любая систематически
меняющаяся вмешивающаяся переменная не позволяет нам восстановить исходный
уровень. И если поведение не возвращается к своему прежнему состоянию, когда
экспериментальная манипуляция прекращается, мы не знаем, чему приписать
поведение в переходном состоянии: манипуляции или какой-то вмешивающейся
переменной.
По этой причине многие традиционные области психологии нельзя
исследовать посредством процедур с исходным уровнем. Вот некоторые явно
неадекватные области: продолжительность жизни, память и некоторые виды
научения. Большинству изменений, которые происходят во время экспериментов в
этих областях, нельзя придать обратную направленность. («А теперь забудьте все
слова, которые вы выучили».)
Второй недостаток состоит в том, что планы с исходным уровнем часто не
могут позволить нам обнаружить небольшие, по важные эффекты. Предположим,
что вы работаете в телефонной компании и ваша задача — определить, уменьшается
ли время, необходимое оператору справочной службы для нахождения номера, при
использовании компьютерной поисковой системы, а не стандартной телефонной
книги. Вы решаете использовать план с исходным уровнем, и когда поступает
каждый запрос, фиксируете продолжительность звонка. Сначала вы просите
оператора использовать телефонную книгу до тех пор, пока не достигаете исходного
уровня. Затем вы просите оператора перейти к системе, в которой информация
вводится с клавиатуры в компьютер, а тот выдает номера. Наконец, вы просите
оператора вернуться к книге.
На рис. (см.) показан ряд возможных результатов. Визуальное изучение
87
рисунка, вероятно, не убедит вас в том, что имеется какое-то различие между
использованием компьютерной системы и телефонной книги. Другими словами,
переходное состояние ничем не отличается от исходного уровня. Однако средний
звонок при работе с компьютерной системой на три секунды короче, чем средний
звонок при работе с книгой. Если мы проведем стандартный эксперимент,
статистическая проверка может показать, что подобное различие статистически
значимо. Но будет ли этот эффект иметь важное значение? Да, будет, поскольку
каждая секунда, сэкономленная на звонке в справочную службу, в итоге экономит
телефонным компаниям миллионы долларов. Нет сомнений, что это для них важно!
Сторонники планов с исходным уровнем могут возразить, что изменчивость
— это оплошность экспериментатора, и возможно, их слова имеют резон
применительно к крысам в стерильной лабораторной обстановке. Однако трудно
представить, как ученый, выполняющий заказ телефонной компании, мог бы лучше
проконтролировать оцениваемое поведение. В этом случае поведение, по-видимому,
зависит главным образом от действий клиента, а не оператора. В некоторых ситуациях изменчивость является неотъемлемой частью обстановки. В этом случае
небольшие, по важные эффекты могут маскироваться этой изменчивостью, и планы
с исходным уровнем окажутся неадекватными.
Последний недостаток экспериментов с исходным уровнем состоит в том, что
бывает трудно определить, насколько распространенным является какой-либо
обнаруженный нами эффект. Люди могут реагировать на экспериментальные
манипуляции по-разному, и наш участник может оказаться каким-нибудь большим
оригиналом. Этого недостатка можно избежать путем повторения эксперимента с
использованием других участников. Однако традицией в эксперимснгах с исходным
уровнем является использование как можно меньшего числа участников.
Таким образом, экспериментальные планы с исходным уровнем могут быть
ценным средством в некоторых областях экспериментальной психологии. Когда
можно выполнить допущения плана, эксперименты с исходным уровнем позволяют
убедительно
продемонстрировать
эффекты
важных
экспериментальных
манипуляций. К сожалению, эти допущения бывают обычно столь строгими, что
88
применение планов с исходным уровнем приходится ограничивать только
несколькими областями экспериментальной психологии.
***
Слепой и двойной слепой эксперимент. Слепой э. – неведение испытуемого о
целях эксперимента. Дв. сл. э. – неведение исп. и экспертов, оценивающих
результаты.
Возможные
причины
предвзятости
экспериментатора:
лучшее
отношение к своим участникам; приверженность той или иной методике (терапии);
знание об отсутствии воздействия в контр. группе и занижение оценок по этой
причине. {И всё же осмысленная обработка результатов лучше: экспериментатор
скорее заметит то, что легко ускользнёт от внимания незаинтересованного
человека}.
-----------------------Квазиэкспериментальные методы в патопсихологии (по Корниловой).
Мартин. Опрос как исследование.
К.Левин. Закон и эксперимент в психологии (для семинара).
Этика психологического эксперимента.
Download