8М - iai.donetsk.ua

advertisement
8М
УДК 519.248: [159.9+57+61]; 612.821: 007
А.А. Морозов 1, В.А. Морозов1, Ю.В. Обухов1, Т.А. Строганова2
1
ИРЭ РАН, Москва, Россия
2
Психологический институт РАО, Москва, Россия
stroganova@pirao.ru
{morozov,vmorozov,obukhov}@mail.cplire.ru
Непараметрический метод
многомерного многофакторного анализа
электроэнцефалограмм человека*
Разработан непараметрический метод многомерного многофакторного анализа, ориентированный на
поиск закономерностей в спектрограммах многоканальных электроэнцефалографических сигналов.
Отличительными особенностями метода являются: учёт нестационарности сигналов при оценке
статистической значимости рассматриваемых эффектов, учёт межканальных и временных
зависимостей сигнала, связанных с несовершенством методов измерения и обработки сигналов, а
также пространственным «размытием» сигналов коры мозга, регистрируемых с поверхности головы,
возможность анализа эффектов взаимодействия факторов, а также специальные средства
визуализации результатов анализа. Разработанный метод был успешно применён для анализа
вейвлет-спектрограмм вызванных осцилляций в электрической активности мозга человека в области
альфа- и гамма-частот.
Исследование кратковременных осцилляций в электрической активности мозга, вызванных стимулом, стало в последние годы одним из основных подходов к
изучению нейрофизиологических механизмов восприятия и внимания человека [1], [2].
Этот новый подход потребовал существенного обновления методов обработки
сигналов и статистического оценивания данных, принятых в нейрофизиологии. В
частности, широкое применение в исследовании вызванных осцилляций (ВО) нашли
параметрические методы многофакторного дисперсионного анализа ANOVA и
MANOVA, непараметрические критерии Вилкоксона, Манна-Уитни [3], [4], а также
бутстрэп (bootstrapping) и перестановочные тесты (permutation) [5]. Однако, несмотря на
повсеместное использование, обоснованность применения этих методов при анализе
вызванных осцилляций во многих случаях вызывает серьёзные сомнения. Это связано с
особыми свойствами электроэнцефалографических сигналов, к которым относятся:
1. Нестационарность электроэнцефалограмм (ЭЭГ), проявляющаяся на различных
временных масштабах [6]. Нестационарность сигнала во многих случаях обуславливает
невозможность или, по крайней мере, некорректность применения методов обработки
сигналов, хорошо зарекомендовавших себя в радиофизике.
2. Наличие пространственных (между различными каналами ЭЭГ), а также
временных (между близлежащими точками спектрограмм ЭЭГ) статистических
зависимостей в ансамблях экспериментальных данных [7]. В зависимости от
конкретной постановки исследовательской задачи необходимо различать два вида
пространственно-временных статистических зависимостей.
*
Работа поддержана РФФИ, проекты 06-07-89302 и 05-01-00651, а также программой
Президиума РАН «Фундаментальные науки – медицине».
«Штучний інтелект» 3’2006
603
8М
Морозов А.А., Морозов В.А., Обухов Ю.В., Строганова Т.А.
a) Зависимости, обнаруживаемые между схожими, но при этом объективно
независимыми источниками электрической активности коры мозга, далее – «формальные» зависимости.
b) Зависимости, приводящие к дублированию в различных пространственных и частотно-временных областях массива экспериментальных данных
информации, пришедшей из одного источника, далее – «причинно-следственные» зависимости.
Причинно-следственные зависимости могут быть присущи исследуемому объекту или
быть обусловлены способом регистрации сигналов ЭЭГ с поверхности скальпа (в
частности, усредняющими и фильтрующими свойствами проводящей среды) и
инструментальными характеристиками обработки («размытием» спектрограмм по
времени и частоте в ходе свёртки с функцией вейвлета и т.п.). Эти зависимости
создают предпосылки для получения некорректных статистических оценок, и
корректное применение каких бы то ни было статистических методов для анализа
частотно-временной динамики многоканальных ЭЭГ требует их учёта.
3. Существенная негауссовость ансамблей экспериментальных данных, во
многих случаях приводящая к невозможности применения наиболее мощных (для
гауссовых выборок) и хорошо отработанных параметрических методов
статистического анализа [2].
Альтернативой параметрическим методам одномерного и многомерного
многофакторного дисперсионного анализа являются непараметрические методы,
свободные от априорных предположений о виде распределения исследуемых величин.
Примерами таких методов являются ранговый дисперсионный анализ КраскелаУоллиса [3], [4], ранговый дисперсионный анализ Фридмана [3], [4], а также
многомерные перестановочные тесты [7]. К сожалению, перечисленные выше
непараметрические методы также обладают существенными недостатками, из которых
здесь мы выделим следующие:
1. Указанные методы непригодны для исследования эффектов взаимодействия
факторов [4].
2. Так же, как и классические методы, они основаны на предположении о
независимости наблюдений. Это предположение может нарушаться, так как для
нейрофизиологических данных зависимость измерений, полученных на различных
электродах, является экспериментально установленным фактом [7].
Для преодоления этих проблем авторами был разработан новый метод
непараметрического многофакторного анализа (НМА), основные положения которого
рассмотрены в настоящей статье.
1. Учёт влияния причинно-следственных зависимостей
Основными видами причинно-следственных зависимостей в выборках электроэнцефалографических данных являются:
1. Статистическая зависимость между амплитудами и фазами электроэнцефалографических сигналов, регистрируемых на различных каналах, возникающая вследствие
пространственного «размытия» сигнала при прохождении его через проводящие
ткани головы (попадания на эти каналы сигнала из одного и того же источника в
коре головного мозга).
2. Статистическая зависимость между близлежащими точками спектрограмм,
возникающая вследствие «размытия» анализируемого сигнала по времени в ходе
спектрального анализа.
604
«Искусственный интеллект» 3’2006
Непараметрический метод многомерного многофакторного анализа…
8М
Примером причинно-следственной зависимости между различными каналами
ЭЭГ может служить корреляционная зависимость между сигналами, регистрируемыми
на симметрично расположенных электродах левого и правого полушарий головного
мозга. В общем случае корреляционная зависимость между такими сигналами может
оказаться следствием протекания схожих, но независимых друг от друга процессов в
разных полушариях мозга (формальная зависимость), а также прохождением сигнала
из одного полушария мозга в другое вследствие синаптической передачи сигналов
между отдельными областями коры мозга или электропроводности тканей головы
(причинно-следственная зависимость). При регистрации ЭЭГ-сигналов исследователь
не имеет возможности определить точно, с зависимостью какого именно рода он
имеет дело. По этой причине, проводя те или иные исследования реакции мозга по
ЭЭГ-сигналу, мы вынуждены исходить из предположения о наихудшем случае и
рассматривать любые корреляционные зависимости между электродами левого и
правого полушарий как причинно-следственные.
В частности, при исследовании зависимости величины ВО от интервала
времени, прошедшего с момента предъявления стимула, необходимо устранить
дублирование информации в выборке экспериментальных данных, обусловленное
причинно-следственной зависимостью между сигналами, регистрируемыми на
электродах левого и правого полушарий головного мозга. В то же время, при
исследовании отличия между ВО левого и правого полушарий мозга в зависимости
от времени, данная причинно-следственная зависимость не должна учитываться в
качестве фактора, приводящего к дублированию информации. При этом, однако,
необходимо учитывать причинно-следственные зависимости, существующие между
ЭЭГ-сигналами, регистрируемыми на каналах одного отдельно взятого полушария.
Для нейрофизиологических исследований наличие в экспериментальных
данных причинно-следственных зависимостей опасно, прежде всего, возможностью
получения заниженных оценок ошибки первого рода, то есть вероятности того, что
наблюдаемые эффекты возникли случайно и не отражают объективно существующие
закономерности. В самом деле, использование в каком-либо методе статистического
анализа выборок данных, без учёта влияния рассмотренных выше особенностей процедур
измерения и спектрального анализа данных (для положительно коррелированных
измерений) фактически эквивалентно увеличению исследуемой выборки значений
(если бы они были свободны от причинно-следственных зависимостей) за счёт
механического повторения одних и тех же экспериментальных данных. Следствием
такого искусственного увеличения выборки данных становится ошибочное утверждение
о закономерности тех или иных свойств ЭЭГ-сигналов, случайно возникших в ходе
проведения эксперимента.
«Размытие» сигнала по времени является неустранимым дефектом любых методов
спектрального анализа. Для оценки влияния эффекта «размытия» сигнала необходимо
учитывать свойства применяемого метода построения спектрограмм, а именно
частотно-временные характеристики функции вейвлета, с которой осуществляется
свёртка анализируемого сигнала, или формы и ширины окна, в случае использования
преобразования Фурье. Заметим, что для спектрограмм характерно «размытие» сигнала
не только по времени, но и по частоте. Это приводит, в частности, к возникновению
причинно-следственных зависимостей между спектрограммами ЭЭГ-сигналов
различных диапазонов частот.
Причинно-следственные зависимости, обусловленные «размытием» сигнала по
времени мы устраняем с помощью прореживания последовательностей измеренных
значений.
«Штучний інтелект» 3’2006
605
8М
Морозов А.А., Морозов В.А., Обухов Ю.В., Строганова Т.А.
В настоящее время для вычисления спектрограмм мы используем комплексные
вейвлеты Морле [4]
1
ψ ( x) =
exp( 2 i π Fc x ) exp( − x 2 Fb ) ,
π Fb
где Fc – коэффициент центральной частоты, а Fb – коэффициент полосы частот.
Коэффициенты Fc и Fb подобраны так, чтобы выделить частотные диапазоны,
соответствующие функционально-значимым ритмам ЭЭГ. В частности, для
частотного диапазона альфа ЭЭГ взрослых людей (8 - 12 Гц) выбраны значения
Fc = 1,275 , Fb ≈ 0,54 , а для диапазона гамма 1 (24 – 48 Гц) Fc = 0,097 и Fb ≈ 33,59 .
После вычисления спектрограмм отдельных реализаций ЭЭГ-сигналов мы
осуществляем отбраковку реализаций, содержащих выбросы. Отбраковка осуществляется с помощью сравнения максимальных значений мощности спектрограмм отдельных
реализаций по методу робастной статистики X42 [8].
Временнáя полуширина комплексного вейвлета Морле (промежуток времени,
за который амплитуда функции убывает в Ratio раз по сравнению со значением
при x = 0) равна
F
Halfwidth = c Fb log( Ratio ) ,
f0
где f0 – центральная частота исследуемого частотного диапазона. В настоящее время
мы используем значение коэффициента Ratio=2 при анализе осцилляций в
частотном диапазоне альфа и Ratio=10 при анализе осцилляций диапазона гамма.
Эти значения коэффициента Ratio обеспечивают убывание спектральной плотности
мощности (квадрата амплитуды) на краях временного окна шириной 2*Halfwidth,
соответственно, в 2 и 10 раз по сравнению со спектральной плотностью мощности
колебаний в середине окна.
Следовательно, для того чтобы в достаточной мере устранить последствия
«размытия» сигнала по времени в ходе спектрального анализа, достаточно взять
точки спектрограммы с шагом не менее 2*Halfwidth секунд, что примерно
соответствует 100 мс для диапазона альфа (8 – 12 Гц) и 33 мс для диапазона гамма 1
(24 – 48 Гц) ЭЭГ взрослых людей. Такой широко используемый подход к прореживанию
оправдан тем, что для используемых вейвлетов Морле коэффициент корреляции
соседних отсчётов экспоненциально быстро убывает при разнесении отсчётов на
интервал более двух полуширин аппаратной функции вейвлета во временной
области (2*Halfwidth).
Наличие причинно-следственных зависимостей между каналами ЭЭГ учитывается
с помощью преобразования многомерных (статистически связанных) исходных
данных в одномерный массив. Это преобразование осуществляется с помощью
метода анализа главных компонент (principal component analysis, PCA). Главные
компоненты можно рассматривать как некоторый новый набор факторов (новую
систему координат), учитывающий внутренние взаимосвязи, существующие в анализируемых данных [4]. В качестве результата преобразований (то есть массива, подаваемого
на следующий этап анализа) мы берём проекцию исходного массива данных на один
из главных компонентов. Обычно выбирается первый по счёту главный компонент,
который вносит наибольший вклад в изменчивость анализируемых данных.
Заметим, что полное устранение причинно-следственных зависимостей между
выборками данных с помощью PCA, к сожалению, невозможно. PCA обеспечивает
лишь отсутствие корреляции (линейной зависимости) между основными компонентами,
606
«Искусственный интеллект» 3’2006
Непараметрический метод многомерного многофакторного анализа…
8М
что для приближённо гауссовых распределений означает их (приближённую)
статистическую независимость. Для негауссовых распределений близость к нулю
коэффициента корреляции ещё не означает их статистическую независимость. Тем
не менее, PCA позволяет существенно ослабить влияние статистической связи между
выборками экспериментальных данных, освобождая их от линейных зависимостей [9].
2. Анализ эффектов взаимодействия факторов
Анализом эффектов взаимодействия факторов называется исследование того,
как воздействие одного фактора на исследуемую переменную изменяется под
влиянием других факторов [3]. В частности, наиболее интересными для анализа
ЭЭГ-сигналов являются:
1. Взаимодействие факторов времени и теста: «Как изменяется отличие между
реакцией на различные стимулы, предъявляемые испытуемому, в зависимости от
интервала времени, прошедшего с момента предъявления стимула?».
2. Взаимодействие факторов времени и электрода: «Влияет ли расположение
электрода на изменение реакции мозга в зависимости от интервала времени,
прошедшего с момента предъявления стимула?».
3. Взаимодействие факторов времени и полушария: «Как изменяется отличие
между реакцией на левом и правом полушариях мозга в зависимости от времени?».
4. Взаимодействие факторов времени, теста и полушария: «Как отличается
разница между реакцией на различные стимулы, предъявляемые испытуемому,
наблюдаемая на левом и правом полушариях, и как это отличие изменяется в
зависимости от интервала времени, прошедшего с момента предъявления стимула?».
5. А также комбинации факторов {время, стимул, электрод}, {время, полушарие,
электрод}, {время, тест, полушарие, электрод} и др.
Во всех случаях результатом анализа должна стать оценка вероятности ошибки
первого рода, то есть вероятности того, что наблюдаемый в эксперименте эффект
взаимодействия факторов является случайным.
Для анализа эффектов взаимодействия факторов повторных измерений мы
разработали специальный метод (далее – метод анализа взаимодействия бинарных
факторов повторных измерений). Метод основан на том факте, что многие важнейшие
факторы, влияющие на интерпретацию результатов нейрофизиологического
эксперимента, являются бинарными, то есть имеют два значения (например, тестовый и
контрольный стимулы, левое и правое полушария). Поэтому для учёта влияния таких
факторов достаточно вычислить парные разности значений, соответствующих
противоположным значениям бинарного фактора, и проверять те или иные
статистические гипотезы на ансамблях вычисленных разностей. Аналогично для учёта
влияния двух бинарных факторов используются парные разности разностей значений,
соответствующих значениям бинарных факторов и т.д.
Для проверки статистических гипотез на выборках экспериментальных данных (в
том числе на выборках разностей) мы используем различные непараметрические
критерии: критерий знаков, критерий парных сравнений Вилкоксона, критерий МаннаУитни, критерий Флайгера-Полицелло (Fligner-Policello), а также перестановочный
метод (permutation). Независимо от того, какой именно метод используется, мы
придерживаемся следующих положений:
1. Используются односторонние версии критериев, то есть проверяются
альтернативные гипотезы «больше», «меньше» (в отличие от двусторонних критериев,
проверяющих альтернативную гипотезу «не равно»).
«Штучний інтелект» 3’2006
607
8М
Морозов А.А., Морозов В.А., Обухов Ю.В., Строганова Т.А.
2. Названные непараметрические критерии используются для проверки статистических гипотез о том, что одна выборка значений является стохастически большей или
меньшей, чем другая (в отличие от других авторов, проверяющих статистические
гипотезы о соотношении медиан или средних генеральных совокупностей).
Названные положения являются принципиально важными для последующей
нейрофизиологической интерпретации результатов анализа, так как нас интересовали
конкретно эффекты увеличения или уменьшения амплитуды (мощности) вызванных
осцилляций под воздействием различных факторов.
Самостоятельной проблемой является учёт таких факторов, как пол, возраст и
состояние здоровья испытуемых. Эти факторы не являются факторами повторных
измерений, так как получены на разных группах испытуемых и, следовательно, не
могут быть учтены с помощью вычитания парных значений. Тем не менее, такие
факторы также могут быть введены в рассмотрение с помощью двухвыборочных
непараметрических критериев, таких как критерий Манна-Уитни и критерий
Флайгера-Полицелло.
Идея состоит в том, что выборка значений ВО (или выборка разностей ВО)
разделяется на две подгруппы в соответствии с заданным фактором (например,
первая группа – значения, полученные на испытуемых младше заданного возраста, а
вторая группа – старших испытуемых), после чего две полученные выборки
сравниваются друг с другом с помощью двухвыборочного непараметрического
критерия. Заметим, что в некоторых случаях перед сравнением выборок целесообразно
уменьшить значения каждой подгруппы на константу – среднее или медиану
значений спектрограмм (амплитуды или мощности, разности амплитуд или разности
мощностей) рассматриваемой подгруппы в достимульной области. Это необходимо
для того, чтобы учесть изменение сигнала в ответ на стимул относительно его
значения в достимульной области.
3. Проверка статистических гипотез
в условиях нестационарности сигнала
Нестационарность ЭЭГ-сигнала приводит, по крайней мере, к двум проблемам
статистического анализа ЭЭГ-спектрограмм:
1. Статистические характеристики сигнала (функция распределения, дисперсия
и пр.) изменяются во времени. Это означает, в частности, что применение для
обработки ЭЭГ-сигнала параметрических методов многофакторного дисперсионного
анализа ANOVA и MANOVA во многих случаях оказывается некорректным.
2. Нестационарность сигнала проявляется как до, так и после предъявления
испытуемому стимула (в «достимульном» и «послестимульном» интервалах времени).
В случаях, когда нестационарность сигнала проявляется в достимульном интервале,
возникает вопрос, какие именно интервалы времени можно использовать в качестве
референтной области для сравнения с ними сигнала после подачи стимула?
Применение непараметрических критериев для проверки статистических гипотез
на выборках экспериментальных данных в сочетании с рассмотренным выше методом
анализа взаимодействия бинарных факторов повторных измерений позволило нам
решить первую из перечисленных выше проблем. Однако вторая проблема (далее
«проблема нестационарной референтной области») потребовала отдельного изучения и
разработки специального метода анализа.
608
«Искусственный интеллект» 3’2006
Непараметрический метод многомерного многофакторного анализа…
8М
Прежде всего необходимо отметить, что проблема нестационарной референтной
области имеет, по крайней мере, два источника происхождения:
1. Нестационарность ЭЭГ-сигнала, обусловленная его природой. Наиболее
ярким примером нестационарности такого рода являются альфа-веретёна, короткие
вспышки осцилляций, спонтанно возникающие в области альфа-частот.
2. Нестационарность ЭЭГ-сигнала, обусловленная постановкой эксперимента.
Как показали эксперименты с визуальными стимулами, в случае предъявления
испытуемому серии стимулов (тестов) изменение статистических характеристик
сигнала, обусловленное предъявлением очередного стимула, может продолжаться
достаточно долго (0,5 – 1 с и более) и попасть в достимульный интервал следующего
теста. Этот эффект был обнаружен нами в ходе исследования фазово-несвязанной
компоненты спектрограмм ЭЭГ и спектрограмм полной мощности ЭЭГ. Эффект
имеет место даже в том случае, если предъявление стимулов осуществляется через
неодинаковые, случайно изменяющиеся промежутки времени. В частности, в наших
исследованиях интервал между окончанием стимула и началом следующего стимула
в серии варьировал от 0,5 до 1 с.
В общем случае проблема нестационарной референтной области не имеет решения,
так как приводит, в частности, к тому, что результаты анализа сигнала оказываются
зависимыми от того, какой именно промежуток времени в достимульном интервале
был принят в качестве референтного. Кроме того, на оценки послестимульных событий
влияет и то, насколько полно возможные состояния сигнала в достимульной
референтной области представлены в данной выборке её значений. Тем не менее,
приняв некоторые допущения о свойствах достимульного интервала ЭЭГ-сигнала,
можно предложить соответствующие подходы, смягчающие эту проблему.
Для решения проблемы нестационарности референтной области мы разработали
метод сравнения исследуемой величины (амплитуды или мощности, разности амплитуд
или разности мощностей) ВО с её значениями в многосегментной референтной
области. Исходным допущением метода является квазистационарность сегментов
референтной области (стационарность в пределах отдельных сегментов этой
области). Исходя из этого допущения осуществляется проверка статистических
гипотез о стохастическом равенстве исследуемого ансамбля данных (соответствующего некоторой послестимульной пространственно-временной области) ансамблям
различных сегментов референтной области. При этом рассматриваются два случая:
1. В качестве конкурирующей гипотезы для всех сегментов референтной
области проверяется гипотеза «больше».
2. В качестве конкурирующей гипотезы для всех сегментов референтной
области проверяется гипотеза «меньше».
Для каждого из названных случаев на основе полученных оценок минимальной
(для рассматриваемого теста) статистической значимости различий сравниваемых
ансамблей вычисляется интегральная функция распределения вероятностей Fc.
Функция Fc является обобщённым биномиальным распределением [10] и показывает
вероятность того, что анализируемые значения экспериментальных данных могли
возникнуть случайно в некоторых N–E сегментах референтной области в условиях
нулевой гипотезы о стохастическом равенстве исследуемого ансамбля со всеми
сегментами референтной области, где N – общее количество сегментов референтной
области, а E – параметр функции распределения, обозначающий количество сегментов,
которые по содержательным соображениям могут быть исключены из анализа.
Например, в высокочастотных областях спектра ЭЭГ часть сегментов достимульной
«Штучний інтелект» 3’2006
609
8М
Морозов А.А., Морозов В.А., Обухов Ю.В., Строганова Т.А.
области обычно бывает загрязнена артефактами и может не учитываться при
анализе. По вычисленной функции распределения и заданному пользователем
количеству E сегментов оценивается ошибка первого рода для утверждения об
отличии ансамбля значений ВО от N–E и более сегментов референтной области.
Таким образом, предлагаемый метод сравнения исследуемой величины ВО со
значениями многосегментной референтной области основан на следующих исходных
предположениях:
1. Сегменты референтной области являются квазистационарными.
2. Рассматриваемый набор сегментов референтной области является репрезентативным по отношению к решаемой задаче, то есть адекватно описывает все возможные
состояния достимульного интервала. Из этого предположения следует, в частности,
что статистически значимое отличие рассматриваемой выборки экспериментальных
данных от N–E и более сегментов референтной области (от всех в одну сторону –
стохастически больше или меньше) позволяет сделать вывод о неслучайном
происхождении рассматриваемой выборки данных.
3. Все сегменты референтной области содержат результаты независимых друг
от друга наблюдений.
Репрезентативность референтной области увеличивается при рассмотрении
большего количества N независимых сегментов. Увеличение параметра E, при
фиксированном значении параметра N, позволяет выявлять более слабые эффекты в
условиях нестационарной референтной области. Однако при этом снижается
устойчивость метода анализа к нестационарности сигнала (то есть увеличивается
вероятность ложного обнаружения эффектов, вызванного нестационарностью). Таким
образом, возможность изменения параметров N и E в сочетании с аккуратным выбором
референтной области позволяет гибко настраивать рассматриваемый метод на анализ
спектрограмм ЭЭГ-сигналов разного вида (фазово-связанные, фазово-несвязанные
компоненты спектрограмм ЭЭГ, спектрограммы полной мощности ЭЭГ) и различных
частотных диапазонов.
4. Трёхмерная визуализация результатов анализа
Разработанный метод трёхмерной визуализации результатов анализа выборок
данных пригоден как для визуализации результатов однофакторного анализа данных
(вырожденный случай), так и для визуализации результатов анализа эффектов
взаимодействия факторов. Идея состоит в том, что на горизонтальных осях
координат откладываются значения факторов, не являющихся бинарными (например,
«электроды» или «время»), а на третьей оси координат откладывается статистическая
характеристика (среднее или медиана) исследуемой величины (амплитуды или
мощности) ВО или разность значений характеристики ВО (если анализируется
взаимодействие бинарных факторов). Кроме того, с помощью цвета отображается
информация о наличии статистически значимого отличия исследуемых выборок от
референтной области, а также о знаке отличия (больше, меньше).
Рассмотрим пример статистической диаграммы, построенной по методу
НМА (рис. 1). Диаграмма иллюстрирует области статистически значимых отличий
мощности фазово-связанных вызванных осцилляций в ЭЭГ мозга взрослого человека в
полосе гамма-частот (24 – 48 Гц) в зависимости от типа зрительного стимула
(иллюзорная фигура «квадрат Канизы» и контрольное изображение). По осям:
610
«Искусственный интеллект» 3’2006
Непараметрический метод многомерного многофакторного анализа…
8М
Рисунок 1 – Пример статистической диаграммы, построенный по методу
непараметрического многофакторного анализа
горизонтальная ось слева – время t в с; t = 0 (в центре оси) соответствует моменту подачи
зрительного стимула; отрицательные значения t соответствуют периоду до подачи
стимула (от – 0,5 до 0 с), положительные – после подачи стимула (от 0 до 0,5 с).
Горизонтальная ось справа обозначает электроды левого и правого полушария
(сгруппированные парами). Цилиндрические фигуры, расположенные вдоль вертикальной оси координат обозначают 95 % доверительные интервалы медиан разностей
откликов на два типа визуального стимула. Чёрным цветом обозначены фигуры, соответствующие пространственно-временным областям статистически значимого эффекта.
Обратите внимание, что величина (мощность фазово-связанной составляющей)
ВО задана в безразмерных единицах, вычисленных с помощью PCA. Конкретно, в
качестве оценки величин ВО, взята проекция исходных величин на первый главный
компонент PCA. В данном примере с помощью PCA учтена линейная зависимость
между ВО левого и правого полушарий мозга. Чёрными точками на диаграмме
обозначены пространственно-временные области, расположенные в районе t = 0. Для
оценки статистической значимости отличий ВО использован метод сравнения со значениями многосегментной референтной области, описанный выше (N = 5, параметр E = 1).
Пространственно-временные сегменты референтной области обозначены цилиндрами с
«паутинкой». Проверка статистических гипотез на выборках разностей ВО осуществлялась с помощью непараметрического критерия парных сравнений Вилкоксона
(Wilcoxon signed rank test).
Как видно из представленной диаграммы, эффект восприятия зрительной иллюзии
состоит в более мощных фазово-связанных гамма-осцилляциях при обработке
иллюзорного контура в сравнении с контрольным изображением, проявляется в узком
временном окне (130 – 230 мс после подачи стимула) и затрагивает в основном зрительные
ассоциативные зоны высокого порядка (теменные и нижневисочные электроды). Иначе
говоря, иллюзорное восприятие целостного паттерна сопровождается «добавочной»
вспышкой гамма-активности в зонах коры, обеспечивающих распознавание целостной
конфигурации элементов зрительного изображения. Выявленная нами специфика
динамики быстрой активности мозга не описана в имеющихся исследованиях [11]. Можно
полагать, что применение предлагаемого метода будет способствовать обнаружению
неизвестных закономерностей в вызванных стимулом осцилляциях ЭЭГ.
«Штучний інтелект» 3’2006
611
8М
Морозов А.А., Морозов В.А., Обухов Ю.В., Строганова Т.А.
Выводы
Рассмотренные элементы в совокупности составляют метод непараметрического
многофакторного анализа ЭЭГ, позволяющий анализировать влияние различных
факторов на частотно-временную динамику волновых процессов коры головного
мозга, порождаемых стимулом, а также эффекты взаимодействия различных факторов.
Разработанный метод отличается от существующих методов парного сравнения
(иногда называемых методами апостериорного сравнения) [3] тем, что:
1. Позволяет проверять статистические гипотезы, учитывающие возможную
нестационарность референтных областей.
2. Учитывает причинно-следственные зависимости между выборками данных
при оценке статистической значимости исследуемых эффектов.
3. Позволяет исследовать эффекты взаимодействия факторов на выборках
нейрофизиологических данных с помощью непараметрических тестов (не зависимых
от того, является ли закон распределения исследуемых данных нормальным).
4. Предоставляет средства трёхмерной визуализации результатов статистического
анализа многомерных данных.
Разработанный метод был реализован и успешно применён для анализа данных,
собранных в ходе экспериментов с иллюзорными изображениями, проводимых
Психологическим институтом РАО. Анализировались фазово-связанные и фазовонесвязанные компоненты спектрограмм ЭЭГ, а также спектрограммы полной
мощности ЭЭГ [12].
Литература
1. Bastiaansen M., Hagoort P. Event-induced theta responses as a window on the dynamics of memory // Cortex. –
2003. – Vol. 39. – P. 967-992.
2. Tallon-Baudry C., Bertrand O., Delpuech C., Pernier J. Stimulus specificity of phase-locked and non-phaselocked 40 Hz visual responses in human // The Journal of Neuroscience. – 1996. – Vol. 16, №. 13. –
P. 4240-4249.
3. Electronic Statistics Textbook. – Tulsa: StatSoft, Inc., 2004. – http://www.statsoft.com/textbook/stathome.html .
4. Using MATLAB. – Natick: MathWorks, Inc., 2002.
5. Makeig S., Debener S., Onton J., Delorm A. Mining event-related brain dynamics // TRENDS in Cognitive
Sciences. – 2004. – Vol. 8. – P. 205-210.
6. Каплан А.Я. Нестационарность ЭЭГ: методологический и экспериментальный анализ // Успехи
физиологических наук. – 1998. – Том 29, № 3. – С. 35-55.
7. Hemmelmann C., Horn M., Reiterer S., Schack B., Süsse T., Weiss S. Multivariate tests for the evaluation of
high-dimensional EEG data // Journal of Neuroscience Methods. – 2004. – № 139. – P. 111-120.
8. Хампель Ф., Рончетти Э., Рауссеу П., Штаэль В. Робастность в статистике. Подход на основе функций
влияния. – М.: Мир, 1989.
9. Харман Г. Современный факторный анализ. – М.: Статистика, 1972.
10. Справочник по теории вероятностей и математической статистике / В.С. Королюк, Н.И. Портенко,
А.В. Скороход, А.Ф. Турбин. – М.: Наука, 1985.
11. Herrmann C., Munk M., Engel A. Cognitive functions of gamma-band activity: memory match and utilization //
Trends in Cognitive Sciences. – 2004. – Vol. 8, № 8. – Р. 347-354.
12. Morozov A.A., Obukhov Yu.V., Stroganova T.A., Tsetlin M.M., Orekhova E.V. The search of the regularity in
the spatio-temporal dynamics of the human visual cortex oscillations // Pattern Recognition and Image Analysis. –
2005. – Vol. 15, № 4. – P. 697-699.
A.A. Morozov, V.A. Morozov, Yu.V. Obukhov, T.A. Stroganova
The Nonparametric Method of Multivariate Analysis of Human’s EEG
The new nonparametric method of multivariate statistical analysis of wavelet EEG data has been developed.
This method enables the analysis of stimulus-induced EEG oscillations under the condition of nonstationarity
of referent interval, and provides an opportunity to assess nonparametric multi-way interaction effects on
EEG variables. The method has been successfully applied for the analysis of wavelet spectrograms of human
EEG and gave the new results on the illusory contour effect on EEG alpha and gamma oscillations.
Статья поступила в редакцию 27.06.2006.
612
«Искусственный интеллект» 3’2006
Download