Описание экспериментальных результатов

advertisement
РАЗЛИЧЕНИЕ ЗЕМЛЕТРЯСЕНИЙ И ХИМИЧЕСКИХ ВЗРЫВОВ ПО
ДАННЫМ ЛОКАЛЬНЫХ СЕЙСМИЧЕСКИХ СЕТЕЙ
А.Ф.Кушнир, В.Ф.Писаренко, Е.В.Троицкий, Л.М.Хайкин
НИЦ СИНАПС 119526 Москва, Проспект Вернадского 101/1 офис 303, тел. 495-434-3638
Международный институт теории прогноза землетрясений и математической геофизики Russia,
113556, Москва, Варшавское ш. 79, корп.2.
тел (095) 110 77 95, FAX (095) 310 70 32, e-mail mitpan@mitp.rssi.tu
Описание методики обработки данных
В данной работе применяется подход к проблеме различения типов сейсмических событий,
основанный
на
выделении
дискриминантных
признаков
из
сейсмограмм
и
последующей
классификациии векторов признаков. В качестве дискриминантных признаков используются различные
характеристики спектров мощности сейсмических фаз, которые обычно являются различными для
землетрясений и взрывов. Проблема классификации векторов признаков решается с помощью
статистических методов распознавания образов. Многочисленные исследования в дискримининтном
анализе [1-4] убедительно показали, что выделение малого числа наиболее информативных признаков
исключительно важно для эффективной классификации по векторам признаков. Несколько тщательно
отобранных признаков могут обеспечить вероятность ошибочной классификации существенно
меньшую, чем при использовании полного набора имеющихся признаков. Этот явление получило
название “многомерного эффекта”.
Процедура отбора наиболее информативных признаков классификации. Отбор признаков
основан на обработке обучающих векторов признаков xl(j); где l1,2 -номер класса, j1,nl , nl -число
обучающих векторов данного класса. В начале каждый вектор состоит из p признаков, выбранных из
эвристических соображений как полезные для данной проблемы распознавания. Процедура отбора
признаков состоит из p шагов. На промежуточном k-м шаге формируются k-мерные векторы xkl(j) (k<p) ,
состоящие из признаков, отобранных в результате k шагов. Отбор признаков основан на оценивании по
обучающим
выборкам
стохастического
расстояния
Кульбака-Махаланобиса
D(k)
между
распределениями вероятностей векторов xkl(j).
На первом шаге процедуры отбора значения функционала D(1) вычисляются для каждого из p
признаков. Максимум из этих p значений достигается на каком то из признаков, который таким образом
отбирается. На втором шаге p-1 значений функционала D(2) вычисляются для пар признаков. Первый
элемент в каждой паре - это признак, отобранный на предыдущем шаге, второй элемент пары - один их
оставшихся признаков. Второй признак отбирается из условия, что на нем достигается максимум
функционала D(2). На k-м шаге процедуры отбора вычисляются значения функционала D(k) по
обучающим векторам, состоящим из k признаков. Первые k компонент этих векторов есть признаки,
отобранные на предыдущих шагах, последняя компонента - один из оставшихся признаков; в качестве
k-го признака отбирается тот признак, для которого функционал D(k) -максимален.
Описанная процедура ранжирует порядок следования признаков в обучающих векторах так,
чтобы обеспечить максимально возможную скорость возрастания расстояния Махаланобиса с ростом
номера признака. Для селекции множества наиболее информативных признаков мы вычисляли на
каждом шаге k=1,2,...,p описанной выше итерационной процедуры оценку ошибочной классификации
P(k) с помощью известной формулы Колмогорова-Деева [1]. Функция D(k), получаемая после
ранжирования признаков, возрастает с ростом k, однако, на практике ее рост, как правило, существенно
замедляется при kp. В этом случае функция P(k) имеет минимум на каком то шаге k0 между 1 и p. В
результате набор наиболее информативных признаков и есть совокупность признаков, отобранных на
шагах 1,...,k0 описанной процедуры. Именно они обеспечивают минимальную полную вероятность
ошибочной классификации, которая может быть получена при данных обучающих наблюдениях.
Процедура скользящего экзамена для оценки вероятности ошибочной классификации.
Оценивание вероятности ошибок с помощью формулы Колмогорова-Деева позволяет построить
быструю и эффективную процедуру отбора признаков [2,3]. Однако, эта асимптотическая формула
часто дает более высокую вероятность ошибок классификации, чем это действительно достигается в
практических экспериментах со средним числом (несколько десятков) обучающих векторов. Наиболее
реалистичная оценка вероятности ошибок классификации обеспечивается процедурой “скользящего
экзамена” [5]. Мы использовали в качестве решающего правила для классификации традиционные
линейную дискриминационную функцию (ЛДФ) и квадратичную дискриминационную функцию (КДФ).
Конечно возможно применять для вынесения решения более сложные статистические правила или
алгоритмы компьютерных нейронных сетей, однако и в этих случаях алгоритм скользящего экзамена
остается таким же, как он описан ниже.
В методе скользящего экзамена на каждом шаге один из обучающих векторов xl(j) , j1,nl, l1,2,
исключается из обучающей выборки. Оставшиеся векторы используются для адаптации (обучения)
ЛДФ и КДФ. Исключенный вектор затем классифицируется с помощью ЛДФ и КДФ, обученных без его
участия. Если этот вектор классифицируется неправильно, т.е. относится к классу 2 вместо класса 1 или
наоборот, соответствующие “счетчики” 12 или 21 увеличиваются на 1. Исключенный вектор затем
возвращается в обучающую выборку, а исключается уже другой вектор xl(j). Процедура повторяется для
всех nl +n2 обучающих векторов. Вычисляемая в результате величина p0=(12 +21)/( nl +n2 ) является
асимптотически несмещенной оценкой полной вероятности ошибочной классификации. Значения ЛДФ
и КДФ, полученные в результате процедуры скользящего экзамена для обоих классов, ранжируются по
амплитуде: ранжированные последовательности удобнее сравнивать с порогом и делать выводы о
“физических” причинах ошибочной классификации.
Описание экспериментальных результатов
Описанный статистический подход к классификации был применен для распознавания по
сейсмограммам землетрясений и химических взрывов в центральном регионе Израиля. Авторы
благодарны Д-ру В. Пинскому и авторам работы за предоставленные сейсмограммы слабых событий,
записанных локальной сейсмической сетью Израиля [6]. Набор сейсмограмм состоял из записей 28
землетрясений с магнитудами 1.1-2.6 и 25 химических взрывов с магнитудами 1.3-2.6. Каждое событие
было записано несколькими станциями сети. На Рис.1 показаны волновые формы землетрясений и
взрывов; причем, моменты вступлений P-волн приведены к одному моменту времени, сейсмограммы
упорядочены
по
эпицентральному
расстоянию
и
нормированы
на
максимумы
амплитуд
соответствующих волновых форм. Сравнение волновых форм землетрясений и взрывов позволяет
заметить их различие: землетрясения имеют относительно более мощные, чем взрывы колебания S-фаз
по сравнению с колебаниями P-фаз. Это отчетливо видно для большинства событий, несмотря на
достаточно малое в ряде случаев отношение сигнал-шум.
С помощью Проблемно-Ориентированной Системы Обработки Данных Сейсмических Сетей,
разработанной в Научно-Инженерном Центре СИНАПС была построена автоматизированная
интерактивная процедура идентификации сейсмических событий по сейсмограммам. Процедура
включает программы для выделения классификационных признаков из сейсмограмм, обработки
векторов признаков с помощью описанных выше алгоритмов отбора информативных признаков,
классификации векторов признаков и оценки вероятности ошибочной классификации. В качестве
дискриминационных признаков использовались различные отношения средней и пиковой мощности P и
S -волн в следующих частотных полосах: 0 = (1-15), 1 = (1-3), 2 = (3-6), 3 = (6-10), 4 = (10-15) Hz.
Кроме спектральных отношений мы измеряли отношения максимумов спектральных плотностей P и Sволн в полной полосе частот 0, а также, частоты fop и FMS, на которых эти максимумы достигаются.
Всего для каждой сейсмограммы измерялся 21 признак, они отражали характер распределения
мощности каждой из сейсмических фаз в общей полосе частот 0, а также спектральные отношения P и
S-фаз в различных частотных полосах.
Чтобы сделать определение классификационных признаков более устойчивым к сейсмическим
шумам оценивалась мощность шума в частотных полосах I. Измерения производились внутри
временного окна, предшествующего вступлению P-фазы и содержащего “чистый” шум. Оценка
мощности шума вычиталась из соответствующей мощности сигнальной фазы. Это обеспечило более
точное измерение признаков в случаях записей событий с малым отношением сигнал/шум. Признаки,
измеренные
по
сейсмограммам,
подвергались
затем
последовательно
двум
нелинейным
преобразованиям в соответствии с функциями y=Len(x) и z=(1/7)(y1/7-1). Преобразования приводят к
большей кластеризации точек, соответствующих землетрясениям и взрывам, в многомерном
пространстве признаков, и как следствие, обеспечивают большую надежность различения типов
событий.
Обработка множества векторов признаков начиналась с выявления пар сильно коррелированных
признаков - с коэффициентом корреляции, превышающим 0.75. Из каждой такой пары признаков
удалялся признак с меньшим значением одномерного расстояния Махалонобиса. Таким способом число
признаков было уменьшено с 21 до 16.
Второй шаг обработки данных состоял в выполнении описанных выше процедур отбора признаков и
скользящего экзамена. Рис.1 и Рис.2 иллюстрируют результаты выполнения этих процедур
применительно к сейсмограммам, записанным на расстояниях 100-200 км. (Рис.1.). Рис.2а отражает
изменения расстояния Махалонобиса и оценки теоретической вероятности ошибочной классификации с
ростом числа наилучших признаков. Точки на этих кривых соответствует векторам, состоящим из
1,2,...,16 признаков, ранжированных в соответствии с наибольшей скоростью роста расстояния
Махалонобиса. Видно, что после 5-го шага расстояние Махалонобиса растет незначительно, а кривая,
соответствующая вероятности ошибочной классификации, имеет на 5-м шаге минимум. Перечень
признаков, ранжированных в соответствии с их дискриминантной мощностью, позволяет отобрать 5
оптимальных признаков, обеспечивающих минимум вероятности ошибочной классификации.
Анализ физической природы отобранных признаков показал, что хорошо известная
дискриминантная характеристика - отношение мощностей S и P волн, обычно используемая при
идентификации
источников
сейсмических
событий,
была
автоматически
отобрана
нашей
статистической процедурой применительно к высоким (свыше 6 гц ) и низким (ниже 3 гц) частотам.
Также важными для дискриминации оказались такие признаки, как доля мощности S-фазы на высоких и
низких частотах по отношению к мощности S-фазы во всей полосе частот.
Рис. 3 отражает результаты процедуры скользящего экзамена, примененной к обучающим
векторам землетрясений и взрывов с использованием только 5 оптимальных признаков, отобранных на
предыдущих шагах. Рис.3а есть итог скользящего экзамена при использовании Линейной
Дискриминантной Функции. Значения ЛДФ для всех векторов признаков упорядочены по величине
отдельно для землетрясений (класс 1) и для взрывов (класс 2). Сравнение этих величин с нулевым
порогом показывает, что только 2 землетрясения, для которых значения ЛДФ превышают порог,
должны быть отнесены к взрывам, и только 2 взрыва, со значениями ЛДФ ниже порога, должны быть
отнесены к землетрясениям. Оценка полной вероятности ошибочной классификации в этом случае
равна 7.5%.
Аналогичные итоги скользящего экзамена для Квадратичной Дискриминантной Функции
представлены на Рис.3.б. В этом случае все землетрясения были классифицированы правильно и только
два взрыва, для которых соответствующие значения КДФ оказались ниже нулевого порога, были
ошибочно отнесены к землетрясениям. Отметим, что эти ложно классифицированные взрывы были
теми же самыми событиями, что и в случае ЛДФ. Оценка полной вероятности ошибочной
классификации в этом случае равна 3.8%.
Рис.4 представляет так называемую трехмерную диаграмму рассеяния. На диаграмме
отображены точки в пространстве 3-х “наилучших” признаков, соответствующие всем исследуемым
событиям. Очевидно, что существуют два четко различимых кластера: для землетрясений
(треугольники) и для взрывов (кружочки). Кластер, соответствующий землетрясениям, значительно
более плотный по сравнению с кластером, соответствующим взрывам. Анализ 3-мерной диаграммы
рассеяния показывает, что при разделении кластеров с помощью некоторой плоскости можно
обеспечить не более 4-х ошибок. В соответствии с результатами, представленными на Рис.3b, при
разделении кластеров с помощью некоторой поверхности второго порядка в пятимерном пространстве
наилучших признаков число ошибок может быть уменьшено до двух.
Выводы и рекомендации
1) Статистический подход к проблеме идентификации сейсмических событий обеспечивает точное
измерение по сейсмограммам и выбор наилучших признаков, для различения землетрясений и взрывов.
2) Процедура отбора позволяет найти оптимальную совокупность признаков, обеспечивающую для
конкретного региона, где осуществляется мониторинг, минимальную вероятность ошибочной
классификации. Процедура скользящего экзамена позволяет получить оценку вероятности ошибочной
классификации землетрясений и взрывов, присущую данному региону Обе процедуры особенно
полезны при малых и средних размерах обучающих выборок.
3) Удачно подобранные нелинейные преобразования могут существенно улучшить качество
классификации.
4) Эффективность различения локальных событий увеличивается с ростом расстояния от станции до
эпицентра события. В нашем эксперименте вероятность ошибочной классификации для событий,
записанных на расстоянии около 60 км, составила 9.5%, в то время как для тех же событий, записанных
на расстоянии около 140 км - 3.5%.
Литература
1. А.Д. Деев (1970) Представление статистик дискриминантного анализа и их асимптотическое
разложение при размерности пространства сравнимой с размером выборки. Докл. Акад. Наук СССР,
том 195, 759-762.
2. Б.Р. Левин, Е.В. Троицкий (1970) Полная вероятность ошибки при классификации нормальных
совокупностей, различающихся векторами средних значений. Автоматика и телемеханика, n.1, 54-56.
3. Ш.Ю. Раудис (1976) Проблема классификации при ограниченных размерах выборок.
Статистические проблемы управления, Труды института физики и математики АН Лит.ССР,
Вильнюс, n.18.
4. С.Л. Цванг, В.И. Пинский, И.С. Хьюсби (1993) Высококачественная дискриминация Европейских
сейсмических событий по записям NORESS. Geophys. J. Intern, v.112, 1-14
5. К. Фукунага, Д.Л. Кессель (1971) Оценивание ошибок классификации. IEEE Trans. on Comp. v.C-20,
N12, 136-143.
6. Y. Gitterman, T. van Eck. (1993) Spectra of quarry blasts and microearthquakes recorded at local
distances in Israel, Bull. Seism. Soc. Am., 83, pp 1799-1812
Названия рисунков
Рис. 1. Один из наборов сейсмограмм событий, использовавшихся для отработки процедуры
идентификации: а. сейсмограммы землетрясений, б. сейсмограммы взрывов.
Рис. 2. Выбор наиболее информативных признаков с помощью пошаговой процедуры.
а. Расстояние Кульбака-Махалонобиса между распределениями обучающих
выборок в
зависимости от количества классификационных признаков.
б. Вероятность ошибочной классификации в зависимости от количества классификационных
признаков
Рис. 3. Значения линейной (а) и квадратичной дискриминационных функций, вычисленные с помощью
процедуры скользящего экзамена. Значения каждого из классов ранжированы по величине.
Рис. 4. Трехмерная диаграмма рассеяния для трех отобранных оптимальных признаков.
Download