Уменьшение краевых эффектов при выполнении эмпирической

advertisement
Физико-математические науки
Уменьшение краевых эффектов при выполнении эмпирической
модовой декомпозиции сигналов преобразования Гильберта-Хуанга
Вадим Анатольевич Давыдов
Институт геофизики УрО РАН, научный сотрудник.
620016, г. Екатеринбург, ул. Краснолесья, д. 16, кв. 116,
тел. (343) 266-08-18, e-mail: davyde@mizarpro.com
Анатолий Васильевич Давыдов
Профессор, доктор геолого-минералогических наук.
Уральский государственный горный университет, профессор.
620109, г. Екатеринбург, ул. Металлургов, д. 6, кв. 28,
тел. (343) 246-58-92, e-mail: davpro@yandex.ru
Аннотация
Рассмотрен процесс возникновения краевых искажений в модовых функциях при выполнении EMD. Уменьшение краевых эффектов обычно выполняется
продлением анализируемых сигналов (задание начальных условий). Предлагается
уменьшать искажения методом краевой коррекции огибающих при вычислении
модовых функций. Это позволяет стандартизовать процесс уменьшения краевых
искажений и ограничить интервал искажений одним периодом модовых колебаний.
Ключевые слова: преобразование Гильберта-Хуанга, эмпирическая модовая декомпозиция, краевые эффекты преобразования, коррекция огибающих.
Введение
Проблема ликвидации краевых эффектов при выполнении эмпирической
модовой декомпозиции (EMD) сигналов в преобразовании Гильберта-Хуанга
(HHT) отмечалась неоднократно, начиная с первых работ авторов преобразования
[1]. По существу, это вопрос задания начальных условий преобразования EMD,
позволяющих раскладывать сигнал на модовые функции без их искажения на
начальных и концевых интервалах, что в какой-то мере является гарантией взаимной ортогональности модовых функций и сохранения их физической значимости на всем интервале задания сигнала.
Как показано в работе [2], причиной концевых искажений модовых функ-
2
ций является непредсказуемость аппроксимации по экстремумам верхней и нижней огибающих сигнала на концевых участках мод. В сигналах сложного частотного состава эта непредсказуемость начинается с первой модовой функции, где
концевые отсчеты вообще не определены по принадлежности к экстремумам, и
увеличивается по мере увеличения номера модовых функций, т.к. уменьшается
средняя частота мод и увеличивается вероятность появления больших интервалов
от концевых отсчетов мод до первых максимумов и минимумов модовой волны.
Следует также учитывать, что ошибки аппроксимации огибающих на концевых
интервалах приводят к искажениям выделенных мод, а так как процесс выделения
модовых функций является последовательным вычитанием текущих вычисляемых мод из предыдущего входного сигнала, то ошибки вычислений рекурсивно
накапливаются. Оба процесса в совокупности приводят к тому, что по мере увеличения номера модовой функции зоны нарастающих погрешностей вычисления
(краевые эффекты) все больше расширяются от концов к центру сигнала, а для
коротких сигналов эти две зоны могут сомкнуться и вообще исключить возможность выделения низкочастотных мод.
Для устранения концевых эффектов при функциональных преобразованиях
сигналов обычно задаются начальные условия в виде продления обеих сторон
анализируемого сигнала на определенный интервал. Методы продления функций
достаточно хорошо разработаны, например, в вейвлетном преобразовании, и здесь
не обсуждаются. Как правило, для продления сигналов используются функции
прогнозирования (типа функции predict в системе Mathcad), вплоть до нейронных
сетей с обратной связью [3].
В данной работе исследуется несколько иной подход к уменьшению краевых эффектов, а именно – коррекция аппроксимации огибающих при выполнении
EMD. Конечная цель – построение системы автоматического задания начальных
условий выполнения EMD.
1. Возникновение краевых эффектов EMD.
Для анализа краевых эффектов зададим простой модельный сигнал в виде
суммы трех гармоник. Модельный сигнал приведен на рис. 1.
3
Рис. 1. Модельный сигнал f0 и его составляющие f1, f2, f3.
Таб. 1. Взаимная ортогональность
Критерием качества разложения сигналов на сумму модовых функций является
их взаимная ортогональность – скалярные
произведения мод. При разложении модельного сигнала с последующим сравнением
модовых функций с исходными сигналами
для применения критерия ортогональности
исходные сигналы также должны быть взаимно ортогональны. Данные по исходной
ортогональности функций модельного сиг-
нала приведены в таблице 1. Отклонения от теоретических нулевых скалярных
произведений гармонических функций объясняются конечностью задания сигнала
(некратная укладка периодов функций в интервал сигнала).
На рис. 2 приведено разложение сигнала f0 на модовые функции. Максимальное количество итераций вычисления мод, в соответствии с рекомендациями
в работе [4], было установлено равным 8 с остановом по относительной среднеквадратической разности между последовательными итерациями менее 0.0001,
если это значение достигалось на меньшем количестве итераций. Количество вычисляемых мод ограничивалось с остановом по количеству экстремумов в остатке
декомпозиции (тренде сигнала), менее 4. Остаточный тренд сигнала показан на
рис. 2 черным цветом непосредственно на графике сигнала (красный цвет).
4
Рис. 2. EMD сигнала f0.
На рис. 3. приведена информация по выполнению процесса EMD: количество итераций отсева и экстремумов каждой моды, расхождение последней итерации с предпоследней при останове отсева и относительная среднеквадратическая погрешность реконструкции сигнала из модовых функций при их последовательном суммировании. Качество вычислений контролировалось по среднеквадратической погрешности реконструкции сигнала суммированием всех модовых
функций и тренда, которая всегда была не ниже 10-6.
Рис. 3. Информация о процессе декомпозиции сигнала.
Таб. 2. Взаимная ортогональность мод
Сравнение рис. 1 и рис. 2 и данные
таблицы 2 дают наглядное представление о
краевых искажениях преобразования, начиная с первой моды. За счет появления краевых выбросов резко увеличивается мощность мод и практически полностью отсутствует их взаимная ортогональность, хотя
сумма мод и тренда продолжает давать точную реконструкцию сигнала, т.е. концевые
искажения компенсируют друг друга.
Начальный процесс формирования ис-
5
кажений в первой моде показан на рис. 4.
Рис. 4. Формирование огибающих на концевых участках сигнала.
На начальном участке сигнала перед первым экстремумом (красный максимум) идет спад сигнала без экстремумов, опережающий даже визуально прогноз
аппроксимации верхней огибающей по трем первым максимумам и явно обратный прогнозу аппроксимации нижней огибающей по трем первым минимумам,
что и подтверждается аппроксимацией огибающих по экстремумам кубическим
сплайном. Тем самым начальная часть сигнала вообще не попадает в зону между
огибающими. Аналогичная ситуация наблюдается и для конца сигнала. При вычитании среднего значения огибающих из входного сигнала для подготовки входного сигнала второй итерации на его концевых участках формируются выбросы,
как это показано на рис. 5.
Рис. 5. Формирование входного сигнала для второй итерации.
Так как выбросы, как правило, имеют плавный характер без локальных экстремумов, то вышеописанная ситуация практически повторяется на второй и последующих итерациях. На рис. 6 приведено формирование огибающих на концевых участках второй итерации.
6
Рис. 6. Формирование огибающих на концевых интервалах второй итерации
В результате итераций отсеивается модовая функция, практически точно
повторяющая первый модельный сигнал f1, искаженный выбросами на концах.
Длина выбросов определяется интервалами до первого и последнего экстремума
на концевых участках сигнала.
Аналогичное явление наблюдается для второй и последующих модовых
функций, при этом, учитывая понижение средней частоты колебаний модовых
функций, интервал искажений непрерывно нарастает. На рис. 7 приведено формирование огибающих первой итерации при вычислении второй модовой функции.
Рис. 7. Начало вычисления второй модовой функции
Следовательно, главной причиной появления искажений на концевых
участках модовых функций является непредсказуемость аппроксимации огибающих на концевых участках входных сигналов при вычислении мод.
7
2. Коррекция огибающих на концевых интервалах.
Эффект непредсказуемости аппроксимации экстремумов на концевых интервалах можно существенно снизить их автоматической коррекцией, адаптивнологической под положение концевых точек входных сигналов. Поясним это на
конкретных примерах концевых ситуаций, которых всего три.
Рис. 8. Концевая ситуация 1
Ситуация 1 (рис. 8) повторяет начало сигнала на рис. 4. Слева от первого зарегистрированного максимума e1 входной сигнал уменьшается без фиксированных экстремумов и начальная точка сигнала sn много меньше и первого максимума e1, и первого минимума m1, в результате чего начальная часть сигнала может
не попадать (полностью, как на рис.8, или частично) между огибающими, ход которых определяется кубическим сплайном по трем последним экстремумам.
Между тем, с достаточно большой степенью вероятности можно считать, что если
бы процесс был зарегистрирован (или с высокой точностью спрогнозирован) влево от нуля, то в ближайших окрестностях этой точки sn должен быть минимум.
Это позволяет присвоить начальной точке сигнала статус минимума m0 (внести
точку sn в таблицу минимумов) и тем самым понизить степень неопределенности
вычисления нижней огибающей. Дополнительно исключается вероятность ухода
8
верхней огибающей вверх или вниз, что вполне возможно для кубического сплайна. Это выполняется введением в таблицу максимумов другой начальной точки
e0, равной по положению k=0 - начальной точке сигнала. Значение этой начальной точки e0 в простейшем случае устанавливается равным значению первого
максимума e1 или среднему значению двух первых максимумов. Вариант с более
высокой степенью адаптации под сигнал – линейная аппроксимация в точку k0
двух первых максимумов, при условии, если второй максимум больше первого, а
результат аппроксимации больше значения начальной точки сигнала. На правом
графике рис. 8 приведены оба возможных варианта. Эффект коррекции очевиден.
Большая часть начальной части сигнала теперь находится внутри огибающих.
Рис. 9. Концевая ситуация 2.
На рис. 9 приведена ситуация 2, аналогичная первой, но обратная по значениям кривой и соотношению с экстремумами. Соответственно, логика изменения
статуса первой точки и продления экстремумов также инвертируется.
На рис.10 приведена третья возможная концевая ситуация, при которой
начальная точка sn сигнала меньше по значению первого максимума e1 и больше
первого минимума m1. В этой ситуации статус точки sn не изменяется, а дополнительно в таблицы экстремумов вводятся две начальных точки e0 и m0 на положение k=0 со значениями соответственно первого максимума e1 и первого мини-
9
мума m1 или, как и в первых двух случаях, применяться линейная интерполяция
экстремумов с условием попадания точки sn между значениями e0 и m0.
Рис. 10. Концевая ситуация 3
Аналогичные ситуации имеют место и для концевой точки входного сигнала, что позволяет использовать аналогичную методику коррекции концевых интервалов.
Так как эффект несоответствия входного сигнала итераций огибающим может проявиться на любой итерации, метод коррекции таблиц экстремумов должен
входить в состав алгоритма всех итераций всех модовых функций. Это несколько
уменьшает производительность итераций, но, как правило, компенсируется сокращением их количества при задании останова порогом по среднеквадратическому расхождению последовательных итераций.
Результаты вычисления первой моды входного сигнала в сопоставлении с
колебанием f1модельного сигнала с применением и без применения коррекции
огибающих приведены на рис. 11. Останов итераций по порогу 0.001 среднеквадратического расхождения. Можно видеть, что неполное соответствие новых огибающих входному сигналу в первой итерации с коррекцией также дает в этой
итерации искажение концевых интервалов модовой функции, но оно гораздо
меньше по величине варианта без коррекции и практически полностью ликвиди-
10
руется последующими итерациями. Заключительная модовая функция практически не отличается от модельной функции f1, относительное среднеквадратическое
расхождение с которой не превышает 0.3%.
Рис. 11. Итерации вычисления первой модовой функции в сопоставлении с f1
Полная декомпозиция модельного сигнала f0 с использованием операции
установления статуса концевых отсчетов и коррекции огибающих приведена на
рис. 12. На последнем графике рис. 12 приведен остаток декомпозиции (тренд Тр
сигнала) с увеличением масштаба в 10 раз. Остаточный тренд EMD обычно никогда не является нулевым в силу эмпирического характера отсева модовых функций. Даже теоретически он может быть нулевым только при нулевой фазе всех
модовых функций в начале и в конце заданного сигнала.
11
Рис. 12. EMD с коррекцией аппроксимации огибающих
Рис. 13. Информация о процессе декомпозиции сигнала
Таб. 3 Взаимная ортогональность мод.
На рис. 13 приведена информация о
процессе декомпозиции. В таблице 3 приведены результаты вычисления взаимной ортогональности модовых функций и тренда.
Среднее отклонение от ортогональности достаточно хорошо соответствует результатам
таблицы 1, особенно по средней мощности
частотных
компонентов.
Положительный
эффект очевиден.
В таблице 4 в столбце 0 приведены относительные среднеквадратические расхождения исходных модельных сигналов f1, f2, f3 и выделенных модовых функций
с1, с2, с3.
12
Таб. 4. Относительные среднеквадратические расхождения
модовых функций с модельными сигналами.
В последующих столбцах таблицы приведены среднеквадратические расхождения модовых функций и исходных сигналов, вычисленные с отсечкой первых и последних отсчетов 5-ти, 10-ти, …, 40-ка отсчетов. Графическое отображение результатов таблицы приведено на рис. 14 в двух масштабах. Вертикальными
маркерами на графике приведены средние значения периодов колебания модовых
функций (с1-4, с2-13, с3-37) в количестве отсчетов на период.
Рис. 14.
Анализ всех представленных результатов позволяет заключить, что выполненная коррекция огибающих существенно улучшила качество декомпозиции, а
остаточные явления сохраняются только на концевых интервалах мод, по своим
значениям много меньше значений модовых колебаний, не превышают одного
периода колебания модовых функций и, как правило, не передаются на последующие моды. Метод будет особенно полезен при выполнении декомпозиции коротких многомодовых сигналов, достаточно точное прогнозное продление которых представляет собой значительную трудность.
Естественно, что полностью исключить концевые эффекты данным методом
невозможно, т.к. нельзя предусмотреть оптимальное продление огибающих под
многообразие возможных ситуаций соотношения значений концевых отсчетов со
значениями ближайших экстремумов.
13
3. Влияние концевых эффектов на остаточный тренд сигнала
Наиболее непредсказуемым последствием начальных условий и эмпирики
вычисления мод является форма выделяемого остатка, которая никогда не является нулевой, даже если исходный сигнал имеет нулевой тренд. Это определяется
тем, что вычисление мод прекращается, если из остатка уже не может быть извлечено ни одной модовой функции, т.е. имеется только один минимум или один
максимум. Кроме того, для достаточно протяженных сигналов концевые эффекты
могут порождать в процессе эмпирики вычисления последних мод выделение
«кажущихся» низкочастотных колебаний, неортогональных вычисленным модам.
Коррекция огибающих в определенной степени блокирует и эти процессы.
Рис. 15. Семейство остаточных трендов EMD.
На рис. 15 приведено семейство остаточных трендов EMD для семейства
входных сигналов длиной 200 отсчетов, полученного вырезкой из модельного
сигнала f0 при разной величине сдвига начального отсчета. Первый верхний график соответствует нулевому сдвигу. Входные сигналы семейства имеют практически нулевой тренд (модельные сигналы – гармоники) с локальными отклонениями от нуля на концевых частях за счет начальной и конечной фазы гармоник, где
главную роль играет самая низкочастотная гармоника f3. Оценка качества выделенных трендов выполнена по относительной доле (в %) дисперсии тренда к дисперсии входного сигнала.
14
Все тренды имеют практически нулевое среднее значение с основными локальными отклонениями от нуля на концевых частях длиной порядка одного периода самой низкочастотной гармоники f3. При сдвиге 0 фаза гармоники f3- синусоиды равна 0, что позволяет оценить корреляцию начальных значений трендов
EMD с локальными начальными трендами входных сигналов. Анализ результатов
показывает, что значимой корреляции не существует ни по значениям трендов, ни
по их знакам. Следовательно, эти концевые искажения трендов EMD определяются концевыми ситуациями продления огибающих при вычислении последней низкочастотной моды. Вместе с тем, величина этих искажений, как правило, незначительна.
Коррекция огибающих не исключает применения продления входного сигнала любыми известными методами, при этом собственно коррекция огибающих
автоматически переносится на концевые интервалы продленного массива. Это
отодвигает остаточные искажения модовых функций и тренда от информационной части сигнала и степень расхождения мод с исходными гармониками модельного сигнала становится практически равной данным, приведенным в таблице 4
для столбца со сдвигом 40. Наибольший эффект имеет место для тренда. Увод
концевых искажений за пределы информационной части на порядок снижает дисперсию тренда до тысячных долей % в единицах дисперсии сигнала. Пример
применения продления сигнала функцией predict в Mathcad совместно с коррекцией огибающих приведен на рис. 16. Интервалы концевого продления отмечены
маркером tp и установлены равными 40 отсчетов (немного больше периода гармоники f3).
Рис. 16. EMD сигнала f0 с его продлением и коррекцией огибающих
15
Коррекция огибающих абсолютно некритична к форме тренда сигнала, как
линейного, так и нелинейного. На рис. 17 приведены результаты EMD для сигнала f0 в сумме с линейным трендом с градиентом 0.005 на отсчет.
Рис. 17. EMD сигнала с трендом
Относительные среднеквадратические расхождения модовых функций и
остатка EMD с модельными сигналами и трендом сигнала f0 с градиентом
0.005/отсчет: f1 – 3.3 10-3, f2 – 0.019, f3 – 5.8 10-3, тренд – 3.5 10-3. Аналогичные
результаты при увеличении угла наклона тренда сигнала в 10 раз (при увеличении
градиента тренда до 0.05/отсчет): f1 – 3.6 10-3, f2 – 0.017, f3 – 0.024, тренд – 5.8
10-4.
Допустимый угол наклона линейного тренда ограничен только одним условием: максимальный градиент самой низкочастотной выделяемой моды должен
быть больше градиента тренда, т.к. в противном случае на гармонике, наложенной на тренд, не будут выделяться экстремумы (минимумы гармоники по своим
значениям будут выше максимумов). На рис. 18 приведены результаты EMD сигнала с трендом, который имеет градиент 0.17/отсчет (угол наклона порядка 10о),
что немножко меньше максимального градиента гармоники f3 в области пересечения нулей. При этом выделяются все моды, результаты расхождения с модельным сигналом: f1 – 3.9 10-3, f2 – 0.018, f3 – 0.122, тренд – 3.9 10-4.
16
Рис. 18. EMD сигнала с углом наклона тренда 9.9о.
В общем случае, так как предел выделения модовых функций – минимум два периода колебаний на интервале К-отсчетов задания сигнала (± четверть периода в
зависимости от значения начальной фазы), то максимальный градиент колебаний
порядка ∆d=Аsin(2π(2±0.25)f/(K+1)) на отсчет, где А-амплитуда, f – частота (в Гц)
модового колебания. Соответственно, если градиент тренда на отсчет будет
иметь значение ∆d, то все частоты выше частоты f будут отсеяны в моды, а ниже
частоты f - останутся в остатке EMD как тренд сигнала. Для гармоники f3 с частотой 7 Гц значение ∆d=0.174, и поэтому на рис. 18 при ∆d=0.17 она выделяется, хотя и с повышенной погрешностью.
Рис. 19. EMD сигнала с углом наклона тренда 10.5о
На рис. 19 приведены результаты EMD при d, равном 0.185. Как и ожида-
17
лось, гармоника с меньшим значением d=0.174 переместилась в тренд EMD. Отсев гармоник f1 и f2 сохранился с погрешностями f1 – 0.004, f2 – 0.017.
При градиентах тренда d > 0.05 целесообразно в любых ситуациях концевых условий всегда применять линейную аппроксимацию огибающих по концевым экстремумам, в том числе в ситуации 3 на рис. 10, и снять ограничения по ее
применению в ситуации 1 на рис. 8 (отбросить условие «если e1'>sn») и в ситуации 2 на рис. 9 (отбросить условие «если m1'<sn»). Тем самым продление огибающих адаптируется к концевым градиентам тренда (тем лучше, чем круче тренд)
и уменьшаются остаточные явления концевых эффектов.
EMD сигналов с нелинейными трендами каких-либо значимых особенностей не имеют.
4. Заключение
Таким образом, применение коррекции огибающих вместо продления сигналов для снижения влияния концевых эффектов на процесс EMD позволяет
стандартизовать процесс уменьшения краевых искажений модовых функций и
ограничить интервал искажений одним периодом модовых колебаний.
Предложенный метод коррекции огибающих, по-видимому, является не
единственным методом. Сущность метода заключается в коррекции огибающих
таким образом, чтобы входной сигнал последовательных итераций всегда находился между огибающими.
Литература
1.
Norden Huang et al. The empirical mode decomposition and the Hilbert
spectrum for nonlinear and non-stationary time series analysis. Proceedings of the
Royal Society of London. A 454, 903–995 (1998).
2.
Y.Deng et al. Boundary-processing-technique in EMD method and Hil-
bemranslbrm," 2001 Chinese Science Bulletin Vol. 46, pp. 954-960.
3.
Chun-Yao Lee, Yao-chen Lee. BPNN Based Processing for End Effects of
HHT. World Academy of Science, Engineering and Technology, 72, 2010.
4.
G. Wang et al. On Intrinsic Mode Function. Advances in Adaptive Data
Analysis. Vol. 2, No. 3, 2010, 277-293.
26.02.11.
Download