Спектрально депривированный речевой сигнал в

advertisement
1
Спектрально депривированный речевой сигнал в моделировании слухового
восприятия имплантированных пациентов
Петров Сергей Михайлович
Санкт-Петербург
Abstract. In the Austrian cochlear implant system the lower frequency range limit is set from 70 to 350 Hz; the upper limit is set from 3500 to 8500 Hz. It is logical to assume that there is an optimum frequency range for best speech
perception.
Previously it was shown that there are parallels between speech recognition by users of cochlear implants and
recognition of comb filtered speech (spectrally deprived speech) by normal hearing persons [1]. Based on these parallels, we conducted present a model study of the spectrally deprived words recognition depending on the width of their
frequency range.
In our study we used 4 frequency ranges: 350-6500, 250-6500, 250-8500 and 70-8500 Hz. After comb filtering each
of them we left 5 bands with a width of 50 Hz. Bands were located at equal distance from each other on the basilar
membrane (model of 5-channel implant). We tested understanding of comb filtered speech by 9 normally hearing listeners.
The greatest intelligibility of words -73%- was detected in the frequency range 250-6500 Hz, minimum -63%- in the
range 70-8500 Hz. The difference is significant according to the Student test. Differences between the individual results
are up to 39%. By demonstrating differences between normally hearing subjects in understanding spectrally deprived
speech, the audiologist can explain different abilities of CI patients to understand speech transformed by an implant.
В австрийской системе кохлеарной имплантации нижняя граница частотного диапазона устанавливается в пределах от 70 до 350 Гц, верхняя - в пределах от 3500 до
8500 Гц. Логично предположить, что для наилучшего восприятия речи имеется оптимальный частотный диапазон.
Ранее мы проводили исследование восприятия речи,
обработанной гребенчатым фильтром. В результате обработки мы получали речевой сигнал, мозаично лишенный
участков спектра (спектрально депривированный), который был представлен пятью узкими полосами в диапазоне
частот 250-6250 Гц [1]. Было обнаружено, что между восприятием речи имплантированными пациентами и восприятием спектрально депривированной речи испытуемыми с нормальным слухом имеются параллели. На основании этих параллелей мы провели настоящее модельное
исследование.
Целью данной работы является исследование разборчивости спектрально депривированных слов в зависимости
от ширины их частотного диапазона.
В работе были использованы 4 частотных диапазона:
350-6500, 250-6500, 250-8500 и 70-8500 Гц. В программе
настройки кохлеарных имплантов «Maestro» мы устанавливали эти частотные диапазоны и отмечали значения
центральных частот первого и двенадцатого каналов
(табл. 1). Эти значения в нашем исследовании были приняты за центральные частоты первой и пятой полос. Далее
по формуле W. Hartmann [2] были рассчитаны значения
трех частот так, чтобы координаты пиков колебаний базилярной мембраны, соответствующие этим частотам, и координаты центральных частот первого и двенадцатого
каналов импланта располагались на равном расстоянии
друг от друга на базилярной мембране.
В таблице 1. приведены значения пяти частот, равноудаленных по расстоянию по базилярной мембране при
четырех, использованных в нашем исследовании, частотных диапазонах.
Вокруг этих частот были использованы полосы шириной по 50 Гц, вырезанные из речевого сигнала.
В результате обработки по программе гребенчатой
Методика
фильтрации «LOR» [3], мы получили речевой сигнал, предВ работе С.М. Петрова [1] было показано, что макси- ставленный пятью равноудаленными по расстоянию на
мальная разборчивость речи, представленной 5 полосами базилярной мембране спектральными полосами шириной
шириной по 50 Гц, распределенных в диапазоне частот по 50 Гц в четырех диапазонах частот.
В качестве иллюстрации результата гребенчатой
250-6250 Гц, составила 90%, т.е. спектральная избыточность у такого речевого сигнала отсутствует. Исходя из фильтрации речевой таблицы на следующем рисунке
этого результата, в данном исследовании мы также ис- представлен пример спектрограммы речевых сигналов,
использованных в настоящей работе.
пользовали 5 полос шириной по 50 Гц.
Таблица 1. Значения центральных частот пяти полос, равноудаленных по расстоянию на базилярной мембране при
четырех частотных диапазонах
Частотный
диапазон
350-6500
250-6500
250-8500
70-8500
Центральная частота 1-ой полосы
398
289
293
120
Центральная частота 2-ой полосы
781
640
693
448
Центральная частота 3-ой полосы
1573
1395
1607
1251
Центральная частота 4-ой полосы
3028
2860
3496
3108
Центральная частота 5-ой полосы
5798
5728
7418
7410
2
Рис.1. Спектрограмма речевого сигнала
Равноудаленное по базилярной мембране распределение полос - в соответствии с нормальной тонотопической
организацией улитки - было выбрано по аналогии с равными расстояниями между электродами в цепочке имплантата, т.е. речевые полосы были расположены вокруг
центральных частот четырех пятиканальных имплантов,
работающих в четырех разных частотных диапазонах.
В исследовании принимали участие 9 испытуемых с
нормальным слухом в возрасте от 22 до 31 года.
Для речевой аудиометрии были использованы табли-
цы слов Гринберга – Зиндера, содержащие по 30 слов.
Испытуемый устанавливал комфортную громкость и должен был повторять предъявляемые слова. Правильные
ответы регистрировались. Использованы телефоны TDH39.
Результаты исследования и их обсуждение
В табл.2 представлены усредненные результаты измерений разборчивости спектрально депривированных слов в
зависимости от ширины их частотного диапазона.
Таблица 2. Разборчивость спектрально депривированных слов в зависимости от ширины их частотного диапазона
Частотный диапазон, Гц
Разборчивость, %
350-6500
71±12
250-6500
73±12
Как видно из таблицы, наибольшая разборчивость
слов обнаружена в частотном диапазоне 250-6500 Гц. Разборчивость слов уменьшается при повышении нижней
частоты до 350 Гц. Также разборчивость уменьшается при
расширении диапазона 250-6500 Гц в сторону ВЧ до
8500 Гц и при расширении диапазона 250-8500 в сторону
низких частот до 70 Гц. Разборчивость слов в диапазоне
частот 250-6500 по критерию Стьюдента для парных при-
250-8500
64±13
70-8500
63±14
знаков достоверно выше, чем во всех остальных.
Представляет интерес рассмотреть индивидуальные
результаты измерений разборчивости слов в диапазоне
частот 250-6500 Гц.
В табл.3 представлены результаты измерения разборчивости слов у девяти испытуемых в диапазоне частот 2506500 Гц.
Таблица 3. Разборчивость спектрально депривированных слов у девяти испытуемых в диапазоне частот 250-6500 Гц
Испытуемые
Разборчивость слов
1
56
2
60
3
63
Поскольку все испытуемые – лица с нормальным слухом, то можно сказать, что с точки зрения состояния слуховой функции при обследовании они находились в одинаковом положении. Однако, как видно по полученным результатам, они в разной степени включались в восприятие обработанных слов. Обнаруженный разброс результатов 36%, служит яркой иллюстрацией различных способностей разных людей осваиваться в новой звуковой картине,
т.е. при равенстве начальных условий психофизические
особенности испытуемых проявляются не одинаково. Во
всех частотных диапазонах разброс индивидуальных результатов находился в пределах от 30 до 39%. Учитывая
аналогичное разнообразие психофизических характеристик
пациентов с кохлеарными имлантами и опираясь на ана-
4
73
5
73
6
76
7
82
8
86
9
92
логии с кохлеарной имплантацией, такие разбросы результатов позволяют аудиологу дать ответ на частый вопрос
родителей: Почему различаются результаты реабилитации
пациентов?
Проведенное исследование показало, что для восприятия спектрально депривированного речевого сигнала лучшим из обследованных нами четырех частотных диапазонов является диапазон частот от 250 до 6500 Гц. На основании параллелей между восприятием речи имплантированными пациентами и восприятием спектрально депривированной речи испытуемыми с нормальным слухом
можно достаточно обоснованно заявить, что максимальный
частотный диапазон 70-8500 Гц не является лучшим для
восприятия речи пациентами после операции кохлеарной
3
имплантации.
Выводы
1. Максимальная разборчивость спектрально депривированных слов, измеренная на модели импланта, обнаружена в диапазоне частот от 250 до 6500 Гц.
2. Частотный диапазон австрийского кохлеарного импланта от 70 до 8500 Гц не обеспечивает максимальной
разборчивости речи у пациентов после операции кохлеарной имплантации.
Литература:
1. Рetrov S. M. Use of comb-filtered speech to demonstrate to parents how children adapt to hearing with an implant
//Cochlear Implants International.- 2008.-Vol.9, N 1.- P. 27-33.
2. Hartmann W. Pitch, periodicity and auditory organization // Journal of Acoustical Society of America.- 1996.- Vol.100,
N6.- P. 3491-3502.
3. Петров С.М. Способ переработки речевого сигнала // 1999.- Патент РФ №2121242.
Download