1.3.5. Представление звуковых данных в двоичном коде Звук

advertisement
1.3.5. Представление звуковых данных в двоичном коде
Звук представляет собой упругую продольную волну в воздушной среде. С помощью микрофона звуковые колебания преобразовываются в электрический аналог звука. Преобразование полученного аналогового сигнала в
цифровую форму заключается в измерении мгновенных значений его амплитуды через равные промежутки времени и представлении полученных
значений, называемых отсчетами, в виде последовательности чисел. Такая
процедура насыпается аналого-цифровым преобразованием (то есть оцифровка сигнала включает в себя два процесса – процесс дискретизации (осуществление выборки) и процесс квантования).
Числа, полученные а результате аналого-цифрового преобразования,
выражаются в двоичной системе исчисления, т.е. в виде комбинации
всего двух цифр — нулей (0) и единиц (1).
Процесс преобразования непрерывного аналогового сигнала в последовательность его мгновенных значений (выборок) называется дискретизацией (рис. 1.6.). Временной интервал между двумя соседними выборками
называется периодом дискретизации.
Определение численного значения величины выборки называется
квантованием. Такое численное значение называется отсчетом. Для этого весь диапазон возможных изменений амплитуды преобразуемого сигнала делится на множество уровней квантования, количеств которых определяется разрядностью используемого при этом двоичного числа. Чем
больше число разрядов квантования, тем меньше расстояние между уровнями квантования (шаг квантования) и тем выше получается точность преобразования.
В процессе квантования за величину выборки (отсчет) принимается
номер ближайшего уровня квантования.
В большинстве ныне существующих цифровых звуковых форматов
используется 16-разрядное квантование. Эта позволяет получить точность
преобразования 1/216 = 1/65536.
С числом разрядов квантования N физически связан динамический
диапазон D звукового сигнала.
D = 6N + 1,76 дБ ≈ 6N + 2дБ.
Следовательно, для цифровых систем звукозаписи с 16-разрядным
квантованием
D = 6 * 1 6 + 2 = 98 дБ.
Выбор частоты дискретизации в общем случае определяется известной
теоремой Котельникова (теоремой отсчетов), которая в оригинале звучит так:
Рис.1.7. Аналого-цифровое преобразование:
вверху — дискретизация; внизу — квантование.
«Если наивысшая частота в спектре функции S(t) меньше чем fm, то
функция S(t) полностью определяется последовательностью своих значений в моменты, отстоящие друг от друга не более чем на 1/2 fm секунд».
В рассматриваемом случае под функцией S(t) следует понимать непрерывный аналоговый звуковой сигнал, а под частотой fm — наивысшую частоту требуемого звукового диапазона. Если необходимо точно отобразить
аналоговый сигнал в диапазоне до fm, то отсчеты должны следовать с периодом, по крайней мере, в два раза меньшим, чем период частоты fm. Иными
словами, частоту дискретизации следует выбирать так, чтобы она была, по
меньшей мере, в два раза выше максимальной частоты звукового диапазона.
При этом минимально возможная частота дискретизации FД =2fm называется частотой Найквиста FH
FH = 2fm.
На практике частота дискретизации FД:
FД = (2,1...2,4)fm.
Слуховой аппарат человека способен различать частотные составляющие звука в среднем в пределах от 20 Гц до ~20 КГц, причем верхняя грани-
ца может колебаться в зависимости от возраста и других факторов. Чтобы
получить полную информацию о звуке в частотной полосе до 22050 Гц, частота дискретизации должна быть не менее 44.1 КГц.
Именно поэтому с учетом возможностей слухового аппарата человека
стандартные параметры записи аудио компакт-дисков следующие: частота
дискретизации – 44.1 КГц, уровень квантования – 16 бит. Это соответствует
65536 (216) уровням квантования амплитуды при взятии ее значений 44100
раз в секунду. Таким образом, 1 с стерео звука займет 2 байт • 44100байт/с •
2 канала • 1 с = 176 400 байт дисковой памяти. Качество звука при этом получается очень высоким.
Для телефонных переговоров удовлетворительное качество получается
при частоте дискретизации 8 кгц и частоте квантования 255 уровней, т.е. 1
байт, при этом 1 сек звуковой записи займет на диске
1 байт • 8000 байт/с • 1 с = 8000 байт.
Download