Uploaded by Майор Асфальт

Цифровой звук

advertisement
Цифровой звук
Оцифровка аналоговой звуковой
волны
В звуковой аппаратуре звук представляется либо непрерывным
электрическим сигналом, либо набором двоичных цифр (нулей и
единиц).
Аппаратура, в которой звук представляется в форме
непрерывного электрического сигнала, называется аналоговой, а
сам рабочий сигнал — аналоговым.
Аналоговый сигнал может быть преобразован в цифровой —
последовательность дискретных значений. Таким образом,
аналоговый звуковой сигнал может быть "введен" в компьютер,
обработан цифровыми методами и сохранен на цифровом
носителе в виде некоторого набора описывающих его чисел.
Оцифровка аналоговой звуковой
волны
Преобразование аналогового звукового сигнала в цифровой вид
называется аналогово-цифровым преобразованием или
оцифровкой. Процесс такого преобразования заключен в трех
следующих шагах:
1. Дискретизация - процесс получения мгновенных значений
преобразуемого аналогового сигнала – отсчетов - с
определенным временным шагом, называемым шагом
дискретизации.
2. Квантование - разбиение диапазона отсчётных значений
сигнала на конечное число уровней и округление этих
значений до одного из двух ближайших к ним уровней
3. Кодирование – запись квантованных значений при помощи
одного из типов двоичного кода.
Дискретизация звуковой волны
Количество
осуществляемых в одну
секунду замеров величины
сигнала называют частотой
дискретизации, или
частотой выборки, или
частотой сэмплирования
(sampling - выборка).
Очевидно, что, чем меньше
шаг дискретизации, тем
выше частота
дискретизации (т. е. тем
чаще регистрируются
значения амплитуды), и
значит, тем более точное
представление о сигнале
мы получаем.
Дискретизация звуковой волны
Минимальная частота дискретизации определяется
ограничением теоремы Котельникова (она же теорема
Шеннона). Согласно этой теореме, аналоговый сигнал с
ограниченным спектром может быть точно описан
дискретной последовательностью значений его амплитуды,
если эти значения следуют с частотой, как минимум вдвое
превышающей наивысшую частоту спектра.
Иначе говоря, аналоговый сигнал, в котором частота
наивысшей составляющей спектра равна Fm, может быть
точно описан последовательностью дискретных значений
амплитуды, если для частоты дискретизации Fd выполняется
условие Fd > 2 * Fm
Дискретизация звуковой волны
На практике это означает следующее: для того чтобы
оцифрованный сигнал содержал информацию обо всем
диапазоне слышимых человеком частот исходного аналогового
сигнала (0-20 кГц), необходимо, чтобы выбранная частота
дискретизации при оцифровке сигнала была не менее 40 кГц.
Полученная последовательность чисел (по одному результату
замера амплитуды сигнала на каждый шаг) и образует цифровую
форму исходного аналогового сигнала - так называемый
импульсный сигнал. Здесь, однако, обнаруживается основная
трудность оцифровки - невозможность записать измеренные
значения сигнала с идеальной точностью.
Квантование звуковой волны
Допустим, что для записи одного значения амплитуды сигнала в
памяти компьютера мы отводим N бит. Соответственно с
помощью одного N -битного слова можно описать 2N разных
положений.
Допустим теперь, что амплитуда оцифровываемого сигнала
колеблется в пределах от -1 до 1 некоторых условных единиц.
Заметим, что измеренные значения амплитуды могут быть
дробными (например, -0,126 или 0,997).
Представим этот диапазон изменения амплитуды - динамический
диапазон сигнала - в виде 2N-1 равных промежутков, разделив его
на 2N уровней - квантов (произведя таким образом однородное,
линейное разбиение амплитудной шкалы).
Квантование звуковой волны
Теперь для записи каждого отдельного значения амплитуды
его необходимо округлить до ближайшего уровня
квантования. Этот процесс называется квантованием по
амплитуде. Говоря более формальным языком, квантование
по амплитуде - это процесс замены реальных (измеренных)
значений амплитуды сигнала значениями, приближенными с
некоторой точностью.
Каждый из 2N возможных уровней называется уровнем
квантования, а расстояние между двумя ближайшими
уровнями называется шагом квантования. В случае
линейного разбиения амплитудной шкалы на уровни
квантование называют линейным (однородным).
Квантование звуковой волны
Как видно,
результатом такой
оцифровки стал
ступенчатый сигнал,
составленный из
прямоугольников,
каждый из которых
имеет ширину равную
величине шага
дискретизации, и
высоту равную
измеренному
значению амплитуды
сигнала.
Квантование звуковой волны
Очевидно, что точность округления зависит от выбранного
количества (2N) уровней квантования, которое, в свою
очередь, зависит от количества бит (N), отведенных для
записи значения амплитуды.
Чем больше уровней квантования и чем ближе они друг к
другу (для некоторого фиксированного диапазона изменения
амплитуды расстояние между уровнями квантования обратно
пропорционально их количеству), тем на меньшую величину
приходится округлять измеренные значения амплитуды и,
таким образом, тем меньше погрешность квантования.
Квантование и кодирование
звуковой волны
Число N называют разрядностью квантования
(подразумевая количество разрядов, то есть бит, в каждом
слове), а полученные в результате округления значений
амплитуды числа - отсчетами или сэмплами (sample замер). Считается, что погрешность квантования с
разрядностью 16 бит остается для слушателя почти
незаметной.
Каждое измеренное значение в процессе кодирования на
выходе АЦП заменяется словом двоичного кода,
передающимся в виде пачек импульсов в последовательном
коде.
Форматы цифрового звука
В цифровом звуке практически любой формат, за редким
исключением, записывается импульсно-кодовым потоком, или
потоком PCM – pulse code modulation – импульсно-кодовой
модуляции. Сами же форматы - лишь способы упаковки,
«консервации» потока PCM.
Первым форматом с использованием PCM послужил CDDA
(Compact Disc Digital Audio), в простонародье его называют Audio
CD или Red Book. Формат был выпущен инженерами Philips и
Sony в 1980 году и стал стандартом для аудио-компакт-дисков.
Характеристики формата:
• частота дискретизации — 44,1 кГц;
• разрядность квантования — 16 бит.
Форматы цифрового звука
Частота дискретизации 44,1 кГц была рассчитана из теоремы
Котельникова. Считается, что слух среднестатистического
человека не способен уловить звук за пределами 19–22 кГц.
Вероятно, частота 22 кГц и была выбрана в качестве верхней
граничной.
22 000 × 2 = 44 000 + 100 = 44 100 Герц
Откуда взялось 100 Герц? Есть версия, что это небольшой
запас на случай ошибок или передискретизации. На самом
деле такую частоту в Sony выбрали из соображений
совместимости со стандартом телевещания PAL.
Форматы цифрового звука
Разрядность формата CDDA — 16 бит, или 65 536 отсчетов, что
равняется динамическому диапазону примерно в 96 дБ. Такое
большое число отсчетов выбрано не случайно.
Во-первых, из-за сильного влияния шумов квантования, вовторых, чтобы обеспечить формальный динамический диапазон
выше, чем у главных тогда конкурентов — кассетных записей и
виниловых пластинок.
Дальнейшее развитие PCM так и продолжилось по принципу
умножения на два. Появились другие частоты дискретизации:
сначала добавилась частота дискретизации 48 кГц, а в
дальнейшем основанные на ней частоты 96, 192 и 384 кГц.
Частота 44,1 кГц также удваивалась до 88,2, 176,4 и 352,8 кГц.
Разрядность же увеличилась с 16 до 24, а позднее и до 32 бит.
Форматы цифрового звука
Следующим после CDDA в 1987 году появился формат DAT —
Digital Audio Tape. Частота дискретизации в нем составила 48 кГц,
разрядность квантования не изменилась. И хотя формат
провалился, частота дискретизации 48 кГц прижилась на студиях
звукозаписи, как пишут, из-за удобства цифровой обработки.
В 1999 году вышел формат DVD-Audio, который позволял
записать на один диск шесть стереодорожек с частотой
дискретизации 96 кГц и разрядностью 24 бит или две
стереодорожки с частотой 192 кГц, 24 бит.
В том же году был представлен формат SACD — Super Audio CD,
но диски для него стали производить только спустя три года.
Это основные форматы, которые считаются стандартом для
цифровых звукозаписей на носителях.
Download