Неравномерное квантование - Кафедра телевидения и

advertisement
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное бюджетное образовательное
учреждение высшего профессионального образования
«ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ СИСТЕМ
УПРАВЛЕНИЯ И РАДИОЭЛЕКТРОНИКИ»
(ТУСУР)
Кафедра телевидения и управления
(ТУ)
УТВЕРЖДАЮ
Заведующий кафедрой ТУ, профессор
_________________И.Н. Пустынский
«______»___________________2012 г.
АУДИОТЕХНИКА.
Часть 2
Учебное пособие
РАЗРАБОТАЛ
_________ С.В. Худяков
«______»_________2012 г.
2012
Худяков С.В. Аудиотехника. Часть 2: Учебное пособие. – Томск:
кафедра ТУ, ТУСУР, 2012. – 188 с.
Пособие составлено на базе учебных пособий, рекомендованных
Министерством образования РФ и содержит систематизированные известные
знания в области аудиотехники. Предназначено для студентов
радиотехнических специальностей ВУЗа, обучающихся на всех формах
обучения, в том числе с использованием дистанционных образовательных
технологий.
© Худяков С.В., 2012
© Кафедра Телевидения и управления, ТУСУР, 2012
СОДЕРЖАНИЕ
Введение ............................................................................................... 5
1 Цифровое представление звуковых сигналов .............................. 6
1.1 Аналого-цифровое преобразование ......................................... 6
1.2 Равномерное квантование ....................................................... 16
1.3 Неравномерное квантование ................................................... 24
1.4 Предыскажения при цифровой передаче сигналов
звукового вещания ................................................................... 34
1.5 Цифроаналоговое преобразование ......................................... 36
1.6 Цифровая обработка звуковых сигналов ............................... 40
1.7 Достоверность цифровой передачи........................................ 42
1.8 Методы обнаружения и коррекции ошибок в цифровых
звуковых сигналах.................................................................... 46
1.9 Кодирование с плавающей запятой ....................................... 64
1.10 Редукция аудиоданных, обусловленная психоакустическими
особенностями ........................................................................ 67
2 Форматы звуковых сигналов ........................................................ 79
2.1 Форматы цифровых сигналов и организация стыков цифровых
трактов ....................................................................................... 79
2.2 Изменение частоты дискретизации ........................................ 86
2.3 Структура цифрового сигнала в стандарте
MPEG-1 ISO/IEC 11172-3 ........................................................ 88
2.4 Особенности стандарта MPEG-2 ISO/IEC 13818.................. 94
2.5 Структура аудиоданных в стандарте
MPEG-2 ISO/IEC 13818-3 ...................................................... 102
2.6 Обработка сигналов в среде Мультимедиа ......................... 106
3 Тракт формирования сигналов программ звукового
вещания. Радиодома и телевизионные центры ........................ 117
3.1 Классификация радиодомов и телевизионных центров .... 117
3.2 Структура аппаратно-студийного комплекса ..................... 118
3.3 Аппаратно-студийные блоки ................................................ 122
3.4 Оборудование студий ............................................................ 123
3.5 Оборудование студийных аппаратных ................................ 126
3.6 Аппаратно-программный блок ТЦ и аппаратная
вещания РД ............................................................................. 130
3.7 Центральная аппаратная ........................................................ 130
3.8 Трансляционные пункты и передвижные звуковые
станции .................................................................................... 132
3.9 Диаграммы уровней вещательных устройств ..................... 135
3.10 Звуковые станции ................................................................. 138
3.11 Звуковые процессоры .......................................................... 140
4 Контроль и измерения в звуковом вещании ............................. 148
4.1 Виды технического контроля ............................................... 148
4.2 Методика измерения основных параметров качества ....... 149
4.3 Дистанционные измерения ................................................... 158
4.4 Автоматический контроль и диагностика в звуковом вещании
161
5 Звуковые карты мультимедийных комплексов ........................ 166
5.1 Звуковая карта ........................................................................ 166
5.2 Методы синтеза звуков .......................................................... 166
5.3 Появление звуковых мультимедийных карт ....................... 168
5.4 Платы расширения, системные шины и ресурсы ............... 171
5.5 Функционирование звуковых плат ...................................... 172
6 Электромузыкальные инструменты .......................................... 177
6.1 Определения ........................................................................... 177
6.2 История развития электромузыкальных инструментов .... 178
6.3 Терменвокс .............................................................................. 181
6.4 Электронный барабан ............................................................ 182
6.5 Приставки к электрогитаре ................................................... 183
6.6 Синтезаторы ............................................................................ 184
Литература ....................................................................................... 186
Список сокращений и терминов .................................................... 187
ВВЕДЕНИЕ
Курс «Аудиотехника» является одним из основных в блоке
специальных дисциплин государственного образовательного
стандарта
высшего
профессионального
образования
по
специальности 201400 (210312) «Аудиовизуальная техника»
направления «Радиотехника».
Данное пособие является второй частью общего учебника
«Аудиотехника». Эта часть пособия является завершающей. В
основном, пособие составлено на основе учебника «Радиовещание
и электроакустика», написанного коллективом авторов под
редакцией Ю.А. Ковалгина, и учебного пособия «Цифровое
кодирование звуковых сигналов» авторов Ю.А. Ковалгина и Э.И.
Вологдина. Содержание пособия соответствует требованиям
государственного
образовательного
стандарта
высшего
профессионального
образования
по
специальности
«Аудиовизуальная
техника»,
направления
«Радиотехника»,
утвержденного
Министерством
образования
Российской
Федерации 17.03.2000 г.
В пособии рассматриваются методы и устройства
преобразования аналоговых и цифровых сигналов, форматы их
представления,
электроакустическая
и
радиовещательная
аппаратура радиодомов и телецентров, трактов первичного и
вторичного распределения программ, а также устройства измерения
и контроля в звуковом вещании. В соответствии с требованиями
государственного
образовательного
стандарта
высшего
профессионального
образования
по
специальности
«Аудиовизуальная техника» в пособие добавлены разделы о
звуковых мультимедийных картах и электромузыкальных
инструментах.
ЦИФРОВОЕ ПРЕДСТАВЛЕНИЕ ЗВУКОВЫХ СИГНАЛОВ
Аналого-цифровое преобразование
Среди методов цифрового представления ЗС наиболее
известна импульсно-кодовая модуляция (ИКМ). Процедура
преобразования аналогового сигнала в цифровой состоит из трех
операций: дискретизации по времени, квантования полученной
совокупности отсчетов и замены квантованных значений сигнала
последовательностью чисел (кодировании).
Аналоговый сигнал при аналого-цифровом преобразовании
представляется последовательностью чисел (цифр), которая при
обратном цифроаналоговом преобразовании преобразуется в
исходные непрерывные изменения напряжения во времени, т.е.
исходный аналоговый звуковой сигнал (ЗС). В простейшем случае
преобразование можно представить как результат измерения
мгновенных значений напряжения через постоянные промежутки
времени (дискретизации) с последующим преобразованием
полученной совокупности значений отсчетов в цифровую
последовательность чисел, каждое из которых может запоминаться
и далее подготавливаться для обработки и передачи.
Процесс аналого-цифрового преобразования звуковых
сигналов в цифровую последовательность показан на рис. 0.1. Здесь
в верхней части (рис. 0.1, а) изображен исходный аналоговый ЗС, в
средней части (рис. 0.1, б) — процесс дискретизации (по оси
ординат
отложены
величины
мгновенных
значений
дискретизированного сигнала в вольтах, а по оси абсцисс —
текущее время); в нижней части (рис. 0.1, в) дан результат
преобразования значений отсчетов в соответствующие им кодовые
слова (процедура кодирования), представленные на этом рисунке в
виде нулей и единиц. При этом строка «Передача» (или
«трансмиссия») соответствует кривой изменения напряжения во
времени при последовательной во времени цифровой передаче
полученной
последовательности
чисел
(кодовых
слов).
Естественно, при параллельной передаче каждая цифра нуждалась
бы в собственной шине (линии) данных.
Рис. 0.1 — Цифровое представление звуковых сигналов:
а — исходный аналоговый ЗС; б — представление непрерывного
сигнала дискретной последовательностью отсчетов; в — кодирование
отсчетов в двоичной системе счисления и передача кодовых слов
ступенчато изменяющимся во времени напряжением
В данном случае цифровое напряжение в каждой такой
отдельной линии изменялось бы с гораздо меньшей скоростью, чем
это показано на рис. 0.1, в. В устройстве, осуществляющем ИКМ
(рис. 0.2, а), входной сигнал s(t) ограничивается по полосе ФНЧ и
поступает в АИМ-модулятор, где происходит его дискретизация.
Выходной сигнал АИМ-модулятора представляет собой временную
последовательность отсчетов (рис. 0.1, б), отстоящих один от
другого на интервал времени Тд, называемый периодом
дискретизации.
Величина fд, обратная периоду (интервалу) дискретизации Тд
(fд = 1/Tд), называется частотой дискретизации. Сигнал,
показанный на рис. 0.1, б, называется дискретным. Спектр такого
сигнала (рис. 0.2, в) содержит низкочастотную компоненту
(заштрихованная область), тождественную по форме спектру
входного сигнала, и множество высокочастотных компонент,
каждая из которых состоит из двух боковых полос модуляции,
расположенных вокруг частоты дискретизации или ее гармоники.
Теоретически спектр такого колебания простирается до
бесконечности. В кодере (см. рис. 0.2, б) выходной сигнал АИМмо-дулятора квантуется по уровню и кодируется. Квантование и
кодирование,
как
правило,
осуществляются
общим
функциональным блоком, однако при анализе качественных
характеристик метода ИКМ удобно рассматривать эти операции
раздельно. Рассмотренная схема является простейшей. Реальные
ИКМ-преоб-разователи
содержат
и
некоторые
другие
функциональные
блоки,
уменьшающие
погрешности
преобразования, что будет рассмотрено позже.
Рис. 0.2 — Устройство, осуществляющее ИКМ (а), временная диаграмма
процесса ИКМ (б), спектр дискретизированного сигнала (в)
Дискретизация.
Значение
частоты
дискретизации
ограничивает разрешающую способность аналого-цифрового
преобразования во времени и, следовательно, наивысшую
возможную частоту на входе АЦП. Наглядной иллюстрацией этого
служит рис. 0.3. Процедура дискретизации с одной и той же
частотой fд представлена на рисунке одновременно для двух
тональных сигналов низкой (F1 — сплошная линия) и высокой (F2
— штриховая линия) частот. В обоих случаях после дискретизации
имеем идентичные временные последовательности значений
отсчетов. Следовательно, сигналы этих двух частот F1 и F2 нельзя
различить и после обратного преобразования правильно
восстановить (реконструировать).
Рис. 0.3 — К дискретизации аналогового сигнала
В соответствии с теоремой отсчетов В.А. Котельникова
неискаженная передача непрерывного (аналогового) сигнала с
полосой частот 0…Fmax дискретной последовательностью его
отсчетов возможна только в том случае, если частота fд связана с
максимальной частотой Fmax исходного сигнала соотношением:
(0.1)
Итак, если требуется передать синусоидальное колебание с
частотой 20 кГц, то требуемая частота его дискретизации должна
быть более 40 кГц, лишь в этом случае возможно точное
восстановление непрерывного сигнала. Все сигналы, частота
которых F > fд/2, при восстановлении интерпретируются
неправильно и трансформируются в сигналы более низкой частоты.
Дискретизированный сигнал можно представить в следующих
двух формах записи:
(0.2а)
(0.2б)
где s(t) — исходный аналоговый сигнал;
t — интервал (период, шаг)
Тд = t = const;
n = 0, 1, 2,...;
 (t) — функция Дирака;
 (т) — функция отсчетов, причем
дискретизации,
причем
(0.2в)
где n — моменты появления отсчетов ЗС.
При передаче ЗС или его обработке шаг дискретизации Tд не
обязан быть одним и тем же в разных трактах канала или на разных
стадиях обработки.
Рассмотрим теперь условия выбора частоты fд. Из рис. 0.2, б
следует, что чем больше fд по сравнению с Fmax, тем дальше в
спектре дискретизированного сигнала разнесены частоты Fmax и fд и
тем легче в ИКМ-демодуляторе отфильтровать полезный сигнал. В
то же время скорость цифрового потока при ИКМ прямо
пропорциональна значению fд. С точки зрения повышения
эффективности канала связи при передаче сигналов ЗВ желательно,
насколько это возможно, снизить fд.
Однако выбор слишком низкого значения может привести к
уменьшению допустимого значения Fmax и, как следствие, к
ухудшению качества передачи. Поэтому значение fд выбирают,
исходя
из
компромисса
между
требуемым
качеством
звуковоспроизведения и допустимой скоростью цифрового потока.
Влияют на выбор fд и системные факторы. Поскольку в системах
связи сигналы ЗВ кодируются и передаются совместно с другими,
например с телефонными сигналами, то частота дискретизации ЗС
должна быть кратна частоте дискретизации телефонного сигнала. В
противном случае в общей структуре цифрового потока системы
связи невозможно обеспечить передачу более широкополосных
сигналов ЗВ вместо нескольких телефонных. С учетом этих
соображений при АЦП сигналов ЗВ в цифровых трактах первичного
и вторичного распределений программ для ЗС с Fmax = 15 кГц
принято значение fд = 32 кГц, что соответствует учетверенному
значению fд для сигнала в телефонном канале.
В системах телевидения при передаче цифровых сигналов
звукового сопровождения во избежание биений между гармониками
строчной частоты и частоты дискретизации значение fд выбирается
кратным частоте строчной развертки. В трактах формирования
программ при Fmax = 20 кГц принято значение fд = 48 кГц, в лазерных
проигрывателях и бытовых магнитофонах fд = 44,1 кГц.
Борьба с погрешностями цифрового преобразования из-за
возможной нестабильности частоты дискретизации сводится к
ограничению полосы частот ЗС фильтрами с полосой пропускания
от 0 до Fmax на входе АЦП и выходе ЦАП и к выполнению
требования теоремы В.А. Котельникова. Предъявляются жесткие
требования к крутизне спада частотных характеристик ФНЧ за
пределами полосы пропускания и стабильности частоты тактовых
генераторов. Выполнение этих требований сегодня не вызывает
трудностей.
Квантование. При квантовании непрерывному множеству
мгновенных значений отсчетов аналогового сигнала ставят в
соответствие конечное множество значений — уровней
квантования. Иначе говоря, каждое значение отсчета заменяется
ближайшим к нему разрешенным значением. Расстояние между
соседними разрешенными уровнями квантования называют шагом
квантования. Процедуру квантования можно рассматривать как
результат прохождения входного сигнала через устройство с
амплитудной характеристикой ступенчатой формы (рис. 0.4),
которая называется характеристикой (или шкалой) квантования.
Если в пределах этой характеристики шаг квантования постоянен
(xi – xi–1 =  и уi – yi–1 = ), то квантование называют равномерным
(рис. 0.4, а). Этот простейший вид квантования широко
используется в цифровой технике. Он удобен для начального
цифрового представления ЗС с целью их последующей обработки, а
также последующего сокращения избыточности цифровых
сигналов при передаче их по каналам связи. Равномерное
квантование часто служит также первым этапом для последующего
неравномерного квантования.
Рис. 0.4 — Равномерная (а) и неравномерная (б)
характеристики квантования:
х — мгновенное значение сигнала на входе квантователя;
у — мгновенное значение сигнала на выходе квантователя
Наряду с частотой дискретизации точность передачи сигнала
при его цифровом представлении зависит от того, как далеко
отклоняется последовательность чисел после АЦП от истинных
значений исходного аналогового сигнала (рис. 0.5, а). Квантование
сигналов неизбежно сопровождается погрешностью. Разность
между исходными и квантованными значениями отсчетов
изображена на рис. 0.5, б. Этот сигнал ошибок называют шумом
квантования. Чем меньше величина шага  при квантовании
отсчетов дискретизированного сигнала, тем меньше по уровню этот
шум квантования. Он возникает в результате детерминированного
нелинейного преобразования входного сигнала и имеет
неслучайный характер. Поэтому при квантовании правильнее
говорить об искажениях, а не о шумах квантования.
Рис. 0.5 — К появлению шумов квантования:
а — квантование непрерывного сигнала; б — изменяющаяся
во времени разность между мгновенными и квантованными
значениями сигнала (погрешность квантования)
Характеристика квантования (см. рис. 0.4, а) имеет две зоны:
квантования при ивх < Uогр и ограничения при ивх > Uогр. Зона
квантования является рабочей областью характеристики. В ее
пределах выполняется квантование сигнала. Если мгновенное
значение сигнала выйдет за пределы зоны квантования, то
выходное напряжение будет оставаться неизменным и равным
Uвых max независимо от значения uвх. Возникающие при этом
искажения имеют характер безынерционного ограничения сигнала
и считаются недопустимыми. Разность между исходным и
ограниченным сигналами называют шумом ограничения. Итак,
квантование — это безынерционно-нелинейное преобразование
сигнала, при котором (в отличие от дискретизации) сигнал нельзя
передать со сколь угодно малой ошибкой ни при каком конечном
шаге квантования.
Кодирование. Этой процедурой называют представление
каждого уровня квантования yi из множества {yi} (или каждого
квантованного значения отсчета s(i) из множества {s(i)}
соответствующей ему конечной кодовой группой символов,
называемой кодовым словом. Если код выбран и множество его
слов есть A, то операция кодирования представляет собой взаимно
однозначное отображение множества {s(i)} в множество А. Чаще
всего кодирование заключается в замене квантованного отсчета,
который можно рассматривать как некоторое число, его
представлением в двоичной системе счисления. Двоичные кодовые
слова имеют всего два кодовых символа 0 и 1. Число у в двоичной
системе счисления представляется в виде
(0.3)
где m — число разрядов (символов) в кодовом слове;
а — число, принимающее значение 0 или 1.
Разрядность двоичного кода т (число символов в кодовом
слове) ставится в зависимость от количества разрешенных уровней
квантования из множества {yi}, которое равно уmax.
Двоичным m-разрядным кодом можно представить 2т
различных кодовых слов и каждому числу из множества {yi}
должно соответствовать определенное кодовое слово. Поэтому
справедливо выражение
(0.4)
которым пользуются для согласованного выбора пары чисел т и
уmax.
Обычно в выражении (0.4) при первичном кодировании
принимают знак равенства. Из общего числа элементов множества
{yi} половина отводится для передачи мгновенных значений
положительных полуволн ЗС, а другая половина — для передачи
отрицательных полуволн. Каждая полуволна кодируется т – 1
двоичными разрядами.
Кодовая комбинация, соответствующая числу n, содержит
передаваемые последовательно символы ат–1, ат–2, ат–3,…,а0.
Необходимое для кодирования число разрядов при данном
максимальном числе уровней шкалы квантования nmax определяется
из выражения т= log2(nmax). Если кодовое слово содержит т
символов 0 и 1, то с помощью такого т-разрядного двоичного кода
можно закодировать числа до пmax = 2m. Так, при т = 7 имеем
максимальное число разрешенных уровней квантования, равное
nmax = 128, при т = 8 соответственно пmax = 256 и при т = 16
соответственно пmax = 65536.
Двоичные символы 0 и 1, входящие в состав кодовых слов,
называют битами. Это слово произошло от английского «bit»,
составленного из начальных и конечной буквы словосочетания
«binary digit», что в переводе с английского означает «двоичная
цифра». Биты в кодовом слове имеют разный вес. Наименьший вес
имеет младший бит a0, несущий информацию об одном шаге
квантования. Старший значащий бит am–1 несет информацию о 2m–1
шагах квантования и имеет наибольший вес. Пусть, например,
кодируется отсчет, имеющий уровень квантования п = 115, а
характеристика квантователя имеет максимальное число
разрешенных уровней квантования nmax = 256. В этом случае
кодовое слово будет иметь число разрядов т = log2 256 = 8 и
кодируемый квантованный отсчет сигнала записывается в
двоичной системе следующим образом:
(0.5)
и соответствующее ему кодовое слово имеет вид 01110011. Такой
код называют натуральным.
В цифровых системах связи и вещания распространены так
называемые симметричные коды. Они характеризуются тем, что
первый разряд кодового слова определяется полярностью сигнала,
а остальные разряды несут информацию об абсолютном значении
(модуле) кодируемого отсчета. Если кодируется сигнал
положительной полярности, то первым битом кодового слова
является 0, а если отрицательной полярности, то 1. Разнополярные
отсчеты, равные по абсолютному значению, в этом случае
отличаются только первым символом в кодовом слове.
Последовательность m-разрядных кодовых слов является
выходным сигналом аналого-цифрового преобразования. Обычно
при передаче и записи к выходному сигналу АЦП добавляется
дополнительная
информация,
служащая
для
повышения
достоверности передачи и синхронизации. При этом кодовые слова,
подвергаемые одновременной обработке, объединяются в блоки.
Порядок следования кодовых слов и отдельных символов в блоке
называется форматом кода.
Равномерное квантование
Одним из наиболее важных показателей цифровых систем
передачи аналоговых сигналов является величина отношения
мощности сигнала Рс к мощности шума квантования Рш кв на
выходе ЦАП.
Определим значение Рш кв для произвольной шкалы
квантования. Пусть сигнал с плотностью вероятности
распределения мгновенных значений во времени W(u) подвергается
квантованию в диапазоне изменения мгновенных значений от –Uогр
до +Uогр с шагом, величина которого может изменяться. Напомним,
что вероятность появления сигнала с уровнем, лежащим в пределах
i-го шага квантования, равна
(0.6)
где W{ui) — плотность вероятности для напряжения сигнала,
находящегося в середине рассматриваемого интервала; i — шаг
квантования в диапазоне изменения мгновенных значений сигнала
от ui–i/2 до ui+i/2. Мгновенная мощность шумов квантования,
развиваемая на сопротивлении в 1 Ом, равна квадрату ошибки
квантования, т.е. Рш кв = (u – ui)2, а часть этой мощности шума,
появляющейся при квантовании сигнала в пределах i-го шага,
составляет
(0.7)
или, с учетом выражения (0.6), имеем
Суммарная мощность шума
составляющих от каждого шага:
квантования
равна
(0.8)
сумме
(0.9)
При равномерной шкале квантования, когда все i равны, из
(0.9) имеем
(0.10)
Отсюда следует важный вывод: при равномерном квантовании
мощность шума квантования определяется исключительно шагом
квантования и не зависит от величины сигнала. Поэтому при
уменьшении уровня сигнала отношение мощности сигнала к
мощности шума квантования снижается.
Шум квантования представляет собой случайный процесс с
равномерным распределением в пределах от
Его
плотность вероятности описывается выражением
(0.11)
Спектр шума квантования равномерный в полосе частот
0...fд/2. Шум квантования появляется только при наличии сигнала.
При отсутствии сигнала на входе АЦП можно было бы ожидать,
что на выходе ЦАП шум будет полностью подавлен. Однако
наличие теплового шума входных аналоговых блоков АЦП,
нестабильность напряжения питания, переходные помехи от
соседних каналов, дрейф постоянной составляющей в усилителях
постоянного тока и действие других факторов приводят к тому, что
самый низкий первый уровень квантования достигается даже при
отсутствии ЗС на входе АЦП.
На рис. 0.6 изображен начальный участок шкалы квантования
и показано, как входные шумы преобразуются в АЦП в
квантованное колебание. На выходе ЦАП это квантованное
колебание превращается в шум, называемый шумом паузы. Шум
паузы менее равномерный, чем белый шум, характерный для
аналоговых систем. Его часто называют гранулированным.
Мощность шума паузы Рш п = 2/4, т.е. на 4,7 дБ больше шума
квантования (0.10).
Определим отношение сигнал/шум (С/Ш) на выходе
квантующего устройства. Поскольку величина Рш кв не зависит от
уровня входного сигнала, то с увеличением мощности входного
сигнала Рс отношение Рс/Рш кв линейно растет до тех пор, пока не
возникнет шум ограничения.
Рис. 0.6 — Преобразование входных шумов
в квантованное колебание в АЦП
Его появление резко уменьшает помехозащищенность
сигнала. Поэтому система кодирования строится так, чтобы
ограничения сигнала практически не возникало. Для этого порог
ограничения квантующего устройства должен быть равен
квазимаксимальному значению сигнала, т.е.
(0.12)
Здесь k — значение пик-фактора сигнала; Uср —
среднеквадратическое значение сигнала. Число шагов квантования
п можно определить при известных величинах Uorp и по формуле
(0.13)
Подставив (0.12) и (0.11) в (0.8), получим
.
(0.14)
Поскольку на сопротивлении 1 Ом мощность сигнала
Рс = U2cp, то из (0.14) следует, что
(0.15)
или в децибелах это выражение преобразуется к виду
.
При m-разрядном кодировании, учитывая, что
преобразуем (0.16) к виду
.
(0.16)
n = 2m,
(0.17)
Из (0.17) видно, что при равномерном квантовании в случае
увеличения числа разрядов т на единицу отношение С/Ш
повышается на 6 дБ. В то же время, переход, например, от 14-разрядного кодового слова к 15-разрядному означает увеличение
скорости передачи цифрового ИКМ-сигнала (vnep = fmД) всего лишь
на 7 %. Это свойство является важнейшей особенностью ИKM с
равномерным квантованием; ни один другой способ кодирования
не позволяет так заметно улучшать помехозащищенность ЗС за
счет сравнительно небольшого увеличения скорости передачи.
При равномерной шкале квантования и гармоническом
сигнале, для которого, как известно, значение пик-фактора k  2 ,
отношение С/Ш квантования, дБ, на выходе квантующего
устройства определяется соотношением (0.17)
.
(0.18)
Для сигнала ЗС значение пик-фактора зависит от жанра
программы и меняется в пределах от 7 до 25 дБ. В среднем
считают, что он равен 12…15 дБ, поэтому для вещательных
сигналов имеем [см. (0.17)]
.
(0.19)
Заметим, что это выражение не учитывает неодинаковой
чувствительности слуха к составляющим шума разных частот,
определяемой псофометрическим коэффициентом. С его учетом
отношение РС/Рш кв еще уменьшается на 8,5 дБ для
широкополосного ЗС с полосой частот 15 кГц и составляет [см.
(0.19)]
.
(0.20)
Для избежания ограничения сигнала его квазипиковое
значение не должно превышать порога ограничения квантователя.
Обычно его выбирают меньшим на величину и = 6…10 дБ.
На рис. 0.7, а представлены зависимости отношения
сигнал/шум (Рс/Рш кв, дБ) для сигналов ЗВ при разных значениях m
от относительного изменения уровня сигнала на входе. Здесь по
оси абсцисс отложена разность между входным уровнем Nc и его
квазимаксимальным значением NCKBmax, дБ. Результаты очевидны
[см. (0.20)] и не требуют пояснения.
Рис. 0.7 — Отношение сигнал/шум при равномерном кодировании (а)
и реальный динамический диапазон ЗС при АЦП (б)
Выражение для отношения С/Ш определяет в конечном итоге
значение максимального динамического диапазона ЗС, который
может быть передан по цифровому каналу без появления
искажений. На практике в трактах формирования программ
звукозаписи обычно используется 16-разрядное равномерное
квантование. При разрядности т кодового слова, равной 16 битам
(размер кодового слова системы компакт-диска), формула (0.18)
дает нам значение 97,8 дБ. Однако отсюда следует вычесть
величину, приблизительно равную 1,5…2,0 дБ, определяющую
дополнительные погрешности, свойственные аналого-цифровому и
цифроаналоговому преобразованиям. Далее, в соответствии с
Рекомендацией CCIR, эту величину с учетом пик-фактора следует
уменьшить еще на 12 дБ (при пересчете уровня мощности шумов
квантования в величину, соответствующую получаемой при
измерении). Для защиты канала от возможного превышения
максимального уровня это значение уменьшают еще на 10 дБ. И
наконец, чтобы избежать слишком больших погрешностей при
квантовании низких уровней сигнала и обеспечить при обратном
преобразовании маскировку шумов квантования полезным
сигналом, его уровень должен превышать уровень шумов по
крайней мере на 20 дБ. С учетом изложенных соображений
получаем, что при т=16 значение динамического диапазона
исходного ЗС на входе цифрового тракта в этом случае не должно
превышать Dс = (6m+1,8) – (1,5…2,0) – 12 – 20 = 54 дБ (рис. 0.7, б).
Напомним, что после обработки звукорежиссером динамический
диапазон ЗС обычно не превышает 40 дБ в радиовещании и 50 дБ
при высококачественной звукозаписи, например на компакт-диск.
При 16-разрядном кодировании и частоте дискретизации
fд = 48 кГц скорость передачи цифрового потока vпер = тfд составит для
монофонического сигнала vпер M = 1648 = 768 кбит/с, а для
стереофонического — соответственно vпер ст = 2 (1648) = 1536 кбит/с.
При fд = 44,1 кГц имеем соответственно vпер м = 705 кбит/с и vпер ст =
= 1411,2 кбит/с.
И последнее важное замечание. Общее разрешение АЦП
ограничено как числом возможных ступеней квантования, так и
временной точностью при дискретизации непрерывного сигнала.
Если мгновенное значение сигнала изменяется очень быстро, то
очевидно, что положение временной точки дискретизации
существенно влияет на значение соответствующего ей отсчета. Так,
ошибка в значении отсчета при частоте сигнала 1 кГц и временной
неточности дискретизации, равной 160 мкс, соответствует ошибке
квантования при 10-битовом разрешении. Очень трудно изготовить
аналого-цифровой преобразователь с высокой точностью
квантования и дискретизации. При непосредственном прямом АЦП
с 16-разрядным разрешением и числом возможных уровней
квантования, равным 65536, необходимо, чтобы сравниваемые в
АЦП постоянные напряжения были бы очень точными. Это трудно
выполнить, так как при максимальном значении амплитуды
входного сигнала UCKBmax = 1 В для каждой отдельной ступени
квантования требуется точность не менее 0,00001 В. Такая точность
должна быть реализована в полосе частот ЗС, равной по меньшей
мере 20 кГц.
Проблема реализации требуемой точности при аналогоцифровом преобразовании может быть упрощена, если
использовать АЦП и ЦАП с более низкой разрядностью в
сочетании с методом дельта-модуляции, являющимся одной из
разновидностей дифференциальной ИКМ (ДИКМ). Простейший
вариант дельта-модулятора изображен на рис. 0.8, а. Он содержит
устройство дискретизации (УД) аналогового сигнала, компаратор К
и интегратор И, являющийся простейшим предсказателем. Здесь
осуществляется однопороговое квантование не самого сигнала, а
разности между отсчетом входного сигнала s(θ) и его
предсказанным значением s*(θ), имеющим вид ступенчатой
функции (рис. 0.8, б).
Рис. 0.8 — Дельта-модуляция и шум квантования:
а — структурная схема дельта-модулятора (УД — устройство дискретизации
ЗС, К — компаратор, И — интегратор); б — входной сигнал (сплошная
кривая) и повторяющая ее ступенчато-изменяющаяся функция
На выходе компаратора имеем цифровой сигнал. Его значение
соответствует 0, если разность двух сигналов на входе компаратора
меньше некоторого порогового значения, и соответствует 1, если
она превышает это пороговое значение. Для ЗС с ограниченной
скоростью изменения мгновенных значений условие малости
приращений ступенчатой функции (рис. 0.8, б), а следовательно, и
малых шумов квантования будет выполнено, если частота
дискретизации fдо в несколько раз превышает значение fд,
необходимое по теореме В.А. Котельникова. Повышение частоты
дискретизации при соответствующей частоте среза ФНЧ приводит
к уменьшению уровня шумов квантования в полосе частот
полезного сигнала. Это уменьшение связано с тем, что при
равномерном квантовании мощность шума квантования [см. (0.10)]
зависит только от шага квантования, а спектральная плотность
шума квантования
(0.21)
тем меньше, чем выше частота дискретизации fдо/2π. При этом
выигрыш в отношении сигнал/шум квантования может быть
реализован, если в тракт «кодер-декодер» введен ФНЧ с частотой
среза Fcp = fд/2. Тогда мощность шума квантования в полезной
полосе частот
(0.22)
где fд — частота дискретизации, определяемая теоремой отсчетов
В.А. Котельникова.
Кодирование ЗС с повышенной частотой дискретизации имеет
и другие достоинства. Оно полностью исключает эффект
наложения спектров полезного сигнала и продуктов модуляции (см.
рис 0.2, в), что обеспечивает отсутствие комбинационных частот
вида Fc ± k(fдо – Fc) при последующей фильтрации. Отпадает также
необходимость применения аналоговых ФНЧ высокого порядка на
входе кодера и выходе декодера. Поэтому кодер имеет хорошие
переходные характеристики и малое групповое время запаздывания
при малой его зависимости от частоты.
Однако для реализации выигрыша в величине шума
квантования и перехода к стандартному значению частоты
дискретизации (48 или 32 кГц) необходимо ограничить полосу
частот с одновременным понижением fдо до значения fд. Для этого к
выходу кодера подключается цифровой фильтр — дециматор. На
входе декодера целесообразно проводить обратную операцию —
интерполяцию отсчетов. В кодерах с использованием ДИКМ
разрядность АЦП тем меньше, чем выше частота дискретизации и
чем больше отсчетов учитывается при определении предсказанного
значения. При этом отличие ступенчатой функции от сигнала будет
наименьшим (см. рис. 0.8, б).
В заключение напомним, что в канале передачи большой
динамический диапазон сигнала можно заменить также на более
широкую полосу частот. Напомним, что объем сигнала
,
(0.23)
где Тс — длительность сигнала (интервал времени, в течение
которого сигнал существует);
Fc — ширина спектра (диапазон частот, в котором
сосредоточена его энергия);
D'c — динамический диапазон (отношение наибольшей
мгновенной мощности сигнала к наименьшей мощности, которую
необходимо еще отличать от нуля).
Неравномерное квантование
Общие сведения
Наряду с равномерным (линейным) квантованием, при
котором шаг квантования постоянен в пределах всего
динамического диапазона изменения уровней, существует
возможность согласования величины шага квантования с
амплитудой сигнала. При этом для малых уровней сигнала
величина шага квантования может быть малой, а для больших —
соответственно более грубой. Правда, в этом случае вместе с
изменением величины сигнала и соответственно шага квантования
меняется и мощность шумов квантования: она возрастает с ростом
амплитуды сигнала. Неравномерное квантование позволяет
обеспечить требуемое высокое отношение С/Ш для слабых
сигналов и определенное его уменьшение для сильных сигналов.
Очевидно, что значение Рс/Рш кв должно быть во всем диапазоне
изменения уровней таким, чтобы шумы квантования оставались бы
неслышимыми. Если использовать логарифмическую зависимость
между выходным и входным сигналами, то можно поддерживать
отношение С/Ш квантования ниже заданной границы как для
малых, так и для больших сигналов. Неравномерное квантование
позволяет уменьшить требуемое число разрядов в кодовом слове
при кодировании отсчетов и тем самым снизить скорость передачи.
Наиболее распространены два способа формирования
неравномерной шкалы квантования: мгновенное и почти
мгновенное компандирование.
Мгновенное компандирование
Устройство, реализующее неравномерное квантование с
использованием мгновенного компандирования (рис. 0.9), состоит
из последовательно включенных сжимателя Сж, квантующего
устройства КУ с равномерной шкалой квантования и расширителя
Расш. Итак, для реализации неравномерного квантования
используется уже известная нам компандерная система.
Рис. 0.9 — Структурная схема устройства для неравномерного
квантования ЗС
Нормализованная характеристика сжатия D показана на рис.
0.10, а (кривая 1). Сигнал с выхода сжимателя подвергается
равномерному квантованию. Кривая 1 показывает, что
квантованию этого сигнала с равномерным шагом  соответствует
неравномерное квантование ЗС с шагом н. Расширитель
включается на приемной стороне цифрового тракта после ЦАП.
Амплитудная характеристика расширителя (рис. 0.10, а, кривая 2)
обратна характеристике сжимателя, и расширитель должен
скомпенсировать искажения, внесенные в сигнал сжимателем.
Иными словами, коэффициенты передачи сжимателя Ксж и
расширителя Kрасш для любых входных уровней ЗС должны быть
связаны соотношением КсжКрасш = 1. Применяемый здесь
сжиматель является безынерционным устройством мгновенного
действия.
Рис. 0.10 — Нормализованные амплитудные характеристики
сжимателя и расширителя (а); отношение С/Ш квантования
в функции от уровня сигнала на входе компандерной системы:
1 — без использования компандера, 2 — с использованием компандера при
128 уровнях квантования (б); к построению оптимальной характеристики
компрессии (в); характеристики компрессии для разных значений
коэффициента сжатия (г)
Выигрыш, получаемый от использования сжимателя, т.е.
увеличение отношения С/Ш, тем больше, чем больше наклон
начального участка кривой сжатия в сравнении с прямой,
проходящей под углом 45°. Поскольку кривая должна проходить
через точки с координатами (0,0) и (1,1), то очевидно, что на какомто (начальном) участке тангенс угла наклона кривой больше 1, а на
другом (конечном) — соответственно меньше единицы. Это
означает, что увеличение отношения С/Ш квантования на
некотором участке возможно только ценой уменьшения этого
отношения на другом участке. Поскольку в случае деления всего
диапазона на интервалы равной ширины отношение С/Ш
квантования мало при низких уровнях сигнала и относительно
велико при высоких уровнях сигнала, то кривые сжатия D,
определяющие увеличение отношения С/Ш квантования, имеют
наибольшую крутизну наклона вблизи нуля. Крутизна наклона
постепенно убывает по мере роста уровня сигнала, что влечет за
собой уменьшение отношения С/Ш квантования для сигналов с
высокими уровнями (рис. 0.10, а, кривая 1).
Выигрыш от применения компандера показан на рис. 0.10, б. По
оси абсцисс отложен уровень сигнала на входе, по оси ординат —
отношение С/Ш квантования. Прямая 1, наклоненная под углом 45°
к оси абсцисс, представляет собой отношение С/Ш квантования для
случая деления всего диапазона уровней на 128 интервалов
постоянной ширины и при отсутствии компандерной системы.
Кривая 2 также соответствует случаю деления динамического
диапазона на 128 интервалов, но с использованием компандерной
системы.
Из рис. 0.10, б следует, что применение компандера дает
выигрыш в отношении С/Ш для сигналов с низкими уровнями,
пока NBX < NBX1, и уменьшение этого отношения при NBX > NBX1.
Выигрыш от компандирования (см. рис. 0.10, а) имеет место, пока
сигнал на входе компандерной системы изменяется в пределах
0 < х < х1, изменяясь от максимума при х = 0 до нуля при х = х1,
а затем принимая отрицательные значения, т.е. вызывая
уменьшение отношения С/Ш в области, где х > x1, тем больше, чем
больше х.
Определим оптимальный закон сжатия D, при котором
отношение С/Ш квантования будет оставаться постоянным в
наибольшем диапазоне изменения входных уровней. При некотором
входном сигнале ивх шаг неравномерного квантования (рис. 0.10, б)
,
(0.24)
где duвыхx/duвх — производная характеристики компрессии.
Используя выражение (0.10), для входного уровня NBX и
соответствующего ему шага квантования н получаем
.
(0.25)
Из (0.25) следует, что Рс/Рш кв будет оставаться постоянным,
если шаг квантования возрастает пропорционально напряжению
сигнала на входе. Такая шкала квантования называется
пропорциональной, и для нее имеем [см. (0.24) и (0.25)]:
.
(0.26)
Решение полученного дифференциального уравнения дает
оптимальную характеристику сжатия D вида
,
(0.27)
где с и μ — постоянные интегрирования. Устройство с такой
характеристикой физически нереализуемо, поскольку при uвых  
имеем uвх  0. По этой причине на практике используют два
других закона сжатия D, несколько отличающихся от
оптимального, но достаточно близких к нему — это законы μ и А.
При μ-законе выходное и входное напряжения сжимателя
связаны зависимостью вида
(0.28)
где μ — значение коэффициента сжатия D в соответствии с
Рекомендациями МККТТ равно 100 при цифровом представлении
речевых сигналов телефонии и 15 при кодировании ЗС
радиовещания и телевидения. Форма этой характеристики для
разных значений μ показана на рис. 0.10, г. Отношение
максимального шага квантования к минимальному при
использовании μ-характе-ристики будет
.
(0.29)
Различие между mах и min тем больше, чем больше
коэффициент сжатия μ. Поэтому выбор значения μ оказывает
большое влияние на отношение С/Ш квантования. Увеличение μ
улучшает отношение Рс/Рш кв для слабых сигналов и ухудшает для
сильных. Уравнение (0.28) определяет характеристику сжатия D в
первом квадранте, в третьем квадранте она строится симметрично
относительно точки с координатами (0,0). Кроме сжатия D по μ-закону, в ЗВ часто применяют сжатие по А-закону вида
,
(0.30)
где А — число, равное 87,6 в многоканальных системах передачи.
При этом сигналы, напряжение которых меньше uвх < uвх mах/А,
квантуются с постоянным шагом; при ивх > uвх mах /А сигналы
квантуются неравномерно с шагом, изменяющимся по
логарифмическому закону. При этом при А-законе характеристика
отношения Рс/Рш кв оказывается более плоской, чем при μ-законе.
В настоящее время в системах кодирования ЗС отказываются
от аналоговых компандеров, заменяя их цифровыми. В последних
плавная характеристика сжатия D заменяется линейно-ломанной
аппроксимирующей функцией. В зависимости от числа
используемых сегментов (отрезков прямых линий) при
аппроксимации и вида закона сжатия эту линейно-ломанную
зависимость обозначают буквой и двумя цифрами.
Например, запись А 87,6/11 означает, что используется
аппроксимация
по
А-закону
при
А = 87,6
с
11-ю
аппроксимирующими отрезками или сегментами (рис. 0.11, а).
Запись μ 15/11 означает, что используется характеристика сжатия D
по μ-закону при μ = 15 с ее аппроксимацией 11-ю отрезками
прямых линий (рис. 0.11, б). В пределах каждого сегмента шаг
квантования постоянен, но при переходе от одного сегмента к
другому возрастает в 2 раза. Число уровней квантования в пределах
каждого сегмента постоянно.
Процедура кодирования каждого отсчета в этом случае
состоит в следующем. Вначале определяется полярность сигнала и
в зависимости от нее формируется символ первого разряда (0 или
1) кодового слова. Затем кодируется в двоичном коде номер
сегмента, в пределах которого находится уровень входного сигнала.
Для кодирования номера сегмента нужны трехразрядные кодовые
комбинации. Далее кодируется уровень сигнала в пределах
сегмента. Если число таких уровней равно 64 (как при 11-сегментном кодировании, показанном на рис. 0.11), то для кодирования
номера уровня необходима шестиразрядная кодовая комбинация.
Рис. 0.11 — Кусочно-линейная аппроксимация характеристик компрессии: а
— при компрессии по А-закону с 11-ю аппроксимирующими сегментами; б
— при компрессии по μ-закону с 11-ю аппроксимирующими сегментами
(части характеристик, находящиеся в третьем квадранте, не показаны)
Общее число разрядов в кодовом слове при этом равно 10, и
структура кодового слова выглядит так: первый разряд определяет
полярность сигнала, следующие три — номер сегмента и последние
шесть — номер уровня в пределах сегмента. В качестве примера на
рис. 0.12 приведена зависимость отношения Рс/Рш кв от
относительного изменения уровня тонального сигнала на входе
(Nc – Nc max) при отсутствии сжатия D (прямая 1), 12-сег-ментной
аппроксимации по А-закону (кривая 2) и 11-сегментной
аппроксимации по μ-закону (кривая 3) характеристик компрессии.
При этом равномерное квантование здесь — 14-разрядное, а
неравномерное — 11-разрядное.
Из рис. 0.12 видно, что для низких входных уровней
приведенные зависимости совпадают, поскольку шаг квантования
является постоянным и равным. Для средних и больших уровней
отношение С/Ш квантования при сжатии D компрессии остается
примерно постоянным (кривые 2 и 3) и достаточно высоким. Таким
образом, компрессия позволяет снизить разрядность кодового слова
с 14 до 11 (14/11) и, как следствие, понизить скорость цифрового
потока примерно на 20 % по сравнению со случаем равномерного
квантования.
Рис. 0.12 — Зависимость отношения сигнал/шум квантования
от относительного изменения уровня сигнала на входе
Итак, при полосе частот передаваемого ЗС, равной 15 кГц, при
fд = 32 кГц, и m = 11 скорость цифрового потока составит 352 кбит/с
для монофонической передачи и 704 кбит/с для стереофонии при
использовании двух равноценных каналов. Заметим, что здесь не
учтены дополнительные биты, которые обычно вводятся для
обнаружения и исправления ошибок. Их наличие несколько
повышает требуемую для передачи высококачественных сигналов
ЗВ скорость цифрового потока.
Почти мгновенное компандирование
При почти мгновенном компандировании обычно используют
пять различных шкал квантования с равномерным шагом внутри
каждой шкалы и изменяющимся при переходе от одной шкалы к
другой (рис. 0.13). Выбор той или иной шкалы определяется
значением максимального уровня сигнала за время, равное 1 мс.
Минимальный шаг квантования имеет шкала 5 (диапазон 0),
максимальный — шкала 1 (диапазон 4). Число шагов квантования у
каждой из шкал одинаково и равно 512 для одной полярности
сигнала. Поэтому кодовые слова, соответствующие каждому
отсчету, содержат 10 разрядов.
Рис. 0.13 — Характеристики почти мгновенного компандирования
с компрессией от 14 до 10 бит/отсчет
Процедура кодирования состоит в следующем. Сначала ЗС
кодируется при минимально возможном шаге квантования с
разрешающей способностью 14 бит/отсчет, при этом используется
стандартная ИКМ с равномерной шкалой квантования и частотой
дискретизации 32 кГц. Выборки из 32 отсчетов 14-разрядных слов,
что соответствует длительности сигнала в 1 мс, запоминаются, а
затем, в зависимости от наибольшего значения отсчета, внутри
каждой выборки четыре разряда из 14 отбрасываются. Для самых
малых уровней (диапазон 0, см. рис. 0.13) отбрасываются четыре
старших разряда. Отбрасывание одного младшего и трех старших
разрядов соответствует увеличению шага квантования в 2 раза
(диапазон 1), двух младших и двух старших — в 4 раза (диапазон
2), трех младших и одного старшего — в 8 раз (диапазон 3) и,
наконец, четырех младших — в 16 раз (диапазон 4, шкала 1).
Таким образом, при почти мгновенном компандировании шаг
квантования зависит не от мгновенного значения сигнала, а от его
максимального значения на интервале времени, равном 1 мс.
Для правильного восстановления на приемной стороне
абсолютного значения каждого отсчета каждый блок из 32 отсчетов
сопровождается служебной комбинацией из 3 бит, определяющей,
какая из шкал квантования использовалась при передаче всех
отсчетов этого блока. При этом полная скорость передачи
оказывается равной 323 кбит/с на моноканал, а отношение
сигнал/шум квантования на 3 дБ лучше, чем при 11-разрядном
кодировании с мгновенным компандированием.
В заключение отметим, что в соответствии с Рекомендацией
660 МККР целесообразно использовать для первоначального
представления сигналов ЗВ стандартную ИКМ с равномерным
квантованием при разрешающей способности 14 бит/отсчет с
последующим цифровым компандированием, применяя при этом
преобразовании либо 11-сегментное 14/11 бит мгновенное
компандирование по А-закону с характеристикой компрессора,
показанной на рис. 0.11, а, либо 5-диапазонное 14/10 почти
мгновенное компандирование с характеристикой компандирования,
изображенной на рис. 0.13.
С учетом дополнительных бит, необходимых для обнаружения
и исправления ошибок, могущих возникать при цифровой передаче
ЗС, общая скорость цифрового потока при передаче
высококачественного ЗС с полосой частот 15 кГц и частотой
дискретизации 32 кГц должна составлять 384 кбит/с (моно) и 768
кбит/с (при стереопередаче, где используются два отдельных канала).
Эта скорость может быть снижена до 320 кбит/с на один
высококачественный канал (Рекомендация 719 МККР). В этом
случае компандирование исходного цифрового сигнала с частотой
дискретизации 32 кГц при равномерном 14-разрядном кодировании
должно выполняться в три этапа:
а) почти мгновенное компандирование с 5-диапазонной
характеристикой компрессии и снижением разрядности от 14 до 10
бит (см. рис. 0.13);
б) разделение отсчетов s(n) на две последовательности —
нечетных s(2n+1) и четных s(2n) отсчетов и вычисление разности
(2n) по формуле
(2n) = s(2n) – [s(2n + 1) + s(2n – 1)]/2;
(0.31)
в) дополнительное почти мгновенное компандирование
разностного сигнала (2n) с 3-диапазонной характеристикой
компрессии (рис. 0.14) и снижением разрядности с 11 до 9 бит. С
учетом дополнительных бит для обнаружения и исправления
ошибок скорость цифрового потока в этом случае составит 320
кбит/с на один канал передачи высококачественного сигнала ЗВ.
Возможна также цифровая передача ЗС по каналам связи в
соответствии с Рекомендацией 718 МККР. При этом исходный
цифровой сигнал при частоте дискретизации, равной 32 кГц, и
разрешающей способности АЦП при равномерном квантовании,
равной 16 битам, преобразуется путем компандирования в 14-битовые слова методом плавающей запятой. Длина кодового блока
здесь 2 мс (64 последовательных отсчета на блок), используется
восемь шкал квантования, коэффициенты масштабирования
передаются 3-битовым словом. Схема метода кодирования 16/14 с
плавающей запятой изложена в п. 0.10. С учетом дополнительных
бит для защиты от ошибок, синхронизации и передачи служебных
данных полная скорость цифрового потока при передаче составляет
в этом случае 496 кбит/с на моноканал.
Рис. 0.14 — Характеристики почти мгновенного
компандирования с компрессией от 11 до 9 бит/отсчет
Далее будут описаны другие более совершенные методы
сокращения скорости передачи цифровых сигналов ЗВ по каналам
связи.
Предыскажения при цифровой передаче сигналов звукового
вещания
При малом шаге квантования, характерном для систем с ИКМ,
спектр шума квантования оказывается равномерным в полосе частот
от нуля до 1/2fд. Напомним, что спектр реальных ЗС имеет обычно
значительный спад в области верхних частот и при передаче через
цифровую
систему
музыкальных
пассажей,
исполняемых
инструментами, спектр которых лежит преимущественно в области
высоких частот, отношение С/Ш заметно уменьшается по сравнению
с максимальным значением. Для борьбы с этим явлением применяют
частотные предыскажения сигнала на стороне передачи и его
восстановление после декодирования. В соответствии с
Рекомендацией 651 МККР при линейном кодировании с 14-би-товым
разрешением, а также при нелинейном кодировании с почти
мгновенным компандированием для уменьшения разрядности с 14 до
10 бит высококачественных сигналов ЗВ с полосой 15 кГц
предыскажения должны соответствовать Рекомендации J17 МККТТ с
вносимым затуханием 6,5 дБ на частоте 0,8 кГц (рис. 0.15, кривая 1)
или предыскажениям 50/15 мкс (рис. 0.15, кривая 2).
Рис. 0.15 — Характеристики предыскажений:
1 — Рекомендация МККТТ J17; 2 — для 50/15 мкс
Представленные здесь кривые соответствуют формулам:
а) кривая 1 (Рекомендация J17 МККТТ):
(0.32)
б) кривая 2 (для 50/15 мкс):
,
(0.33)
где К — коэффициент передачи, дБ; ω = 2πF — круговая частота; F
— частота, Гц. В Районе 1 предпочтительнее использование
предыскажений в соответствии с Рекомендацией МККТТ J17. На
стороне приема эти частотные предыскажения компенсируются
восстанавливающим контуром, поэтому частотные искажения на
выходе системы отсутствуют. Шум квантования проходит только
через восстанавливающий контур, в то время как ЗС — через обе
цепи внесения и коррекции предыскажений. В результате
отношение С/Ш выравнивается по спектру, субъективно
улучшается восприятие высокочастотных компонент сигнала ЗВ.
Количественно величина отношения Рс/Рш кв возрастает примерно
на 4 дБ.
Цифроаналоговое преобразование
Для восстановления исходной кривой изменения во времени
аналогового напряжения ЗС цифровая последовательность чисел
(рис. 0.16, а) должна быть преобразована. Восстановленные в
результате обратного преобразования (рис. 0.16, б) значения
отсчетов сохраняются как постоянные значения напряжений вплоть
до следующего отсчета (см. ступенчато-изменяющуюся функцию
на рис. 0.16, б). Эта ступенчатая функция, кроме восстановленного
тонального сигнала, содержит также множество гармонических
составляющих.
При частоте fд = 44,1 кГц полученная последовательность
отсчетов дискретизированного сигнала, описываемая выражением
(0.2), имеет спектр, показанный на рис. 0.17, а. Высокочастотные
составляющие ступенчатой функции, представляющие собой
продукты
нелинейных
искажений,
должны
быть
при
восстановлении исходного сигнала отфильтрованы, чтобы
получить результат, показанный на рис. 0.16, в. Если спектр
входного сигнала простирается до 20 кГц, то для этой цели
требуется ФНЧ с частотой среза 20 кГц. При этом все
составляющие, лежащие выше этой частоты, должны быть надежно
отфильтрованы. Такой ФНЧ может быть реализован как
аналоговым, так и цифровым способом, однако последний является
более предпочтительным.
Рис. 0.16 — К пояснению цифроаналогового преобразования:
а — исходная цифровая последовательность; б — восстановленные
значения отсчетов после обратного преобразования (ступенчато
изменяющаяся функция напряжения); в — восстановленный аналоговый
сигнал
Эта фильтрация может быть упрощена, если повысить частоту
дискретизации восстановленных отсчетов. В этом случае спектр
продуктов искажений также сместится в сторону более верхних
частот. При повышении частоты дискретизации в 4 раза (с 44,1 до
176,4 кГц) спектр продуктов искажений начинается уже только от
частоты f = 176,4 – 20 = = 156,4 кГц; их фильтрация может быть
выполнена очень простыми средствами (рис. 0.17, б).
Рис. 0.17 — Спектр дискретизированного сигнала при обычной (а)
и повышенной частоте дискретизации (б)
Поэтому обычно на цифровом уровне рассчитывают
промежуточные значения отсчетов при преобразовании цифрового
сигнала в аналоговый. При расчете трех дополнительных значений
отсчетов на один отсчёт сигнала при fд = 44,1 кГц (например,
цифровым фильтром), получается увеличение в 4 раза первой
средней частоты мешающего спектра, значение последней
составляет fдо = 176,4 кГц (так называемая четырехкратная
избыточная дискретизация). При этом на приемной стороне
цифровым фильтром подавляются все возможные частотные
компоненты в полосе частот примерно от 20 до 156 кГц. Важно,
чтобы эти дополнительные значения отсчетов рассчитывались
корректно. В этом случае на аналоговом выходе ЦАП нужно сначала
подавить в полной мере очень высокие частоты, начиная примерно с
f = 150 кГц. Эта задача разрешается достаточно просто.
Отметим, что без потери точности при обратном
цифроаналоговом преобразовании 16-битового слова с частотой
дискретизации 44,1 кГц можно использовать при повышении
частоты следования отсчетов до 176,4 кГц 14-битовое обратное
преобразование, т.е. в самом преобразователе отбросить два
последних разряда от первоначального 16-битового кодового слова.
При вычислении дополнительных промежуточных отсчетов
учитывают 15-й и 16-й биты так, что среднее значение из четырех
отсчетов с 14-тью битами и частотой дискретизации 176,4 кГц
соответствует значению первоначального 16-битового числа. Этот
способ называют «noise-shaping».
Изготовить ЦАП с достаточной точностью восстановления
исходных значений ЗС, малой нелинейностью и другими
погрешностями менее чем в 1/2 бита трудно. Однако это
необходимо, если хотят достигнуть теоретически возможной
точности. Правда, технически проще изготовить ЦАП, чем АЦП. О
трудности реализации высокоточных АЦП уже было сказано ранее
(см. разд. 0.1). Повышение частоты дискретизации в обоих случаях
дает ряд преимуществ. Кроме более простой фильтрации,
преимущество избыточной (повышенной) частоты дискретизации
(как об этом уже было сказано ранее в разд. 0.1) состоит в том, что
частотный спектр шума распределяется в этом случае на больший
частотный диапазон и таким образом доля шумов, приходящаяся на
полосу частот ЗС, становится меньше, что является важным
достоинством данного метода.
Обратим внимание еще на одну особенность восстановления
(реконструкции) исходного сигнала при повышенной частоте
дискретизации. Если рассмотрим рис. 0.18, то увидим
изображенный толстой линией исходный сигнал (оригинал) с более
чем удвоенной частотой дискретизации и его восстановленную
«копию» из соседних значений отсчетов (тонкая линия на рис. 0.18)
с явно недостаточным качеством.
Рис. 0.18 — К появлению искажений по фазе и амплитуде при
восстановлении исходного сигнала с повышенной частотой
дискретизации
Восстановленный из отсчетов сигнал сильно искажен
модуляцией по амплитуде и фазе. Причина появления этих
искажений состоит в том, что кривая восстановлена
(реконструирована) покусочно лишь из двух соседних значений
отсчетов и наблюдаются биения, вследствие изменяющегося во
времени различия фаз между исходным сигналом и сигналом
тактовой частоты. Для повышения точности цифроаналогового
преобразования при восстановлении (реконструкции) сигнала
необходимо использовать очень много значений отсчетов, что
позволяет минимизировать фазовое различие даже в том случае,
если это тональный сигнал, не говоря уже о сигнале более сложной
формы, состоящем из ряда тональных колебаний с различными
частотами и фазами, изменяющимися к тому же во времени.
Рассматривая проблему фильтрации при цифроаналоговом
преобразовании, отметим также следующие моменты. Чем ближе
реальный ФНЧ к идеальному по форме АЧХ, тем больше время
задержки сигнала в нем и тем больше значений отсчетов
связываются в этом фильтре друг с другом. Переходные процессы в
фильтре дополняют сигнал между значениями соседних отсчетов,
но при этом важно, чтобы не образовывались дополнительные, не
присутствующие в исходном ЗС частотные компоненты.
Правильный расчет интерполяционных значений между соседними
значениями отсчетов при фильтрации необходим для точного
восстановления аналоговых сигналов именно при высоких частотах
колебаний. При сравнительно низких частотах значения отсчетов
расположены так плотно во времени, что реконструкция дает
высокое качество даже при использовании простых методов, т.е. в
процессе их обратного преобразования возникают незначительные
искажения в амплитуде и фазе, модуляции и шумы довольно
небольшие.
Цифровая обработка звуковых сигналов
Аналоговые ЗС в студийной аппаратной не только
смешиваются друг с другом, но и видоизменяются регуляторами
спектра и фильтрами с различной формой АЧХ, ревербераторами,
прослушиваются с помощью громкоговорителей. Затраты на эти
процессы связаны с необходимостью применения очень высоких по
качеству и трудоемких в изготовлении усилителей, регуляторов
спектра и фильтров, смесительных устройств. Чем больше сигналов
обрабатывается одновременно, тем труднее становится для
оператора точное управление оборудованием студийных
аппаратных. В дальнейшем нельзя избежать ухудшения качества
формируемых сигналов даже путем применения самых
дорогостоящих аналоговых устройств.
Цифровыми сигналами можно управлять с помощью
компьютера. При этом каждый рабочий шаг в схеме программы
можно заранее фиксировать. После этого сигнал может быть
прослушан для контроля, при необходимости откорректирован и
позже окончательно выведен, например для записи. Это не только
значительно упрощает работу звукорежиссера, но и открывает
новые возможности для редактирования фонограмм. С появлением
цифровых устройств стало возможным так точно и комплексно
(сложно) обрабатывать ЗС, как это невозможно было представить в
аналоговой технологии. Качество старых аналоговых записей,
содержащих шумы и другие помехи, можно существенно
улучшить.
В основе реализации огромного числа современных
алгоритмов обработки цифровых ЗС лежит очень малое число
элементарных операций: сложение, вычитание, умножение,
запаздывание. Их выполнение не вызывает трудностей. Для
обработки цифровых ЗС имеются быстродействующие сигнальные
процессоры. С помощью запаздывающих сигналов можно
смоделировать
процесс
послезвучания
(реверберации)
в
концертных залах. Этим возможностям поставлены границы,
главным образом тем, что компьютеру нужно грамотно составить
программу операций с сигналом. При единичных цифровых
операциях сигналы произвольным образом не искажаются, не
добавляются шумы квантования, не появляются другие заметные
на слух искажения. Число копий сигнала при цифровой записи
практически не ограничено.
К настоящему времени разработаны и широко применяются
на практике цифровые пульты звукорежиссера, устройства для
создания спецэффектов, цифровые ревербераторы, синтезаторы
звука, звуковые процессоры, шумоподавители.
Цифровые
пульты
по
сути
дела
являются
специализированными ЭВМ. Они содержат блоки АЦП и ЦАП,
арифметическо-логические устройства, процессоры, панели
управления и индикации, накопители на гибких, жестких
магнитных и оптических дисках. В качестве внешних устройств к
пульту звукорежиссера через системную шину подключают
цифровые магнитофоны и проигрыватели компакт-дисков,
цифровые
ревербераторы,
устройства
спецэффектов.
Арифметическо-логическое устройство содержит регулятор формы
АЧХ, ограничитель уровня, сжиматель и расширитель. Внешние
устройства имеют интерфейсы для сопряжения с процессором
пульта. В состав пульта звукорежиссера входят также блоки
формирования формата кода, устройство запоминания программ,
селекторы сигналов и др.
Число программ обработки сигналов достигает нескольких
сотен. Программы определяют регулировку уровня и изменение
формы спектра ЗС как в целом, так и в каждом отдельном канале
обработки, коммутацию каналов в группы. Цифровые устройства
обработки ЗС могут быть включены в любой последовательности и
в любую точку звукового тракта. Особенностью цифровых пультов
является возможность запоминания положения всех органов
управления, что позволяет без проблем восстановить режим
обработки сигнала в случае перерыва в работе звукорежиссера. В
цифровых пультах имеется возможность обработки сигналов
определенного вида по заранее разработанным программам. Это
облегчает труд звукорежиссеру и ускоряет технологический
процесс при формировании сигналов радиовещания и
звукосопровождения телевидения.
Целый ряд звуковых эффектов основан на изменении
тональности сигнала. Для транспозиции тона ЗС разделяется на
достаточно короткие отрезки, и далее осуществляется их временное
компрессирование или экспандирование, а затем — рекомбинация.
При этом тональность может быть сдвинута на какой-то интервал
гармонического звукоряда. Так, можно, транспонируя мелодию,
получать из записи голоса солиста многоголосное пение в
различных регистрах и т.п. Высотой тона можно управлять от
внешнего источника, в этом случае получается гармонайзер —
устройство, в котором мелодия модулируется речью, пением, может
изменяться с изменением цвета освещения помещения и т.д.
Достоверность цифровой передачи
При записи, передаче и воспроизведении цифровых данных
могут появляться ошибки. Причиной пропадания знаков при записи
или считывании являются погрешности в магнитном слое, пыль и
грязь на магнитной ленте или головке воспроизведения, а в системе
компакт-диска (КД) — царапины и грязь. При изготовлении КД
зеркальный слой может иметь погрешности, а синтетический
материал — содержать пузыри. При передаче цифровых сигналов
по каналам связи биты цифровых ЗС могут подвергаться
воздействию помех или исчезать, что приводит к ошибкам при их
декодировании. Большинство ошибок в цифровых трактах
первичного распределения программ ЗВ можно считать
одиночными.
Однако
достаточно
велика
вероятность
группирования одиночных ошибок в пакеты сравнительно
небольшой длительности (до 5…7 ошибочных символов подряд).
Наличие в цифровом сигнале ошибок приводит к искажениям
в аналоговом ЗС после цифроаналогового преобразования, т.е. при
его восстановлении в процессе декодирования. Эти ошибки
проявляются по-разному, в зависимости от того, какой разряд
кодового слова оказывается искаженным. При использовании
симметричных кодов первый разряд кодового слова несет
информацию о полярности сигнала, поэтому ошибка в его передаче
ведет к изменению полярности отсчета на противоположную.
Второй разряд кодового слова является старшим, он имеет
наибольший вес, равный половине всей шкалы квантования.
Младший разряд кодового слова имеет вес, равный одному шагу
квантования. При равномерном квантовании соответствующее
значение имеет и ошибка при декодировании: ошибка в старшем
разряде приводит к погрешности, равной половине шкалы
квантования, ошибка в младшем разряде — к погрешности на один
шаг квантования.
Погрешности декодирования, связанные с появлением
ошибок, можно оценивать в децибелах. Если обозначить
абсолютное значение погрешности через ∆u, то при максимальном
значении сигнала Umax и равномерном квантовании относительная
погрешность (зависимость 1 на рис. 0.19) согласно (0.17) будет
(∆u / Umax) = 6mi,
(0.34)
где mi — номер разряда кодового слова, в котором произошла
ошибка (для старшего разряда значение т1 = 1).
В случае использования симметричных кодов, где первый
разряд является знаковым, относительная погрешность (кривая 2 на
рис. 0.19)
(∆u/Umax) = 6(mi – 1).
(0.35)
Рис. 0.19 — Относительная погрешность в восстановлении отсчета
при искажении различных символов в кодовом слове. (Ошибка
в первом символе меняет полярность восстановленного отсчета,
а не его абсолютное значение, она не отражена на кривой 2)
При почти мгновенном компандировании погрешность
обусловлена использованной шкалой квантования, выбираемой, как
уже известно, в зависимости от максимального значения сигнала в
блоке. При этом шкале 1 (см. рис. 0.13) соответствует кривая 3,
совпадающая с кривой 2 на рис. 0.19, шкале 3 — кривая 4, шкале 5
— кривая 5. Из сопоставления этих зависимостей наглядно видно,
что уменьшение уровня максимального отсчета в блоке при почти
мгновенном
компандировании
приводит
к
снижению
относительной погрешности при декодировании, если при этом
изменился шаг квантования, т.е. осуществился переход от одной
шкалы квантования к другой.
Если при почти мгновенном компандировании ошибочно
будет передана трехразрядная комбинация, определяющая
выбранную при кодировании шкалу квантования, то с
погрешностью, и весьма существенной, будут восстановлены при
декодировании не один, а сразу все 32 отсчета в блоке. Величина
погрешности в данном случае зависит от того, какой разряд
служебного слова из этой комбинации поражен: если младший, то
произойдет переход к соседней шкале квантования и уровни всех
восстановленных 32-х отсчетов изменятся на 6 дБ; если
искаженным окажется второй символ, то значения отсчетов
изменятся на 12 дБ, а при ошибке в старшем разряде — уже на 24
дБ.
Итак,
появление
ошибок
по-разному
влияет
на
восстановленный после декодирования ЗС. В некоторых ситуациях,
например при одиночных ошибках в младших разрядах кодовых
слов, их влияние может быть практически незаметным на слух, вопервых, из-за кратковременности действия на орган слуха,
который, как известно, является инерционным аппаратом, а вовторых, из-за небольшой относительной погрешности, вызываемой
этими ошибками. Ошибки в старших разрядах кодовых слов
(обычно в пяти-шести старших разрядах) вызывают существенные
изменения в восстановленном сигнале, заметны на слух и
проявляются в виде резких щелчков, сильно ухудшающих качество
звукопередачи. Поэтому меры борьбы с ошибками в младших и
старших разрядах по надежности их обнаружения и устранения
должны быть разными. Групповые ошибки наиболее заметны.
Результаты экспертиз по оценке слуховой заметности
одиночных ошибок показали следующее: при равномерном 12-разрядном кодировании отсчетов высококачественного ЗС и частоте
дискретизации 32 кГц необходимо защищать четыре-пять старших
разрядов при наличии маскировки и шесть разрядов при ее
отсутствии. В случае неравномерного квантования с мгновенной
компрессией также необходимо защищать четыре-пять старших
разрядов кодового слова. При почти мгновенном компандировании
картина много сложнее. Здесь гораздо более надежно должны быть
защищены коэффициенты масштаба, определяющие номер шкалы
квантования. Более того, ошибки при передаче коэффициентов
масштаба должны быть не только обнаружены, но и надежно
исправлены.
При расчете требуемой достоверности передачи цифровых
сигналов ЗВ обычно считают, что при высококачественном
звуковоспроизведении допустимо появление в восстановленном
сигнале не более одного заметного на слух щелчка в час. Если
принять, что вероятности появления ошибок во всех разрядах
равны и к щелчкам приводит половина всех ошибок, то при
стереофонической передаче допустима вероятность появления
ошибки при условии, что не используется помехоустойчивое
кодирование, равная
.
(0.36)
Из (0.36) следует, что для трактов формирования программ
при fд = 48 кГц и т = 16 имеем рОшдоп ≈ 310–10, для каналов
распределения программ при fд = 32 кГц и т = 14 получим рОш доп ≈
≈ 610–10. Для сигнала с гауссовским законом распределения
требуемое качество передачи можно обеспечить при отношении
С/Ш на входе декодирующего устройства не менее 24…26 дБ (рис.
0.20) без учета выигрыша от помехоустойчивого кодирования.
Рис. 0.20 — Зависимость вероятности появления ошибки
при цифровой передаче от отношения сигнал/шум на входе
декодирующего устройства
Методы обнаружения и коррекции ошибок в цифровых звуковых
сигналах
В цифровых каналах связи средняя вероятность появления
ошибки составляет 10–5...10–6, а в отдельных случаях и 10–4,
поэтому влияние ошибок на качество звукопередачи неизбежно.
Это вызывает необходимость применения помехоустойчивого
кодирования при передаче сигналов ЗВ.
Обнаружение и коррекция ошибок требуют введения в сигнал
определенной избыточности. Для этой цели сигнал на выходе АЦП
разделяется на блоки, в которые, кроме основной информации,
связанной с кодированием отсчетов, включаются дополнительные
символы, необходимые для обнаружения и исправления ошибок.
Перед цифроаналоговым преобразованием эти блоки подвергаются
дополнительной цифровой обработке, в процессе которой на этапе
обнаружения определяется наличие ошибок. Для исправления
ошибок необходимо определить место пораженных символов в
блоке, чтобы заменить их на правильные. Исправление ошибок —
задача гораздо более сложная, чем их обнаружение.
Помехоустойчивое кодирование основано на применении
корректирующих кодов, в которые вносится некоторая
избыточность, что приводит к увеличению требуемой пропускной
способности канала связи. Различают коды для обнаружения
ошибок и коды для исправления обнаруженных ошибок.
Помехоустойчивые коды могут быть построены с любым
основанием, однако наиболее простыми и часто используемыми
являются двоичные коды.
Обнаружение ошибок в корректирующих кодах строится
обычно на том, что для передачи используются не все кодовые
слова кодового списка, а лишь их некоторая часть (разрешенные);
остальные кодовые слова из этого списка являются запрещенными.
Если переданное разрешенное кодовое слово вследствие ошибки
преобразуется на приемной стороне тракта в запрещенное, то такая
ошибка может быть обнаружена. Процедура исправления ошибок
состоит в замене ошибочно принятой комбинации на разрешенную,
которая принадлежит данному коду и расстояние до которой
оказывается наименьшим.
Ошибки могут быть одиночными и сгруппированными в
пакеты. Под пакетами понимают появление двух или большего
числа ошибок в пределах одной m-разрядной кодовой комбинации.
Если ошибки, возникающие при передаче сигналов, являются
статистически независимыми, то вероятность появления пакета
ошибок кратности q
(0.37)
где Cmq , — число сочетаний из т символов по q. Для 10-раз-рядных
кодовых слов вероятность появления двойных ошибок при
исходной вероятности рош = 10–5 составляет p1 = 510–9, а при
рош = 10–4 уже составляет р2 = 510–7. Это соответствует появлению
одной двойной ошибки каждые 2,5...3 мин.
Кроме того, в цифровых каналах передачи при средней
вероятности появления ошибки рош = 10–4 и выше возникают
коррелированные ошибки, вызванные действием импульсных
помех, несовершенством систем коммутации и т.д. Поэтому
вероятность появления ошибок большой кратности возрастает.
Особенно велика роль пакетов ошибок в каналах цифровой
магнитной записи и в системе компакт-диска из-за возможных
повреждений носителя записи. Системы исправления ошибок
должны эффективно бороться не только с одиночными, но и с
пакетами ошибок, заметность которых существенно выше. Чем
больше кратность ошибки, тем больше должна быть избыточность,
которую необходимо вносить в сигнал. Требуемая избыточность
тем больше, чем большее число разрядов кодовой группы
необходимо защищать. С учетом заметности искажений в системах
цифровой передачи и записи ЗС обычно защищают от ошибок пятьшесть старших разрядов информационных символов кодируемых
отсчетов, служебные комбинации, определяющие, например, номер
шкалы квантования при почти мгновенном компандировании.
Ошибки в младших разрядах, если частота их появления не
слишком велика, достаточно обнаруживать и затем маскировать,
используя методы интерполяции, о которых будет сказано ниже.
Выбор способа обнаружения ошибок, метода их маскирования
и исправления, возможного только при помехоустойчивом
кодировании, зависит как от среднего значения вероятности
появления ошибки, так и от того, являются они одиночными или
групповыми. Для тракта студийной аппаратной, а также трактов
звукозаписи и первичного распределения программ ЗВ эти методы
различны.
Простейшие методы обнаружения ошибки. Если цифровые
аудиоданные передаются или считываются, то в приемнике нет
возможности распознать, корректно ли принимаемое число
(например, число 0101) либо один или несколько символов в
принятом кодовом слове неверны. Для решения этой проблемы
применяют коды. Самые простые из них — коды с повторением.
Каждый информационный символ можно, например, повторить n
раз (обычно n нечетно и больше двух), т.е.
0 <----> 0 0 0 0 0…0,
1 <----> 1 1 1 1 1…1.
Это (n,1)-код. Для него минимальное расстояние равно n, и в
предположении, что большинство принятых битов совпадает с
переданным информационным битом, может быть исправлено (n–
1)/2 ошибок. Если символы передать только дважды, а затем
обнаружить, что они различаются, то нет возможности принять
решение о том, какое из двух чисел является правильным. Каждое
число нужно передать по крайней мере трижды и после сравнения
распознать ошибочное. Такой метод неэффективен, он приводит к
резкому увеличению требуемой скорости передачи. Найдены
другие, более эффективные возможности.
Очень простыми являются коды с проверкой на четность. К
информационным битам каждого кодового слова k-й разрядности
добавляют (к+1)-й бит так, чтобы полное число единиц (или нулей)
в кодовом слове было четным. Данный прием в цифровых
устройствах из-за простоты используют очень часто. При этом
дополнительный бит называется битом проверки на четность
(паритетным битом). Например, для k = 4 имеем
Исходный код
0
0
0
0
0
0
0
1
0
0
1
0
0
0
1
1




0
0
0
0
0
0
0
0
0
0
1
1
Бит четности
0
1
1
0
0
1
0
1
и т.д.
Этот код является (k + 1,k)-кодом. Минимальное расстояние
кода равно 2, и, следовательно, ошибки могут быть обнаружены, но
никакие ошибки не могут быть исправлены. Если бит передается
неправильно, то распознается появление ошибки в слове (ибо
сумма всех единиц не будет равна четному числу, если ошибка
одиночная). Однако позицию ошибки в кодовой комбинации
определить невозможно. Таким образом, данный код не позволяет
исправить ошибки. В силу этого данный код используется только
для обнаружения одиночных ошибок, но не для их исправления.
Впрочем, можно распознать позицию единичных (отдельных)
ошибок, если несколько слов предварительно объединить в
матрицу, а контрольные разряды четности (дополнительные биты
проверки на четность) добавить к информационным символам
кодовых слов построчно и по столбцам, например:
Правильно
0
1
1
0
1
0
1
0
0
0
0
1
1
1
1
0
0
0
1
1
Ошибка в первой строке, третий столбец
(выделена подчеркиванием)
0
0
1
1
1
0
0
1
0
0
1
0
1
1
1
0
1
1
1
0
0
1
0
1
0
0
1
1

(неправильная четность)
Однако если в таком блоке одновременно появляется
несколько ошибок, то такой метод не принесет пользы.
Маскирование ошибок. Если средняя вероятность появления
ошибки не превышает рош = 10–5 и источником ошибок является
шум в канале передачи, то расчеты показывают, что одиночные
ошибки появляются в среднем 2 раза в секунду, а двойные —
примерно 4 раза в сутки. В этих условиях достаточно учитывать
только одиночные ошибки. Действие последних приводит к
искажению величины отдельных отсчетов сигнала, и эффективным
способом борьбы с ними является обнаружение ошибочно
принятых кодовых слов с последующим маскированием
искаженных отсчетов. Для обнаружения обычно используется уже
описанный выше принцип проверки на четность, причем такой,
чтобы число единиц в кодовом слове было четным. При приеме
после выделения кодовых слов в каждом из них подсчитывается
число единиц. Нечетное их число будет означать наличие ошибки в
данном кодовом слове.
Вероятность (p0) того, что при использовании данного метода
ошибка не будет обнаружена, зависит как от вероятности (рош) ее
появления в канале, так и от числа разрядов (символов) т в
кодовом слове, включая разряд четности. Величину p0 можно найти
по формуле
p0  Cm2  pî2ø ,
(0.38)
где Ñm2 — число сочетаний т символов по 2. Отсюда видно, что
использование длинных кодовых слов ведет к росту вероятности
необнаруженной ошибки.
Если одиночная ошибка в кодовом слове обнаружена, то ее
маскирование после этого состоит в замене искаженного отсчета.
Обычные методы, используемые для этого процесса, показаны на
рис. 0.21. На рис. 0.21, а отмечено ошибочное значение отсчета.
Самым плохим наверняка является его замена на нуль, т.е.
выбрасывание отсчета с ошибочным значением (рис. 0.21, б).
Лучше, если ошибочный отсчет будет заменен на значение
предыдущего отсчета (рис. 0.21, в). Еще лучше, если его значение
будет получено как интерполяция значений двух соседних
отсчетов, например путем вычисления среднего значения (рис. 0.21,
г). Однако все же разность между восстановленным и истинным
значениями отсчета может быть заметной на слух и намного
превысить шаг квантования.
Рис. 0.21 — Маскирование ошибочных отсчетов:
а — обнаруженная ошибка в значении отсчета sn; б — замена ошибочного
отсчета sn отсчетом с нулевым значением; в — коррекция (экстраполяция
нулевого порядка) через замену ошибочного отсчета sn его предыдущим
значением sn–1; г — интерполяция первого порядка путем вычисления
среднего значения из предыдущего sn–1 и последующего sn+1 отсчетов
Поскольку слух человека инерционен, то метод маскирования
оказывается эффективным, если число ошибок не превышает
одной-двух в секунду. Это условие выполняется при вероятности
появления ошибки в канале рош = 10–5. При т = 6 в этом случае
получаем, что вероятность необнаруженной ошибки р0 = 1510–10,
что примерно соответствует требуемому значению.
Увеличение рош до значения 10–4 ведет к резкому росту
среднего числа ошибок в секунду до 20. Метод интерполяции
первого порядка не обеспечивает полного маскирования ошибок
полезным сигналом, они становятся уже заметными на слух.
Можно считать, что изложенный выше метод маскирования
применим, когда значение рот  10–5.
Исправление ошибок. Если вероятность ошибки превышает
рош = 10–5, то образуются пакеты ошибок и от их маскирования
приходится переходить к исправлению. Для исправления ошибок
применяют помехоустойчивое кодирование. При этом наиболее
широкое распространение получили блочные линейные (m,k)-коды. У таких кодов передаваемая последовательность символов
разделена на блоки, содержащие одинаковое число символов.
Общее число символов (битов) в кодовом слове равно m, из них
информационными являются первые k символов, а последние
r = т – k символов — проверочными. Проверочные символы
формируются в результате выполнения некоторых линейных
операций над информационными символами. В частности,
проверочные символы могут являться суммой по модулю 2
различных сочетаний информационных символов. Чем больше
число проверочных символов, тем больше корректирующие
возможности кода. Особенностью линейного кода является также
то, что сумма (и разность) входящих в код кодовых слов также
является кодовым словом, принадлежащим этому коду.
Корректирующие коды характеризуются избыточностью. Она
определяется относительным увеличением длины блока из-за
введения в него дополнительной проверочной информации и
оценивается выражением
(0.39)
где R — избыточность кода.
Наиболее известной разновидностью блочных линейных (т,
k)-кодов являются коды Хэмминга. Для каждого т существует (2m–
1
, 2m–1 – m)-код Хэмминга. Кроме параметров т и k, важным
является минимальное расстояние d, определяющее меру различия
двух наиболее похожих кодовых слов. Расстоянием d по Хэммингу
между двумя q-ичными последовательностями х и у длины n
называется число позиций, в которых они различны. Это
расстояние обозначается d(x,y). Например, если х = 10101 и
у = 01100, то имеем d(10101, 01100) = 3. При этом минимальное
расстояние кода равно наименьшему значению из всех расстояний
по Хэммингу между различными парами кодовых слов в коде; (п,
k)-код с минимальным расстоянием d называется также
(п, k,
d)-кoдoм.
Из теории помехоустойчивого кодирования известно, что если
произошло t ошибок и расстояние от принятого слова до каждого
другого больше t, то декодер исправит эти ошибки, приняв
ближайшее к принятому кодовое слово в качестве действительного
переданного. Это будет всегда так, если
(0.40)
Например, для обнаружения одиночной ошибки d = 2. Это
означает, что достаточно информационные кодовые группы
увеличить на один разряд. Для исправления одиночных ошибок
каждую кодовую группу необходимо увеличить уже на три разряда.
С ростом кратности ошибок объем требуемой дополнительной
информации резко возрастает. Так, для числа k битов аудиоданных
требуется следующее число контрольных (дополнительных,
проверочных) битов r в коде Хэмминга, чтобы ошибка могла быть
исправлена:
Биты данных k
Контрольные биты r
1–4
3
5–11
4
12–26
5
27–57
6
58–120
7
Контрольные биты рассчитываются (вычисляются) путем
сложений по модулю 2. В них участвуют информационные биты
аудиоданных по меньшей мере дважды. Чтобы с большой
вероятностью
обнаружить
ошибку
в
потоке
данных,
информационные слова и контрольные слова охватываются
совместно в блоки. Эти блоки затем снова рассматриваются как
отдельные единицы информации и далее кодируются (блочный
код). Иногда удается исправлять конфигурацию из t ошибок даже в
том случае, если неравенство (0.40) не выполняется. Однако если d
< (2t + 1), то исправление любых t ошибок не может быть
гарантировано, так как оно зависит от передаваемого слова и
конфигурации из t ошибок, возникших внутри блока.
При кодовом расстоянии d = 3 коды Хэмминга имеют длину
т = 2r–1. При двух проверочных символах r = 2 существует код
Хэмминга (3,1); при r = 3 — код (7,4); при r = 4 — код (15,11) и т.д.
Коды, для которых d = 3, могут исправлять одиночную ошибку.
Для нахождения места этой ошибки необходимо выполнить r
проверок, представляющих собой операции суммирования по
модулю 2. Технически это реализуется достаточно просто.
Например, (7,4)-код Хэмминга можно описать с помощью
реализации, приведенной на рис. 0.22, а.
Рис. 0.22 — Кодек для простого (7,4)-кода Хэмминга:
а — кодер; б — декодер
При заданных четырех информационных битах данных (i1, i2,
i3, i4) каждое кодовое слово дополняется тремя проверочными
битами, задаваемыми равенствами
(0.42)
Знак «+» здесь означает сложение по модулю 2: 0 + 0 = 0, 0 +
1 = 1, 1 + 0 = 1, 1 + 1 = 0. Шестнадцать разрешенных кодовых слов
(7,4)-кода Хэмминга имеют вид (i1,i2, i3, i4, r1, r2, r3):
i1
0
0
0
0
0
0
0
0
i2
0
0
0
0
1
1
1
1
i3
0
0
1
1
0
0
1
1
i4
0
1
0
1
0
1
0
1
r1
0
0
1
1
1
1
0
0
r2
0
1
1
0
1
0
0
1
r3
0
1
0
1
1
0
1
0
i1
1
1
1
1
1
1
1
1
i2
0
0
0
0
1
1
1
1
i3
0
0
1
1
0
0
1
1
i4
0
1
0
1
0
1
0
1
r1
1
1
0
0
0
0
1
1
r2
0
1
1
0
1
0
0
1
r3
1
0
1
0
0
1
0
1
Пусть при передаче в принятом слове v = (i'1, i'2, i'3, i'4, r'1, r'2,
r'3). По изображенному на рис. 0.22, б коду вычисляются биты
(0.44)
Трехбитовая последовательность (s1, s2, s3) называется
синдромом. Она зависит только от конфигурации ошибок. Всего
имеется восемь возможных синдромов: один для случая отсутствия
ошибки и по одному для каждой из семи возможных одиночных
ошибок, при этом каждая ошибка имеет только свой единственный
синдром. Несложно сконструировать цифровую логику, которая по
синдрому локализует соответствующий ошибочный бит. После
исправления ошибки проверочные символы опускаются. При
наличии двух и более ошибок код будет ошибаться: он
предназначен для исправления только одной одиночной ошибки в
кодовом слове группы.
При d = 4 коды Хэмминга имеют длину т = 2r–1 и
записываются соответственно как (4,1); (8,4); (16,11) и т.д. Они
получаются из кодов Хэмминга с минимальным расстоянием d = 3
добавлением к каждому кодовому слову [см. (0.43)] одного
проверочного символа, равного сумме по модулю 2 всех остальных
символов, как информационных, так и проверочных для каждого
кодового слова исходного (7,4)-кода Хэмминга.
При выборе кода важно определить мощность кода М, т.е.
максимальное число кодовых слов в двоичном коде длиной т
(множество двоичных слов длины m) при заданном кодовом
расстоянии d. Обычно при d = 3
(0.45)
Следовательно, (3, 1)-код Хэмминга состоит всего лишь из
двух кодовых слов. Для увеличения числа кодовых слов
необходимо увеличить длину кодового слова: для (7,4)-кода
Хэмминга уже имеется 16 кодовых слов. С увеличением m растет
сложность декодирования. Коды Хэмминга в силу этой причины
целесообразно использовать для исправления одиночных
независимых ошибок при небольшом числе возможных
информационных символов. В частности, коды Хэмминга
используют
для
передачи
трехсимвольных
комбинаций,
определяющих номер шкалы квантования при кодировании ЗС с
применением почти мгновенного компандирования.
Достаточно
простой
процедурой
кодирования
и
декодирования обладают линейные циклические коды (CRC-коды),
где разрешенные кодовые слова формируются из других
разрешенных слов циклическим сдвигом символов на один шаг
вправо. Цикличность позволяет уменьшить объем памяти
устройств, осуществляющих кодирование и исправление ошибок, а
возможность записи кодовых слов в виде степенных полиномов
сводит процедуры кодирования и декодирования к операциям
умножения и деления полиномов, легко реализуемых технически.
Кодовое слово Z – (a0, a1, a2,..., an–1), состоящее из n символов,
определяется полиномом Y(x) = a0 + a1x + a2x2 +...+ an–1xn–1. Среди
всех полиномов, соответствующих кодовым словам циклического
кода, имеется ненулевой полином наименьшей степени. Он
называется порождающим, степень его r = n – k (k — число
информационных символов, n — число символов в кодовом слове),
а свободный член равен единице. Основная особенность
порождающего полинома заключается в том, что он полностью
определяет циклический код (все кодовые слова циклического
кода) и является делителем всех полиномов, соответствующих
кодовым словам циклического кода.
Процесс кодирования при использовании циклического кода
состоит в следующем. Полином G(x) степени (k – 1),
характеризующий k-разрядное передаваемое информационное
кодовое слово, умножается на хr. Полученный полином G(x)xr
степени k+r–1 делится на порождающий полином F(x). В
результате деления образуется остаток q(x) степени не более r – 1.
Полином Q(x) = = xrG(x) + q(x), делящийся на F(x) без остатка,
определяет каждое разрешенное кодовое слово циклического кода.
Члены полинома Q(x) со степенью r+1 и выше соответствуют
информационным символам, смещенным на r разрядов в результате
операции умножения, а остаток q(x) от деления — поверочным
символам. Для обнаружения или исправления ошибок в
циклическом коде обычно используют операцию деления полинома
Q1(x) принятого кодового слова на заранее известный
порождающий полином F(x). Если остаток от деления не равен
нулю, то принятое кодовое слово считается ошибочным. Место
ошибки определяется детектором ошибки в результате сравнения
остатка от деления с эталонным полиномом, хранящимся в памяти.
Биты избыточности, полученные изложенным выше способом,
передаются совместно с первоначальными битами данных.
Пример. Последовательность из n = 10 битов можно
представить степенным полиномом, например вида Р(х) = х9 + х5 + х2
+ 1, который представляет собой информационное кодовое слово
1000100101. Разделим теперь Р(х) на порождающий полином,
называемый также генераторным полиномом G(x). Результатом
деления будут частное Q(x) и остаток R(х).
Возьмем в качестве генераторного полинома G(x) = х5 + x4 +
+ х2 + 1, представляющий двоичное число 110101. Перемножим
Р(х) и первый член полинома G(x), имеющий наивысшую степень, а
полученный результат затем разделим на G(x):
Выполним эти вычисления
P(x)x5
G(x)
= 1 0
+ 1 1
1
+
1
+
+
+
+
0
0
0
1
1
1
0
1
1
0
1
1
1
0
1
1
0
0
0
1
1
0
1
1
0 1 0 1 0 0 0 0 0
0
1
1
0
1
1
1
1
0
1
1
1
0
0
0
1
1
1
1
1
0
0
0
1
0
0
0
1
1
0
0
1
1
0
1
1
0
1
1 0
0 1
+
Остаток R(x)
1 1 0 1 1 0
1 1 0 1 0 1
1 1
Передаваемое кодовое слово D(x) в этом случае имеет вид
в примере соответственно 1 0 0 0 1 0 0 1 0 1 0 0 0 1 1.
Декодирующее устройство делит эти биты данных на G(x), и если
новый остаток R'(x) = 0, то передача свободна от ошибок (без
ошибок). В противном случае из остатка можно локализовать
ошибку.
В качестве примера на рис. 0.23 показаны структурные схемы
кодирующего и декодирующего устройств с использованием
циклического кода (29,24). Порождающий многочлен этого кода
имеет вид F1(x) = x5 + x2 + 1. Первоначально (рис. 0.23, а) ключ К
замкнут и на вход схемы последовательно подаются
информационные символы. Одновременно эти же символы
поступают на выход. Кодер представляет собой здесь
многотактный линейный фильтр Хаффмена, состоящий из
элементов 1 — 5 сдвигового регистра и двух сумматоров C1 и С2.
Данное устройство выполняет деление полинома x5G(x) на
порождающий полином F1(x). После 24-х тактов работы кодера в
его регистре образуется остаток q(x) от деления. На 25-м такте
ключ К перебрасывается в верхнее положение, и символы остатка
(поверочные символы) один за другим поступают на выход кодера.
За пять тактов на выход поступают пять поверочных символов и
происходит обнуление регистра. Затем происходит кодирование
следующей группы информационных символов.
Рис. 0.23 — Пример структурных схем кодера (а) и декодера (б)
с использованием циклического кода (29,24)
Принятый декодером (рис. 0.23, б) входной сигнал
запоминается регистром сдвига PC и одновременно через ключ К
поступает на устройство деления УД, подобное тому, которое
имеется в кодере. После поступления в УД 29-ти символов (блок
данного кода) ключ К перебрасывается в нижнее положение и
поступление входного сигнала на УД прекращается. Одновременно
с выхода УД сигнал поступает на детектор ошибки. Если принятое
кодовое слово не имеет ошибок, то на выходе УД имеется нулевой
сигнал, что и фиксирует детектор, разрешая без коррекции
информационным символам покидать PC через сумматор С3. Если
принято ошибочное кодовое слово, то на выходе УД имеется
ненулевой сигнал. В этом случае продолжающийся тактовый сдвиг
разрядов сигнала в регистре УД приводит к появлению кодового
слова, соответствующего эталонному полиному. В тот же момент в
детекторе
формируется
исправляющий
сигнал,
который
соответствует положению ошибки в информационных символах,
проходящих через сумматор С3. Исправляющий символ,
поступающий от детектора ошибок, исправляет ошибочный
информационный символ.
Подклассом
циклических
кодов
являются
широко
распространенные коды БЧХ (Боуза–Чоудхори–Хоквингема). Для
них справедливо правило: для любых значений s и q < (2s – 1)/2
существует двоичный циклический код длиной n = 2s – 1,
исправляющий все комбинации из q или меньшего числа ошибок и
содержащий не более чем sq проверочных символов. Так, код БЧХ
(63,44), используемый в системе спутникового цифрового
радиовещания, позволяет исправить две или три ошибки,
обнаружить и замаскировать пять или четыре ошибки на каждый
кодовый блок из 63-х символов. При вероятности ошибки рош = 10–
3
это означает появление одной необнаруженной ошибки в час.
Избыточность данного кода составляет R = (63 – 44)/63 = 0,33 (33
%). Такой же избыточностью обладают и циклические коды Рида–
Соломона. Двойной код Рида–Соломона с перемежением символов
(CIRC-код) как наиболее эффективный при исправлении ошибок
большой кратности нашел применение в системе компакт-диска и
цифровой магнитной записи.
В последнее время стали использоваться также сверточные
коды. В них обрабатывается непрерывная последовательность
символов без разделения ее на независимые блоки. Поверочные
символы в каждой группе из n0 символов сверточного кода
определяются не только k0 информационными символами этой
группы, но и информационными символами предшествующих
групп. Поэтому он не является блочным кодом длины n0.
Недостатком сверточных кодов является возможное размножение
ошибок, т.е. появление нескольких ошибок на выходе декодера,
если одиночные ошибки оказались не исправленными при
декодировании. Сверточные коды в сочетании с двойным кодом
Рида–Соломона
с
перемежением
символов
предлагается
использовать
в
системе
непосредственного
цифрового
радиовещания.
Перемежение символов. Этот способ широко применяется
для защиты от пакетов ошибок длиной в сотни разрядов, например
в аппаратуре цифровой записи сигналов. В принципе имеются три
возможности перемежения: перемежение разрядов в пределах
кодового слова, соответствующего одному отсчету ЗС,
перемежение между разрядами разных отсчетов сигнала ЗВ и
рассредоточенное размещение цифрового сигнала в канальных
интервалах цикла цифровой системы передачи.
Перемежение старших и младших разрядов в пределах одного
отсчета используется очень часто. При этом младшие разряды,
число которых обычно равно или составляет более половины всех
разрядов отсчета, размещаются равномерно между старшими
разрядами (рис. 0.24, а). Здесь кодовое слово является 12-символьным, из которых 11 информационных разрядов (а1, a2...а11) и
один (b1) — поверочный, определяемый как сумма по модулю 2
пяти старших информационных разрядов (a1, а2...a5). Поверочный
разряд находится на последней позиции, а самый младший 11-й
разряд — на первой. В этом случае пакеты ошибок, состоящие из
двух символов, и около 40 % пакетов ошибок длительностью в три
символа приводят к появлению одиночной (односимвольной)
ошибки на выходе декодера.
Перемежение разрядов разных отсчетов сигнала в принципе
позволяет исправлять пакеты ошибок любой длительности.
Ошибки здесь также преобразуются в одиночные (рис. 0.24, б). На
строке 1 условно записана исходная последовательность кодовых
слов по восемь символов в каждом. Символы кодовых слов
обозначены буквами от а до ж с цифровыми индексами,
определяющими порядковый номер (место) разряда в слове. Перед
передачей или записью порядок следования символов в
последовательности изменяется, например так, как это показано в
строке 2. Вначале передаются первые разряды всех кодовых слов,
затем вторые, третьи и т.д. При приеме (воспроизведении) порядок
следования символов восстанавливается (строка 3 на рис. 0.24, б).
Пусть при передаче или считывании возник пакет ошибок в этой
последовательности. Места ошибок обозначены звездочками.
Рис. 0.24 — К перемежению символов при защите от ошибок:
а — перемежение разрядов внутри 12-символьного кодового слова;
б — перемежение разрядов разных отсчетов; в — перемежение старших
и младших разрядов в восьми 10-разрядных отсчетах
В отсутствии перемежения (строка 1) эти ошибки исказят
подряд символы а7, a8, б1, б2, б3, б4, б5. Если же пакет ошибок
возник у сигнала, подвергнутого перемежению (строка 2), то из
строки 3 видно, что после операции, обратной перемежению, пакет
ошибок превратился в совокупность одиночных ошибок, с которым
можно бороться уже описанными выше способами.
Благодаря перемежению ошибочно восстановленные отсчеты
уже не следуют друг за другом (рис. 0.25, б), поэтому они могут
быть скорректированы путем интерполяции, о которой говорилось
уже выше. При отсутствии перемежения после считывания в
восстановленном сигнале (рис. 0.25, а, 4) появился бы ряд
отсутствующих отсчетов. Рисунок не требует дополнительного
пояснения.
Эффективность данного метода особенно высока, если
перемежение символов в пределах одного блока информации
дополняется перемежением самих блоков, как это, например,
принято в цифровых магнитофонах. Однако при исправлении
пакетов ошибок большой длительности усложняются устройства
перемежения в связи с необходимостью запоминать большое число
отсчетов. Кроме того, увеличиваются длина цикла передачи и
время задержки сигнала.
Рис. 0.25 — К пояснению принципа перемежения отсчетов:
а — без перемежения; б — с перемежением; 1 — исходный аналоговый ЗС; 2
— отсчеты дискретизированного сигнала (а — без перемежения; б —
с перемежением); 3 — пропадание соседних отсчетов при считывании;
4 — восстановленные отсчеты (а — без перемежения, б — с перемежением);
штриховой линией показаны потерянные отсчеты при считывании,
их восстановление возможно путем интерполяции
Размещение цифрового ЗС в канальных интервалах цикла
цифровой системы передачи обычно производят емкостью в один
октет. Для примера на рис. 0.24, в показано перемежение восьми
10-разрядных отсчетов. В первом октете размещены 1-й и 10-й
разряды первых четырех нечетных отсчетов, во втором октете — 2й и 9-й разряды тех же отсчетов и т.д. Затем подобным же образом
перемежаются разряды четырех четных отсчетов. При разделении
отсчетов на четные и нечетные пакет ошибок длительностью в
восемь символов не приводит к одновременному искажению
соседних отсчетов. Последнее позволяет использовать далее
интерполяцию нулевого или первого порядка при коррекции
восстановленных отсчетов.
Кодирование с плавающей запятой
Если принять во внимание, что чувствительность
человеческого уха зависит от уровня громкости звука и требуется
определенное время, чтобы была достигнута максимальная
чувствительность слуха после действия сигналов больших уровней,
то очевидно, что при цифровой передаче максимальных уровней
можно не учитывать тонкой ступенчатости битов с низкой
значимостью. Если уровни сигналов малы, то наибольшие значения
битов (старших разрядов) равны 0 и не передаются. И наоборот,
при больших уровнях сигналов низкие значения битов можно не
передавать. Для правильного восстановления отсчетов необходимо
также определить, биты каких разрядов передаются и каковы
значения коэффициентов масштаба самой большой и самой малой
ступеней квантования. В соответствии с инерционностью уха
достаточно согласовать это масштабирование в миллисекундном
интервале. Эта технология используется в методах NICAM
(кодирование путем почти мгновенного компандирования) и D2MAC (двойное бинарное кодирование с уплотнением аналоговых
компонент) для передачи звука в телевидении и при спутниковом
радиовещании DSR.
В методе NICAM 14-битовые сигналы передаются по каналу с
разрешением 10 бит. Для преобразования исходного ЗС в формат
передачи используется описанный выше метод почти мгновенного
компандирования с пятью различными шкалами квантования.
Выбор шкалы определяется значением максимального уровня
кодируемого сигнала во временном интервале, равном 1 мс (см.
разд. 0.3).
При цифровом спутниковом радиовещании DSR применяется
соответственно 16/14-битовая техника с плавающей запятой, чтобы
согласовать параметры передачи с линиями данных ведомства
связи. Для этого исходный цифровой ЗС с 16-битовым линейным
разрешением и частотой дискретизации 48 кГц (параметры
цифрового студийного тракта) преобразуется с использованием
метода плавающей запятой в 14-битовые кодовые слова с частотой
дискретизации 32 кГц. Масштабный коэффициент передается 1 раз
для блока из 64 отсчетов длительностью соответственно 2 мс. Так
же, как при почти мгновенном компандировании, внутри
временных окошечек длительностью 2 мс находится максимальный
уровень сигнала (максимальная амплитуда отсчета из выборки),
который определяет соответствующую ему область изменения
амплитуд сигнала и значение масштабного коэффициента. Всего
здесь имеется восемь возможных областей изменения модуля
амплитуды сигнала и соответственно восемь масштабных
коэффициентов. Масштабный коэффициент представляет собой
трехбитовое двоичное число, изменяющееся в пределах от 000 до
111. Оно определяет диапазон изменения уровня сигнала для
каждого значения коэффициента масштаба. Каждой из восьми
используемых в данном случае шкал квантования соответствует
изменение уровня сигнала на 6 дБ (рис. 0.26, а).
Стратегия преобразования 16/14 состоит в следующем. Лишь
в громких местах сигнала биты старших разрядов исходного 16разрядного кодового слова не будут равны нулю. При тихих
пассажах, наоборот, вся важная информация содержится в битах
младших разрядов, которые не всегда равны нулю. Вообще говоря,
следует передавать лишь биты с высокой значимостью при каждом
значении уровня сигнала. Можно даже отказаться от передачи по
каналу связи разрядов с низкой значимостью без заметных на слух
потерь в качестве.
На рис. 0.26, б, в изображено преобразование 16/14 битов,
полученное с учетом этих соображений. Первый бит (0 или 1)
содержит информацию о знаке отсчета, это старший значащий бит
(MSB) исходного 16-битового слова; последний бит — младший
значащий бит (LSB). Биты от Y2 до Y8, идентичные по значению с
первым знаковым битом (их число меняется от нуля до семи в
зависимости от амплитуды сигнала и соответствующего ей
коэффициента масштаба), при передаче выбрасываются, и все
последующие разряды сдвигаются соответственно влево. Это дает
возможность при малых уровнях передавать самые младшие 15-й и
16-й разряды. Лишь при самых высоких уровнях теряются один или
два младших бита, которые для сигналов больших уровней
незначимы. Впрочем, данный метод позволяет в принципе для
сигналов самых малых амплитуд работать с разрешением до 21 бита.
Рис. 0.26 — Метод преобразования 16-битовых кодовых слов
в 14-битовые (16/14) с плавающей запятой:
а — кодирование масштабных коэффициентов в зависимости
от уровня сигнала; б — схема кодирования отсчетов ЗС;
в — формат передачи по каналу
Масштабный коэффициент длиной 3 бита, добавляемый к
каждому блоку из 64 отсчетов, указывает, сколько битов,
следующих за знаковым Y1 во всех кодовых словах блока, имеют то
же самое значение 0 или 1, что и знаковый (рис. 0.26, б).
Назначение битов, пронумерованных от Z1 до Z5 (рис. 0.26, в), пока
еще не определено. На приемном конце масштабный коэффициент
используется для сдвига разрядов в кодовых словах блока в их
первоначальное положение, и, таким образом,
восстановление исходных 16-битовых кодовых слов.
происходит
Редукция аудиоданных, обусловленная психоакустическими
особенностями
Человек со своими органами чувств в состоянии принимать
огромные потоки информации. Но сознательно он способен
обрабатывать лишь около 100 бит/с информации. Поэтому можно
говорить о присущей ЗС избыточности. Значительной проблемой
при цифровом представлении ЗС является сокращение имеющейся
в них статистической и психофизической избыточности. Это
позволяет уменьшить скорость цифрового потока при кодировании
ЗС до предельно возможной величины, при которой шумы, помехи
и искажения остаются еще незаметными на слух даже для
высококвалифицированных экспертов. Особенно важную роль
играет сокращение психофизической избыточности ЗС, основанное
на учете такого феномена слухового восприятия, как маскировка, и
ряда динамических свойств слуха. Напомним наиболее основные
для дальнейшего изложения свойства слуха.
Большое значение имеет такое понятие, как порог
слышимости, ниже которого акустические сигналы не
воспринимаются. Величина порога слышимости не постоянна, она
согласуется со звуковыми событиями и зависит, во-первых, от
частоты и, во-вторых, от уровня других сигналов, на фоне которых
воспринимается данный звук. Например, вследствие маскировки
громкий звук может сделать неслышимым тихое звучание. При
этом значение имеют формы спектров ЗС, их уровни и временная
последовательность. Важно и то, идет ли речь о тонах или звуках,
имеющих
широкополосные
спектры.
Достаточно
полно
исследовано, как изменяется (сдвигается) временно порог
слышимости одного сигнала в присутствии другого, как тон и шум
делают неслышимым звучание в соседних частотных полосах
диапазона
слышимых
частот
(см.
кривые
изменения
относительного порога слышимости тона NaT в присутствии
узкополосного мешающего шума Nа ш, показанные на рис. 0.27, а) и
как громкое звуковое событие маскирует восприятие более тихих
звуков, которые начинаются несколько раньше, т.е. опережают
сигнал высокого уровня на интервал времени –30…20 мс (явление
предмаскировки), или позже, т.е. запаздывают по времени на
0…120 мс (явление послемаскировки).
Рис. 0.27 — Зависимость изменения относительного порога слышимости
тона при его маскировке узкополосным шумом со средней частотой
1000 Гц для разных уровней последнего (а) и структурная схема кодера
MUSICAM с дополнительным спектральным анализом для оценки
относительного порога слышимости (б)
Если известно, какие доли (части) ЗС ухо воспринимает, а
какие нет вследствие явления маскировки, то нужно вычленить и
затем передать по каналу связи лишь те части сигнала, которые ухо
способно воспринять, а неслышимые доли (части, составляющие
сигнала) можно отбросить.
Кроме того, сигналы можно квантовать с возможно меньшим
разрешением так, чтобы шумы квантования, изменяясь по величине
с изменением уровня самого сигнала, еще не становились бы
слышимыми.
Учет всех этих свойств слуха и связанных с ним особенностей
восприятия позволяет сильно сократить общее число бит,
требуемое для цифрового представления ЗС, т.е. сократить то
количество информации, которое необходимо передать или
запомнить без потери качества звучания. За счет устранения
психофизической избыточности можно уменьшить требуемый
объем для высококачественной передачи (записи) цифровых
аудиоданных более чем в 10 раз.
Исследования, выполненные в данном направлении,
позволили
разработать
два
принципиально
новых
высокоэффективных метода цифрового представления ЗС: ASPEC
— Audio Spectral Perceptual Entropics Coding (разработан фирмой
AT&T, Thomson Brand und Fraunhofer Geselschaft) и MUSICAM —
Masking Pattern Universal Subband Integrated Coding And
Multiplexing (разработан Институтом техники радиовещания в
Мюнхене, фирмой Филипс и ССЕТТ). Методы позволят в будущем
использовать для передачи высококачественных сигналов ЗВ
узкополосные каналы (телефон, сети ISDN). Рассмотренные
методы предполагается использовать также в системах цифрового
радиовещания (Digital Audio Broadcasting — DAB).
Кроме учета свойств слуха и связанным с этим сокращением
объема цифровой информации, приняты во внимание также и
экономические факторы. В частности, декодер должен быть
максимально простым, что возможно, если алгоритм обработки
сигналов при их декодировании четко определен (задан). Тогда
декодер будет максимально дешевым при массовом производстве.
Кодирование даже при минимизации всех затрат может оставаться
сложным, а значит, и дорогим, особенно если учитывать свойства
человеческого уха. Алгоритм обработки сигналов не должен быть
жестким, ибо наши знания о механизмах слуха постоянно
развиваются и уточняются, меняются и характеристики звукового
материала. Поэтому должна иметься возможность изменения
сигналов управления при кодировании, которые формируются на
стороне передачи и затем доводятся до декодера. Такой подход
открывает возможность улучшения качества передачи. При этом
пользователям не нужно будет постоянно менять свои
декодирующие устройства, что важно с потребительской точки
зрения. В будущем изменения, по-видимому, коснутся методов
кодирования на стороне передачи.
В идее MPEG (Moving Pictures Experts Group) содержатся две
психоакустические модели, которые могут альтернативно служить
в качестве основы для редукции аудиоданных при их обработке с
целью сокращения избыточности передаваемых (консервируемых)
цифровых ЗС. Возможная редукция аудиоданных в обоих моделях
различна. Однако для декодирования этих сигналов используется
один и тот же декодер.
В стандарте ISO/IEC 11172-3 (часть 3) предусмотрено
несколько уровней (ступеней, слоев) компрессии цифровых
аудиоданных, при этом декодеры более высокой ступени могут
декодировать сигналы, подвергнутые меньшей компрессии на
стороне передачи. Возможны три ступени компрессии, каждой из
которых соответствуют своя скорость цифрового потока и своя
рекомендуемая область применения. Перечислим основные
характеристики ступеней:
«Layer 1» (слой 1) — рекомендуется для применения в
профессиональной области и в системах записи с достаточной
емкостью памяти, перезаписью и записью со студийным качеством,
очень высоким качеством звука, характеризуется небольшой
сложностью и не слишком высокой степенью редукции
аудиоданных. Основные параметры: скорость цифрового потока
при передаче составляет 192 кбит/с в полосе частот ЗС, равной 15
кГц; коэффициент компрессии равен 4; запаздывание (задержка)
сигнала при обработке составляет 20 мс.
«Layer 2» (слой 2) — потребительская область, простые
профессиональные случаи применения, высококачественное
радиовещание, средняя сложность и средняя степень компрессии
аудиоданных при их цифровой обработке. Основные параметры:
скорость цифрового потока 128 кбит/с в полосе частот ЗС, равной
15 кГц; коэффициент компрессии 6; запаздывание сигнала 40...50 мс.
«Layer 3» (слой 3) — рекомендуется для передачи речи по
узкополосным каналам в сети ISDN в профессиональной области (в
радиовещании и в системах записи с малой емкостью памяти и
средним качеством), отличается высокой сложностью и
характеризуется следующими параметрами: скорость цифрового
потока 64 кбит/с в полосе частот сигнала 15 кГц; время задержки
сигнала более 50 мс.
Напомним, что уже в аналоговых системах для расширения
динамического диапазона передаваемого ЗС в новейших
компандерных системах (« Dolby-A», -В, -С; dBx; «Highom»;
«Panda») учитываются свойства слуха и прежде всего явление
маскировки. Общим для таких систем является то, что на стороне
передачи с помощью сжимателя поднимают уровни сигнала при
тихих пассажах, а затем после передачи (или записи) при
воспроизведении они обрабатываются снова в расширителе с
целью компенсации ранее внесенных изменений.
Однако даже если при этом используется раздельная
обработка частей сигнала в полосах частот, то важным является то,
что
эти
выделенные
частотные
диапазоны
довольно
широкополосные (например, «Dolby-A»), а значит, имеющиеся в
них помехи и шумы отличаются сравнительно невысокими
значениями порогов маскировки.
Сокращение объема цифровой информации, применяемое,
например, при методе MUSICAM, предусматривает отбор по
времени и спектру долей сигнала таким образом, чтобы выше
порога слышимости помехи, шумы и искажения отсутствовали при
слуховом восприятии. Иначе говоря, после обработки в сигнале
должны отсутствовать те частотные компоненты и те временные
отрезки, которые при слуховом восприятии маскируются,
частотные области без сигнала при этом должны быть свободны от
информации и, следовательно, от шумов. Величина шага
квантования изменяется так, что шум квантования остается
неслышимым, т.е. маскируется полезным сигналом. Соотношение
амплитуды полезного сигнала и минимального относительного
порога слышимости определяет в этом случае величину
необходимого шага квантования. Чтобы этот подход имел высокую
эффективность, предварительно широкополосный ЗС разделяют
фильтрами на узкополосные составляющие, близкие по полосе к
критическим полосам слуха, где маскировка наиболее ощутима, так
как обработка ЗС в слуховой системе выполняется именно в этих
полосах.
В MUSICAM-кодере спектр входного цифрового ЗС
разделяется блоком полифазных фильтров на 32 узкополосные
составляющие (рис. 0.27, б). Преимуществом этих фильтров
является относительно малое время задержки сигнала при
одновременной компенсации искажений, возникающих за счет
интерференции сигналов в местах стыковки полос. К тому же их
реализация не очень сложна. Все n = 32 полос пропускания блока
цифровых фильтров имеют постоянную ширину:
(0.46)
где fд — частота дискретизации ЗС. После фильтрации следующие
по времени друг за другом значения отсчетов каждой отдельной
полосы собираются в один блок, после чего в нем определяется
максимальное значение отсчета, которое определяет коэффициент
масштаба. Масштабный коэффициент кодируется с помощью 6 бит,
что обеспечивает перекрытие динамического диапазона сигнала в
120 дБ.
Параллельно этому в кодере в так называемой
психоаутенической модели вычисляется относительный порог
слышимости для спектральных компонент выборки ЗС. Далее с
учетом этого полученного значения рассчитываются величина SNR
(отношение сигнал/маска) и требуемый шаг квантования. Обратим
внимание (см. рис. 0.27, б), что параллельно фильтрации для ЗС
осуществляется быстрое преобразование Фурье (БПФ). Оно
необходимо для расчета глобального порога маскировки и далее
отношения SNR для каждой субполосы.
Параллельный анализ банком фильтров и применение БПФ
обеспечивают незначительное время прохождения сигнала (менее
25 мс в кодере).
На рис. 0.28 в качестве примера показан амплитудный спектр
(SPL, вертикальные линии с точками) в сравнении с относительным
порогом слышимости (кривая LT сложной формы) и допустимыми
максимальными по величине шумами квантования в полосах
(заштрихованный диапазон) кодирования ЗС по методу MUSICAM.
Рис. 0.28 — Спектр звука «ео» (вокал), зависимость изменения относительно
порога слышимости и допустимые уровни шумов квантования при его
полосной обработке в кодере MUSICAM (заштрихованные области)
Полезным сигналом является певческое исполнение сочетания
звуков «ео» с основным тоном, равным 200 Гц, и целым рядом
сопутствующих ему обертонов. Штриховая линия представляет
собой абсолютный порог слышимости тона в тишине (кривая 1). Не
все части этого сложного сигнала, если они существуют
одновременно, могут быть восприняты слухом, несмотря на то, что
каждая спектральная компонента лежит выше абсолютного порога
слышимости, полученного для тонального сигнала. Те части
сигнала и шумы, которые находятся ниже относительного порога
слышимости LT, неслышны.
Этот порог получается из учета уровней спектральных частей
(основного тона и обертонов) сигнала, попадающих в каждую
отдельную полосу частот. Для другого звука кривая порога LT
очевидно будет выглядеть иначе. Все спектральные компоненты
сигнала, оказавшиеся в одной полосе, обрабатываются в кодере
MUSICAM совместно с одинаковым шагом квантования. В разных
полосах величина шага квантования имеет свое значение и в
соответствии с этим свой уровень шумов квантования (см. рис.
0.28, заштрихованная область). Уровень мешающего сигнала лежит
всегда ниже относительного порога слышимости (кривая LT). Те
спектральные компоненты, которые лежат по уровню ниже кривой
LT, передавать не требуется.
Итак, для сокращения объема цифровой информации с учетом
психоакустической модели необходимы следующие шаги и
вычисления:
1. Пересчет спектральных компонентов с помощью БПФ из
временной области в частотную.
2. Определение уровня интенсивности сигнала в каждой
частотной полосе.
3. Определение абсолютного порога слышимости.
4. Выделение тональных (синусоподобных) и нетональных
частей (шумоподобных) спектральных компонент.
5. Редуцирование спектральных компонент.
6. Вычисление
индивидуальных
кривых
маскировки,
оставшихся после редуцирования спектральных компонент.
7. Вычисление (расчет) глобального порога маскировки.
8. Вычисление наименьшего значения порога маскировки для
каждой частотной субполосы.
9. Расчет SNR (отношения сигнал/маска) для каждой
субполосы.
Весь
этот
комплекс
вычислений
выполняется
в
психоаутенической модели MPEG-кодера. Последовательность
операций, выполняемых в MPEG-кодере (ISO/ICE 11172-3),
представлена на рис. 0.29.
Блоком полифазных фильтров (с оптимизированным окном)
входной сигнал разделяется на 32 части (субполосы), в каждой из
которых для совместной обработки используются 12 или 36
значений отсчетов, объединенных в группу. Субполосы имеют
одинаковую ширину. Полосные сигналы дискретизируются с
частотами, кратными 32 кГц. В слое 3 («Layer 3») в группы
объединяются 6 или 18 значений отсчетов (6x32 или 18x32).
Быстрое преобразование Фурье выполняется для 512 («Layer 1»)
или 1024 («Layer 2») значений отсчетов. Разрешение подсистемы
при этом составляет fд/512 или соответственно fд/1024. В качестве
частот дискретизации предусмотрены уже известные нам значения
48, 44,1 и 32 кГц.
Рис. 0.29 — Алгоритм кодирования ЗС в соответствии
со стандартом ISO/IEC 11172-3
После того, как в кодере определены уровни сигнала в
отдельных частотных субполосах, определяется абсолютный порог
слышимости и анализируется, идет ли речь о тональных
(синусоподобных) или нетональных (шумовых) частях сигнала. На
основе
использованной
психоакустической
модели
идентифицируются доли (части) сигнала, которые в значительной
степени маскируются, и затем вычисляется отношение SNR, при
котором шум еще маскируется полезным сигналом. Эти расчеты в
слоях 1 и 2 выполняются для каждой субполосы, а в слое 3 — для
групп частотных полос. С помощью вычисленных значений SNR и
уровней сигнала для каждой субполосы рассчитываются шаги
квантования и необходимое для кодирования число бит. Общее
число бит распределяется между субполосами так, чтобы
выполнялись требования, относящиеся как к скорости передачи
сигнала, так и к маскировке шумов в каждой субполосе. При
большой компрессии неизбежные слышимые искажения стараются
оформить по возможности как «приятные».
Расчеты, выполняемые для слоя 3 («Layer 3»), более
трудоемкие, поскольку обрабатываются несколько выборок
исходного поворота ЗС одновременно. При форматировании
цифровых данных объединяются информационные аудиоданные и
данные управления. В слоях 1 и 2 для кодирования в каждой
субполосе применяется обычная ИКМ с линейным квантованием,
при этом в слое 2 квантованные значения могут быть объединены в
группы. В случае слоя 3 применяются коды Хаффмена, длина
которых переменная и тем самым адаптирована (по возможности) к
низким скоростям передачи битов. Наверняка многим известен код
Морзе, в котором часто встречающиеся буквы имеют мало битов, а
редко встречающиеся — много битов. В кодере слоя 3 («Layer 3»)
использована и эта идея для получения большей компрессии
данных.
Декодер сигналов (рис. 0.30), кодированных методом
MUSICAM, проверяет входящие данные на ошибки, а также
разделяет данные управления процессом декодирования и сжатые
информационные аудиоданные. Прежде всего разделенные на
отдельные полосы сигналы экспандируются с помощью
информации управления, в результате происходит их обратное
преобразование в исходную форму. В инверсном блоке фильтров
различные спектральные части ЗС вновь объединяются в
первоначальный сигнал. Результатом этого является цифровой
поток аудиоданных на выходе декодера, который уже подготовлен
для цифроаналогового преобразования.
Рис. 0.30 — Структура декодера системы кодирования MUSICAM
Поскольку при каждой передаче могут возникать ошибки, то
для борьбы с ними (как об этом уже говорилось ранее) применяют
коды с проверочными битами (см. разд. 0.7), которые служат для
распознавания и коррекции ошибок. Затраты на эти операции
должны быть как можно меньше. Поэтому есть смысл выяснить,
какие погрешности передачи слышимы, менее слышимы и
неслышимы вообще. Эффективная защита в соответствии с этой
оценкой должна реализоваться с разной силой. В нормах MPEG
ошибки по их слышимости классифицируются по пяти ступеням.
Сильно заметными на слух (катастрофическими) являются ошибки
в битах, определяющих место (позицию) отдельных частей данных
и значение коэффициента масштаба. Заметными являются ошибки
в трех старших битах коэффициента масштаба, менее мешающими
— ошибки в младших низкозначимых битах коэффициента
масштаба и в старших информационных битах субполосных
составляющих ЗС, практически неслышимыми — ошибки в обоих
самых младших низкозначимых информационных битах
субполосных сигналов.
В настоящее время декодеры MUSICAM разработаны в виде
интегральных микросхем, которые могут декодировать сигналы
слоев 1, 2 и 3. Единый декодер, который может обрабатывать
сигнал слоев 1, 2 и 3 одновременно, находится еще в стадии
разработки. Не выясненной пока остается также и предельно
допустимая степень сжатия D сигнала, при которой искажения
остаются еще незаметными на слух, особенно это относится к
передаче стереофонического сигнала, где при сжатии D могут
возникать и другие искажения, связанные с пространственным
демаскированием.
Контрольные вопросы
1. Назовите основные погрешности при аналого-цифровом
преобразовании. Поясните причины, их вызывающие.
2. Сравните равномерное и неравномерное квантования
отсчетов ЗС с точки зрения скорости передачи и отношения
сигнал/шум.
3. Нарисуйте спектр АИМ колебания. В каких случаях может
возникнуть эффект наложения спектров?
4. В чем трудность реализации неравномерного квантования?
Как можно определить допустимое значение динамического
диапазона сигнала, если задана разрядность кодового слова?
5. Перечислите
основные
трудности
в
реализации
цифроаналогового преобразования.
6. Как можно оценить выигрыш от применения компандера
при цифровом преобразовании ЗС?
7. Какие законы компрессии обычно применяются в ЗВ?
Поясните их особенности и принципы реализации.
8. Какие свойства сигнала и слуха используются при почти
мгновенном компандировании?
9. Что такое статистическая избыточность цифрового ЗС?
10. Почему
можно
говорить
о
психоакустической
избыточности цифровых ЗС и как можно ее уменьшить?
11. Перечислите основные особенности системы кодирования
«MUSICAM».
ФОРМАТЫ ЗВУКОВЫХ СИГНАЛОВ
Форматы цифровых сигналов и организация стыков цифровых
трактов
В цифровых устройствах ЗВ кроме кодовых слов,
определяющих мгновенные значения отсчетов ЗС, в общем с ними
цифровом потоке передаются различные служебные символы,
команды управления, добавочные символы помехоустойчивого
кодирования и т.д. Порядок следования символов в кодовом слове
или кодовых слов различного назначения в цифровом потоке
называют форматом или структурой кода.
Форматы кодов у звуковых устройств различного назначения
существенно отличаются. У них не совпадают законы кодирования
отсчетов, способы защиты от ошибок, число звуковых каналов в
одном потоке, характер и объем информации управления, объем
служебной информации. Например, в оборудовании студийных
аппаратных применяют равномерное квантование отсчетов с
числом разрядов не менее 16 (в пультах звукорежиссера и
устройствах шумоподавления число разрядов на отсчет доходит до
24), дискретизацию с частотой 48 кГц. Избыточность, вводимая с
целью обнаружения и исправления ошибок, достигает 33 %.
Управляющие сигналы, осуществляющие перестройку системы
обработки сигналов, и адресно-временной код источника
программы передаются совместно с ЗВ. Суммарная скорость
цифрового потока в ТФП особой роли не играет. В отличие от этого
в ТПРП и ТВРП одним из наиболее важных параметров является
требуемая для передачи ЗС скорость цифрового потока. Для ее
сокращения частоту дискретизации принимают равной 32 кГц,
используют дополнительную обработку студийных цифровых
сигналов с целью сокращения статистической и психофизической
избыточности (компандирование, полосное кодирование с учетом
маскировки, преобразование с плавающей запятой и т.п.),
значительно снижают объем служебной и дополнительной
информации, ищут оптимальные по затратам пути для борьбы с
ошибками.
В силу изложенного форматы кодов в ТФП, ТПРП и ТВРП
оказываются разными. По этой причине весьма важной оказывается
проблема стыка цифровых устройств с разными форматами кодов.
Обеспечить соединение (стык) можно путем преобразования
одного формата в другой в месте стыка или каждого из данных
форматов в некоторый единый (общий) формат. Предпочтение
отдано последнему способу, когда формат кода каждого устройства
при необходимости стыка с аппаратурой другого формата
преобразуется в единый стандартный формат. Устройства,
реализующие
эти
стыки,
называются
интерфейсами
(транскодерами). Интерфейсы стандартизованы. Наибольшее
распространение получил интерфейс S/P-DIF, разработанный
фирмами Сони и Филипс и изложенный в Рекомендации 647-1
МККР «Цифровой звуковой стык для радиовещательных студий» и
в документе IEC 958. В соответствии с мировым стандартом ЗС
двух
цифровых
каналов,
сопровождаемые
служебной
информацией, мультиплексируются и пакетируются в общий
цифровой поток в заданном формате, который передается со
скоростью 3,072 Мбит/с (рис. 0.1). На приемном конце другого
цифрового устройства он снова преобразуется в исходные
цифровые сигналы и затем в формат, необходимый для дальнейшей
передачи (консервации).
Рис. 0.1 — Соединение двух цифровых устройств:
ФКС — формирователь кода студии; ДКС — дешифратор кода студии
Рассмотрим особенности структуры данных в этом
интерфейсе. Формат данных имеет периодическую структуру и
состоит (рис. 0.2) из блоков, циклов (или фреймов) и подциклов
(соответственно субфреймов). Блок состоит из 192 циклов,
имеющих номера 0,1,...191. Каждый цикл (фрейм) разбит на два
подцикла (субфрейма). Один подцикл (первый) несет информацию
об одном отсчете ЗС левого канала, а также относящуюся к нему
служебную информацию, а другой (второй) — аналогичную
информацию, но относящуюся к правому каналу стереопары. В
цикле могут передаваться два отдельных монофонических сигнала.
В начале блока и каждого подцикла передается специальная
кодовая группа, называемая преамбулой. Преамбулы представляют
собой определенные комбинации символов
(0 и 1),
обеспечивающие синхронизацию и опознавание блоков, циклов
(фреймов) и подциклов (субфреймов). Для достижения
синхронизации в пределах одного периода дискретизации, а также
для того, чтобы сделать этот процесс абсолютно надежным, в
преамбулах используется бифазный код «biphase-mark». Его
применение исключает возможность имитации преамбул
аудиоданными. Кроме того, они свободны от постоянной
составляющей, легко обеспечивают восстановление тактовых
импульсов. Преамбулы передаются в течение четырех временных
интервалов, пронумерованных цифрами от 0 до 3. Используются
преамбулы трех типов Z, X и Y. За четыре временных интервала
передается восемь состояний:
Z: 11101000 или 00010111 (первый подцикл цикла 0 и начало
блока);
X: 11100010 или 00011101 (первый подцикл циклов от 1-го до
191-го);
Y: 11100100 или 00011011 (второй подцикл каждого цикла).
Рис. 0.2 — Структура формата кода
(Рекомендация 647 МККР и документ IEC 958)
Преамбула каждого типа имеет две противоположные
разновидности (рис. 0.3), поскольку первое ее состояние всегда
отличается от состояния предыдущего бита, которым является бит
четности (им заканчивается кодовое слово отсчета).
Рис. 0.3 — Преамбулы:
а — Z-типа; б — Х-типа; в — Y–типа
Тип преамбулы обозначает, следуют ли после нее
аудиоданные левого или правого каналов. Блок всегда начинается с
преамбулы типа Z, далее идут аудиоданные левого канала. Внутри
блока каждый цикл, следующий после первого, начинается с
преамбулы типа X, предваряющей аудиоданные левого канала.
Аудиоданные правого канала всегда предваряются преамбулой
типа Y. Начало преамбулы определяется символом бита четности,
расположенным в самом конце субфрейма. Иначе говоря, в
зависимости от того, заканчивается ли поток аудиоданных в
субфрейме битами 0 или 1, применяется та или иная полярность в
начале преамбулы одного типа.
Каждый подцикл разделен на 32 временных интервала,
пронумерованных от 0-го до 31-го (см. рис. 0.2). Интервалы с 0-го
по 3-й несут одну из преамбул. Временные интервалы 4 — 27
отведены для передачи разрядов кодового слова, т.е. несут
информацию об отсчете ЗС. При этом старший разряд (старший бит
— MSB) кодового слова располагается в 27-м интервале, а младший
(LSB) — в 4-м, если код является 24-разрядным. Если же код 20разрядный, то младший бит располагается в 8-м интервале. При 16разрядном коде младший бит располагается уже в 12-м временном
интервале подцикла. Незанятые интервалы (4 — 7 или
4—
11) могут быть использованы для других применений (например,
для передачи дополнительного служебного речевого сигнала,
другой возможной дополнительной информации или заполнены
логическими нулями).
После звуковых данных в следующих временных интервалах
передаются:
в 28-м V: флаг достоверности отсчета (если передается
логический 0, то слово отсчета достоверно, если 1 — то отсчет
неверный);
в 29-м U: один бит служебной информации, вводимой по
усмотрению пользователя;
в 30-м С: один бит состояния канала;
в 31-м Р: один бит четности для обнаружения ошибок в
передаваемом кодовом слове отсчета, который выбирается так,
чтобы в интервалах 4 — 31 было четное число единиц и нулей
(применительно ко всему блоку).
Таким образом, в одном блоке за 192 цикла передаются по 192
бита состояния первого и второго каналов и по 192 бита
информации пользователя. Информация о состоянии канала и
информация пользователя передаются в последовательной форме за
время передачи блока, причем повторяются в каждом блоке.
Частота следования циклов равна частоте дискретизации сигнала.
Служебная информация о состоянии канала в каждом блоке
разделена на 24 байта (1 байт равен 8 битам). Формат данных о
состоянии канала представлен на рис. 0.4.
Байт 0:
бит 0
a=0  бытовое использование канала;
a=1  профессиональное использование канала;
бит 1
b=0  обычный звуковой режим;
b=1  незвуковой режим;
биты 2 — 4 с: — кодирование предыскажений сигнала:
0 0 0  без предыскажений, в приемнике коррекция
вводится вручную;
1 0 0  без предыскажений, в приемнике коррекция
невозможна;
1 1 0  предыскажения 20 мкс, без ручной коррекции;
1 1 1  предыскажения в соответствии с Рекомендацией
J17 МККТТ (с введением ослабления 6,5 дБ на
частоте
800
Гц),
ручное
отключение
автоматического
режима
в
приемнике
блокируется;
Рис. 0.4 — Формат данных о состоянии канала:
а — использование блока состояния канала; b — режимы звук/без звука;
с — предыскажение звукового сигнала; d — синхронизация частоты
дискретизации источника; е — частота дискретизации; f — режим работы;
g — управление битами пользователя; h — использование вспомогательных
битов отсчета; i — длина слова источника и предыстория кодирования
источника; j — описание дальнейших многоканальных функций
бит 5
d=0  частота
дискретизации
источником
d=1  частота
дискретизации
синхронизируется
синхронизована
с
источника
не
биты 6 и 7
е: —
00
01
10
11
кодирование частоты дискретизации:
 частота дискретизации не указывается (по
умолчанию в приемнике принята равной
48 кГц);
 равна 48 кГц, ручное отключение автоматики
или автоматическая установка блокируются;
 равна 44,1 кГц, ручное отключение
автоматики или автоматическая установка
блокируются;
 частота дискретизации 32 кГц, ни ручное и
автоматическое управление не допускаются;
Байт 1:
биты 0 — 3 f: —
режим работы канала:
0 0 0 0  не указан, приемник по умолчанию
устанавливается на двуканальный режим,
допускается ручное отключение автоматики;
0 0 0 1  двуканальный режим, ручное отключение
автоматики блокируется
0 0 1 0  одноканальный режим (монофонический),
ручное отключение автоматики блокируется;
0 0 1 1  режим первичный/вторичный (канал 1
является первичным);
0 1 0 0  стереофонический режим с одновременными
отсчетами в каналах 1 и 2, канал 1 — левый,
ручное отключение автоматики блокируется;
0 1 0 1  стереофонический режим с чередующимися
отсчетами, канал 1 — левый, дискретизация
сигнала в левом канале производится раньше,
чем правого сигнала, ручное отключение
автоматики блокировано;
 остальные комбинации битов не определены;
биты 4 — 7 g: —
коды управления битами пользователя, пока не
определены.
Если установка состояния канала не осуществляется, тогда все
данные блока состояния канала должны быть установлены в
логический
0,
а
приемный
интерфейс
автоматически
устанавливается на частоту дискретизации 48 кГц с
использованием двухканального режима работы с 20-разрядными
кодовыми словами отсчетов без предыскажений.
Байт 2:
биты 0 — 2 h: —
использование дополнительных битов кодового
слова отсчета:
000
001
биты 3 — 7 g: —
Байт 3:
биты 0 — 7 j: —
 использование дополнительных битов не
определено, длина слова отсчета составляет
20 битов;
 длина слова отсчета 24 бита;
 остальные сочетания символов не определены;
кодовое слово источника и предыстории его
кодирования, зарезервированы, но пока не
определены;
функционирование
многоканальной
зарезервированы и пока не определены.
системы,
Назначение информации, передаваемой в остальных байтах,
отображено на рис. 0.4 и не требует дополнительных пояснений.
Итак, сигнал стыка содержит все сведения о цифровом ЗС и
служебную информацию, необходимую для перекодирования из
одного формата в другой. Преобразование кода из одного формата
в другой происходит в интерфейсе автоматически. В большинстве
вновь разрабатываемых устройств — цифровых магнитофонах,
лазерных проигрывателях, средствах цифровой обработки ЗС —
предусмотрены входы и выходы, позволяющие включать их в
звуковой тракт в соответствии с требованиями описанного
стандарта.
Изменение частоты дискретизации
Сочленение цифровых устройств осуществляется достаточно
просто, если частоты дискретизации в коммутируемых устройствах
совпадают. В этом случае достаточно согласовать законы
компандирования в разных звеньях тракта. Реализуется это на
основе ИКМ-сигнала с равномерным квантованием, который, как
правило, является исходным для всех АЦП. По этому общему для
всех цифровых устройств закону и объединяют тракты системы с
разными законами компандирования.
Если же частоты дискретизации не совпадают, то интерфейс
должен содержать также дополнительно блок передискретизации.
Эта задача, например, возникает при организации стыка
аппаратуры ТФП (fд = 48 кГц) с аппаратурой ТПРП (fд = 32 кГц)
или при соединении аппаратуры систем записи сигналов (fд = 44,1
кГц) с аппаратурой ТФП и каналов связи.
Изменить частоту дискретизации можно двумя способами:
промежуточным переходом к аналоговой форме и непосредственно
путем преобразований в цифровом сигнале. Первый способ
предполагает преобразование сигнала в аналоговую форму и его
последующую дискретизацию с новой частотой и кодирование в
новом формате. При этом способе исходный ЗС дважды
подвергается квантованию, что приводит к возрастанию мощности
шума квантования и не является желательным. Например, при
переходе от ТФП (где fд = 48 кГц и т = 16) к ТПРП и ТВРП (где
fд = 32 кГц и т = 10) уменьшение числа разрядов приводит к
возрастанию шумов квантования на 20…26 дБ. Собственно же
передискретизация в этом случае не сказывается на общем
отношении сигнал/шум.
Если передискретизация выполняется без преобразования
цифрового сигнала в аналоговую форму, то для получения новой
совокупности отсчетов используется процедура интерполяции. При
этом реализация метода наиболее проста, если частоты
дискретизации имеют общий кратный сомножитель.
В качестве примера рассмотрим переход от частоты
дискретизации fд = 48 кГц к новому значению, равному 32 кГц (рис.
0.5). Наименьшее значение частоты, кратное этим величинам,
составляет 96 кГц. Увеличение частоты дискретизации достигается
здесь интерполяцией промежуточных дополнительных значений
отсчетов, а уменьшение частоты дискретизации до 32 кГц —
отбрасыванием лишних значений.
Итак,
поскольку
32
кГц = (482):3,
то
процедура
передискретизации состоит в следующем:
1. Вначале выполняется преобразование от fд = 48 кГц к fд = 96
кГц.
Для
этого
методом
интерполяции
рассчитывают
дополнительные значения отсчетов в середине исходного тактового
интервала (показаны на рис. 0.5, а штриховой линией). Полученная
в результате этого суммарная последовательность отсчетов
соответствует fд = 96 кГц.
Рис. 0.5 — К пояснению процесса передискретизации
цифрового сигнала
2. Далее из этой новой последовательности выбирается
каждый третий отсчет (рис. 0.5, б), что означает снижение частоты
дискретизации в 3 раза по отношению к fд = 96 кГц.
Для большей наглядности на рисунке показаны не кодовые
слова, а соответствующие им отсчеты ЗС. В действительности же
интерфейс оперирует, выполняя интерполяцию с цифровыми
сигналами. Осуществляя передискретизацию сигналов, следует
помнить о возможности появления искажений, вызванных так
называемым наложением спектров. Для устранения этого явления
при уменьшении частоты дискретизации в интерфейс в случае
необходимости должны включаться цифровые фильтры для
ограничения
полосы
частот
исходного
ЗС.
Например,
необходимость такой дополнительной фильтрации возникает при
уменьшении fд с 48 до 32 кГц, когда требуется снизить полосу
частот ЗС с 20 кГц (ТФП) до 15 кГц (ТПРП и ТВРП).
Структура цифрового сигнала в стандарте MPEG-1 ISO/IEC
11172-3
В течение последних десяти лет в мире сформировался новый
стандарт для совместной цифровой передачи сигналов изображения
и звука в компрессированном (сжатом) виде, получивший название
MPEG-1 Standart ISO/IEC 11172-3, опубликованный в 1993 г., и его
дальнейшее развитие для систем с многоканальным звуком MPEG2-Standart ISO/IEC 13818-3, опубликованный в 1994 г. Стандарт
MPEG-1 реализован в системе цифровых компакт-кассет (DCC), где
для кодирования звука используется «Layer-1». Его применение
предусмотрено также в цифровом радиовещании (системы DAB —
Digital Audio Broadcast, Eureka-147), где для кодирования ЗС
используется «Layer-2». MPEG-2 предполагается реализовать в
телевидении высокой четкости, а также для многоканальной
передачи звука в ЗВ, для записи и передачи сигналов по сети ISDN.
Суммарная скорость цифрового потока при передаче сигналов
изображения и звука в MPEG-1 составляет 1,5 Мбит/с.
На передающей стороне системы сигналы изображения и
звука кодируются, далее подвергаются цифровой обработке с
целью сокращения избыточности, дополняются служебной и иной
информацией и после этого объединяются в единый цифровой
поток, состоящий из пакетов, для передачи по каналу либо для
записи. На приемной стороне происходит их разъединение и
последующее декодирование. Системный стандарт не определяет
жестко процедуру кодирования ЗС, он содержит лишь правила,
определяющие структуру потока, т.е. данные, необходимые для
правильного декодирования сигналов на приемной стороне.
Декодер в отличие от кодера является устройством, где процедуры
декодирования жестко определены так, чтобы входные цифровые
данные были бы верно интерпретированы. Поэтому формат кода,
точнее, интерфейс для компрессированного сигнала жестко
определен.
В MPEG-1 компрессированные сигналы передаются
совместно в едином пакете (рис. 0.6, верхняя часть; обозначены
Pack(i), Pack(i+1), Pack(i+2),...). Перед каждым таким пакетом
имеется «системная» преамбула (Header), где содержатся все
системные параметры и вся необходимая общая служебная
информация о системе. Системная тактовая частота равна 90 кГц ±
4,5 Гц. Преамбула повторяется перед началом каждого пакета.
Более подробно структуры преамбулы и собственно пакета данных
представлены ниже на этом же рисунке в его средней части.
Рис. 0.6 — Структура сигнала при совместной передаче сигналов
изображения и звука в стандарте MPEG-1
Стандарт предусматривает, что поток данных может
содержать как аудио-, так и видеоданные, причем скорость
передачи данных может составлять, например, для звуковой части
(если компрессия ЗС выполняется кодером «Layer-2» при fд = 48
кГц) 24 кбайт/с (192 кбит/с), а для передачи видеочасти — 150
кбайт/с. Из соотношения этих скоростей передачи аудио- и
видеоданных можно определить, с какой частостью должна
передаваться в пакете данных аудио- и видеоинформация. Вся
дополнительная информация, необходимая для разделения и
декодирования сигналов изображения и звука, должна быть
приемнику известна (передана). Она и содержится в преамбуле
пакета. Преамбула начинается стартовым кодом пакета (Pack Start
Code), следующие 8 байт служат для передачи сигнала
синхронизации и сигналов управления системой в целом (System
Clok Reference — SRC), после этого передается системная
преамбула данного пакета (System Header), которая содержит всю
необходимую информацию управления для разделения следующих
в пакете в переменной структуре аудио- и видеоданных. Без
правильного приема и выделения информации управления
процессы разделения потоков и их последующее декодирование
будут невозможны. Длина преамбул составляет 12 байт, лишь
самая первая преамбула имеет длину 29 байт.
Таким образом, затраты на передачу информации управления
достаточно малы. Однако данный способ позволяет всей системе
очень гибко адаптироваться к различным потокам информации. В
пакетах видео- и аудиоданные сведены в отдельные субблоки
(например, каждый длиной по 2 кбайт), несколько блоков
(например, три) вновь образуют блок. Вся информация об этой
структуре упаковки видео- и аудиоданных и местах расположения
этих блоков в пакете содержится в преамбуле к пакету.
Принимаемый компрессированный цифровой поток данных в
соответствии
с
информацией
по
управлению
демультиплексируется, затем собирается в промежуточной памяти,
после чего подвергается обратной цифровой обработке с целью
декомпрессии. В результате образуются исходные цифровые
потоки аудио- и видеоданных. При этом компрессия звуковых
данных в стандарте MPEG-1 ISO / IEC 11172-3 базируется на
использовании метода MUSICAM (см. разд. 0.11). Временные
затраты на требуемый объем промежуточной памяти можно
минимизировать в кодирующем устройстве за счет рационального
размещения потоков данных.
Теперь остановимся подробнее лишь на структуре цифрового
потока, относящегося только к передаче ЗС. В соответствии со
стандартом MPEG-1 ISO/IEC 11172-3 основной структурной
единицей формата кода является подцикл (фрейм), включающий
преамбулу (Header) и относящиеся к данному фрейму
компрессированные аудиоданные (Frame(i) data) (рис. 0.7). Фрейм
объединяет ту часть аудиоданных, которая декодируется
самостоятельно.
Фрейм представляет собой последовательность данных,
включающих в себя: служебную информацию; таблицу
распределения общего числа бит по субполосам; информацию о
масштабных коэффициентах (МК) субполос; значения МК;
значения отсчетов субполосных сигналов; биты заполнения.
Остановимся подробнее на формате фрейма. Служебная
информация, содержащаяся в преамбуле (32 бита), включает
синхрослово 1111 1111 1111 (12 бит) и информацию о состоянии,
относящуюся к структуре данных фрейма (20 бит):
 бит идентификации — ID, равный 1, если поток
аудиоданных полностью соответствует стандарту ISO/MPEG
11172-3 и 0 в противном случае;
 код уровня (2 бита), идентифицирующий тип слоя
кодирования — «Layer-1», «Layer-2», «Layer-3», резерв;
Рис. 0.7 — Структура компрессированного цифрового звукового сигнала на
выходе кодеров «Layer-1» (а) и «Layer-2» (б),
(MPEG-1 ISO/IEC 11172-3)
 бит защиты, равный 1, если не применяется
помехоустойчивое кодирование и 0 в противном случае;
 значение скорости цифрового потока (4 бита) для каждого
слоя кодирования (32...448 кбит/с для «Layer-1», 32...384 кбит/с для
«Layer-2» и 32...320 кбит/с для «Layer-3»);
 частоту дискретизации — 44,1 или 48 либо 32 кГц (2 бита);
 «паддинг» бит, равный 1, если частота дискретизации 44,1
кГц и 0 в противном случае;
 бит для использования в специальных целях, например
передачи дополнительной информации;
 код режима передачи (2 бита), идентифицирует режимы:
стерео, «объединенное» стерео, два независимых канала, один
канал;
 код режима расширения (2 бита) при передаче в режиме
«объединенное стерео»;
 бит права копирования, равный 0, если копирование
запрещено;
 бит «оригинал/копия», равный 1, если передается оригинал;
 код предыскажения (2 бита).
После преамбулы 16 бит отводятся для помехоустойчивого
кодирования (обнаружения и коррекции ошибок при цифровой
передаче — CRC на рис. 0.7). Далее следуют собственно
аудиоданные компрессированного ЗС. Первой идет таблица,
идентифицирующая
распределение
общего
числа
бит,
используемых для кодирования отсчетов каждого из субполосных
сигналов (Bit Allocation). Таблица состоит из 30 слов: A(1), A(2),…,
A(i), …, A(30) длиной от 2 до 4 битов. Вспомогательная таблица
F[A(i)] задает функцию, значениями которой являются число бит
для кодирования отсчетов i-й субполосы. Субполосные сигналы 31й и 32-й субполос не кодируются и не передаются. При
использовании формата «Layer-1» MPEG-1 ISO/IEC 11172-3 все
слова А(i), i = 1,…, 30, имеют одинаковую длину, равную 4 битам.
Для слоя 2 («Layer-2») длина слов А(i) переменна, зависит от числа
кодируемых субполосных сигналов, скорости цифрового потока,
частоты дискретизации и меняется в пределах 2...4 бит.
Затем во фрейме располагается информация о МК (SCFSI —
Scalenfactors Selection Information). Она передается только для слоя
2 («Layer-2») и лишь для тех субполос, где F[A(i)] > 0. Информация
о МК передается словами длиной 2 бит, определяющими, сколько
бит (6, 12 или 18) тратится на кодирование трех МК данной
субполосы.
После этой информации располагаются данные о значениях
МК (Skalenfactors). Они представляют собой квантованные (из
расчета 6 бит), максимальные по абсолютной величине значения
отсчетов субполосных сигналов в блоке (грануле), состоящем из 12
следующих подряд отсчетов ЗС. Значения МК записываются в
часть фрейма, обозначенную как «Skalefactors» (см. рис. 0.7),
начиная с низкочастотных субполос и со старшего бита кода МК.
Наконец,
во
фрейме
следуют
кодовые
группы,
соответствующие отсчетам ЗС в субполосах (Subband Samples).
Они объединены в 12 блоков: B(1), B(2),…, B(j), B(12). Блок B(j)
содержит значения нормированных на МК отсчетов для полос с
номерами от 3j – 2 до 3j, для которых F[A(i)] > 0.
Размер блока B(j) равен (F[A(1)] + F[A(2)] +..+.
+ F[A(30)])/12.
Каждый блок B(j) содержит 30 подблоков: С(1), С(2),...,
С(k),...,С(30).
Подблок С(k) содержит группу из трех отсчетов k-й полосы.
Структура подблока С(k) зависит от значения F[A(k)].
Заметим, что в формате «Layer-1» каждый фрейм содержит
информацию о 384 отсчетах ЗС, подвергнутых ИКМ с равномерной
шкалой квантования при fд = 48 кГц (длительность выборки
составляет в данном случае 8 мс). В отличие от этого в формате
«Layer-2» фрейм содержит информацию о 1152 отсчетах ИКМ
сигнала, дискретизированного также с частотой 48 кГц, но
длительность выборки равна уже 24 мс.
Завершают фрейм дополнительные данные (AD — Ancillary
data). Эта часть фрейма может быть использована для передачи
дополнительных данных (определяется пользователем).
Такова структура цифровых данных в стандарте MPEG-1
ISO/IEС 11172-3, принятом Европой.
Особенности стандарта MPEG-2 ISO/IEC 13818
MPEG-2 Standart ISO/IEC 13818-3 (принят в марте 1994 г.)
расширяет и дополняет MPEG-1 Standart ISO/IEC 11172-3 до
возможности формирования в едином цифровом потоке пяти
отдельных звуковых каналов и дополнительно канала сверхнизких
частот (LFE — Low Frequence Enhancement) с высоким качеством и
низкой суммарной скоростью их передачи. Тем самым становится
возможным передать в цифровой форме по каналам связи, записать
и воспроизвести в помещении прослушивания (комната
радиослушателя, видеозал, кинотеатр и т.п.) всю совокупность
конфигураций форматов воспроизведения, предусмотренных
Документом 10/63Е ITU-R.
В MPEG-2 стандарте может быть организована передача
любой конфигурации ЗС: 3/2, 3/1, 3/0, 2/2, 2/1, 2/0, 1/0, а также
общего канала сверхнизких частот с полосой до 150 Гц (система
звукопередачи 5+1). Напомним, что сформированный в ТФП
пятиканальный
ЗС
перед
кодированием
подвергается
матрицированию с целью выполнения требований совместимости и
лишь после этого цифровой обработке для сокращения
избыточности. Для компактного цифрового представления ЗС в
данном случае используется метод кодирования MUSICAM, но в
отличие от MPEG-1 в этом новом стандарте расширен состав
применяемых кодеков и используемых частот дискретизации: 16,
22,05 и 24 кГц (дополнительно к ранее предусмотренным
значениям: 32, 44,1 и 48 кГц). Стандарт MPEG-2 позволяет
передавать одновременно: стереофонические сигналы в двух
конфигурациях (3/0 и 2/0); стереофоническое звучание и
дополнительно речь на двух языках; моносигнал и дополнительно
до семи комментаторских каналов с более низким качеством,
используя дополнительные частоты дискретизации 16, 22,05 и 24
кГц. В этом новом формате декодер ISO/IEC 11172-3 (MPEG-1)
может восстанавливать два канала без дополнительной
многоканальной части, а декодер MPEG-1 ISO/IEC 13818-3
расшифровывать поток данных формата 111723 как устройство
более высокой иерархии.
Итак, для пары основных сигналов стереопары Л = Т0 и П = Т1
выполнено требование как прямой, так и обратной совместимости
при декодировании (рис. 0.8).
Рис. 0.8 — К пояснению принципа передачи дополнительных сигналов
многоканального расширения в стандарте MPEG-1 ISO/IEC 11172-3
Алгоритм
декодирования
дополнительных
сигналов
многоканального расширения Т2, Т3, Т4 иной, достаточно гибкий,
ориентированный на максимально допустимое сокращение
скорости цифрового потока при их передаче. Кроме того, длина
фрейма в MPEG-2 составляет 48 мс вместо 24, поэтому для
распознавания нового формата ID-бит в MPEG-1 принимает
значение 0 (см. разд. 0.14).
В зависимости от вида кодирования декодер MPEG-2 ISO/IEC
13818-3 может декодировать либо чистую стереоинформацию
[сигналы Л и П], либо смесь сигналов нескольких каналов.
Заметим, что пространственные сигналы LS и RS имеют
полосу частот 100...7000 Гц, как это принято в системе «DolbySurround». Полоса частот сигнала С ограничивается значением
9 кГц, лишь два сигнала L и R имеют полную полосу частот.
Матрица
кодирования
и
декодирования
исходного
пятиканального сигнала MPEG-2 стандарта представлена на рис.
0.9.
Рис. 0.9 — Матрицирование сигналов в стандарте MPEG-2
На передающей стороне системы звукопередачи исходный
пятиканальный сигнал преобразуется в новую совокупность в
соответствии со следующим алгоритмом (это преобразование
выполняется для того, чтобы удовлетворить требованию
совместимости:
(
0.49)
где α, β, γ — постоянные коэффициенты, которые могут иметь
различные значения (табл. 0.1) в зависимости от режима работы.
Таблица 0.1
Режим
0
1
2
3
α
1/(1+2)
1/(1,5+0,5 X 2)
1/(1+2)
1
Коэффициенты матрицирования
β
γ
1/2 1/2 (см. рис. 0.11)
1/2 1/2 (см. рис. 0.11)
1/2 1/2 (для сигналов Л и П сдвиг по фазе ±90º)
1
1 (без матрицирования)
Последняя строка в этой таблице соответствует режиму
работы, когда исходная совокупность сигналов без матрицирования
прямо доводится до пользователя. Далее, чтобы избежать
возможной перегрузки, уровни сигналов T0, T1, T2, T3, T4 при
передаче понижаются на значение α. Режим 2 соответствует
передаче сигналов системы «Dolby Surround», поэтому при их
дематрицировании для выделения пространственных сигналов
должен выполняться поворот фазы сигналов Л и П соответственно
на ±90°.
На рис. 0.10 изображена в упрощенном виде структура MPEG2 кодера для многоканальной звукопередачи. Исходными здесь
являются входные сигналы LS, L, С, R, RS. Сигнал С центрального
фронтального канала ограничивается по полосе сверху значением 9
кГц, а его более высокочастотные компоненты распределяются на
левый L и правый R фронтальные каналы. Все исходные сигналы
анализируются с учетом психоакустической модели. Кроме того, с
помощью банка фильтров, как и ранее в MPEG-1 стандарте,
каждый из сигналов разделяется на 32 полосные составляющие, а
затем дискретизируется с различной частотой дискретизации, но
кратной системной тактовой частоте fs.
Рис. 0.10, a — Структурная схема устройства для кодирования многоканального сигнала в соответствии
с MPEG-2 ISO/IEC 13818-3 для слоев «Layer-1» и «Layer-2»:
1 — психоакустическая модель; 2 — ФНЧ и ФВЧ с частотой среза 9000 Гц; 3 — банк полосовых из 32-х ПФ с
полосой пропускания 720 Гц каждый; 4 — предварительное квантование отсчетов полосных ЗС; 5 — селекция
каналов; 6 — вычисление предсказанных значений; 7 — распределение бит в дополнительных каналах;
8, 9 — кодирование сигналов основных и дополнительных каналов; 10 — форматирование
Рис. 0.10, б — Цифровые последовательности при кодировании
отсчетов полосных сигналов по MPEG-1 для слоев
«Layer-1» и «Layer-2»
Сигналы С, LS, RS дополнительных каналов квантуются до
кодирования, чтобы уменьшить ошибки при их матрицировании.
Далее все сигналы «взвешиваются» (α, β, γ), после чего поступают
на сумматоры (+) для получения совместимых сигналов обычной
стереофонии Л = T0 и П = T1. Эта основная пара сигналов
дополняется тремя дополнительными сигналами T2, T3, T4, которые
должны по возможности иметь при передаче как можно меньший
суммарный поток аудиоданных.
В MPEG-2 стандарте для получения максимально возможной
компрессии общего цифрового потока при кодировании
дополнительного многоканального расширения (сигналы T2, T3, T4)
учитывается также и степень корреляции между основными (Т0, Т1)
и дополнительными (T2, T3, T4) сигналами. Если корреляция
сильная, то от передачи данных по дополнительным каналам
можно отказаться и передавать лишь различия по отношению к
сигналам основных каналов. Для этой цели служит адаптивное
предсказание, которое используется в MPEG-2 кодере при передаче
дополнительных сигналов. Более того, сам состав передаваемых
сигналов в дополнительных каналах непостоянен.
Возможны
следующие
восемь
их
комбинаций
с
соответствующим переключением в кодере:
Т0
Л
Л
Т1
П
П
Т2
С
L
Т3
LS
LS
Т4
RS
RS
Л
Л
Л
Л
Л
П
П
П
П
П
R
С
С
С
R
LS
L
LS
L
L
RS
RS
R
R
RS
Для уменьшения скорости передачи данных в MPEG-1
предусматривается режим «Joint-Stereo» («объединенное стерео»), в
котором для области верхних частот в левом и правом каналах
передаются только коэффициенты масштаба, сами же сигналы этой
области остаются монофоническими. При более двух передаваемых
сигналах можно исходить из того, что не каждый из них
одновременно нуждается в максимальном потоке данных при его
передаче. Для восприятия ЗС не требуется полной передачи всей
информации в каждом из них.
Как правило, вся необходимая для полноценного восприятия
информация в текущий момент времени содержится не более чем в
двух-трех сигналах, остальные же из них в этот момент времени
являются как бы «фоновым дополнением». Например, если в
текущий момент явно ощущается какое-то приоритетное
направление в пеленгации источника звука, то значительная доля
информации в паре сигналов, определяющих его восприятие,
идентична.
В этой связи в MPEG-2 стандарте предусматривается
значительно более гибкий метод для компрессии общего потока
данных — так называемое динамическое переходное затухание
между каналами, что позволяет экономить значительное число бит
при передаче. Для одного, двух или трех каналов передаются, как и
при режиме «Joint-Stereo», лишь коэффициенты масштабирования,
с помощью которых после декодирования меняется лишь
соотношение уровней данной группы сигналов, остающихся
одинаковыми по структуре (монофоническими, точнее говоря,
изоморфными).
Иначе говоря, все значения отсчетов для таких групп
частотных полос остаются общими и одинаковыми, кроме значения
уровня. Одинаковыми и общими после декодирования являются и
сами эти сигналы, наблюдаются лишь отличия в их уровне,
необходимые для пеленгации (локализации) источника звука. В этой
ситуации требуется лишь передать коэффициенты масштаба, а сами
значения отсчетов восстанавливаемого сигнала берутся из другого
канала. Таким образом, корреляция сигналов различных каналов
используется здесь для дополнительной компрессии данных.
И еще одно замечание — при передаче многоканального
расширения субполосные сигналы объединяются в 12 групп (табл.
0.2) для их последующего анализа и обработки с целью управления
значением динамического переходного затухания между каналами
многоканального расширения. В выходной части кодера все
множество разделенных цифровых данных форматируется в
соответствии с определенными правилами в единый цифровой
поток.
Таблица 0.2
Номер группы полосных сигналов
Номер полосной составляющей
исходного сигнала
0 1 2 3 4 5 6 7 8
9
10–
0 1 2 3 4 5 6 7 8–9
11
10
12–
15
11
16–
31
Изложенное позволяет говорить о существенном отличии
алгоритма обработки сигналов многоканального расширения в
кодере MPEG–2 по сравнению с MPEG-1. Это отличие базируется
на еще более тонком учете как структуры многоканального
сигнала, так и свойств слуха при его восприятии и преследует
только одну цель — обеспечить максимально возможное
сокращение избыточности передаваемой информации, а значит, и
уменьшение скорости цифрового потока при его передаче.
На рис. 0.11 изображена упрощенная структурная схема
MPEG-2 декодера. Входной цифровой поток данных разделяется во
входной части устройства на сигнальные и управляющие
составляющие, а затем восстанавливаются первоначальные
значения отсчетов ЗС. Декодированные ЗС подвергаются
обратному преобразованию в матрице в каждой из 32 полос. И
наконец, различные полосные составляющие каждого из сигналов
вновь объединяются в инверсном банке фильтров. На выходе
декодера получается исходная совокупность восстановленных
сигналов Л', П' и LS', L', С', R', RS'.
Структура аудиоданных в стандарте MPEG-2 ISO/IEC 13818-3
Рис. 0.11 — Структура устройства для декодирования многоканального ЗС в соответствии
с MPEG-2 ISO/I ЕС 13818-3:
1 — деформатирование суммарного цифрового потока; 2 — декодирование; 3 — дематрицирование
Напомним, что аудиофрейм формата MPEG-1 ISO/IEC 11172-3
содержит (см. рис. 0.9):
1) преамбулу (Header) информации (32 бита);
2) биты избыточности для помехоустойчивого кодирования
(CRC) с целью обнаружения и коррекции ошибок (16 бит);
3) аудиоданные, информацию о распределении бит по полосам
частот для слоя «Layer-2» (BAL), информацию о селекции МК
(SCFSI), значения МК (SCF) и значения отсчетов ЗС для отдельных
частотных полос;
4) дополнительные данные, длина которых не определена изза гибкости применений.
Два формата аудиофрейма, предусмотренных стандартом
MPEG–2 ISO/IEC 13818, изображены на рис. 0.12 и 0.13. Прежде
всего рассмотрим формат структуры данных, когда он обратно
совместим с MPEG–1 (рис. 0.12).
Рис. 0.12 — Структура аудиофрейма MPEG-2 при передаче ЗС
многоканального расширения в рамках формата ISO/IEC 11172-3 стандарта
MPEG-1
Структура цифровых аудиоданных сигналов Т0 и Т1 стандарта
MPEG-2 ISO/IEC 1381-3 соответствуют формату аудиоданных в
MPEG-1. Информация каналов Т2, Т3, Т4 располагается в первой
части аудиофрейма, относящейся к передаче дополнительных
данных. Здесь также имеются своя преамбула (MC-Header), биты
для
помехоустойчивого
кодирования
(MC-CRC),
часть,
относящаяся к передаче собственно аудиоданных сигналов Т2, Т3,
Т4 (Audiodaten Zusatzdaten), и часть для передачи дополнительной
информации. Требуемая скорость для передачи битов сигналов Т2,
Т3, Т4 в многоканальной системе может варьироваться от фрейма к
фрейму в зависимости от характеристик ЗС. Остаток части
аудиофрейма может также предоставляться для передачи других
дополнительных данных, например речевых сигналов. Общая
(суммарная) скорость передачи битов поддерживается постоянной
в соответствии с ISO/IEC 11172-3. Частота дискретизации для
основных сигналов Т0, Т1 составляет 48, 44,1 или 32 кГц; для
сигналов дополнительного многоканального расширения — 24,
22,05 и 16 кГц.
Возможные комбинации передаваемых сигналов приведены в
табл. 0.3. В таблице: L2 и R2 — дополнительные второй левый и
второй правый сигналы. При любом сочетании возможна
дополнительная передача сигнала сверхнизких частот (LFE) с
помощью отдельного канала. Канал сверхнизких частот (LFEC)
имеет параметры: частоту дискретизации fд/96; ширину полосы 125
Гц; разрешение более 20 бит/отсчет.
Таблица 0.3
Число каналов
передачи
5
5
4
4
3
3
2
1
Конфигурация
(формат
воспроизведения)
3/2
3/0 + 2/0
3/1
2/0 + 2/0
3/0
2/1
2/0
1/0
Передаваемые сигналы
L, С, R, LS, RC
L, С, R + L2, R2
L, С, R. S (Sorround)
L, R + L2, R2
L, C, R
L, R, S
L, R (Stereo, ISO 11172-3)
Моно (ISO 11172-3)
В стандарте MPEG-2 содержатся 29 таблиц расположения
аудиоданных передаваемых сигналов, которые приписывают
сигнальные компоненты к каналам Т0…Т4.
Структура данных для случая введения дополнительного по
сравнению с MPEG-1 расширения показана на рис. 0.13.
Аудиофрейм данных начинается с преамбулы (Header), за
которой следуют CRC-биты (контрольный код цикличной
избыточности). Следующие биты используются в слое 2 для
кодирования распределения битов в субполосах (BAL),
информация о распределении МК (SCFSI), за которыми
расположены значения МК (SCF) и аудиоданные отсчетов
полосных сигналов, соответствующие по структуре формату
ISO/IEC 11172-3 для основной пары сигналов Л и П. Затем следуют
дополнительные данные многоканального расширения (МС). Эта
вторая часть фрейма (см. рис. 0.13) вновь начинается с преамбулы
(MC-Header), далее идут данные помехоустойчивого кодирования
для обнаружения и коррекции ошибок, а также информация о
дополнительных каналах, информация о распределении бит по
субполосам, селекции МК, значения МК: MC-CRC, MC-BAL,
МСSCFS1, MC-SCF. Далее следуют аудиоданные, сначала МСпредсказание, затем МС-данные групп частотных полос и, наконец
(если имеются в наличии), многоязыковые каналы (до семи
комментаторских каналов).
Рис. 0.13 — Структура аудиофрейма MPEG-2 ISO/IEC 13818-3
с дополнительным расширением
Вся эта совокупность данных многоканального расширения
располагается на месте дополнительных данных стандарта ISO/1
EC 11172-3 (см. рис. 0.13) и лишь потом могут еще следовать
дополнительные данные. Формат этих дополнительных данных
представлен внизу справа. Он начинается с синхронизации части
расширения (Sync), за которой следует расширение CRC, указание
о длине расширения (ext Lange), собственно аудиоданные
расширения (ext МС-аудиоданные) и возможные дополнительные
данные (МС-дополнительные данные 2). Этот поток расширения
позволяет
превысить
максимальную
скорость
данных,
предусмотренную стандартом MPEG-1 384 кбит/с. Но
одновременно остается учтенным основное требование к обратной
совместимости аудиофрейма. MPEG-1 декодер использует лишь
часть аудиофрейма, соответствующую его норме. MPEG-2 декодер
может перерабатывать всю информацию, включая и это последнее
дополнительное расширение.
Обработка сигналов в среде Мультимедиа
Назначение и возможности технологии Мультимедиа
Мультимедиа — своеобразное слово-лозунг, используемое в
самых различных случаях, часто в рекламных целях. Эквивалентом
данного слова является термин «много сред коммуникаций». В
этом смысле термином «Мультимедиа» можно обозначить любую
интеграцию более чем двух автономных сред коммуникаций,
например таких, как компьютер, факс и модем.
При более точном толковании термин «Мультимедиа»
означает, что человек одновременно и наиболее рационально
использует для связи с окружающим миром по возможности все
свои органы чувств, по крайней мере, такие важнейшие для приема
и переработки информации, как зрение и слух. При этом связь
может осуществляться как с партнером (человеком), так и с какойлибо технической системой. Иначе говоря, Мультимедиа — это
ориентированный на человека интерфейс, связывающий его с
компьютером
как
универсальным
или
всеобъемлющим
устройством,
являющимся
сегодня
важнейшим
звеном
телекоммуникационной системы.
До настоящего времени отдельные технические средства
телекоммуникации, такие, как телефон, ЗВ, звуковоспроизведение,
передача данных (сети ЭВМ), передача текстов (электронная почта,
телефакс, Internet), ТВ-вещание, передача неподвижных и
движущихся изображений, все еще более или менее отделены друг
от друга. При использовании технологии мультимедиа эти виды
технических средств, используемые для передачи разнородной
информации, объединяются на общей цифровой основе,
позволяющей создать новую среду, включающую персональный
компьютер, проигрыватель компакт-дисков, радиоприемник,
телевизор, факс, видеотелефон с автоответчиком. Независимо от
того, состоит ли передаваемая в этой среде информация из чисел,
текста, графики, неподвижных и движущихся изображений со
звуком или только из звуковой информации, ее можно будет
создать, рассчитать, изменить, передать, принять, накопить,
воспроизвести, стереть и т.п.
Существует много сфер деятельности, где человек мог бы
использовать средства мультимедиа. В самом общем виде их
можно разделить на три части:
1. Передача и прием информации (сообщений). К одному или
нескольким приемникам можно будет передать любую
информацию акустического, визуального или абстрактного типа,
которую позже эти приемники обнаружат и используют. Сюда же
относится также добывание мультимедийной информации из
банков данных, причем содержащих не только печатную
продукцию, но и подвижные изображения и звуки. При этом
продолжительность передачи не будет играть существенной роли.
2. Представление информации. Пользователь сам сможет
регулировать, в каком виде и форме ему будет представлена
информация из посланных сообщений и банков данных: в
акустическом виде, в виде текста или изображения, в качестве
изменяющейся картинки или любой комбинации этих зависящих
либо независящих от времени видов. При этом имеющиеся в
распоряжении пользователя технические средства и компьютерные
программы помогут ему отфильтровать и отсортировать
информацию, исходя из своих представлений (информационное
самоопределение). Кроме того, информация, представленная или
подготовленная в одной форме с помощью программного
обеспечения, сможет быть преобразована в другую, по
возможности более компактную и наглядную форму.
3. Связь пользователей в реальном масштабе времени. Люди,
находящиеся в разных местах, благодаря мультимедийным
средствам телекоммуникаций смогут не только видеть и слышать
друг друга, но также одновременно работать над документами
(официальными бумагами, чертежами, рисунками, акустическими
сигналами и т.п.). Таким образом, несмотря на то, что участников
разделяет пространство, между ними возможна кооперация,
совместная работа. Связь в реальном масштабе времени и
одновременная работа пространственно разнесенных участников
требуют не только записи и воспроизведения информации на
рабочем месте в удобной для человека форме, но и средств для ее
передачи с высокой скоростью.
Итак, технология мультимедиа обеспечит эффективные,
универсальные рабочие места, которые создадут удобную для
человека среду, привычную рабочую атмосферу для участников,
разделенных в пространстве. В этой пространственно разнесенной
среде использование зрения и слуха не будет неестественно
ограничено. При этом мобильные слушатели, перемещающиеся по
территории, будут иметь возможность для передачи и приема
разнородной информации. Конечно, совсем необязательно, чтобы
каждое рабочее место было оборудовано всем набором
мультимедийных средств обработки, хранения, передачи и
воспроизведения информации. Однако интеграция различных, пока
еще изолированных телекоммуникационных служб, а также
радиовещания, телевидения, компьютерных сетей будет возрастать
на общей цифровой основе. Другое применение технологии
мультимедиа имеет место в так называемых системах виртуальной
реальности. Кажущаяся действительность возникает за счет
объединения реальных изображений и изображения, созданного
компьютером, т.е. речь идет о комбинации реальных и
синтетических изображений в одном видеоряде. Чтобы, например,
изобразить картины с живыми существами, соответствующие им
сигналы сначала преобразуют в цифровую форму. При этом можно
рассчитать также промежуточные картины для создания
движущегося изображения. При показе на дисплее компьютера
подвижного ряда изображений необходимо вычисление двумерного
изображения, освещаемого источником света для создания игры
тени и света. В ряде мультимедиа может происходить достоверное
представление реальных или созданных компьютером живых
существ в реальных или искусственных мирах. При этом
искусственные живые существа можно «пробудить к жизни»,
создав иллюзию того, что они являются живыми, реально
существующими персонажами разворачивающегося действия.
Типичными примерами применения такой компьютерной
технологии мультимедиа являются такие фильмы, как «Парк
Юрского периода», где искусственные динозавры действуют
вместе с реальными актерами, и «Форрест Гамп», в котором живой
актер действует вместе с уже умершими людьми, о действиях
которых имеется ранее при их жизни сделанная видеозапись.
С другой стороны, с помощью дополнительных устройств
становится возможным создание пользователю впечатления, что он
входит в сформированное компьютером помещение и движется в
нем, поворачивая голову, и видит определенные меняющиеся
планы. Система пространственного видения и слушания (созданная
с помощью стереонаушников и стереоочков) регистрирует
(отображает) любое движение головы и даже движение глаз и
создает сообразно с этим изменяющимся направлением взгляда
новые компьютерные изображения и сопутствующие звуковые
сигналы. Типичным применением технологии мультимедиа может
стать архитектура, где появляется возможность «увидеть» здание,
сконструированное с помощью ЭВМ, и войти в него. Таким
образом, каждый пользователь может перемещаться в построенных
с помощью компьютера мирах. Если скомбинировать эту систему
виртуального видения и слышания с «перчаткой данных руки»,
имеющей соответствующие датчики, то с помощью специальных
чувствительных
элементов
можно
регистрировать
и
идентифицировать любое движение руки человека. При хватании
любого виртуального предмета «перчатка данных руки» выдает
ощущение тяжести или легкости этого предмета, его твердости или
мягкости, теплоты, холодности, то есть совокупность тех
ощущений, которые возникают у человека при хватании реального
предмета.
«Перчатка данных» может быть расширена до «костюма
данных»,
если
чувствительными
элементами
будут
регистрироваться изменения состояния всего тела, например будет
чувствоваться касание к предмету благодаря датчикам давления.
Таким образом, отображение действий реального живого существа
происходит с помощью трехмерного сканера, т.е. все движения
человека в помещении регистрируются и записываются. Подобный
трехмерный сканер может работать в полосе частот ТВ-сигнала,
если видеокамеры записывают вызываемые движением человека
позиционные изменения. При этом измерительные датчики
закрепляются на самых важных местах «костюма данных».
Таким образом, можно передать движение реального человека
по направлению к управляемому компьютером виртуальному
человеку. В другой ситуации движение может передаваться роботу,
который работает во враждебном окружении. В том случае, когда
робот и человек оснащены соответствующими датчиками, человек
может, например, не только видеть и слышать, но также и
чувствовать то, что делает робот, а также соответственно управлять
им с помощью собственных движений.
В виртуальном мире люди, находящиеся в различных местах и
связанные сетью передачи данных, смогли бы вместе двигаться и
действовать в нем. В этом смысле задуманы виртуальные бюро, где
несколько человек (виртуально) работают друг с другом.
В конечном итоге, связь между находящимися на расстоянии
людьми могла бы быть с передачей не только зрительной, но и
звуковой информации. В это взаимодействие могут быть вовлечены
и другие органы чувств человека — вкус и обоняние.
Технология мультимедиа станет основой для распространения
разнородной информации в XXI веке, так как ожидается
значительный рост информационных услуг.
Технические требования к технологии мультимедиа
Реализация всех возможностей технологии мультимедиа
требует не только значительных затрат при организации рабочего
места пользователя, но и больших объемов памяти для записи,
хранения и последующей обработки разнородной информации,
поступающей по телекоммуникационным каналам цифровых
данных. Кроме того, как уже было упомянуто ранее, нужно иметь
каналы с большой пропускной способностью в том случае, если
должна быть выполнена передача массива данных в масштабе
реального времени.
Полоса частот передачи значительно увеличивается, если в
масштабе реального времени будет передаваться не только
аудиовизуальная, но также зрительная информация и информация о
движении изображения. Ниже будут рассмотрены объемы данных,
которые поступают в канал при преобразовании в цифровую форму
изображений (графиков, фотографий, движущихся изображений), а
также сопутствующих им ЗС. Для хорошей разрешающей
способности цветного неподвижного изображения (качество
хорошей фотографии) необходимо иметь 3072x2048 точек
изображения (элементов изображения — Pixel). Если для
кодирования трех основных цветов — красного, зеленого, голубого
— используется по 8 битов (1 байт), то сигнал изображения уже
имеет объем в 3072x2048x24 = 144 Мбит или 18 Мбайт.
В видеоформате YUV в каждой строке имеется 720 Y-значений отсчетов сигнала изображения с разрешающей способностью
по яркости 8 бит и соответственно 360 U- и V-значений отсчетов с
необходимым разрешением по цвету 8 бит. При 625 строках
(PAL/SECAM) и передаче 25 кадров в секунду это дает в итоге
поток данных со скоростью около 172 Мбит/с. Для телевидения
высокой четкости (HDTV) с 1920x1152 элементами (точками на
кадр) и передаче 50 кадров в секунду скорость передачи данных
уже составляет около 2,5 Гбит/с.
Цифровой стереосигнал с частотой дискретизации 48 кГц и
линейным квантованием с разрешением 16 бит/отсчет дает
скорость передачи данных 1,5 Мбит/с. Для компакт-диска скорость
передачи данных составляет 1636 Мбит/с.
Итак, при преобразовании информационных видео- и
аудиосигналов в цифровую форму возникает большой объем
цифровых данных и требуемая для их передачи пропускная
способность канала связи оказывается очень высокой. Отказаться
от преобразования сигналов в цифровую форму нельзя, так как
только в цифровой технике возможно многократное копирование
сигнала и его разнообразная обработка без потери качества.
Имеющиеся в распоряжении дешевые цифровые сети,
например ISDN, допускают скорость передачи данных n64 кбит/с,
максимально до 2 Мбит/с. Через них можно передать без сжатия
данных лишь стереосигнал, но не видеосигнал. Передача одного
фотоизображения продлилась бы почти 75 секунд. Более высокие
скорости передачи предлагают сети VBN с пропускной
способностью 140 Мбит/с или широкополосные ISDN сети на 155
Мбит/с. Но их использование для обычного рабочего места с
технологией мультимедиа слишком дорого. Например, было бы
желательным видеоконференции проводить с использованием
линии ISDN, где качество при передаче сигналов изображения
соответствует сегодняшнему телевидению.
В качестве доступной по цене накопительной памяти
предлагается компакт-диск (КД). В режиме 1 (2048 бит полезных
данных/сектор, максимальное число секторов 333000/КД) можно
накопить до 650 Мбайт цифровых данных. Тем самым один КД мог
бы содержать до 36 изображений. Чтение КД можно выполнять со
скоростью лишь 600 кбайт/с. Это означает, что для чтения одного
изображения с КД требуется свыше 30 с. Видеосигналы,
представленные в стандарте МККР, можно накопить до длины 30 с.
Но их нельзя будет считывать с КД в масштабе реального времени.
Данные должны были бы непосредственно считываться с
видеопамяти, поскольку шина персонального компьютера не может
работать с требуемой для передачи в реальном времени скоростью.
Лишь стереоаудиоданные с частотой дискретизации 44,1 кГц можно
без проблем считывать с накопителя на магнитных дисках или КД.
Процесс накопления таких данных может длиться до 74 мин. В
режиме СД-ДА можно считывать 75 секторов с емкостью 2352
байта каждый или 176400 байт/с. Это соответствует скорости
передачи данных около 1,36 Мбит/с (поток данных с качеством
компакт-диска).
Из изложенного следует, что совместная передача и накопление
цифровых данных, соответствующих видео- и аудиосигналам,
становятся возможными лишь при значительном сжатии этих
данных. Если удастся поток данных со скоростью 172 Мбит/с для
видеосигнала, включая 1,5 Мбит/с для аудиосигнала, сжать в общей
сложности до значения 1,5 Мбит/с, то лишь тогда можно
использовать канал ISDN для их передачи, а компакт-диск для их
накопления. Подобное сжатие достигается MPEG-стандартом,
который уже рассматривался ранее применительно к аудиосигналу.
Способ компрессии аудиоданных
В стандарте MPEG-1 для ЗС приняты частоты дискретизации
32, 44.1 и 48 кГц, в MPEG дополнительно введены частоты
дискретизации 16, 22,05 и 24 кГц. Скорость передачи потока
данных в MPEG-1 изменяется от 32 до 448 кбит/с, в то время как
стандарт MPEG-2 допускает и более низкие скорости передачи
данных — до 8 кбит/с. Будущий стандарт MPEG-4 позволит вести
передачу цифровых данных с еще более низкой скоростью.
Стандартом MPEG-1 предусматриваются три различных метода
кодирования аудиосигналов: «Layer-1», «Layer-2» и «Layer-3»,
реализующих разную степень компрессии аудиоданных. Во всех
случаях реализуется метод субполосного кодирования, когда
аудиосигнал расщепляется на 32 одинаковые по ширине частотные
полосы, в каждой из которых прежде всего выполняется понижение
частоты дискретизации в 32 раза. Квантование отсчетов ЗС
происходит с учетом психоакустической модели, в которой
учитываются характеристики маскировки человеческого слуха.
Квантованные
значения
отсчетов
ЗС,
коэффициенты
масштабирования и другая информация о кодировании образуют
группу данных, с адаптивным распределением битов по
субполосам. В группе данных (аудиофрейме) определена лишь их
структура, но не содержание, например вид психоакустической
модели, используемой при кодировании отсчетов выборки ЗС.
Наиболее высокое разрешение по частоте и лучшее
энтропийное кодирование с заранее определенными таблицами
Хоффмана реализовано в «Layer-3».
Стандарт MPEG-2 (ISO/IEC 13818-3) содержит в сравнении с
MPEG-1 многоканальное кодирование сигналов окружения
(Surround). Наряду с каналами Л и П стандарт MPEG-2
поддерживает также центральный фронтальный канал С и два
канала пространственного звучания LS и RS (3/2 формат), а также
другие форматы воспроизведения ЗС, например 3/1, 3/0, 2/2, 2/1,
предусмотренные документом 10/63Е, и канал сверхнизких частот
(Low frequency enhancement — LFE). Эта новая по сравнению с
MPEG-1 стандартом информация размещается в части блока
дополнительных данных, определенного в MPEG-2, так что поток
данных остается совместимым с MPEG-1. Декодирующее
устройство
MPEG-1
может
просто
игнорировать
эти
дополнительные данные. В то же время декодирующее устройство
стандарта MPEG-2 может перераспределять путем последующего
матрицирования моно- и стереоинформацию кодирующего
устройства MPEG-1 на многоканальный вывод.
Таким образом, декодирующее устройство стандарта MPEG-1
может
перерабатывать
стереоинформацию
кодирующего
устройства MPEG-2. В свою очередь, декодер стандарта MPEG-2
может воспроизвести моно- и стереоинформацию кодирующего
устройства MPEG-1.
Способ компрессии видеоданных
В этом разделе рассмотрено сжатие видеоинформации,
которое требуется для реализации технологии мультимедиа. При
кодировании сигналов изображений необходимо удалить
избыточную информацию, и тогда, возможно, будет достигнуто
требуемое для передачи сигналов изображения сжатие.
Для кодирования неподвижных изображений имеется
стандарт JPEG. Сжатие данных изображения достигается
применением 8x8 дискретного косинусного преобразования
(Diskrete Cosinus Transformation — DCT) и специального
квантования.
При
этом
учитывается
свойство
зрения,
заключающееся в том, что человек воспринимает с меньшими
помехами шумы квантования при высоких пространственных
частотах,
чем
при
низких.
Поэтому
высокочастотные
коэффициенты преобразования DCT квантуются более грубо. Для
их кодирования используется адаптивная дифференциальная ИКМ,
причем 64 коэффициента преобразования блока картинки
кодируются с помощью таблиц Хоффмана, где для кодирования
коэффициентов DCT используются кодовые слова разной длины:
более короткие для часто встречающихся коэффициентов и более
длинные — для редко встречающихся. Таким образом, может быть
достигнута компрессия потока цифровых видеоданных в пределах
от 8:1 до 18:1.
Для кодирования подвижных изображений прежде всего был
расширен стандарт JPEG. В его разновидности M-JPEG отдельно
кодируется каждое видеоизображение. Таким образом достигается
сжатие в пределах от 20:1 до 50:1 и даже более. Недостатком
модифицированного стандарта M-JPEG является то, что процедура
кодирования сжатых сигналов очень трудоемка. Кроме того, с
увеличением степени сжатия значительно ухудшается качество
изображения.
Лучшие результаты дает стандарт MPEG (ISO/IEC 11172-2 и
13818-2), который тоже использует для сжатия корреляцию
сигналов внутри кадра и при смене кадров. Коэффициенты
преобразования DCT, во-первых, подвергаются локальной
пространственной обработке, при которой используется корреляция
данных внутри кадра изображения. Кроме того, коэффициенты
разных кадров изображения подвергаются временной обработке,
которая использует похожесть следующих друг за другом кадров
изображения (картинок). После двух ступеней обработки
происходит адаптивное квантование, а потом кодирование
коэффициентов DCT кодовыми словами переменной длины, при
котором редким высоким амплитудным значениям соответствуют
длинные кодовые слова, а частым маленьким амплитудным
значениям — короткие кодовые слова. Дальнейшее сжатие
достигается благодаря тому, что через регулярные интервалы
времени передается полная информация о кадре изображения
(картинке), подвергнутая сжатию путем двухступенчатой
обработки коэффициентов DCT, а в промежутках вся необходимая
информация вычисляется через предсказание. Дополнительное
сжатие при этом осуществляется также благодаря интерполяции
информации о цвете.
Заметим, что процедура кодирования становится здесь более
трудоемкой, а декодирование компрессированных данных —
наоборот более простым в сравнении с методом M-JPEG. Поэтому
кодирование
осуществляется
с
помощью
специального
аппаратурного обеспечения (Hardware), в то время как
декодирование
компрессированных
видеосигналов
может
происходить с помощью программного обеспечения (Software). В
стандарте MPEG-1 (ISO/IEC 11172-2) достигается сжатие
видеоданных от 50:1 до 200:1, так что для передачи видеосигнала
необходима скорость 1,2 Мбит/с. В этом случае видеоинформацию
на видеокомпакт-диск можно записывать длительностью не 39
секунд, а 50...60 мин. Если дополнительно к этому использовать
способ записи с повышенной плотностью, то становится
возможным записать игровой фильм с длительностью показа
120...150 мин.
Более эффективное сжатие цифровых видео- и аудиоданных
обеспечивает стандарт MPEG-2 (ISO/IEC 13818-2 и 3).
Следует отметить, что оба указанных стандарта определяют
лишь синтаксис и семантику потока цифровых данных. При этом
скорость передачи данных сжатого сигнала может быть как
постоянной, так и переменной. Пока соблюдаются определенные
правила синтаксиса, различные декодеры и кодеры с разной
степенью компрессии цифровых данных могут меняться местами.
Сигналы, которые создаются кодирующим устройством MPEG-2,
могут обрабатываться декодирующим устройством MPEG-1.
Процедура декодирования в обоих стандартах жестко
регламентирована в отличие от процедуры кодирования, где
имеется определенная степень свободы при обработке данных.
Мультимедийные авторские системы
Данные
системы
представляют
собой
изделия
с
соответствующим программным обеспечением. С их помощью
можно без дополнительного программирования сгруппировать
различные видео- и аудиоданные, обрабатывать их, архивировать,
выполнять различные презентации. Для презентации, кроме
программного
обеспечения
(Software),
требуется
также
соответствующее аппаратное обеспечение (Hardware), которое в
масштабе реального времени восстанавливает сжатые данные в
накопительной среде и затем выводит их на экран монитора или
соответственно на громкоговоритель системы воспроизведения.
Обработка видеоизображений от их введения в компьютер до
анимирования (оживления) и составляет основное содержание
программного обеспечения мультимедийных авторских систем.
Перевод объекта из одной формы в другую (оживление)
происходит через оценку начальной и конечной форм с помощью
специальных вспомогательных линий и точек маркировки,
определяющих диапазон и скорость преобразования изображений.
При
этом
все
промежуточные
изображения
(кадры)
рассчитываются программным способом.
Контрольные вопросы
1. Зачем вводят предыскажения при цифровой передаче?
2. Какие методы повышения помехозащищенности ЗС
используются в ЗВ?
3. В чем состоит обнаружение и исправление ошибок при
передаче цифровых ЗС? Поясните особенности каждого из
применяемых методов.
4. Сравните между собой методы маскирования ошибок.
5. Назовите источники искажений цифровых сигналов при
изменении их формата.
6. Опишите алгоритм компрессии аудиоданных, основанный
на учете свойств слуха.
7. Поясните основные форматы цифровых ЗС.
8. Поясните особенности стандартов MPEG-1 и MPEG-2.
Сравните их между собой. Нарисуйте форматы кодов при данных
способах передачи ЗС.
9. Что такое аудиофрейм, чем отличается его структура в
стандартах MPEG-1 и MPEG-2?
ТРАКТ ФОРМИРОВАНИЯ СИГНАЛОВ ПРОГРАММ
ЗВУКОВОГО ВЕЩАНИЯ. РАДИОДОМА
И ТЕЛЕВИЗИОННЫЕ ЦЕНТРЫ
Классификация радиодомов и телевизионных центров
Головной частью электрических каналов звукового вещания
(ЗВ) и звуковых каналов телевизионного вещания (ТВ) является
тракт формирования программ (ТФП). Организационной формой
ТФП служат радиодома (РД) и телевизионные центры (ТЦ). В
каждом РД и ТЦ имеются две крупные структуры — творческая
(художественная) и техническая, тесно связанные между собой. В
первую входят редакции и другие творческие объединения,
специализированные по видам вещания, дикторская группа, группа
звукорежиссеров, отдел выпуска, отдел координации и некоторые
другие, во вторую, называемую аппаратно-студийным комплексом
(АСК), — студии, аппаратные и некоторые вспомогательные
службы. Творческие и технические подразделения предназначены
для подготовки и исполнения частей, входящих в программы
вещания, формирования, записи и передачи в последующие части
электрических каналов ЗВ-сигналов, отображающих вещательные
программы. В зависимости от среднесуточного объема вещания и
соответственно числа редакций и других творческих объединений,
а также технического оснащения, РД и ТЦ подразделяются на
несколько классов (табл. 0.1).
Таблица 0.1
Объем вещания, ч
Собственного РД
Местного ТЦ
В том числе
собственного
1
4,4...4,7
16
8
Класс РД пли ТЦ
2
3
2,5...3,0
1,5...2,0
3
1,5...2,0
2
0,5...1,0
4
1,0
1,0
0,8.
Большие РД и ТЦ Москвы, С.-Петербурга и некоторых других
крупных городов относятся к внеклассным. Приведенные данные о
среднесуточном объеме вещания носят ориентировочный характер.
В течение значительной части суток республиканские, краевые и
областные РД и ТЦ передают программы центрального звукового и
телевизионного вещания.
Структура аппаратно-студийного комплекса
Аппаратно-студийный комплекс (рис. 0.1) — это
совокупность взаимосвязанных функциональных блоков и служб,
размещенных в одном или нескольких зданиях и содержащих
технические
средства,
с
помощью
которых
ведется
технологический процесс формирования и выпуска программ
звукового и телевизионного вещания. В общем случае АСК
содержит аппаратно-студийные блоки АСБ, в которых создаются
отдельные части программ, и аппаратные вещания АВ, в которых
полностью формируются программы и из которых сигналы,
отображающие эти программы, направляются на выход РД. При
ТВ-вещании программы формируются в подразделениях,
называемых аппаратно-программными блоками АПБ.
Рис. 0.1 — Структура АСК
Каждый АСБ состоит из студии и связанной с ним студийной
аппаратной СА. Иногда при студии оборудуют две аппаратные —
записи АЗ и вещания АВ. Наличие двух аппаратных обусловлено
различной технологией непосредственного вещания и записи.
В монтажных аппаратных МА находятся технические
средства, предназначенные для подготовки частей будущих
программ. Различают аппаратные монтажа фонограмм АМФ,
аппаратные сведения и монтажа фонограмм АСМФ и аппаратные
подготовки программ АПП. Аппаратная монтажа фонограмм
предназначена
для
сравнительно
несложного
монтажа
музыкальных и речевых фонограмм, преимущественно после
первичной записи. Аппаратная сведения и монтажа фонограмм
содержит комплекс технических средств, предназначенных для
получения
фонограммы
из
сигналов,
записанных
на
многодорожечном магнитофоне в виде отдельных партий
музыкальных инструментов или групп инструментов. Наконец, в
аппаратной подготовки программ при относительно несложной
работе (например, выравнивании уровней фонограмм) или вовсе
без работы по регулированию и преобразованию сигналов
формируют части будущей передачи из фонограмм-оригиналов
отдельных произведений.
Готовые фонограммы-оригиналы хранят в фонотеке. Персонал
фонотеки подбирает фонограммы по заказам редакций. Различают
фонотеки для длительного хранения фондовых, особо ценных
фонограмм и фонотеки для оперативной, текущей работы. В
последнее время в связи с участившимися случаями утери или даже
хищения
выданных
фонограмм,
последние
копируют
непосредственно в фонотеке или воспроизводят на магнитофонах
фонотеки, а электрические сигналы передают по внутренним
линиям РД в соответствующие редакции или АПП.
Основным коммутационным узлом РД и ТЦ служит
центральная аппаратная ЦА. Через нее сигналы внешних
источников программ, поступающие из АТС, МТС и
трансляционной аппаратной ТА, направляются в другие
аппаратные РД, а сигналы выпускаемых программ непосредственно
или через коммутационно-распределительную аппаратную (КРА)
организаций связи поступают к потребителям — радиопередающим
центрам и станциям, междугородной вещательной аппаратной
МВА, междугородной телефонной станции, на центральную
станцию проводного вещания ЦСПВ.
Контроль технического качества выпускаемых программ
осуществляют в аппаратной технического контроля отдела
технического контроля (ОТК) РД и ТЦ. Дежурный персонал ОТК
проводит контрольные прослушивания, проверяет уровни
вещательных сигналов. Для фиксации случаев технического брака и
нарушений норм в аппаратной ОТК установлены магнитофоны и
самописцы, регистрирующие уровни и другие параметры сигналов.
Согласование деятельности редакций по размещению
подготавливаемых передач в сетке вещания ведет отдел
координации, а управление выпуском программ — отдел выпуска.
В отделе выпуска имеется аппаратная или рабочее место с
коммутатором для оперативной связи с редакциями и аппаратными
вещания. Диспетчер отдела выпуска руководит проведением
передач и контролирует их ход, а в некоторых, особо оговоренных
случаях, принимает решение об изменении сетки вещания.
Внутренние и внешние линии РД и ТЦ проходят через кроссовую.
В ней установлены стойки или шкафы, с помощью которых
осуществляют неоперативные или полуоперативные соединения
(кроссировку) этих линий.
Особую роль в деятельности РД и ТЦ играет аппаратная
реставрации фонограмм. В ней находятся технические средства,
предназначенные для восстановления фонограмм, техническое
качество которых не соответствует современным требованиям
вещания и записи. Реставрируют фонограммы, записанные давно с
помощью низкокачественных устройств записи, или фонограммы,
техническое качество которых ухудшилось в результате долгого
хранения, например возрос копирэффект, увеличился уровень
шумов. Спектр записанных сигналов бывает заужен, особенно со
стороны верхних частот. Иногда старые фонограммы записаны с
большими амплитудно-частотными искажениями, а скорость
записи отличается от стандартной. Для уменьшения перечисленных
недочетов
используют
устройства
шумоподавления,
многополосные регуляторы АЧХ, магнитофоны с изменяемой
скоростью движения носителя записи, устройства расширения
спектра (эксайтеры).
В состав РД и ТЦ входит трансляционная аппаратная (ТА), в
которую сходятся соединительные линии (СЛ) от городских
трансляционных пунктов (ТП), расположенных в государственных
и общественных сооружениях, зрелищных и спортивных
учреждениях. Из ТП электрические сигналы поступают в AЗ и АВ.
Одной из наиболее важных служб РД И ТЦ является служба
сбора, хранения и обработки информации, в которую непрерывно
вводятся материалы, поступающие по телефонным, телеграфным,
факсимильным и другим каналам передачи. Работники редакций
имеют
возможность
обращаться
к
базам
информации
непосредственно со своих рабочих мест с помощью терминалов.
Должны обеспечиваться перевод, редактирование, хранение
рабочих материалов и их оперативный вывод на дисплеи или
печатающие устройства редакций.
Система распределения звуковых и телевизионных сигналов
обеспечивает персоналу редакций прослушивание и просмотр по
внутренним линиям РД и ТЦ программ звукового и телевизионного
вещания, создаваемых в данном РД и ТЦ и получаемых от внешних
источников.
Для того чтобы обеспечивать создание программ из фондовых
фонои
видеограмм,
предусматривается
служба
автоматизированного хранения, поиска и доставки фоно- и
видеограмм из фондов оперативного и долговременного хранения.
В крупных РД и ТЦ возможно передавать электрические сигналы из
хранилищ непосредственно в редакции или соответствующие
аппаратные.
Важными для поддержания нормальной деятельности РД и ТЦ
являются служба времени, из которой электрические импульсы
подаются на электрические часы, расположенные в аппаратных,
студиях, редакциях и других отделах, местная АТС,
электроподстанция с вводами электроэнергии не менее чем от двух
трансформаторных подстанций городской электрической сети,
иногда
резервная
дизельная
электростанция,
установки
кондиционирования воздуха, отопления и водоснабжения.
Целенаправленные действия административных служб РД и
ТЦ облегчаются автоматизированной системой управления
административной и хозяйственной деятельностью. Аналогичная
автоматизированная система управляет работой технических
служб. С ее помощью следят за использованием студий и
аппаратных, занятостью персонала в подготовке и проведении
передач.
На случай чрезвычайных обстоятельств оборудованы
резервные АСБ, снабженные всем необходимым для работы в
автономном режиме.
Аппаратно-студийные блоки
В состав каждого АСБ входят студия и студийная аппаратная.
Иногда при студии оборудуют две аппаратные — AЗ и АВ,
несколько различающиеся составом оборудования. В AЗ чаще
используют многодорожечные магнитофоны. Это позволяет
раздельно записывать партии отдельных инструментов или групп
инструментов, а потом объединять («сводить») фонограммы, вводя
при этом в каждый тракт свои преобразования сигналов и
регулируя соотношения «звучностей» инструментов и групп
инструментов. Подчас звучание голосов солистов записывают
позже, но синхронно со звучанием аккомпанирующего ансамбля.
Помимо пульта, контрольных громкоговорящих агрегатов и
магнитофонов аппаратная комплектуется стойкой устройств
звуковых эффектов. В АВ для быстрого введения в передачу
сигналов от разных внешних источников — ТП, АТС, МТС —
помещают стойку оперативной коммутации. При АВ оборудуют
телефонные кабины, предназначенные для приема вопросов от
слушателей, т.е. для диалогов со слушателями.
Чтобы создать звукорежиссеру или режиссеру, ведущему
передачу, более спокойную обстановку для работы, аппаратную
иногда разделяют на две части — режиссерскую и техническую
(рис. 0.2).
Студия 1 связана с режиссерской 2, а она, в свою очередь, с
технической аппаратной 3 звуконепроницаемым окном 4. В
режиссерской размещают пульт звукорежиссера 5, контрольные
громкоговорящие агрегаты 6, стойки 7 и 8 звуковых эффектов и
управляющей ЭВМ. В технической располагают магнитофоны 9,
стойки коммутации и измерений 10 и 11, щиток питания 12. Для
улучшения звукоизоляции студия связана с аппаратной и другими
помещениями через тамбур 13. Студии могут иметь отдельные
кабины для исполнителей 14.
Рис. 0.2 — Пример планировки и расположения оборудования
в АСБ радиодома
Оборудование студий
Студии в зависимости от назначения и числа исполнителей
различаются размерами, временем реверберации и формой
частотной характеристики времени стандартной реверберации.
Большинство студий обладает несколько необычным
интерьером, отличающимся от привычных музыкантам интерьеров
концертных залов и открытых эстрадных площадок. К тому же
замкнутость объема вызывает у некоторых исполнителей
ощущение, подобное клаустрофобии — боязни закрытого
пространства. Эти обстоятельства сказываются на эмоциональном
состоянии исполнителей.
Возникла и уже кое-где реализуется идея зрительно связать
помещение студии с окружающим пространством. В студии
устраивают большие окна, выходящие в тихий озелененный дворик
или парк с искусственным водоемом, водопадом или фонтаном, или
проецируют на установленные в студии экраны изображения
природных или живописных пейзажей. Пока трудно решить,
привьются
ли
эти
новшества,
призванные
улучшить
психологическое состояние исполнителей.
Столь же угнетающе действует нахождение в небольшом
замкнутом пространстве на персонал аппаратных. Поэтому,
несмотря на удорожание мер по звукоизоляции, в наружных стенах
аппаратных также устраивают окна.
Основным вещательным оборудованием студий являются
микрофоны, пульт диктора, контрольные громкоговорящие
агрегаты. Последние позволяют исполнителям прослушать только
что сделанную запись и при необходимости изменить характер
исполнения.
Устанавливаемые в студии микрофоны М связаны гибким
экранированным кабелем с микрофонными розетками 15 (см. рис.
0.2). Микрофонные цепи от розеток до пульта звукорежиссера
проложены в стальных трубах. Они защищают микрофонные цепи
от магнитных полей, создаваемых осветительной системой студии.
Пульт диктора представляет собой стол, на котором находятся
два микрофона, кнопки включения микрофона и дистанционного
включения магнитофона, сигнальные лампы, телефонный аппарат с
оптическим вызывным сигналом. Диктор может связаться с
аппаратной, отделом выпуска, редакцией, некоторыми другими
службами. Для переговоров часто используют один из микрофонов
пульта,
а
ответы
слушают
с
помощью
небольшого
громкоговорителя, вмонтированного в пульт. Стол диктора
покрывают плотной тканью. Она предназначена для того, чтобы
предотвратить интерференцию звука, идущего непосредственно от
рта диктора к микрофону, и звука, отраженного от поверхности
стола, и тем самым устранить частотные искажения, вызываемые
интерференцией.
Современные пульты диктора приобрели достаточно сложную
структуру (рис. 0.3).
Для уменьшения влияния магнитных полей внешних
источников на микрофонный кабель, идущий в СА, уровни сигнала
увеличены с помощью микрофонного усилителя МУ, встроенного в
пульт. Ступенчатый делитель напряжения «Дел.» на входе пульта
компенсирует различную чувствительность микрофонов М. Для
выхода на ЦА в обход СА предназначен линейный усилитель ЛУ.
Во избежание чрезмерных уровней сигнала, подаваемых с пульта в
тракт, используется ограничитель максимальных уровней «Огр.».
Интенсивности звука голосов дикторов и различных выступающих
неодинаковы. Для выравнивания уровней в пульт встраивают
стабилизатор среднего уровня СУ. Это — особый автоматический
регулятор, усиление которого устанавливается в режиме
«Репетиция», когда диктор в течение 5…6 с произносит несколько
слов. При этом управляющая цепь УЦ автоматического регулятора
«запоминает» уровень сигнала и соответствующим образом
регулирует усиление СУ. Затем после нажатия кнопки «Микрофон
включен» установленный средний уровень поддерживается
регулятором неизменным. Номинальный уровень на выходе пульта
довольно высок. Он составляет +6 дБ (напряжение 1,55 В). Итак,
современный пульт диктора включает в себя большинство звеньев
микрофонного тракта пульта звукорежиссера.
Рис. 0.3 — Структурная схема пульта диктора
Диктор поддерживает двустороннюю телефонную связь с СА,
ЦА, отделом выпуска, редакциями с помощью блока дуплексной
связи БДС. В качестве микрофона используется один из
микрофонов
пульта.
Небольшой
громкоговоритель,
вмонтированный в пульт, получает ответный сигнал через
предварительный (ПУ) и оконечный (ОУ) усилители. Громкость
регулируется регулятором уровня РУ. Имеется оптический сигнал
вызова ОСВ.
На стене студии установлены светящиеся сигнальные
надписи: «Репетиция», «Приготовиться», «Микрофон включен», а
также бесшумные электрические часы с часовой, минутной и
секундной стрелками.
Оборудование студийных аппаратных
Как указывалось ранее, студийные аппаратные в зависимости
от назначения разделяют на аппаратные записи и вещания,
звукорежиссерские и технические. В РД 3-го и 4-го классов AЗ и
АВ объединяют с ЦА. На ТЦ для облегчения труда творческого и
технического персонала студийную аппаратную разделяют на
четыре части (рис. 0.4): режиссерскую 1, звукорежиссерскую 2,
техническую аппаратную звука 3 и техническую видеоаппаратную
4.
Рис. 0.4 — Планировка и размещение оборудования
в аппаратной АСБ телевизионного центра
Все эти части соединены со студией большими смотровыми
окнами. Режиссер передачи дает указания операторам
телевизионных камер о выборе и смене изобразительных планов,
ведет монтаж изобразительного ряда. Звукорежиссер согласует с
режиссером звуковой ряд передачи. Режиссер и звукорежиссер
управляют передачей с помощью соответствующих пультов и
устройств видео- и звуковых эффектов. Контроль результатов
ведется с помощью видеоконтрольных устройств и контрольных
громкоговорящих агрегатов. Технический персонал управляет
действием видеомагнитофонов и магнитофонов, ведет коммутацию
источников и проверяет технические параметры сигналов.
За годы развития вещания оборудование студийных
аппаратных претерпело ряд изменений. Первое поколение
оборудования на электронных лампах производилось до конца 60-х
годов, второе — на полупроводниковых приборах — выпускалось
со второй половины 60-х годов, третье — на микросхемах малой
степени интеграции и операционных усилителях — со второй
половины 70-х годов, четвертое — на микросхемах средней и
большой степени интеграции — начало разрабатываться и
выпускаться в 80-х годах. Для четвертого поколения характерно
применение сигнальных процессоров, средств вычислительной
техники, отображение информации о проводимых операциях и их
результатах с помощью дисплеев. Дистанционное управление почти
всеми устройствами регулирования и преобразования сигналов
позволило перейти к управлению операциями по заранее созданным
программам с помощью компьютеров и микропроцессоров.
К третьему поколению, в частности, относится отечественное
оборудование «Перспектива-ЦТ» для АСК, оборудование «ПТСМагнолия», оборудование типа ФИТ-Е венгерской фирмы БЕАГ. К
четвертому
поколению
относится
оборудование
фирм
«Schlumberger» (Франция) и SSL (США); первым цифровым
микшерным пультом является пульт фирмы «Neve».
В комплектовании студийных аппаратных пультами
звукорежиссера,
магнитофонами,
устройствами
звуковых
эффектов, синтезаторами звука существует несколько направлений.
Наряду с аппаратными, в которых установлено только аналоговое
оборудование, имеются аппаратные «гибридного» типа с
аналоговыми устройствами и цифровым управлением, а также
чисто цифровые. Выбор того или иного решения определяется
прежде всего экономическими соображениями.
Различно решается структура пульта звукорежиссера, с
помощью которого выполняются творческие и технические задачи:
регулирование и преобразование электрических сигналов,
редактирование и монтаж частей программы. В построении пультов
преобладают два пути:
1) замена некоторых аналоговых устройств регулирования и
преобразования сигналов цифровыми и введение цифровых
устройств управления и контроля;
2) создание полностью цифровых пультов, обладающих
расширенными технологическими возможностями.
Пример аналогового построения оборудования АСБ приведен
на рис. 0.5.
Рис. 0.5 — Структурная схема аналогового оборудования АСБ
Сигналы из студии от микрофонов М поступают в СА по
микрофонным кабелям или через тракт радиомикрофона РМ,
содержащий передатчик дециметрового диапазона «Пер.» и
приемник «Пр.». Кроме сигналов из студии, через входной
коммутатор K1 к пульту подводятся сигналы из других аппаратных
РД, а также от внешних источников ТП, АТС, МТС. Для
субъективного
и
объективного
контроля
результатов
регулирования сигналов служат контрольные громкоговорители
КГ,
измерители
уровня
ИУ,
стереогониометр
СГ
и
стереокоррелометр СК.
Последние два прибора служат для проверки правильности
фазирования сигналов при стереопередаче и оценки совместимости
сигналов стереопары. Через выходной коммутатор К2 сигналы
направляются к магнитофонам «Маг», в систему озвучивания
студии О3, в ЦА и другие аппаратные.
Упрощенная структура цифрового оборудования изображена
на рис. 0.6. Сигналы на входе и выходе оборудования могут быть
представлены в аналоговой и цифровой формах, во втором случае
— в формате студийной аппаратной, определенном Рекомендацией
647 МККР. В этом же формате соединяются отдельные
функциональные устройства внутри АСБ: магнитофоны,
проигрыватели компакт-дисков, устройства звуковых эффектов.
Сигналы аналоговых источников (магнитофонов, микрофонов,
входящих СЛ) предварительно подаются на АЦП, затем
преобразуются в код аппаратной в формирователе кода ФК.
Сигналы, поступающие на аналоговые устройства (магнитофоны,
контрольные громкоговорящие агрегаты и др.), декодируются в
ЦАП. Сигналы, поступающие от некоторых цифровых устройств,
имеют частоту дискретизации, отличающуюся от стандартной
частоты дискретизации СА, равной 48 кГц. Поэтому вначале
производится передискретизация этих сигналов, а затем они
преобразуются в формат кода аппаратной.
Рис. 0.6 — Структурная схема цифрового оборудования АСБ
Сравнивая аналоговое и цифровое оборудование, следует
сделать некоторые пояснения. Цифровое оборудование нуждается в
ЭВМ и соответствующем программном обеспечении. Заявленные
изготовителем возможности реализуются не всегда, например
многофункциональность ЭВМ, достигаемая сменой управляющих
программ. Меняя программу, можно заставить ЭВМ действовать
как АРУ, анализатор спектра, многополосный регулятор тембра
(эквалайзер),
однако
одновременно
указанные
функции
выполняться не могут и фирмы-изготовители об этом
предусмотрительно
умалчивают.
Зато
отдельные
(не
универсальные) аналоговые устройства, общая стоимость которых
во много раз меньше цифрового универсального, могут быть
включены в тракт одновременно и выполнять разные задачи.
Рекламируемые параметры цифровых устройств не всегда
соответствуют действительным. Так, часто объявляемый
изготовителями динамический диапазон 90…96 дБ обычно
является отношением сигнал/шум квантования. Если, например,
установить, как это принято, запас на превышение номинального
уровня 6…10 дБ, а запас на превышение уровня шумов
квантования 20…25 дБ, то реальный динамический диапазон
цифровой аппаратуры составит около 55…65 дБ, что вполне
достижимо и в аналоговой аппаратуре.
Сказанное, конечно, не означает, что цифровое оборудование
хуже аналогового. Достоинства первого хорошо известны, и эти
примеры даны лишь для того, чтобы показать, что не всегда
затраты на цифровую аппаратуру оправдаются. Часто выгоднее
«гибридное» построение, при котором преобразования сигналов
ведутся аналоговым способом, а управление и контроль —
цифровым. Такое решение, как правило, уменьшает затраты.
Аппаратно-программный блок ТЦ и аппаратная вещания РД
В аппаратно-программном блоке ТЦ и аппаратной вещания
РД формируются передачи и программы в целом из отдельных
ранее подготовленных частей. Части, из которых формируется
программа, как правило, уже прошли полное звукорежиссерское
регулирование, монтаж и редакционную «правку» и аттестованы
службой технического контроля. Поэтому сложного регулирования
и преобразования сигналов в АПБ или АВ не предусмотрено, и
оборудование в этих аппаратных проще, чем в АСБ и АМФ. Зато
здесь
используется
оборудование,
предназначенное
для
автоматизации выпуска программ и отображения информации об
источниках программ и состоянии тракта. Формирование программ
осуществляется переключением источников или переключением с
наложением одного сигнала на другой (например, речевого на
музыкальный). На крупных ТЦ и РД оборудование АПБ
размещается в режиссерской и технической аппаратных.
В АПБ и АВ с цифровым трактом входные и выходные
сигналы могут быть аналоговыми и цифровыми, поэтому на входе
включают АЦП, а на выходе — ЦАП. Дистанционное управление,
как и в других аппаратных, реализуется в соответствии с
Документом 3245 EBU.
Центральная аппаратная
Центральная аппаратная — основной коммутационный узел
РД или ТЦ, предназначенный для распределения сигналов
внутренних и внешних источников программ на внутренние линии
АСК и исходящие СЛ. Основной задачей ЦА является соединение
различных аппаратных между собой, введение в сигналы программ
позывных, сигналов точного времени и некоторых служебных
сигналов. Предусматриваются корректирование АЧХ входящих
СЛ, слуховой контроль сигналов ЗВ, обеспечение диспетчерской
связи со службами РД и ТЦ, при необходимости — контрольная
запись сигналов исходящих программ и некоторых служебных
переговоров. Объем и состав оборудования ЦА зависят от числа
выпускаемых программ, числа входящих и исходящих СЛ, а также
аппаратных РД и ТЦ.
Структурная схема ЦА изображена на рис. 0.7.
Рис. 0.7 — Структурная схема оборудования центральной аппаратной
С входной кроссировочной стойки КС1 сигналы поступают на
входные блоки пульта ЦА. Блоки внутренних источников 1 РД и
ТЦ содержат установочные регуляторы уровня РУ и
разделительные усилители У, входные блоки внешних источников
2 (входящих СЛ) и корректирующие контуры КК. Далее сигналы
проходят входной коммутатор K1, тракты программ, содержащие
ограничители максимальных уровней «Огр.», выходной коммутатор
К2, выходную кроссировочную стойку КС2 и поступают на
исходящие линии 3. При этом обеспечивается возможность
разветвления сигналов каждой из программ к нескольким
потребителям.
Для
зрительного
и
слухового
контроля
в
ЦА
предусматриваются измерители уровня (ИУ) и контрольные
громкоговорящие агрегаты КГ. Лампы Л1 и Л2 сигнализируют о
том, что АВ и коммутационно-распределительная аппаратная КРА
организаций связи готовы к началу передачи.
В ЦА имеются электрические первичные часы ПЧ, от которых
секундные импульсы поступают в сеть вторичных часов ВЧ,
расположенных во всех помещениях РД и ТЦ: студиях,
аппаратных, служебных помещениях. Для введения музыкальных
сигналов опознавания программы имеется аппаратура позывных
сигналов АПС. В Москве от датчика сигналов точного времени
ДСТВ вводятся импульсы сигналов поверки времени. К этим же
импульсам примешиваются измерительные импульсы для
автоматического
контроля
состояния
трактов,
оценки
коэффициента передачи, коэффициента гармоник и АЧХ.
Соединение и переключение цепей в коммутаторах K1 и К2 в
оборудовании второго поколения осуществлялись с помощью
электромагнитных реле, третьего поколения — с помощью
электронных ключей или герконовых реле. Кроме двух цепей
сигналов
программ,
одновременно
коммутируются
вспомогательные цепи четырехпроводной телефонной связи и
передача сигналов идентификации (опознавания) программ. В
современных РД и ТЦ широко используют аппаратуру
программирования переключений по заранее составленному
расписанию, которое введено в память программирующего
устройства.
Предусмотрена
возможность
оперативного
вмешательства в порядок и время переключений.
Трансляционные пункты и передвижные звуковые станции
В звуковом и телевизионном вещании широко используются
трансляционные пункты (ТП), перевозимые и переносимые
технические средства, предназначенные для формирования
отдельных частей программы.
В зависимости от важности объекта и частости передач
оборудуются стационарные или полустационарные ТП. В первых
комплект оборудования устанавливается постоянно, во вторых —
на время проведения передач. Стационарный ТП предназначен для
проведения регулярных трансляций или записей. Стационарные ТП
оборудуют в театрах, концертных залах, больших спортивных
сооружениях. Они соединены с РД или ТЦ постоянными линиями
связи — радиорелейными или кабельными. В специально
оборудованных помещениях полустационарных ТП перевозимое
или переносимое оборудование устанавливают на время
трансляции. Для связи с РД и ТЦ используют передвижную
радиорелейную станцию или телефонную линию, отключаемую на
кроссе АТС от коммутационной аппаратуры и соединяемую на
время трансляции с линией, идущей в РД или на ТЦ. Вторую
линию используют для служебной связи с трансляционной
аппаратной (ТА) РД или ТЦ и в качестве резервной. Если надежных
линий связи нет, предпочитают вести запись непосредственно на
месте, в помещении полустационарного ТП.
Для стационарного ТП в здании зрелищного предприятия
оборудуют звукоизолированное помещение, связанное с залом
большим смотровым окном. Помещение ТП подключают к системе
кондиционирования воздуха. Планировка стационарного ТП и
размещение оборудования в нем показаны на рис. 0.8.
Рис. 0.8 — Пример планирования помещений трансляционного пункта
В аппаратной находятся пульт звукорежиссера, контрольные
громкоговорящие агрегаты КГ, магнитофоны М, стойка
коммутатора линий КЛ, силовой щит СЩ. Трансляционный пункт
должен получать электропитание бесперебойно, поэтому он имеет
не менее двух вводов от разных силовых трансформаторных
подстанций. Часто оборудуют не одну, а две кабины диктора КД. В
одной находится диктор или комментатор, дающий пояснения в
антрактах и по ходу спектакля или концерта. Во вторую кабину
приглашают собеседников (например, режиссера спектакля или
концерта, исполнителей, слушателей и зрителей) для высказываний
о содержании и ходе постановки. В КД находятся пульт диктора
ПД и КГ. Площадь аппаратной ТП составляет 6...9 м2 и более,
площадь КД — 3...4 м2.
Особенностью трансляции спектаклей и концертов является
наличие большого числа микрофонов. Например, в оперном театре
микрофоны устанавливаются в оркестре, у рампы, по бокам сцены
и в ее глубине. На концертах часто используют радиомикрофоны.
Для повышения надежности иногда устанавливают два комплекта
оборудования. Поэтому пульты ТП имеют большое число входных
(микрофонных) трактов (до 32) и несколько независимых
выходных трактов. Иногда тракты разделены на две группы и
питаются от двух разных выпрямителей.
Более сложную структуру имеет оборудование телевизионных
ТП, поскольку содержит тракты формирования сигналов звука и
изображения.
Передвижные технические средства формирования, записи и
передачи сигналов частей программ звукового и телевизионного
вещания размещают в специально оборудованных автобусах. В
перечень этих средств входят: передвижные телевизионные
станции (ПТС), передвижные станции магнитной видеозаписи
(ПВС), передвижные телевизионные станции с магнитной
видеозаписью (ПТВС), передвижные репортажные телевизионные
станции (ПРТС), передвижные звуковые станции (ПЗС),
тележурналистский комплекс (ТЖК). Перечисленные технические
средства различаются оборудованием и технологическими
возможностями.
В состав ПТС входит телевизионное и звуковое оборудование,
передающая
радиорелейная
станция
и
вспомогательное
оборудование. С его помощью регулируют исходные сигналы,
записывают их на магнитную ленту, передают в ТА ТЦ.
Передвижная станция видеозаписи содержит тот же комплекс
устройств, кроме передающей радиорелейной станции, и действует
обычно совместно с ПТС. Передвижная телевизионная станция так
же, как и ПВС, не содержит передающего устройства, но
отличается от нее развитыми средствами подготовки и
регулирования сигналов звука и изображения. В ПРТС входит
телевизионное
и
звуковое
оборудование,
отличающееся
портативностью и малым временем развертывания — портативные
телевизионные камеры и видеомагнитофоны.
Оборудование передвижной звуковой станции (ПЗС),
называемой иначе автозвукопередвижкой, предназначено для
творческого и технического регулирования сигналов звука, их
записи и передачи по линиям связи в ТА РД или ТЦ.
Тележурналистский комплекс (ТЖК) — переносное звуковое
и телевизионное оборудование, предназначенное для оперативной
записи сигналов звука и изображения с помощью портативного
видеомагнитофона, совмещенного с телевизионной камерой. Для
чисто
звукового
репортажа
используются
репортерские
магнитофоны. Более расширенными возможностями обладают
ТЖК с небольшим смесительным пультом, имеющим несколько
входов, и автономным источником питания. Иногда в комплекс
входит радиомикрофон.
Диаграммы уровней вещательных устройств
Под диаграммой уровней понимают график изменения уровня
напряжения или мощности сигнала в отдельных точках
вещательного тракта. Диаграммы уровней строят и используют в
ряде случаев:
1) при проектировании оборудования вещательных трактов с
целью выявления «узких» мест тракта, в которых уровни сигнала
недопустимо приближаются к уровню внутренних помех (шумов)
тракта;
2) при настройке оборудования после его монтажа в РД или
ТЦ;
3) при соединении различных устройств тракта между собою;
4) при проверке состояния устройств тракта и отыскании
места повреждения.
Зная расчетные значения уровня в отдельных точках тракта и
выражая их диаграммой уровней, решают вопрос о структуре
тракта, т.е. о размещении различных регуляторов и усилителей в
тракте, устанавливают номинальные значения уровней при
настройке оборудования. Диаграмму уровней, построенную по
результатам периодических измерений, сверяют с расчетной и при
необходимости вносят поправки, изменяя положение установочных
регуляторов, поскольку отклонение измеренных уровней от
номинальных значений приводит к ухудшению параметров
качества оборудования. При снижении уровня против расчетного
ухудшается отношение сигнал/помеха, при повышении —
увеличивается коэффициент гармоник. Необходимо соблюдать
равенство номинальных уровней при соединении различных видов
оборудования между собою. Грубые отклонения диаграммы
уровней от расчетного свидетельствуют о неисправности
оборудования.
Различают диаграммы уровней по напряжению и по
мощности. Проще строить диаграмму уровней по напряжению,
однако при этом можно потерять представление о мощности
сигнала в отдельных точках тракта, что иногда бывает важно.
Обычно диаграмму уровней строят по напряжению и, зная
сопротивления нагрузок в различных точках тракта, определяют
при необходимости уровень мощности в этих точках. Диаграммы
уровней по напряжению и по мощности совпадут в единственном
случае: если сопротивления нагрузок в расчетных точках будут
равны 600 Ом.
Диаграммы уровней строят для максимального и
минимального значений акустического уровня, например для 20 и
0,02 Па, иногда для номинального уровня. Считается, что он
должен быть выше максимально допустимого на 6…10 дБ. Этот
запас нужен для того, чтобы случайные превышения уровня сверх
максимального расчетного не повлекли за собой недопустимое
увеличение
нелинейных
искажений.
Ввиду
различной
чувствительности микрофонов максимальное значение входного
электрического уровня оказывается несколько неопределенным.
Поэтому чаще всего за начальную точку принимают входное
напряжение 1 мВ, которому соответствует входной электрический
уровень –58 дБ. Начальной точкой для построения диаграммы
уровней по шумам служит напряжение внутренних помех,
приведенное (пересчитанное) к входу оборудования, или расчетный
уровень акустических шумов в студии –30 дБ над порогом
слышимости. Разность уровней сигнала и помех (шумов)
определяет отношение сигнал/помеха.
В пультах старых выпусков усиление было распределено
между несколькими усилителями: микрофонным, промежуточным
(иногда даже двумя) и линейным; уровни постепенно нарастали от
входа к выходу аппаратуры. В настоящее время признано, что
более рационально сосредоточить основное усиление во входной
части тракта и строить диаграмму уровней так, чтобы в
последующих частях тракта уровни оставались примерно
одинаковыми. Снижение уровня в звеньях, вносящих ослабление
сигнала (регуляторы уровня и АЧХ, фильтры, смесительные
шины), компенсируют усилителями, включенными после каждого
такого звена. При таком построении уменьшается влияние
внутренних и внешних помех, а звенья тракта могут соединяться в
разных комбинациях, например для исключения из тракта
неиспользуемых или поврежденных устройств.
Диаграммы уровней помещают под упрощенной структурной
схемой тракта. Расчетные или измеренные значения уровней
наносят на линии, опущенные из соответствующих точек
структурной схемы, и соединяют прямыми линиями. Нарастающий
или спадающий ход линий свидетельствует об усилении или
ослаблении сигнала по тракту, а разность численных значений
уровня на концах прямолинейного отрезка — о значении усиления
или ослабления.
Рассмотрим в виде примера диаграмму уровней пульта
звукорежиссера с усилением, сосредоточенным в начальной части
тракта (рис. 0.9). На рисунке приняты обозначения: МУ —
микрофонный (входной) усилитель; ИР и ОР — индивидуальный и
общий регуляторы уровня; СШ — смесительная шина; У —
усилители, компенсирующие ослабление предыдущего звена; ЛУ
— линейный (выходной) усилитель.
Рис. 0.9 — Пример диаграммы уровней пульта звукорежиссера
Выходной номинальный уровень при подаче сигнала на
магнитофоны или в ЦА принят равным +6 дБ (заметим попутно,
что при подаче сигнала на СЛ выходной уровень должен быть не
менее +15 дБ). Перепад уровней от –58 до +6 дБ определит
необходимое усиление МУ, равное –64 дБ. Затухание,
обусловленное установочным положением ИР и ОР, и эффективное
затухание СШ примем равными 12 дБ. Эти данные позволяют
построить диаграмму уровней, изображенную на рис. 0.9.
Примем также, что уровень внутренних помех тракта,
приведенный ко входу, равен –133 дБ. Тогда отношение
сигнал/помеха составит –58 – (–133) = 75 дБ. Соответствующая
диаграмма уровней шумов лежит на 75 дБ ниже номинальной и на
рисунке не показана.
Если в тракт входят звенья, коэффициент передачи которых
изменяется с частотой, например в тракт включен корректирующий
контур, то диаграммы уровней строят для нескольких частот и
проверяют, не сближается ли уровень сигнала с уровнем
собственных шумов или не превышает ли уровень сигнала
номинальное значение.
Звуковые станции
В аппаратных звукового вещания, предназначенных для
формирования или оперативного выпуска программ, сосредоточено
множество технических устройств: пульт звукорежиссера с
большим количеством входов, выходов и различных органов
управления, коммутаторы внешних и внутренних источников,
цифровые и аналоговые стереофонические, многодорожечные,
кассетные магнитофоны, проигрыватели компакт-дисков, стойки
устройств звуковых эффектов, устройства оперативного ввода
текстовой информации в виде буквопечатающих телеграфных
аппаратов и дисплеев.
Широкое
распространение
получили
аппараты
воспроизведения сигналов с многодисковых («этажерочных»)
магнитофонов и проигрывателей компакт-дисков. Процесс
формирования
музыкальных
программ
сводится
к
воспроизведению определенных фрагментов фонограмм в
желаемой последовательности.
Однако управление комплексом устройств стало трудным
делом. Установка органов коммутации в нужное положение,
регулирование уровней и спектров сигналов происходят в условиях
острого недостатка времени на решение возникающих творческих и
технических задач, а психофизиологические возможности
оператора (звукорежиссера, звукоинженера, ведущего программы)
ограничены.
Формирование и выпуск программы сводятся, в основном, к
следующим операциям:
 запоминание и последующее выполнение в реальном
масштабе времени, в заданные промежутки нужных соединений
цепей для получения желаемой структуры тракта;
 установка в исходное положение оперативных и
неоперативных органов управления;
 включение и выключение в желаемом порядке источников
сигналов;
 автоматическое управление по заранее составленным
программам некоторыми оперативными регуляторами с целью,
например, наложения речевой информации на музыкальные
отрывки с заданной скоростью, длительностью и заданными
пределами изменения уровней вводимых и выводимых сигналов;
 реализация некоторых звуковых эффектов.
Автоматизация части операций высвобождает время и
мыслительные способности операторов для выполнения творческих
задач.
В последние годы для расширения возможностей
автоматизации процессов вещания и облегчения труда
выпускающих стали применять так называемые звуковые станции.
Это — объединение в общую управляемую систему пульта
звукорежиссера,
коммутационных
устройств,
устройств
воспроизведения записанных сигналов, стоек звуковых эффектов,
музыкального
синтезатора
и
цифрового
процессора.
Технологические
операции,
подлежащие
автоматизации,
формализуются в виде управляющих программ. Содержание
музыкальных и некоторых речевых частей программы, например
рекламных объявлений, записывается на магнитные диски.
Некоторые части программы воспроизводятся непосредственно с
компакт-дисков. Перечень подготовленных фономатериалов
выводится на экран дисплея, образуя так называемое «меню».
Порядок воспроизведения записанных частей программы по
желанию оператора может изменяться, например в связи с
изменением содержания оперативной речевой информации. Во
избежание несанкционированного доступа к хранящейся
информации, который иногда возникает с целью «пиратской»
перезаписи музыкальных частей программы для продажи «на
сторону», каждому оператору присваивается кодовый номер
(пароль), разрешающий или запрещающий пользование той или
иной частью хранящейся информации.
Как правило, в распоряжении оператора имеется набор
готовых «слов» (команд), из которых составляются «предложения».
Они служат для выполнения операций управления. Составив
нужное «предложение», оператор нажимает клавишу исполнения.
Команда преобразуется в управляющие импульсы и передается
соответствующим устройствам. Работа на языке, понятном
оператору, удобна для него, но ввод команд, проверка
правильности их формулирования и передача «предложений»команд управляемым устройствам требует применения ЭВМ,
микроЭВМ или персонального компьютера. В некоторых звуковых
станциях словарь выведен на экран дисплея, и оператор выбирает
нужные «слова», пользуясь курсором или нажимая особой указкой
или пальцем на соответствующие места экрана дисплея.
Звуковые процессоры
В настоящее время прочное место на рынке заняли системы
стереофонического воспроизведения, имеющие от трех до шести
громкоговорителей. Сигналы для питания дополнительных
громкоговорителей формируются чаще всего из двух сигналов
специальной, например Dolby-Stereo, или обычной фонограммы
или берутся непосредственно, если речь идет о формате «Surroundcompatible multi-channel system». Задачи обработки сигналов
решаются с помощью так называемых звуковых процессоров.
Аппаратура этого класса (рис. 0.10) обычно имеет четыре или
пять основных каналов воспроизведения с громкоговорителями
ЛФ, Ц, ПФ, ЛТ (или LS), ПТ (или RS) (рис. 0.11).
Фронтальные громкоговорители ЛФ, ПФ воспроизводят
сигналы в полосе частот от 20…30 до 20000…30000 Гц;
центральный и тыловые — от 80…100 до 15000…20000 Гц. Часто в
систему звуковоспроизведения вводят также дополнительный
канал сверхнизких (СНЧ) частот (Subwoofer) и соответствующий
ему громкоговоритель СНЧ, обеспечивающий воспроизведение
сигналов в полосе частот до 80…125 Гц.
Нижняя
граница
полосы
частот,
воспроизводимых
фронтальными громкоговорителями, в данном случае может быть
повышена до 80…125 Гц без потери качества. При этом тракт
сверхнизких частот оптимизируется с целью получения
минимальных искажений на низших частотах. Остальные каналы
воспроизведения определяют возможности системы по передаче
пространственной информации и оптимизируются именно по
указанному критерию.
Рис. 0.10 — Структурная (а) и функциональная (б) схемы комплекса
аппаратуры для воспроизведения стереофонических сигналов
с повышенным качеством звучания:
ИП — источник программы; СПЗ — синтезатор пространственного звучания
(блок обработки сигналов обычной стереофонии); УДМ — управляемая
декодирующая матрица (блок обработки сигналов кодированной
фонограммы, например системы «Dolby-Stereo»); 1 — устройство
коммутации каналов воспроизведения и управления режимами работы
звукового процессора; 2 — блок управления громкостью, окраской звучания,
балансом каналов воспроизведения; 3 — формирователь сигналов
управления;
У — усилители 1, 2, 3,...6-го каналов воспроизведения; 7, 8, 9, 10, 11, 12 —
громкоговорители системы воспроизведения; Л, П — левый и правый
сигналы стереопары; ЛФ, Ц, ПФ — левый, центральный и правый
фронтальные сигналы системы воспроизведения; ЛТ, ПТ — левый и правый
тыловые сигналы или левый и правый пространственные сигналы
«окружения» LS, RS; СН — канал сверхнизких частот; А — оптимальное
место
прослушивания
Рис. 0.11 — Система воспроизведения «Dolby-stereo»:
ЛТ, ПТ — левый и правый тыловые громкоговорители; ЛФ (L), Ц (С) —
левый, центральный громкоговорители; LS, RS — левый и правый
громкоговорители, излучающие левый и правый сигналы «окружения»
Совершенствование
звуковых
процессоров
(ЗП)
с
многоканальными системами воспроизведения ведется по двум
направлениям, предусматривающим разработку декодирующих
устройств,
предназначенных
для
обработки
специальных
кодированных фонограмм, например системы «Dolby-Stereo», «Dolby
Pro Logic» и устройств для обработки сигналов обычных
двухканальных фонограмм. Эти два блока являются основными в
составе ЗП.
Возможная структура управляемой декодирующей матрицы
ЗП показана на рис. 0.12.
Рис. 0.12 — Управляемая декодирующая матрица звукового процессора
Входные сигналы стереопары Л и П поступают на фильтры
Ф1, Ф2, обеспечивающие подавление спектральных составляющих
за пределами диапазона частот 20…20000 Гц. Сумматоры Σ1 и Σ2
формируют сумму (Л + П) и разность (Л – П) сигналов Л и П,
которые затем подаются на основные входы управляемых
усилителей УУ1, УУ2. На основные входы УУ3 и УУ4 подаются
сигналы Л и П непосредственно с выхода фильтров Ф1 и Ф2.
Сумматоры Σ3, Σ4 формируют сигналы для левого ЛФ и правого
ПФ фронтальных громкоговорителей. Сумматор Σ5 формирует
сигнал Ц для центрального фронтального громкоговорителя.
Суммарно-разностный преобразователь СРП формирует сигналы
k1Л – k2П и k1П – k2Л, которые далее поступают на формирователь
Ф. Он служит для получения сигналов окружения (при работе
устройства в режиме «Dolby-Stereo») или пространственных
сигналов (при обработке сигналов обычной стереофонии) LS и RS
для питания левого ЛТ и правого ПТ тыловых громкоговорителей.
Управляемые
усилители
УУ5,…, УУ9
необходимы
для
регулирования
уровня
громкости
и
баланса
каналов
воспроизведения.
Блок управления ЗП формирует: сигналы управления при
работе устройства в режиме «Dolby-Stereo-Decoder»; сигналы
управления для регулирования уровня громкости и баланса каналов
воспроизведения; тестовые сигналы, необходимые для слуховой
оценки работоспособности устройства в целом. Кроме того, он
может формировать сигналы видеоряда, отображающие режим
работы аппаратуры звуковоспроизведения (библиотеку рисованных
изображений, отображающих текущее состояние сигналов
стереопары, согласованное с особенностями пространственного
слухового восприятия).
В качестве примера на рис. 0.13 и 0.14 приведены
структурные схемы кодера и декодера системы «Dolby-Stereo».
Структурная схема кодера проста и не требует
дополнительного пояснения. Что касается собственно декодера, то
здесь необходимо отметить следующее. При работе УДМ (см. рис.
0.12) в режиме адаптивного декодирования сигналов кодированной
фонограммы (см. рис. 0.13) системы «Dolby-Stereo» в блоке
управления должны вычисляться оценка коэффициента корреляции
и соотношение интенсивностей, а также фаз (0, 180°, 90°) входных
сигналов стереопары Л и П.
Рис. 0.13. Структурная схема кодера системы «Dolby-Stereo»:
L, R — соответственно левый и правый фронтальные сигналы;
С — фронтальный сигнал; S — сигнал окружения 1, 2, 5, 6 — сумматоры
сигналов; 3 — фильтр; 4 — компандер модифицированной
системы шумопонижения «Dolby-B»
Рис. 0.14 — Структурная схема декодера системы «Dolby-Stereo»:
1 — регулятор баланса (лево/право); 2 — адаптивная декодирующая
матрица; 3 — дополнительная матрица; 4 — фильтр; 5 — линия задержки;
6 — экспандер модернизированной системы шумопонижения «Dolby-B»
Указанные выше параметры вычисляются только для
среднечастотных составляющих входных сигналов Л и П в полосе
частот от 100 до 5000…8000 Гц и динамическом диапазоне
изменения уровней не уже 50 дБ. Требования к точности
вычислений обусловлены заметностью искажений, вызываемых
погрешностью формирования сигналов управления, которая не
должна превышать 2…5%. Управляющие сигналы являются
низкочастотными (до 100 Гц), что упрощает задачу достижения
необходимой точности при их формировании. Предварительно
формируются сигналы вида
(0.1)
где Ë и Ï — выпрямленные и усредненные мгновенные значения
напряжений сигналов Л и П. Усреднение выпрямленных
напряжений при формировании сигналов управления выполняется
с постоянной времени в цепи заряда, равной 3…5 мс, а в цепи
разряда — 9…30 мс. Далее из полученной пары сигналов
выбирается максимальное значение
(0.2)
причем если с < 0,9, то происходит адаптация к сигналу источника
(режим формирования единственного КИЗ) и основные сигналы на
выходе управляемой матрицы имеют вид (см. рис. 0.12):
(0.3)
При работе ЗП (см. рис. 0.12) в режиме декодирования
сигналов системы «Dolby-Stereo» формирователь Ф (см. рис. 0.13)
содержит ПФ с полосой пропускания 100…7000 Гц, ЛЗ с временем
запаздывания 9…30 мс, экспандер системы шумопонижения
(модифицированный вариант системы шумопонижения «Dolby-B»)
и декодер тыловых каналов воспроизведения с управлением. При
этом на вход формирователя (рис. 0.15) поступает сигнал
окружения S вида k(k1Л – k2П) с выхода СРП (см. рис. 0.13).
Рис. 0.15 — Структурная схема формирователя сигнала
«окружения» системы «Dolby-Stereo»:
1 — полосовой фильтр с полосой пропускания 100…7000 Гц;
2 — линия задержки с временем запаздывания 10…30 мс;
3 — экспандер модифицированной системы шумопонижения
«Dolby-B»
В
режиме
адаптивного
декодирования
реализуется
непрерывная адаптация управляемой матрицы к пространству
состояний (единственный или множество КИЗ) исходных сигналов
Л и П. При этом максимальный диапазон изменения коэффициента
передачи управляемых усилителей (УУ1...УУ4, см. рис. 0.12) в
каналах воспроизведения составляет 30 дБ. Управляемые
усилители УУ1...УУ9 декодирующей матрицы могут быть
реализованы как управляемые напряжением или кодом усилители
или регуляторы с широтно-импульсным модулятором ШИМ. В
режиме формирования единственного КИЗ управляемая матрица
адаптируется к сигналу источника (входные сигналы стереопары).
В этой ситуации в зависимости от разности уровней и соотношения
фаз входных сигналов изменяются коэффициенты передачи
УУ1...УУ4 под действием сигналов управления. При работе
устройства в режиме формирования единственного КИЗ источник
звука формируется сигналами только двух близлежащих к нему
громкоговорителей. В режиме формирования множества КИЗ
коэффициенты передачи УУ1...УУ4 не изменяются. Разделение
каналов воспроизведения здесь существенно хуже, чем при работе
устройства в режиме формирования единственного КИЗ.
При обработке сигналов обычной фонограммы адаптация не
используется и сигналы управления для УУ1...УУ4 не
формируются. Их коэффициенты передачи равны 1.
При работе устройства в режиме формирования множества
КИЗ постоянная времени интегрирования составляет около 2 с.
Переход управляемой матрицы в режим формирования
единственного КИЗ должен осуществляться за время около 10 мс, а
в режим формирования множества КИЗ — около 30 мс. Выбор
постоянных времени при формировании сигналов управления
определяет слуховую заметность искажений при работе ЗП в
режиме декодирования сигналов системы «Dolby-Stereo».
Контрольные вопросы
1. Перечислите оборудование аппаратных звукового вещания:
студийных, звукозаписи, монтажа, центральной, коммутационнораспределительной, трансляционной. Каковы структурные схемы
этих аппаратных?
2. Что входит в состав стационарного и передвижного
трансляционных пунктов?
3. Чем отличаются структуры дикторских пультов с низким и
высоким выходными уровнями?
4. Каковы особенности звуковых трактов телевизионных
центров?
КОНТРОЛЬ И ИЗМЕРЕНИЯ В ЗВУКОВОМ ВЕЩАНИИ
Виды технического контроля
Современные системы звукового вещания являются
сложными техническими устройствами, состоящими из многих
звеньев, характеризуемых многочисленными параметрами. На пути
с выхода микрофона до потребителя сигналы ЗВ неоднократно
усиливаются, преобразуются, коммутируются, в результате чего
искажаются. Вместе с тем непрерывный рост требований к
качеству и эффективности работы систем связи определяет жесткие
нормы параметров качества, которые должны соблюдаться в
течение всего срока эксплуатации. Контроль параметров
осуществляется с помощью типовых средств измерений.
Документом, регламентирующим основные параметры
качества и методы их измерений, является ГОСТ 11515-91 «Каналы
и тракты звукового вещания. Основные параметры качества.
Методы измерений». В этом документе оговариваются предельно
допустимые величины таких параметров качества, как: полоса
передаваемых частот; неравномерность АЧХ; коэффициент
гармоник; защищенность от взвешенного шума (для трактов
вторичного распределения — защищенность от невзвешенного
шума); защищенность от внятной переходной помехи; отклонение
выходного уровня от номинального значения (для передатчиков —
коэффициента модуляции); коэффициент разностного тона;
изменение группового времени прохождения; разность фаз в
каналах Л и П; защищенность от внятных переходных помех между
каналами Л и П; разность уровней на выходах каналов Л и П,
образующих стереопару.
Дополнительно для цифровых каналов ЗВ нормируются
защищенность от продуктов внутриполосной перекрестной
модуляции второго и третьего порядков и защищенность от
продуктов внеполосной перекрестной модуляции первого и второго
порядков.
Бесперебойное функционирование каналов и трактов ЗВ
возможно лишь при соблюдении перечисленных параметров
качества. Это обеспечивается развитой системой контроля и
измерений, где на первое место выступают диагностика и
прогнозирование неисправностей.
Система измерений и контроля сочетает в себе три вида
эксплуатационных измерений и контроля: периодические
измерения, оперативный и автоматический контроль.
Периодические измерения проводятся в порядке плановых
профилактических мероприятий, время на проведение которых
строго регламентировано. Их осуществляют по окончании
плановых профилактических мероприятий, во время перерывов и в
процессе работы оборудования системы ЗВ. Измерения проводят в
пределах как отдельных звеньев, так и всего сквозного тракта.
Территориальная разобщенность контролируемых объектов
приводит к усложнению системы контроля, введению специальных
линий обратного контроля для передачи информации о состоянии
объектов. Результаты измерений позволяют своевременно
обнаружить неисправности, предотвратить возможные отказы,
исключить технический брак.
Для эпизодической оценки параметров качества трактов ЗВ в
паузах передачи используется оперативный контроль. Этот вид
эксплуатационных измерений позволяет своевременно обнаружить
нарушения в работе из-за внезапных отказов.
Оценка работоспособности каналов и трактов во время
передачи
сигналов
ЗВ
осуществляется
с
помощью
автоматического контроля. Непрерывная информация о
соответствии параметров качества установленным нормам
позволяет
обнаруживать
неисправности
в
момент
их
возникновения.
Методика измерения основных параметров качества
Измерение
неравномерности
АЧХ.
Измерение
неравномерности АЧХ осуществляется по схеме, представленной
на рис. 0.1. На вход тракта (канала) от генератора низкочастотных
сигналов подается синусоидальный измерительный сигнал с
частотой 1000 (800) Гц и уровнем на 21 дБ ниже номинального
входного уровня. Его контролируют с помощью вольтметра B1.
Напряжение на выходе отсчитывают по вольтметру В2.
Рис. 0.1 — Схема измерений неравномерности АЧХ:
ЗГ — генератор звуковых частот; Т — измеряемый тракт или канал;
Р — номинальное сопротивление нагрузки; В1, В2 — вольтметры
Затем на вход измеряемого тракта (канала) подают сигналы с
указанным выше уровнем и частотами 40, 63, 125, 250, 500, 1000
(800), 2000, 4000, 8000, 10000 и 15000 Гц для каналов с полосой
частот до 15 кГц; 50, 63, 125, 250, 500, 1000 (800), 2000, 4000, 6000
и 10000 Гц для каналов с полосой частот до 10 кГц; 100 (50), 125,
250, 500, 1000 (800), 2000, 4000 и 6300 Гц для каналов с полосой
частот до 6,4 (6,3) кГц. При этом напряжение на входе должно
поддерживаться с точностью не хуже 0,3 К (К — предельно
допустимое отклонение коэффициента передачи испытуемого
устройства в абсолютных единицах), но не более ±2,2 дБ.
Неравномерность АЧХ определяют по формуле
(0.1)
при отсчете выходного напряжения в вольтах или
(0.2)
при градуировке шкалы вольтметра в децибелах. В выражениях
(0.1) и (0.2) UF (NF) — напряжение (уровень) выходного сигнала на
измеряемой частоте, U1000(800) (N1000(800)) — напряжение (уровень)
сигнала на выходе на частоте 1000 (800) Гц.
Измерение нелинейных искажений. В области низких и
средних частот нелинейные искажения оцениваются методом
коэффициента
гармоник.
Структурная
схема
измерения
коэффициента гармоник приведена на рис. 0.2 (обозначения те же,
что на рис. 0.1, ИНИ — измеритель нелинейных искажений или
анализатор спектра).
Рис. 0.2 — Схема измерений коэффициента гармоник
На вход испытуемого устройства подается гармонический
сигнал номинального уровня. Собственный коэффициент гармоник
ЗГ не должен превышать величину, равную 0,3 KГИУ (KГИУ —
ожидаемый коэффициент гармоник испытуемого устройства).
Измерения проводят на частотах 40, 63, 125, 250, 500, 1000
(800), 2000 и 4000 Гц для каналов (трактов) с полосой эффективно
воспроизводимых частот до 15 кГц; 100 (63), 125, 250, 500, 1000
(800), 2000 Гц для каналов (трактов) с полосой частот до 10 и 6,4
(6,3) кГц.
При измерении нелинейных искажений в трактах с цифровой
аппаратурой или ПВ с усилителями звуковой частоты,
работающими в ключевом режиме, следует применять анализатор
спектра. Величина коэффициента гармоник при этом вычисляется
по формуле
(0.3)
где U1, U2, U3 — величины напряжений синусоидальных
составляющих на выходе измеряемого устройства.
В каналах ЗВ, содержащих устройства частотного
предыскажения (ПК-ВК), измерения проводят на частоте 800 Гц. В
цифровых каналах ЗВ измерения проводят на частоте 2,1 кГц.
Длительность непрерывной подачи сигнала не должна превышать 5
с.
Метод коэффициента гармоник, к сожалению, не позволяет
оценить нелинейные искажения в области ВЧ, так как продукты
нелинейности (гармонические составляющие) испытательного
сигнала могут оказаться вне эффективно воспроизводимого
испытуемым устройством диапазона частот. Поэтому для
измерения нелинейных искажений в верхней части номинального
диапазона частот рекомендуется применять метод разностного
тона. На рис. 0.3 приведена схема измерений нелинейных
искажений методом разностного тона.
Рис. 0.3 — Схема измерений коэффициента разностного тона
В качестве измерительного сигнала используется сумма двух
равных по амплитуде синусоидальных колебаний с близкими
частотами F1 и F2 (бигармонический сигнал). Такой сигнал
получают на выходе линейного суммирующего устройства (Σ), ко
входу которого подключены два генератора звуковых частот ЗГ1 и
ЗГ2, настроенные на частоты F1 и F2 соответственно. Выходное
сопротивление сумматора не должно превышать нормированного
значения внутреннего сопротивления источника сигнала.
Амплитуду бигармонического сигнала устанавливают равной
номинальному значению амплитуды входного сигнала. Для каналов
и трактов с полосой частот до 15 кГц рекомендуется проводить
измерения на частотах F1 = 12100 Гц и F2 = 12900 Гц.
На выходе измеряемого канала (тракта), нагруженного на
номинальное сопротивление нагрузки Р, последовательно
измеряют напряжения частот F1, F2, F2 – F1, 2F1 – F2, 2F2 – F1 с
помощью анализатора спектра АС.
Количественной
мерой
нелинейности
являются
коэффициенты разностного тона второго KРТ2 и третьего KРТ3
порядков, определяемые по формулам
(0.4)
(0.5)
где UF1 И UF2 — значения напряжений составляющих
бигармонического измерительного сигнала F1 и F2 на выходе
измеряемого тракта или канала; UF2–F1, U2F1–F2', U2F2–F1 —
напряжения
продуктов
нелинейности
(комбинационных
составляющих) с частотами F2 – F1, 2F1 – F2, 2F2 – F1.
Измерение взвешенного шума. Измерение взвешенного
шума осуществляется по схеме, представленной на рис. 0.4.
Рис. 0.4 — Схема измерений взвешенного шума
Предварительно к входу измеряемого тракта (канала)
подключают экранированное сопротивление (600±30) Ом или
другой экранированный резистор P1, сопротивление которого
должно быть равным модулю полного электрического
сопротивления источника сигнала на средних частотах.
Одновременно к выходу подключают эквивалент сопротивления
нагрузки P2.
Взвешенный шум измеряют псофометром Пс, выполненным в
соответствии с Рекомендациями 468-4 МККР или Р.53 МККТТ.
Такой псофометр снабжен специальным взвешивающим фильтром,
ограничивающим частотный диапазон измеряемого шума (помехи).
На рис. 0.5, а приведена АЧХ взвешивающего фильтра.
Допускается применение псофометрического фильтра, АЧХ
которого приведена на рис. 0.5, б.
Рис. 0.5 — Амплитудно-частотные характеристики
взвешивающих фильтров
Защищенность от взвешенного шума при отсчете выходного
напряжения псофометра в вольтах вычисляют по формуле
,
(0.6)
где UH — номинальное напряжение сигнала; Uпш — напряжение
псофометрического шума.
При градуировке измерительного прибора в децибелах
,
(0.7)
где NH — номинальный уровень сигнала; Nпш — измеренный
псофометрический уровень шума.
При измерении невзвешенного шума взвешивающий фильтр
псофометра отключают. Защищенность от невзвешенного шума
определяется по формулам (0.6) и (0.7) с той лишь разницей, что
вместо напряжения (уровня) псофометрического шума в них
подставляют напряжение (уровень) невзвешенного шума.
Измерение защищенности от внятных переходных помех.
Защищенность от внятных переходных помех измеряют по схеме,
приведенной на рис. 0.6.
Рис. 0.6 — Схема измерений защищенности от внятных
переходных помех:
Т1 — тракт (канал), вносящий помеху; Т2 — испытуемый
тракт (канал); Р3 — резистор — эквивалент выходного
сопротивления источника сигнала
Перед началом измерений выходы влияющего T1 и
измеряемого Т2 трактов (каналов) нагружают резисторами P1 и Р2,
сопротивления которых равны модулю полного электрического
сопротивления реальной нагрузки на средних частотах. К входу
тракта
(звена),
подверженного
влиянию,
подключают
экранированное сопротивление (600±30) Ом.
На вход влияющего тракта (звена) T1 от ЗГ подают
синусоидальный сигнал частотой 1000 (800) Гц и напряжением,
соответствующим номинальному значению входного уровня.
Значения напряжений на входе и выходе влияющего тракта (звена)
контролируют вольтметрами B1 и В2 соответственно. Длительность
подачи сигнала не должна превышать 5 с.
Если в испытуемых устройствах имеются предыскажающие и
восстанавливающие контуры ПК-ВК, допускается изменять частоту
измерительного сигнала в зависимости от их характеристик. В
трактах ПВ измерения выполняют на частоте 2000 Гц.
Уровень внятной переходной помехи на выходе тракта
(канала), подверженного влиянию, измеряют анализатором спектра
АС или селективным вольтметром, настроенным на частоту
испытательного сигнала.
При градуировке шкалы измерительного прибора в вольтах
защищенность от внятных переходных помех определяют по
формуле
,
(0.8)
где UH — номинальное напряжение сигнала; UВН Перех —
напряжение внятных переходных помех, измеренное АС или
селективным вольтметром.
При градуировке шкалы измерителя в децибелах
.
(0.9)
В трактах, используемых для стереофонических передач,
защищенность от внятной переходной помехи между каналами Л и
П измеряют аналогичным образом, причем за влияющий тракт
принимают по очереди канал Л и канал П.
Измерение разности уровней на выходах каналов Л и П,
образующих стереопару. Разность уровней определяют расчетным
путем при сравнении АЧХ каналов Л и П:
(0.10)
где Nвых Л и Nвых П — уровни сигналов на выходах каналов Л и П при
одинаковых значениях частот и уровней гармонических
испытательных сигналов на входах этих каналов.
Измерения проводят по схеме, приведенной на рис. 0.7.
Методика измерения АЧХ изложена выше.
Рис. 0.7 — Схема измерений разности уровней
на выходах стереоканалов
Измерение разности фаз в каналах Л и П, образующих
стереопару. Разность фаз на выходах каналов Л и П в трактах,
используемых для стереофонических передач, измеряют при
подаче на вход обоих каналов гармонического сигнала с уровнем на
21 дБ ниже номинального. Измерения проводят фазометром Ф на
частотах 40, 1000 (800) и 15000 Гц по схеме, приведенной на рис. 0.8.
Рис. 0.8 — Схема измерений
разности фаз
Защищенность от продуктов внутриполосной перекрестной
модуляции второго и третьего порядков (F'd) и внеполосной
перекрестной модуляции первого и второго порядков (Fd)
оценивают по следующей методике. Значения частот продуктов
перекрестной модуляции определяют на основе следующих
соотношений:
(0.11)
(0.12)
где F'd, Fd — частоты продуктов перекрестной модуляции; fд —
частота дискретизации; Fi — частоты внутриполосных сигналов; Fa
— частоты внеполосных паразитных сигналов; n — натуральный
ряд чисел (1, 2, 3).
В табл. 0.1 и 0.2 приведены значения частот F'd, Fd, Fi и Fa при
fд = 32 кГц.
Таблица 0.1
Таблица 0.2
n
Fi, кГц
Fa, кГц
2
9
14
3
13
6
7
11
11
1
n'
Fi, кГц
Fa, кГц
2
31
1
3
33
1
63
1
65
1
Схема измерений представлена на рис. 0.9. На вход канала ЗВ
(КЗВ) от ЗГ подают гармонический измерительный сигнал с
уровнем 0 дБ и погрешностью не хуже ±0,1 дБ. Коэффициент
гармоник ЗГ не должен превышать 0,3 КГ (КГ — номинальное
значение коэффициента гармоник измеряемого канала ЗВ). Частота
испытательного гармонического сигнала устанавливается с
погрешностью не более 0,001 fд (0,1 % от частоты дискретизации).
Рис. 0.9 — Схема измерений защищенности от продуктов
внутриполосной и внеполосной перекрестной модуляции:
СВ — селективный вольтметр; Ч — частотомер;
КЗВ — канал звукового вещания
Защищенность от продуктов внутриполосной А и внеполосной
А' перекрестной модуляции вычисляют по формулам
(0.13)
,
(0.14)
где NF'd, NFd — уровни продуктов внутриполосной и внеполосной
перекрестной модуляции соответственно; NFt — уровень
внутриполосных измерительных сигналов; NFa, — уровень
внеполосных измерительных сигналов.
При градуировке шкалы измерительного прибора в вольтах
защищенность от продуктов внутриполосной А и внеполосной А'
перекрестной модуляции можно определять по формулам
(0.15)
,
(0.16)
где UFt — напряжение внутриполосных измерительных сигналов;
UFa — напряжение внеполосных измерительных сигналов; UF'd., UFd
— напряжения продуктов перекрестной модуляции.
Дистанционные измерения
Измерения параметров качества трактов и отдельных звеньев
могут осуществляться с помощью аппаратуры дистанционных
измерений (АДИ). Из РД, например, можно измерить параметры
сквозного канала «РД — КРА — СЛ — передатчик». Широкое
внедрение АДИ объясняется тем, что таким образом можно
определить все основные параметры: коэффициент гармоник,
неравномерность АЧХ, уровень шума и т.д., причем измерительные
сигналы ввиду их малой длительности практически незаметны для
слушателей. Структурная схема дистанционных измерений
представлена на рис. 0.10.
Рис. 0.10 — Структурная схема дистанционных измерений:
ДИС — датчик измерительных сигналов; Тр — трансформатор;
КК — корректирующий контур; Ф — узкополосный режекторный фильтр;
УО — усилитель-ограничитель; В — выпрямитель; ИУ — интегрирующая
цепь; ИП — измерительный прибор; K1 — K4 — коммутирующие контакты
Измерение коэффициента гармоник. Этот параметр
является наиболее важным, так как изменение режимов работы
тракта ведет, как правило, к повышению коэффициента гармоник
КГ. Измерения осуществляются подачей кратковременных
измерительных сигналов в паузах передачи. Во время передачи
контакты K1 и К4 находятся в верхнем положении, К2 и К3 — в
нижнем. В паузе K1 переключается на ДИС, замыкается контакт К4,
контакт К2 с задержкой в 20 мс переходит в верхнее положение,
включая цепь на вход усилителя-ограничителя УО через
узкополосный режекторный фильтр Ф, контакт К3 с небольшой
задержкой переходит в верхнее положение, подключая к выходу
УО выпрямитель В и интегрирующую цепь ИУ измерительного
прибора (ИП). Во время кратковременного нахождения К2 в
нижнем положении калибрующий синусоидальный сигнал
проходит на вход УО, устанавливая его на коэффициент передачи
за порогом ограничения.
Поскольку постоянная времени разряда управляющей цепи
УО велика (10…12 с), то при переходе К2 в верхнее положение
коэффициент передачи УО практически не меняется. Так как
фильтр Ф настроен на частоту измерительного сигнала, то через
УО проходят только его гармоники, обусловленные нелинейными
искажениями в измеряемом тракте. Для исключения влияния на
результаты измерений нестационарного процесса, возникающего
при включении фильтра Ф, контакт К3 замыкается с небольшой
дополнительной задержкой. После выпрямителя В напряжение
подается на интегрирующую цепь ИУ. Время ее разряда больше 20
с, а шкала измерительного прибора ИП градуируется в процентах.
При длительности измерительного сигнала 100 мс время задержки
включения контактов К2 и К3 займет приблизительно 20 мс. При
принятых больших значениях времени восстановления цепей УО и
ИУ коэффициент передачи в течение приблизительно 80 мс
практически не изменится. Отсчет сделать легко, так как стрелка
измерительного прибора ИП отклоняться от максимального
положения будет медленно.
При дистанционном измерении КГ возникает систематическая
погрешность 6…10 % по сравнению с результатами измерений КГ
от 3 до 7% обычным способом. При малых значениях КГ
погрешность
значительно
меньше.
Причиной
указанной
погрешности является линейное детектирование смеси напряжений
гармоник, поданных на выпрямитель, и уход рабочей точки УО во
время измерений (примерно на 3%).
Измерение АЧХ. В качестве измерительных сигналов
используются импульсы длительностью 100 мс с прямоугольной
огибающей с заполнением синусоидальным напряжением с
частотами 1000, 50 и 10000 Гц. При измерении АЧХ датчик
измерительных
сигналов
автоматически
выполняет
дополнительные коммутации в схеме, представленной на рис. 0.10:
1) УО переводится в режим усиления, для чего отключается
управляющая цепь;
2) фильтр Ф исключается, а контакт К3 находится в верхнем
положении;
3) калибровочным
потенциометром
стрелка
ИП
устанавливается на середину шкалы при опорном сигнале 1000 Гц.
Шкала ИП имеет дополнительную градуировку в децибелах;
4) измерения проводятся напряжением в 2 раза меньшим
номинального;
5) «экспресс-проверка» на частотах 1000, 50 и 10000 Гц
позволяет оценить АЧХ на краях частотного диапазона, где обычно
имеются
наибольшие
отклонения.
Воспользовавшись
перестраиваемым генератором, можно измерить АЧХ в любой
части частотного диапазона. Однако это увеличивает длительность
измерений.
Измерения уровня шумов. При измерении уровня шумов в
схеме, показанной на рис. 0.10, автоматически производятся
следующие изменения:
а) добавляется предварительный усилитель с калиброванным в
децибелах потенциометром на входе. Выход этого усилителя
подключается к входу УО, который работает в режиме усиления;
б) ИП подключается непосредственно к входу выпрямителя В.
Для оценки уровня шума относительно номинального уровня
сигнала измерения проводятся непосредственно после измерения
АЧХ, когда зафиксировано напряжение на частоте 1000 Гц.
При указанных выше изменениях в схеме усиление
измерительного тракта увеличивается на 54 дБ, что дает
возможность измерять уровни шумов такого же порядка. С
помощью калиброванного в децибелах потенциометра стрелка ИП
устанавливается в положение, которое она занимала при измерении
АЧХ на частоте 1000 Гц. Деления на шкале потенциометра покажут
уровень шумов относительно номинального уровня сигнала.
В отличие от измерений КГ или АЧХ, которые проводятся
короткими импульсами длительностью 100 мс, продолжительность
измерений уровня шума значительно больше, так как из схемы ИУ
исключена интегрирующая цепь и время срабатывания ИП около
200 мс.
В системе АДИ имеются также устройства для измерения
коэффициента модуляции AM передатчика и девиации МВ-ЧМ
передатчика с помощью специальных приемников.
Автоматический контроль и диагностика в звуковом вещании
Возрастающая сложность систем передачи информации,
постоянный рост числа и протяженности каналов ЗВ,
территориальная разобщенность объектов измерения приводят к
усложнению устройств контроля, необходимости введения
специальных каналов для передачи данных о состоянии объектов.
Без развитой системы автоматического контроля и измерений
невозможно обеспечить высококачественную бесперебойную
работу каналов ЗВ. Основу контроля должны составлять
диагностика и прогнозирование неисправностей, где на первое
место выступает предупреждение отказов.
Типичная структура системы технического контроля и
диагностирования представлена на рис. 0.11.
Рис. 0.11 — Типичная структура системы технического контроля
и диагностирования
Датчики
сигналов
ДС
из
объекта
технического
диагностирования ОТД выводят сигналы, параметры которых
характеризуют состояние диагностируемой системы. По каналам
передачи КП эта информация транслируется к средствам
измерений СИ, но так как обычно трудно одновременно измерять
все параметры, то сигналы последовательно коммутируются
коммутатором К. Результаты измерений или сравнения в блоке
дискриминатора (устройстве сравнения) ДСК с полем допусков ПД
индицируются индикатором Инд и документируются ДУ в виде
решения о техническом состоянии. Устройство управления УУ
реализует операцию управления состоянием самого ОТД или
отдельными его составляющими. Испытательные сигналы
подаются с помощью генераторов стимулирующих сигналов ГСС, а
устройство прогнозирования УП позволяет определить состояние
объекта в будущем посредством обработки информации о его
текущем и прошлом состояниях.
В результате автоматического контроля и диагностирования
выносится
решение
о
техническом
состоянии
ОТД.
Работоспособное
состояние
определяет
возможность
использования ОТД по своему прямому функциональному
назначению.
Показанные на рис. 0.11 связи могут реализоваться в виде
воздействий
оператора
(ручное
или
автоматизированное
управление) либо с помощью интерфейса, под которым понимают
систему сопряжения, включающую как аппаратные, так и
программные средства. Отметим, что применение стандартного
интерфейса позволяет реализовать блочно-модульный принцип
построения объекта (ОТД) и эта система является частным случаем
информационно-измерительной системы в современном понимании
(т.е. управляется ЭВМ, агрегатируется и т.д.)
За каждой функциональной подсистемой стоит конкретная
схемотехническая реализация. В качестве примера рассмотрим
практическую реализацию устройства КПУ-2 (контрольное
приемное устройство), которое может быть применено в составе
блока СИ (см. рис. 0.11) для оценки параметров качества и
диагностики систем трехпрограммного проводного вещания (ТПВ).
Указанное устройство рекомендовано к применению ГОСТ 1151591 «Каналы и тракты звукового вещания. Основные параметры
качества. Методы измерений».
Контрольно-измерительное устройство КПУ-2 предназначено
для
проведения
эксплуатационных
измерений
основных
параметров качества трактов ТПВ с полосой передаваемых частот
50...10000 Гц и 100...6300 Гц, а также для проведения лабораторных и
производственных измерений. Устройство КПУ-2 позволяет:
 избирательно измерять напряжения синусоидальных и AM
измерительных сигналов в каналах сети ТПВ;
 измерять
напряжение
псофометрического
шума,
интегральной помехи и избирательно измерять напряжение внятной
переходной помехи соответственно с защищенностью от этих помех
до 70, 70 и 75 дБ в первом, во втором и третьем каналах
соответственно сети ТПВ с учетом регулирования уровня несущей
частоты;
 измерять
коэффициент
гармоник
при
частотах
испытательного сигнала 1 и 4 кГц, а в комплекте с измерителем
нелинейных искажений в диапазоне частот 0,05...10 кГц.
Измерение указанных параметров устройство обеспечивает в
двух режимах работы: вольтметра и приемного устройства. Шкала
измерителя проградуирована в среднеквадратических значениях
синусоидального напряжения. Структурная схема устройства КПУ2 представлена на рис. 0.12.
Рис. 0.12 — Структурная схема устройства КПУ-2
При работе устройства в режиме вольтметра все
переключающие контакты переключателя S2 должны находиться в
положении 1–2. В этом случае сигнал с входа поступает на
симметрирующее устройство СУ, затем на аттенюатор AT, где
устанавливается необходимый предел измерения сигналов, и далее,
в зависимости от выбранного с помощью переключателя S1 канала
измерения, через ФВЧ или ФНЧ на усилитель вольтметра УВ и
затем на показывающий прибор ПП2. Кроме того, с выхода
усилителя вольтметра через переключатель S3 и контрольный
усилитель
КУ
измеряемое
напряжение
подается
на
громкоговоритель Гр, преобразующий электрический сигнал в
акустический.
Иначе говоря, принцип действия КПУ-2 в режиме вольтметра
основан
на
выделении
соответствующими
фильтрами
составляющих входного напряжения, их взвешенном ослаблении с
помощью аттенюатора, детектировании, усилении и измерении
сигнала показывающим прибором, а также при необходимости на
прослушивании измеряемого сигнала через громкоговоритель.
В режиме приемного устройства принцип действия КПУ-2
основан на выделении полосовыми фильтрами входного AM-сигнала второго или третьего каналов сети ТПВ, их взвешенном
ослаблении аттенюатором, демодуляции и выделении в усилителе
приемника огибающей AM-сигнала, измерении ПП параметров
этой огибающей. Составляющие огибающей, определяющие ее
параметры, выделяются ФНЧ. При необходимости прослушивания
измеряемый сигнал может быть воспроизведен громкоговорителем.
При работе в режиме приемного устройства все
переключающие контакты переключателя S2 должны находиться в
положении 3–2. Сигнал AM с входа поступает на СУ, AT и далее
через контакты переключателя S1, ФВЧ, усилитель приемника УП,
ФНЧ, оконечный усилитель ОУ, усилитель вольтметра УВ на ПП2,
а также с выхода усилителя вольтметра УВ через контакты
переключателя S3 на вход КУ и Гр.
Преобразование
постоянного
нестабилизированного
напряжения 6 В в питающее стабилизированное напряжение 18 В
осуществляется преобразователем напряжения ПН.
Показывающий прибор ПП1 используется для контроля
напряжения питания на входе ПН в режиме вольтметра. При работе
в режиме приемного устройства этот прибор служит для контроля
уровня огибающей AM-сигнала на выходе УП.
Блоки питания БП1 и БП2 предназначены для питания
устройства от сети переменного тока или источника постоянного
тока соответственно.
Контрольные вопросы
1. Перечислите основные параметры качества каналов и
трактов звукового вещания, нормируемые ГОСТ 11515-91.
2. Какие виды технического контроля вы знаете? В каких
случаях они применяются?
3. Какова методика измерения неравномерности АЧХ?
4. Почему неравномерность АЧХ рекомендуется измерять при
подаче на вход испытуемого устройства гармонического
измерительного сигнала на 21 дБ ниже номинального?
5. В каких случаях и почему длительность подачи
испытательного сигнала номинального уровня не должна превышать
5 с?
6. Почему нелинейные искажения недостаточно измерять
методом коэффициента гармоник?
7. Чем
обусловлен
вид
АЧХ
взвешивающих
(псофометрических) фильтров?
8. Каковы особенности построения системы автоматического
контроля и диагностики?
9. Каким образом и какие параметры контролируются с
помощью устройства КПУ-2?
ЗВУКОВЫЕ КАРТЫ МУЛЬТИМЕДИЙНЫХ
КОМПЛЕКСОВ
Звуковая карта
Звуковая карта, звуковой адаптер, звуковая плата (sound board,
sound card) — это плата, позволяющая с помощью компьютера
записывать и воспроизводить звуки, синтезировать музыку,
управлять внешней акустической аппаратурой, подключенной к
компьютеру. Все звуковые карты по назначению можно разделить
на три группы: чисто звуковые, чисто музыкальные и
комбинированные.
Чисто звуковые карты позволяют только записывать или
воспроизводить непрерывный звуковой поток, наподобие
магнитофона. Вся работа по запоминанию записываемого и
подготовке воспроизводимого потока возлагается на программное
обеспечение. Некоторые платы имеют встроенные сигнальные
процессоры для обработки звука в процессе его записи или
воспроизведения.
Чисто музыкальные карты (платы) содержат только
музыкальный синтезатор. Такие платы ориентированы, прежде
всего, на генерацию относительно коротких музыкальных звуков
по командам от центрального процессора; при этом звуки либо
создаются заново, либо воспроизводятся звуки, цифровые коды
которых были заранее помещены в память синтезатора.
Музыкальные платы не имеют возможности записи звука и не
рассчитаны на воспроизведение непрерывного звукового потока.
Некоторые музыкальные платы содержат эффект-процессор для
обработки создаваемого звука.
Комбинированные, или звукомузыкальные, звуковые карты
располагают блоком цифровой записи/воспроизведения, называемым
также цифровым каналом, или трактом, блоком музыкального
синтезатора и блоками, осуществляющими регулирование уровней,
коммутацию, усиление и сведение звуковых сигналов.
Методы синтеза звуков
Принципиально разных методов синтеза всего два. На заре
развития компьютерный музыки был разработан метод частотной
модуляции (или FM-синтез, от английских слов Frequency
Modulation). Суть его в том, что один генератор электрических
колебаний создает волну определенной формы и частоты. На эту
же волну накладываются колебания от другого генератора, которые
изменяют во времени, т.е. модулируют параметры первой волны. В
результате и синтезируется звук с необходимыми тембрами.
Поскольку схемы соединения генераторов, а также параметры
колебаний каждого из них (частота, амплитуда и закон изменения
во времени) могут быть самыми разнообразными, то и количество
синтезируемых тембров и всевозможных звуковых эффектов
теоретически не ограничено.
В этом заключается главный плюс FM-синтеза, на основе
которого работали первые электромузыкальные инструменты.
Главный его минус в том, что практически нельзя добиться точной
имитации живого звука — очень уж много такой звук имеет
тонких, едва уловимых оттенков. Поэтому звучание кажется не
совсем естественным, сугубо компьютерным и в настоящее время
встречается разве что в музыкальных сопровождениях к
компьютерным играм.
Второй метод, появившийся в начале восьмидесятых годов,
получил название sampling, что в буквальном переводе с
английского означает «отбор образцов». Суть этого способа
заключается в том, что для синтеза используется заранее
записанный фрагмент натурального звука. Такие образцы живого
звучания, которые находятся в памяти компьютера, называются
сэмплами.
Для экономии памяти сэмплы обычно хранятся в виде
отдельных фаз: начало звука (атака), стационарная фаза
(поддержка), завершение звука (затухание) (рис. 0.1).
Рис. 0.1 — Осциллограмма формирования звука
При исполнении сэмпла фазы начала и конца звука
воспроизводятся без изменений, а стационарная фаза как бы
зацикливается на требуемое время (пока, например, нажата
клавиша рояля или продолжается дыхание в мундштук трубы).
Сюда же могут быть отнесены различные приемы игры,
отражающие специфическую динамику звукоизвлечения, как то:
игра на рояле с использованием педали — и без нее, сильный удар
по струне гитары — и мягкое ее касание. В общем, набор сэмплов
слегка напоминает хранящиеся в холодильнике полуфабрикаты, из
которых опытный музыкант легко приготовит звуковое блюдо на
любой вкус.
У последнего метода есть еще другое (хотя и не совсем
правильное) название — волновой синтез. А закодированные
наборы сэмплов называются волновыми таблицами (по-английски
Wave Table). Поэтому о звуковых картах, в которых реализован
рассмотренный метод, говорят, что они поддерживают WT-синтез.
Очевидно, WT-синтез выгодно отличается от FM-синтеза тем,
что позволяет добиться естественного звучания самых разных
музыкальных инструментов, причем высокого качества CD-дисков,
и потому получил основное направление в компьютерной музыке.
Появление звуковых мультимедийных карт
Необходимость в озвучивании компьютера появилась, как это
ни смешно, в результате развития игр. Гораздо приятнее было
гонять маленького человечка по лабиринту в сопровождении
незатейливой мелодии, раздающейся из маленького динамика, чем
просто так. Различные производители стали устанавливать в
машины простейшие блоки синтеза и воспроизведения звука. А
фирма Apple оснастила свои компьютеры MIDI-интерфейсом, что
сразу же привлекло профессионалов, и, начиная с середины 80-х
годов, Apple Macintosh стал таким же привычным студийным
устройством, как и микшер. MIDI-интерфейс появился и на
машинах производства фирмы Atari.
IBM-совместимые компьютеры довольно долго оставались в
стороне от этих новых течений. Встроенный динамик вполне
удовлетворял и разработчиков игр, и пользователей. Но вечно так
продолжаться не могло, и в 1988 году никому не известная
сингапурская фирма Creative Labs выпустила специализированную
плату расширения для озвучивания игр, которая получила название
Game Blaster. На плате были установлены специально
разработанный чип FM-синтезатора C/MS и пара незатейливых
преобразователей для ввода/вывода звука. Цена новинки была
довольно высокой — около 400 долларов, и поэтому Game Blaster
широкого распространения не получил.
В это же время канадская фирма Ad Lib выпустила свою
версию звуковой карты. На ней стоял чип FM-синтезатора YM3812,
который фирма Yamaha использовала для производства
игрушечных музыкальных инструментов. В остальном карта Ad Lib
совершенно ничем не отличалась от Game Blaster’а. Качество звука
синтезатора на основе чипа фирмы Yamaha было выше, чем у
C/MS, поэтому де-факто именно Ad Lib стал тогда стандартом.
Но Creative Labs не замедлила с ответом и создала в 1989 году
звуковую карту Sound Blaster. Сингапурские «звуковых дел
мастера» пошли по пути наименьшего сопротивления и просто
купили у Yamaha лицензию на YM3812 и заявили о полной
совместимости своего изделия со стандартом Ad Lib. Но на
новинке появился MIDI-интерфейс, а качество звука в аудиотракте
улучшилось
за
счет
установки
модифицированных
преобразователей. Все эти новшества сыграли решающую роль в
выборе Sound Blaster’а в качестве основы для спецификации MPC
(Multimedia PC) компании Microsoft.
С этого момента и начинается применение РС в музыке —
наличие в спецификации MPC MIDI-интерфейса сделало эту
платформу привлекательной для разработчиков программных
секвенсеров, которые не могли упустить случая закрепиться на
новом рынке. А цена на IBM PC-совместимые компьютеры всегда
была в два раза ниже, чем на близкие по мощности Macintosh, что
выглядело очень привлекательно в глазах музыкантов —
потенциальных покупателей компьютерных систем. Платформа
Atari в качестве серьезного конкурента PC и Mac никогда не
рассматривалась из-за меньшей производительности и отсутствия
универсальности — она изначально создавалась для компьютерных
игр и таковой до своего конца и осталась.
После принятия спецификации MPC очень многие компании
стали выпускать клоны Sound Blaster и Ad Lib, а также создавать
свои собственные оригинальные разработки. Обострившаяся
конкуренция не могла не сказаться на цене звуковых карт, и в
результате в начале 90-х годов практически любой пользователь PC
мог себе позволить играть на компьютере со звуковым
сопровождением.
Но дешевые чипы FM-синтезаторов производства Yamaha не
могли удовлетворить все возрастающие потребности слушателей,
поэтому компании, выпускающие звуковые карты, начали
устанавливать на свои изделия чипы синтезаторов, работающие по
принципу воспроизведения семплов (sample playback). В
мультимедийной терминологии этот принцип получил не совсем
верное название Wave Table. К профессиональным синтезаторам
эти разработки, за редким исключением, имели очень далекое
отношение — в целях их удешевления нещадно урезался объем
постоянной памяти и применялись алгоритмы компрессии, которые
сильнее «упаковывали» образцы, но в результате ухудшали звук.
Параллельно с усовершенствованием мультимедийных Wave
Table синтезаторов шла работа над доработкой аудиотракта. В
результате сегодняшние дешевые звуковые карты записывают и
воспроизводят «живые» музыкальные инструменты не хуже
бытовых магнитофонов, а некоторые из них уже довольно близко
подобрались по качеству звучания к студийной технике.
Последнее время на дорогих мультимедийных картах
появились цифровые входы и выходы формата SPDIF. Цифровой
интерфейс позволяет избежать потерь качества при записи с
цифровых источников (CD-плейер, минидиск, DAT-магнитофон). А
если для оцифровки «живых» музыкальных инструментов
использовать внешние дорогие студийные преобразователи, то
можно говорить о том, что на мультимедийной технике достигнуто
студийное качество записи звука.
С середины 90-х годов лучшие мультимедийные звуковые
карты начали стремительно приближаться к профессиональным
устройствам по качеству звучания. Но и со стороны
производителей профессиональной техники наметился поворот в
сторону платформы PC. Все больше синтезаторов и звуковых
модулей оборудуется последовательным интерфейсом для
подключения к соответствующему порту компьютера. Для PC
сейчас уже есть мощные секвенсеры, программы для
профессиональной записи на жесткий диск и CD-мастеринга.
Появляется все больше серьезных студийных комплексов
многоканальной записи, использующих PC в качестве
управляющего элемента. Причем процесс этот, похоже, принял
необратимый характер, и в настоящий момент именно PC
рассматривается
большинством
ведущих
производителей
студийной техники в качестве основы для новых разработок.
Платы расширения, системные шины и ресурсы
Почему IBM PC-совместимые компьютеры выдержали
жесточайшую конкурентную борьбу с другими платформами,
несмотря на то, что они никогда не были на первых местах по
производительности? Все дело в том, что PC обладают открытой
архитектурой, то есть компьютер выходит с завода в минимальной
конфигурации, а для его модернизации предусмотрены
специальные «посадочные места» или слоты расширения для
установки
специализированных
плат.
Это
позволяет
приспосабливать компьютер для любого типа деятельности или
легко интегрировать его в уже существующие системы.
Для использования в музыкальных целях компьютер
приспосабливается именно таким образом — в слоты расширения
устанавливается одна или несколько звуковых плат и
инсталлируются программы. К звуковым платам подключаются все
специализированные устройства — микшеры, микрофоны, MIDIклавиатуры и т.д. Все процессы преобразования и синтеза звука
происходят именно в звуковой карте, а компьютер только
управляет ею и производит всю дальнейшую обработку
полученных данных.
Шиной в компьютере называется совокупность однотипных
каналов передачи данных вместе с устройствами согласования
(контроллерами), которые предназначены для организации
взаимодействия процессора, памяти и любых периферийных
устройств. Упрощено шину можно представить как пучок
проводов, который с одной стороны подключен к платам
расширения, а с другой стороны — к процессору через
специальные схемы согласования. Процессор передает по этим
проводам управляющие сигналы, а платы передают данные для
обработки.
Естественно, ключевым параметром любой шины будет
пропускная способность — количество данных, которые можно
передать по ней за единицу времени. От пропускной способности
зависит количество одновременно работающих периферийных плат
и способность работы со специализированными устройствами,
которые требуют передачи большого объема данных.
В результате конкурентной борьбы победу одержала шина PCI
(Peripheral Component Interconnect — Взаимосвязь Периферийных
Компонентов). Она обеспечивает пропускную способность 132
Мб/с. Большинство современных периферийных устройств
рассчитано для работы именно с ней.
Но шина PCI имеет ограничение на количество
устанавливаемых на ней устройств. Теоретически, она позволяет
держать в компьютере 10 независимых плат расширения, но на
практике это число меньше. Во-первых, оно ограничено
количеством свободных слотов. На современных материнских
платах обычно устанавливаются 3 — 6 слотов PCI. Во-вторых, оно
зависит от наличия свободных линий аппаратных прерываний
(IRQ).
Функционирование звуковых плат
Сейчас есть множество типов звуковых карт: универсальные,
карты-синтезаторы,
оцифровщики
звука,
многоканальные
аудиоинтерфейсы, MIDI-интерфейсы, семплеры и др. Рассмотрим
именно универсальные мультимедийные платы, так как они
наиболее распространены среди музыкантов-любителей и
небогатых профессионалов. «Прародителями» таких плат были уже
упоминавшиеся выше Sound Blaster и Ad Lib, поэтому их нередко
называют «саунд бластерами».
На рис. 0.2 приведена типовая структурная схема
мультимедийной звуковой карты.
ОЗУ
MIDI/джойстик
порт
ПЗУ
Wave Table синтезатор
FM синтезатор
Line In
Mic In
CD In
Входной
микшер
АЦП
ЦАП
ЦАП
DSP
сигнальный
процессор
Выходной
микшер
Line Out
ЦАП
Aux In
MIDI
Шина PCI
Audio
Рис. 0.2 — Схема мультимедийной звуковой карты
Входы звуковой карты расположены на металлической
панели, выходящей на заднюю стенку системного блока
компьютера. К входам подключаются внешние аудиоустройства —
микрофоны, магнитофоны, электрогитары и т.д. На данном рисунке
показаны 4 входа. Вход Line In называется линейным, а Mic In —
микрофонным входом. Они обычно выполнены на разъемах типа
«мини-Джек» (похожи на разъемы для подключения наушников в
портативных плеерах). Отдельный вход Mic In предусмотрен из-за
того, что у микрофонов сигнал имеет низкий уровень и его нужно
усиливать до нормального уровня, перед тем как направлять на
преобразователь. Поэтому на микрофонных входах звуковой карты
всегда установлен предусилитель — небольшая схема, повышающая
уровень сигнала до нормального (линейного) уровня.
На
некоторых
типах
звуковых
плат
установлен
дополнительный вход Aux In. Сигнал с этого входа минует
основные устройства звуковой платы и поступает на выходной
микшер, а оттуда — сразу на выход. Этот вход позволяет упростить
коммутацию внешних устройств и использовать внутренний
микшер звуковой платы для смешивания сигналов с внешнего и
внутренних источников. Например, если у вас есть автономный
синтезатор, то его выход можно подключить в Aux In и все, что вы
играете, будет слышно в колонках, подключенных к звуковой
карте. Aux In тоже обычно делается на разъеме типа «мини-Джек».
Вход
проигрывателя
компакт-дисков,
как
правило,
расположен не на задней панели звуковой платы, а прямо на ней,
среди микросхем и других радиодеталей. Поэтому выход привода
CD/DVD ROM можно связать с этим входом звуковой карты. Такое
соединение позволяет слушать аудио компакт-диски и
оцифровывать звук прямо с привода.
Кроме всех перечисленных входов, на задней панели звуковой
карты есть обычно 15-контактный разъем MIDI/джойстик порта,
который служит для подключения любых внешних MIDI-устройств
(синтезаторов, MIDI-клавиатур и т.д.) или джойстика, если карта
используется для игр (рис. 0.3). В данном варианте карты на
металлической планке виден круглый разъем — дополнительный
цифровой выход 5-канального звука.
Рис. 0.3 — Внешний вид звуковой карты
Все сигналы с внешних аудиоустройств поступают на входной
микшер звуковой платы (см. рис. 0.2). Он работает точно так же,
как и обычные пульты, с той только разницей, что все управление
происходит программно. В комплект служебных программ любой
звуковой карты входит программа микшера.
Входной микшер нужен для того, чтобы установить
оптимальный
уровень
записи.
После
аналого-цифрового
преобразования данные поступают в сигнальный процессор (DSP
— Digital Signal Processor) — сердце звуковой платы. Этот
процессор управляет обменом данными со всеми остальными
устройствами компьютера через шину PCI. Если центральный
процессор выполняет программу записи звука, то цифровые данные
поступают либо прямо на жесткий диск, либо в оперативную
память компьютера в зависимости от выполняемой программы.
Этим данным можно присвоить любое имя — получится звуковой
файл.
При воспроизведении этого звукового файла данные с
жесткого диска через шину поступают в сигнальный процессор
звуковой платы, который направляет их на цифроаналоговый
преобразователь (см. рис. 0.2). Электрический сигнал,
получившийся в результате преобразования, в свою очередь,
поступает на выходной микшер. Этот микшер практически
идентичен входному и управляется при помощи программы.
При записи сигнальный процессор одновременно может
работать с двумя потоками цифровых аудиоданных: идущих с АЦП
через шину к другим устройствам компьютера и поступающих с
жесткого диска на ЦАП. Это режим full duplex — запись
одновременно с воспроизведением. Благодаря этому режиму можно
использовать звуковую карту как многоканальный магнитофон.
На любой универсальной мультимедийной звуковой карте есть
синтезатор. Сейчас практически на всех картах устанавливается не
один, а два синтезатора: FM — для сохранения совместимости с Sound
Blaster и Ad Lib, и Wave Table — для получения качественного звука.
Именно эти синтезаторы показаны на рисунке 0.2.
Исторически так сложилось, что FM-синтезаторы звуковых
плат звучат не очень хорошо. Как правило, на современные
мультимедийные карты устанавливаются наборы микросхем
(чипсеты) FM-синтезаторов производства Yamaha под названием
OPL-2, OPL-3 или совместимые с ними. В музыкальных
приложениях такие синтезаторы не применяются — они нужны
исключительно для звукового сопровождения игр.
Мультимедийные
Wave
Table-синтезаторы
позволяют
получить более приличный звук. Некоторые фирмы-производители
мультимедийной техники не только копируют автономные
музыкальные инструменты, но и расширяют их функциональные
возможности.
На рис. 0.2 вы видите, что у Wave Table-синтезатора есть не
только постоянная память (ПЗУ), но и оперативная (ОЗУ).
Оперативной памятью обладают семплеры, и используется она для
загрузки любых звуковых файлов, которые проигрываются с
разной высотой при нажатии клавиш на подключенной клавиатуре
или поступлении команд от секвенсера. То есть Wave Table
синтезатор, имеющий оперативную память помимо постоянной, —
это ни что иное, как комбинация синтезатора и семплера, которая
может выполнять функции обоих устройств. Это означает, что вы
можете использовать как образцы звучания, хранящиеся в
постоянной памяти, так и загружать в оперативную память
дополнительные библиотеки или создавать свои собственные звуки.
Такая особенность расширяет творческие возможности компьютера.
Чтобы синтезаторы, установленные на звуковой карте, можно
было использовать в качестве музыкальных инструментов, к
MIDI/джойстик порту подключают либо MIDI-клавиатуру, либо
автономный синтезатор, который может служить в качестве
клавиатуры. Сигналы, поступающие с клавиатуры, подаются в
процессор (см. рис. 0.2), который направляет их либо через
системную шину к центральному процессору, либо к синтезаторам
звуковой карты. Путь MIDI-сигнала зависит от выполняющихся
программ — в любом развитом программном секвенсере можно
коммутировать MIDI-порты и устройства произвольным образом.
Каждый из синтезаторов, установленных на звуковой карте,
имеет свой собственный ЦАП. После преобразования сигналов в
аналоговую форму, они поступают на выходной микшер звуковой
карты. Можно устанавливать необходимый баланс синтезаторов,
аудиотракта
и
аудиоустройства,
подключенного
к
дополнительному (aux) входу. Такая возможность оказывается
крайне полезной при окончательном микшировании композиций,
записанных при помощи компьютера. А итоговый сигнал поступает
на линейный выход (Line Out), который находится на задней
панели звуковой карты.
Вот, вкратце, все устройство универсальной мультимедийной
звуковой карты. Все специализированные музыкальные платы
работают точно таким же образом, только на них нет тех или иных
элементов. Например, на картах-синтезаторах установлен только
MIDI-интерфейс и качественный Wave Table синтезатор. Картыоцифровщики имеют хорошие АЦП и ЦАП, сигнальный процессор
и ничего больше.
ЭЛЕКТРОМУЗЫКАЛЬНЫЕ ИНСТРУМЕНТЫ
Определения
Электромузыкальными инструментами (ЭМИ) называют
музыкальные инструменты, в которых звук создается в результате
генерирования, усиления и преобразования электрических сигналов
с помощью электронной аппаратуры. Инструменты имеют
своеобразный тембр звука, могут имитировать различные реальные
инструменты. К электромузыкальным инструментам относятся
терменвокс, эмиритон, синтезатор, электрогитары, электроорганы,
электробарабаны и другие. Эти инструменты применяются главным
образом в эстрадной и рок-музыке.
Терменвокс — «голос Термена», электромузыкальный
инструмент, в котором высота звука изменяется в зависимости от
расстояния правой руки исполнителя до одной из антенн, а
громкость — от расстояния левой руки до другой антенны.
Изобретателем является русский инженер Лев Сергеевич Термен.
Эмиритон — электромузыкальный инструмент, снабженный
клавиатурой фортепьянного типа. Сконструирован в СССР
изобретателями А.А. Ивановым, А.В. Римским-Корсаковым,
В.А. Крейцером и В.П. Дзержковичем. Первая модель была создана
в 1935.
Музыкальный синтезатор (frequency modulation synthesizer) —
электронный блок, который создает сложный сигнал путем
комбинации цифровых импульсов, представляющих образы звука.
Этот сигнал подается на цифроаналоговый преобразователь и уже в
форме звукового аналогового сигнала попадает на акустические
системы.
Электромузыкальные инструменты бывают одноголосыми и
многоголосыми. В одноголосом ЭМИ только один генератор, в нем
с помощью клавиатуры или иным способом переключают элементы
схемы, которые определяют частоту. В таком одноголосом ЭМИ
аккорды звучать не могут, он поет только одним голосом, как
флейта или как человек. В качестве генератора одноголосого ЭМИ
часто используется мультивибратор.
Несмотря на то, что одноголосый инструмент не дает
аккордов, звучание его может быть очень эффектным. Все зависит
от того, какие тембры удается создать.
В многоголосом ЭМИ одновременно может работать большое
число источников сигнала, возможны различные звукосочетания,
аккорды.
Казалось бы, есть только один путь создания многоголосого
ЭМИ — в нем нужно иметь для каждой ноты свой собственный
генератор так же, как в рояле для каждой ноты есть своя струна.
Однако, используя цифровые делители частоты — триггеры, можно
создать многоголосый ЭМИ по другой схеме, имея в инструменте
всего 12 генераторов — для всех нот одной, самой
высокочастотной октавы. Затем частоту каждого генератора можно
делить с помощью триггера и перейти к следующей, более
низкочастотной октаве. Таким образом, имея 12 генераторов и 12
делителей-триггеров, можно получить двухоктавный многоголосый
ЭМИ. Если добавить к нему еще 12 триггеров, то увеличим число
октав до трех и так далее.
По числу элементов и по сложности схемы многоголосый
ЭМИ с делителями частоты практически не отличается от
инструмента с отдельными генераторами на каждую ноту. Но зато
система с делением частоты имеет одно важное достоинство,
связанное со стабильностью настройки инструмента. В
инструменте, где на каждую ноту имеется отдельный генератор,
возможности расстройки довольно велики, расстроиться может
каждый из генераторов. Значительно сложнее и настраивать такой
инструмент, нужно подгонять элементы схемы в каждом из
генераторов. А в инструменте с делителями нужно подбирать и
подстраивать частоту только 12 генераторов. Если основные
генераторы будут настроены точно, то триггеры автоматически
разделят их частоту на два, на четыре, на восемь. Настроив 12
генераторов, мы настраиваем весь инструмент.
История развития электромузыкальных инструментов
Разнообразные механические музыкальные инструменты были
известны уже несколько столетий назад. Первые часовые
музыкальные шкатулки и ручные органы появились уже в 17-м
веке. Однако все эти механизмы не были предназначены для
собственно создания музыки. Использование электричества для
извлечения звука началось в 1837 году, когда доктор К.Д. Пэйдж
(C.G.Page) из Массачусетса заявил о своем случайном открытии
«гальванической музыки», метода извлечения круговых тонов с
использованием подковообразных магнитов и спиралей из медной
проволоки. Первым электромузыкальным инструментом стал в
1874 году «Музыкальный телеграф» Элиши Грэй (Elisha Grey),
представлявший
собой
двухоктавный
полифонический
электроорган. За ним последовали многие другие. К примеру,
«Поющая радуга» Уильяма Дудделя (William Duddell) в 1899 году и
«Телармониум» Таддеуша Кахила (Thaddeus Cahill) в 1900.
Последний инструмент представлял из себя огромный комплекс,
весивший 200 тонн и длиной около 20-ти метров. Механическая
часть «Телармониума» была позже адаптирована и использована в
органе «Hammond» (рис 0.1), первая модель которого относится к
1929 году.
Рис. 0.1 — Вид органа «Hammond»
Отдельно необходимо упомянуть советского изобретателя
Льва Термена, создавшего в то же время свой «Терменвокс»,
основанный на изменениях напряжения электрических полей (рис.
0.2).
Рис. 0.2 — Лев Термен с терменвоксом
В середине 20-х Термен эмигрировал в США и в 1931 году
изготовил для американского композитора Генри Коуэлла
специальную клавиатуру, названную «ритмикон», которая могла
повторять серии нот, — это был первый секвенсор.
Вовлечение электроники в генерацию звуков повлекло за
собой несколько последовательных музыкальных революций.
Новая техника позволила производить звуки, ранее не
существовавшие в природе, и развиваться им во времени путями,
невоспроизводимыми традиционными инструментами.
В конце 50-х были изобретены синтезаторы. Первый
синтезатор, названный АНС, сконструирован советским инженером
Евгением Мурзиным. Действие синтезатора было основано на
принципе графического изображения звуковой дорожки или
графического звукосинтеза, применяющемся в кино. Роль
фотооптического генератора в синтезаторе выполнял стеклянный
диск, покрытый фотоэмульсией, на котором были отпечатаны 144
звуковые дорожки «чистых тонов». Звук задавался путем рисунков
на специальной маске, располагавшейся между диском и
фотоэлементом. Далее развитие синтезаторов пошло по другому
пути, однако у АНСа в наличии были такие вещи, некоторые из
которых не превзойдены и до сих пор, — к примеру, он содержал
720 генераторов синусоидальных тонов. АНС был запатентован в 58м году.
Первым западным синтезатором стал в 59-м году синтезатор
RCA. В середине-конце 60-х появились относительно недорогие и
портативные модели коммерческих синтезаторов типа Moog и
Buchla. В начале 70-х появился первый настоящий синтезатор, как
мы его себе сегодня представляем, — SYNTI-100. Он имел уже две
клавиатуры, два генератора шумов, два ревербератора,
трехголосную память, 8 фильтров и 8 мелодических генераторов.
Терменвокс
Это первый инструмент, положивший начало новому
направлению в радиоэлектронике — электронной музыке
(электромузыке). Разработал его молодой петроградский физик Лев
Термен. По имени изобретателя и был назван необычный
электромузыкальный инструмент. Необычен же он тем, что не
имеет клавиатуры, струн или труб, с помощью которых получают
звуки нужной тональности (рис. 0.3). Игра на терменвоксе
напоминает выступление фокусника-иллюзиониста — самые
разнообразные мелодии звучат из динамической головки при едва
заметных манипуляциях одной или двумя руками вблизи
металлического
прутка-антенны,
торчащего
на
корпусе
инструмента.
Рис. 0.3 — Терменвокс
Терменвокс — одноголосый инструмент. Секрет терменвокса
в том, что в нем находятся два независимых генератора,
вырабатывающих колебания весьма высокой частоты — около
сотни тысяч герц. Но частоту одного из генераторов можно
изменять своеобразным переменным конденсатором, образуемым
рукой
играющего
и
металлическим
штырем-антенной,
соединенным с частотозадающей цепью генератора. Приближение
руки к антенне или удаление ее приводит к изменению суммарной
емкости частотозадающей цепи, а значит, частоты генератора.
Сигналы обоих генераторов подаются на смеситель. На
выходе смесителя выделяется разностный сигнал, который
усиливается усилителем ЗЧ и воспроизводится динамической
головкой. В исходном состоянии частоты обоих генераторов
одинаковые, разностного сигнала практически нет, звука не
слышно. Но стоит приблизить к антенне руку, как разностный
сигнал появляется и в головке раздается звук. Тональность его
изменяют рукой, приближаемой к антенне или удаляемой от нее.
Таков принцип работы любого терменвокса. Разница между
конструкциями заключается в схемотехническом решении
отдельных узлов — генератора, смесителя, усилителя, а также в
наличии узлов, позволяющих получать оригинальные оттенки
звучания или звуковые эффекты.
Электронный барабан
Барабан — один из популярных, но в то же время громоздких
музыкальных инструментов. Уменьшить его габариты и сделать
более удобным в транспортировке — желание едва ли не каждого
ансамбля. Если воспользоваться услугами электроники, можно
получить имитацию звучания барабана.
Если с помощью микрофона, усилителя и осциллографа
«просмотреть» звук барабана, то удастся обнаружить следующее.
Сигнал на экране осциллографа промелькнет в виде всплеска,
напоминающего падающую каплю воды. Правда, падать она будет
справа налево. Это значит, что левая часть «капли» имеет крутой
фронт, обусловленный ударом по барабану, а затем следует
затухающий спад — он определяется резонансными свойствами
барабана. Внутри же «капля» заполнена колебаниями почти
синусоидальной формы частотой 100...400 Гц — это зависит от
размеров и конструктивных особенностей данного инструмента.
Подобные электрические колебания может генерировать
контур ударного возбуждения, если подать на него запускающий
импульс, или генератор звуковых колебаний, находящийся в
заторможенном (ждущем) режиме в момент кратковременного
запуска его.
Приставки к электрогитаре
Популярность электрогитары сегодня во многом объясняется
возможностью подключать к ней электронные приставки,
позволяющие получать самые разнообразные звуковые эффекты.
Среди
музыкантов-электрогитаристов
можно
услышать
незнакомые для непосвященных слова «вау», «бустер», «дистошн»,
«тремоло» и другие. Все это — названия эффектов, получаемых во
время исполнения мелодий на электрогитаре.
«Бустер»-приставка. Если ударить медиатором по одной из
струн гитары и посмотреть на осциллографе форму электрических
колебаний, снимаемых с выводов звукоснимателя, то она напомнит
импульс с заполнением. Фронт «импульса» более крутой по
сравнению со спадом, а «заполнение» — не что иное, как почти
синусоидальные колебания, промодулированные по амплитуде. Это
значит, что громкость звука при ударе по струне нарастает быстрее,
чем спадает. Время нарастания звука музыканты называют атакой.
Динамика исполнения на гитаре возрастет, если ускорить
атаку, т.е. увеличить скорость нарастания звука. Получающийся
при этом эффект звучания получил название «бустер».
Чтобы получить эффект «бустер», достаточно эффективно
воспроизвести нижние частоты (основной тон) и форманту высших
частот в диапазоне 2000...5000 Гц для подчеркивания атаки и
подавить в определенной степени обертона в диапазоне частот
500...1000 Гц.
«Вау»-приставка. Если при прослушивании музыкальной
передачи, скажем, через радиоприемник начать быстро и в
широких пределах поворачивать ручку регулировки тембра, звук
обретет новую окраску, появится модуляция, схожая со звуками
«ква-ква» или «вау-вау». Такой эффект проявляется и при
исполнении мелодии на электрогитаре, сигнал с которой проходит
через специальную приставку. Подобные приставки нередко
называют «квакушками».
Обычно «вау»-приставка устроена так, что ее амплитудночастотная характеристика (АЧХ) может изменяться переменным
резистором или автоматическим регулятором резонансной частоты.
При этом в области низших частот на почти прямолинейной АЧХ
возникает резонансный «горб» (он похож на резонансную кривую
колебательного контура), который можно перемещать с помощью
ножной педали, механически связанной с осью переменного
резистора, по АЧХ в сторону высших частот.
Приставка «вибрато». Эффект «вибрато» проявляется в том,
что основные колебания сигнала, снимаемого с датчика
электрогитары, модулируются по амплитуде колебаниями весьма
низкой частоты (от единиц до нескольких десятков герц), причем
глубина модуляции небольшая.
Синтезаторы
Любой цифровой профессиональный синтезатор по сути
представляет из себя специализированный компьютер. Как и в
персональном компьютере, у него есть микропроцессор,
оперативная и постоянная память, средства ввода/вывода
информации и т.д. От обычного компьютера его отличают только
блок синтеза звука (звуковой модуль) и высококачественные
цифроаналоговые преобразователи. Современные синтезаторы
могут иметь несколько клавиатур, различные генераторы шумов,
память, фильтры, ревербераторы, мелодические генераторы.
Музыкальный синтезатор относится к многоголосым электронным
инструментам.
Синтезатор может имитировать звучание различных
музыкальных инструментов при помощи создания различных
тембров звучания. Основа этих инструментов — электрические
генераторы, взявшие на себя роль струн, сигнал с генератора
подается на громкоговоритель через усилитель и создает звук.
Высота тона, естественно, определяется частотой генератора, а тембр
звучания — формой кривой генерируемого напряжения. Чтобы в
широких пределах менять тембр звучания, между генератором и
громкоговорителем включаются электрические цепи, влияющие на
спектр сигнала, например RC-фильтры, резонансные фильтры,
нелинейные элементы, формантные фильтры, элементы изменения
атаки, умножители и делители частоты.
У всякого музыкального звука различают три части — атаку,
установившуюся стационарную часть (поддержку) и спад. Тембр
звучания зависит в очень сильной степени от характера атаки и
спада.
Изменение атаки — задача непростая. В простейшем случае
она решается с помощью RC-цепей, которые после нажатия
клавиши начинают заряжаться (или разряжаться) и обеспечивают
различную задержку сигнала на входе усилителя.
Другая возможность резко изменить форму сигнала — его
нелинейное искажение. Осуществить искажение можно многими
разными способами. В усилительном каскаде с помощью диода
можно «срезать» один из полупериодов или, резко увеличив
уровень сигнала на входе усилителя, ограничить его по максимуму
и по минимуму. За счет простейших RС-фильтров добиваются среза
высших или низших частот. Подобные искажения значительно
изменяют сигнал или вообще делают сигнал неузнаваемым. За счет
изменения тембра удается имитировать звучание скрипки,
виолончели, фагота, органа, трубы и многих других инструментов.
ЛИТЕРАТУРА
1. Радиовещание и электроакустика: Учебник для вузов / С.И.
Алябьев, А.В. Выходец, Р. Гермер и др.; Под ред. Ю.А. Ковалгина.
— М.: Радио и связь, 1998. — 792 с.
2. Ковалгин Ю. А., Вологдин Э. И. Цифровое кодирование
звуковых сигналов. — СПб.: КОРОНА-принт, 2004. — 240 с.
3. Звуковое вещание: Справочник / А.В. Выходец, П.М. Жмурин, И.Ф. Зорин и др.; Под ред. Ю.А. Ковалгина. — М.: Радио и
связь, 1993. — 464 с.
4. ГОСТ 11515–91. Каналы и тракты звукового вещания.
Основные параметры качества. Методы измерений. — М.: Изд-во
стандартов, 1991. — 42 с.
5. Багларов
И.А.,
Ефимов
А.П.,
Никонов
А.В.
Стереофоническое вещание. — М.: Радио и связь, 1993. — 240 с.
6. МККР. Рекомендации МККР. Радиовещательная служба
(звуковая). — Т.Х. — 4.1. — Дюссельдорф, 1990. — 204 с.
7. МККР. Рекомендации МККР. Передача сигналов
телевизионного и звукового радиовещания (СМТТ). —
Дюссельдорф, 1990. — 170 с.
8. МККР. Рекомендации и отчеты МККР. Радиовещательная
спутниковая служба (звуковая и телевизионная). — Т.X и XI. — Ч.2
— Дубровник 1990. — 498 с.
9. МККР. Рекомендации и отчеты МККР. Радиовещательная
служба (звуковая). — Т.Х. — Ч.1. — Дубровник, 1986. — 378 с.
10. ISO/IEC
11172-3.
International
Organization
for
Standardization, 1993 — 152 с.
11. ISO/IEC
13818-3.
International
Organization
for
Standardization 1994 — 99 с.
12. Стереофоническое радиовещание / М.А. Балан, С.А.
Бедойа, А.В. Выходец и др.; Под ред. А.В. Выходца и Б.В.
Одинцова. — К.: Техника, 1995. — 240 с.
СПИСОК СОКРАЩЕНИЙ И ТЕРМИНОВ
Сокращение
ASPEC
DAB
DCT
LFE
MPEG
MUSICAM
АВ
АДИ
АЗ
АМФ
АПБ
АПП
АПС
АСБ
АСК
АСМФ
АЧХ
БДС
ВК
ДКС
ДСТВ
ЗВ
ЗС
ЗЧ
ИКМ
КД
КИЗ
КРА
МА
МВА
МК
ОТД
ОТК
ПВС
ПЗС
ПК
ПРТС
ПТВС
Расшифровка
Audio spectral perceptual entropics coding
Digital audio broadcasting
Diskrete Cosinus Transformation (дискретное косинусное
преобразование)
Low frequency enhancement (канал сверхнизких частот)
Moving pictures experts group
Masking pattern universal subband integrated coding and
multiplexing
Аппаратная вещания
Аппаратура дистанционных измерений
Аппаратная записи
Аппаратная монтажа фонограмм
Аппаратно-программный блок
Аппаратная подготовки программ
Аппаратура позывных сигналов
Аппаратно-студийный блок
Аппаратно-студийный комплекс
Аппаратная сведения и монтажа фонограмм
Амплитудно-частотная характеристика
Блок дуплексной связи
Восстанавливающий контур
Дешифратор кода студии
Датчик сигналов точного времени
Звуковое вещание
Звуковой сигнал
Звуковая частота
Импульсно-кодовая модуляция
Компакт-диск
Канал источника звука
Коммутационно-распределительная аппаратная
Монтажная аппаратная
Междугородная вещательная аппаратная
Масштабные коэффициенты
Объект технического диагностирования
Отдел технического контроля
Передвижная станция магнитной видеозаписи
Передвижная звуковая станция
Предыскажающий контур
Передвижная репортажная телевизионная станция
Передвижная телевизионная станция с магнитной
Сокращение
ПТС
РД
СА
СЛ
СПЗ
СРП
ТА
ТВ
ТВРП
ТЖК
ТП
ТПВ
ТПП
ТПРП
ТФП
ТЦ
УДМ
ФКС
ЦА
ЦСПВ
Расшифровка
видеозаписью
Передвижная телевизионная станция
Радиодом
Студийная аппаратная
Соединительные линии
Синтезатор пространственного звучания
Суммарно-разностный преобразователь
Трансляционная аппаратная
Телевизионное вещание
Тракт вторичного распределения программ
Тележурналистский комплекс
Городской трансляционный пункт
Система трехпрограммного проводного вещания
Тракт приема программ
Тракт первичного распределения программ
Тракт формирования программ.
Телевизионный центр
Управляемая декодирующая матрица
Формирователь кода студии;
Центральная аппаратная
Центральная станция проводного вещания
Download