ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

advertisement
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ
ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО
ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
СТАВРОПОЛЬСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ
УНИВЕРСИТЕТ
Экономический факультет
УТВЕРЖДАЮ
Заведующий кафедрой
________________________
«___»_____________201_ г.
ЛЕКЦИЯ №6
по дисциплине «Теория информационных процессов и систем»
Дискретизация аналогового сигнала
для студентов
направления
230400.62
шифр
«Информационные системы и
технологии»
Наименование направления
(специальности)
Рассмотрено УМК
" " ___________ 201_ года
протокол N ______________
Ставрополь – 201_ г.
Цель лекции
Дать систематизированные основы научных знаний по указанной теме
занятия.
Учебные вопросы:
1. Этапы аналого-цифрового преобразования
2. Теорема Котельникова.
Время- 2 часа
1. Этапы аналого-цифрового преобразования
Формирование цифрового сигнала из аналогового предусматривает
последовательное выполнение трех основных операций:
• дискретизация аналогового сигнала по времени, в результате чего
формируется импульсный сигнал, промодулированный по амплитуде, т.е.
АИМ-сигнал;
• квантование АИМ-сигнала по уровню;
• кодирование отсчетов АИМ-сигнала.
В цифровых системах передачи (ЦСП) формируется групповой
цифровой сигнал, иначе называемый сигналом импульсно-кодовой
модуляции (ИКМ). При формировании группового ИКМ-сигнала
добавляется еще одна операция: перед квантованием по уровню
производится объединение индивидуальных АИМ-сигналов.
Рис. 1 Преобразование аналогового сигнала в цифровой ИКМ-сигнал
Преобразование ИКМ-сигнала в аналоговый предусматривает
последовательное выполнение основных операций:

декодирование (преобразование ИКМ-сигнала в АИМ);

восстановление аналогового сигнала (выделение из спектра
АИМ-сигнала исходного сигнала).
В ЦСП соответствующие операции обработки производятся
отдельными устройствами. Операции квантования и кодирования в ЦСП
обычно объединяют в одном устройстве.
В
процессе
формирования
АИМ
сигнала
осуществляется
дискретизация непрерывного (аналогового) сигнала во времени в
соответствии
с
известной теоремой
дискретизации (теоремой
В.А.Котельникова): любой непрерывный сигнал, ограниченный по спектру
верхней частотой FВ полностью определяется последовательностью своих
дискретных отсчетов, взятых через промежуток времени Tд=1/2 FВ,
называемый периодом дискретизации. В соответствии с ним частота
дискретизации, т.е. следования дискретных отсчетов, выбирается из условия
FД = 2FВ.
Поскольку все реально существующие непрерывные сигналы связи
представляют собой случайные процессы с бесконечно широким спектром,
причем основная энергия сосредоточена в относительно узкой полосе частот,
перед дискретизацией необходимо с помощью фильтра нижних частот
ограничить спектр сигнала некоторой частотой FВ. Для телефонных сигналов
необходимо использовать ФНЧ с частотой среза FВ=3,4 кГц. Частота
дискретизации для телефонных сигналов выбрана равной 8 кГц.
Устройство,
выполняющие
дискретизацию
во
времени,
называют устройством выборки и хранения (УВХ) (Рис. 2). УВХ могут
выпускаться в интегральном исполнении. Вид сигналов в точках 1, 2 и 3 УВХ
показан, соответственно, на Рис. 3, Рис. 4 и Рис. 5.
Рис. 2 Устройство выборки и хранения
Рис. 3 Аналоговый сигнал
Рис. 4 Сигнал АИМ1
Рис. 5. Сигнал АИМ2
2. Теорема Котельникова.
Довольно много споров ходит по поводу того, что именно отображает
теорема Котельникова (которая на Западе больше известна как Нейквиста). О
чем она говорит? предел качества звука, воспринимаемого человеческим
ухом, может быть достигнут, если частота дискретизации превышает
верхний предел слышимых частот в два раза. В зависимости от этого был
сформирован стандарт звучания CD - 16 бит, 44,1 КГц. И по своим
характеристикам он устраивает как музыкантов, так и пользователей. «CD
quality 44100 Hz». Имеется в виду, что на компакт-дисках звук хранится в
виде дискретных отсчетов, по 44100 штук на секунду. А это, согласно
озвученной теореме, означает что «на CD можно идеально записать звук с
частотой до 22050 Гц», что вполне себе хорошо, так как слышимый
человеком диапазон укладывается в эти рамки.
Возьмем кинопленку. Установлено, что при скорости передачи
изображений, равной 24 кадра в секунду, человеческий глаз не улавливает
перемену кадров, а смотрит на экран как на полноценное видеоизображение.
Дело в том, что 1/24 секунды - это скорость, с которой человек моргает
глазами!
Началось всё с немого кинематографа, где использовалась плёнка с 16
кадрами в секунду. При демонстрации отрывков из довоенных фильмов вы
наверняка замечали неестественно высокую скорость происходящего на
экране — это следствие соответствующей частоты кадров (фильмы, снятые
со скоростью 16 кадров в секунду, показывались на скорости 24 кадра в
секунду). Затем, при появлении звука в фильмах для размещения
аудиодорожки число кадров увеличили до 24 (иначе звук был слишком
искажен), это значение остаётся актуальным по сегодняшний день.
Впрочем, если уж быть точным, то в кинозалах показывают фильмы не
с 24, а 48 кадрами в секунду. Это связано с работой одной из деталей
проектора, обтюратора — механического устройства для периодического
перекрывания светового потока в момент движения кинопленки в кадровом
окне. То есть, грубо говоря, каждый второй кадр — просто «пустой», а
мелькание
практически
незаметно.
Но
даже при
одинаковой
информативности 24 и 48 кадров/с последний формат является куда более
комфортабельным для восприятия человеком. Благодаря «инертности»
восприятия визуальной информации нашими глазами, обтюратор нивелирует
«рывки» при переходе от одного кадра к другому.
Инерция зрения — особенность зрительного восприятия дискретных
последовательных событий, которые кажутся непрерывными. Так, например,
когда крутят горящий факел, глаз видит огненный круг вместо нескольких
положений одного и того же горящего факела.
Таким образом, персистенция — это способность глаза соединять
быстро сменяющиеся изображение в одно — неподвижное. Именно на этом
принципе устроен кинематограф, поскольку любое изображение (в кино или
на экране монитора) представляет собой множество быстро сменяющихся
изображений.
Тем не менее в кинематографе уже не одно десятилетие идут разговоры
о необходимости перехода с привычного стандарта 24 кадра в секунду. Но
этому мешал ряд проблем, связанных в основном с технологическими
сложностями. Однако в последние годы, когда фильмы стали всё чаще
снимать и показывать в залах при помощи цифрового оборудования, задача в
этом плане существенно упростилась.
Но есть ещё один аспект, касающийся кинематографичности
видеоряда. Например, при 60 кадрах/с наши глаза получают больше
информации, за счет чего меняется восприятие происходящего на экране.
Становится заметна искусственность декораций и визуальных эффектов,
создаётся впечатление, что вы присутствуете на театральной постановке или
прямо в студии, где снимают фильм. Это отрицательным образом влияет на
аутентичность кинокартины, зачастую сводя на нет некоторые режиссёрские
и операторские приёмы. Зато всё это нисколько не отменяет всех тех
положительных свойств, какими обладает видео с высокой частотой кадров.
Это и потрясающая плавность изображения, и естественность картинки —
прямо как в реальной жизни, что создаёт отличный эффект присутствия и
веры в происходящее. И наконец, большее число кадров нивелирует
мерцание (особенно заметное по краям экрана), снижая утомляемость глаз.
Джеймс Кэмерон, главный киноноватор на нашей планете,
заставивший весь мир полюбить 3D, всерьёз пообещал совершить ещё одну
революцию в индустрии. Его следующие проекты «Аватар-2» и «Аватар-3»
будут сняты в формате 60 кадров в секунду и наглядно продемонстрируют
человечеству все достоинства подобной технологии. Однако Питер Джексон
со своим «Хоббитом» собрался опередить режиссёра «Титаника» — уже в
конце этого года мы сможем посмотреть картину по роману Толкиена с 48
полноценными кадрами в секунду.
С телевидением все обстоит немного иначе. В мире распространены
три формата телевещания: NTSC, PAL и SECAM. Каждый имеет свои
частоты, свойства передачи видеоряда и встречается в строго определённых
регионах. NTSC является американским стандартом, в котором
предусмотрено 30 кадров/с. Технологически близкие PAL и SECAM
используются в других частях света и предусматривают 25 кадров/с.
Как и с обтюратором в кино, количество кадров в телевещании следует
умножать на два. Это связано с использованием чересстрочной развёртки
(интерлейс), когда один кадр разбивается на два полукадра, каждый из
которых состоит либо из чётных, либо из нечётных строчек. В результате
эфирное изображение кажется достаточно плавным, что неудивительно при
60 или 50 кадрах/с для NTSC и PAL/SECAM соответственно.
Если вы посмотрите один и тот же фильм на большом телевизоре с
DVD-диска и в телеэфире, то легко заметите принципиальную разницу в
изображении. При телевещании картинка будет более естественной и даже
чем-то похожей на театральную постановку. Обратный эксперимент:
попробуйте купить DVD-диск с футбольным или хоккейным матчем.
Спортсмены будут двигаться как-то более резко, а трансляция удивит
непривычной «рваностью», что особенно заметно при горизонтальном
перемещении камеры вдоль стадиона. В цифровых форматах вроде DVD или
Blu-Ray используются традиционные 24 кадра в секунду без обтюраторов
или чересстрочных кадров, поэтому на телевизорах с большой диагональю в
панорамных сценах легко заметить раздражающие подёргивания
изображения, в частности по краям экрана — из-за особенностей
периферийного зрения.
К сожалению, цифровые носители с 48, 60 или 100 кадрами в секунду в
наши дома пока не спешат. Даже Blu-Ray-издание «Хоббита» заявлено в
привычном стандарте 24 кадра/с, что, в общем-то, логично — видеоплееры
просто не умеют воспроизводить иные форматы. Зато насладиться красотами
высокой частоты кадров можно с помощью современных телевизоров,
поддерживающих технологию плавности изображения.
Но иногда добавление реалистичности и эффекта театральности через
системы плавности изображения превращает определённые фильмы в
смехотворные спектакли. Сразу видны плохо нарисованные задники,
прилепленные во время постпродакшена посредственные спецэффекты, а
также прочие радости. Хотите убедиться сами — включите последнюю
«Обитель зла» на продвинутой LED-панели, «Человека-паука» Сэма Рэйми
или какого-нибудь «Халка». Ну а про старые фильмы и говорить нечего —
при просмотре классических «Звёздных войн» вы воочию убедитесь, что все
космические корабли — это и в самом деле пластиковые макеты, снятые в
комнате с черными обоями.
Практически точно так же устроено и человеческое ухо. Представьте
себе, что у вас в максимально замедленном режиме звучит четыре удара по
бочке барабана. При ускорении темпа из этих четырех ударов в одно время
просто появится дробь, а при еще большем ускорении (о, чудо!) все четыре
удара сольются в один звук. Причем советую поэкспериментировать.
Сначала у вас начнется слитие звуков бочки по низким частотам, хотя
верхние еще останутся раздельными для каждого из четырех звуков. С
увеличением темпа начнут сливаться средние частоты и вскоре верхние.
Только когда сольются верхние частоты, вы станете воспринимать звук
четырех ударов как полноценный один.
Теперь давайте поставим вместо четырех ударов бочки барабана
обыкновенные дискретные значения, из которых состоят наши WAV-файлы.
Чем больше частота дискретизации, тем естественней воспринимается звук.
Представим, что порог слышимости человека - 20 КГц. То есть, один период
звукового колебания на данной частоте равен 1/20000 секунды. При частоте
дискретизации в 44,1 КГц электрический сигнал "захватывается" с частотой
44100 раз в секунду. То есть, звуковая волна с частотой 20 КГц
"захватывается" примерно 2,2 раза за период при частоте дискретизации
44100 Гц, при ней же волна в 10 КГц "захватывается" 4,4 раза, 1 КГц - 44,1
раз, 100 Гц - 441 раз.
Человеческое ухо по своей реакции имеет аналоговую природу. Здесь
его можно сравнить с простой электронной лампой. Помимо времени
восприятия основных значений данных, есть еще некоторое время атаки и
затухания, и электрический сигнал, имеющий какую-либо частоту просто
"сглаживается" в лампе, так как постоянные атаки и затухания не дают
какой-нибудь электрической характеристике принять нулевое значение.
Поэтому и люди так любят аналоговый звук лампы, так как она во многом
повторяет действия уха и близка к природным явлениям. С другой стороны, в
любом случае и то, и другое можно описать математическими формулами,
если у кого-нибудь хватит на это терпения. Но это будут формулы
математического усреднения между атакой, максимальным значением и
затуханием.
То есть, мы же слышим звук (или колебания воздуха) с помощью
особых рецепторов-волосков, каждый из которых отвечает за свою частоту.
На частоте 20 КГц мы слышим нечто среднее между атакой, основным
значением и затуханием. Если звук записан на частоте сэмплирования 22,05
КГц и в среднем на период выделяется 1,1 точка, то взятые значения могут
быть искажены, так как не всегда приходятся на максимальную амплитуду, в
результате чего возникает очень большая погрешность в значениях.
Для того, чтобы правильно описать рабочую электрическую
характеристику, энергетикам требуется, как минимум, 4 дискретных
значения на период. То есть, для частоты дискретизации в 22,1 КГц болееменее достоверно передается частота... 5525 Гц. Все, что выше, уже идет с
большими погрешностями по нарастающей. На частоте 11 КГц - это уже
примерно 2 точки на период и так далее.
На частоте дискретизации 22050 Гц можно с небольшими потерями
отписывать бас-гитару или большой барабан. Но гитару, у которой многие
составляющие тембра находятся в спектральном диапазоне вокруг 7 КГц, на
такой частоте качественно не запишешь.
Надеюсь, мы хорошо разобрались с тем, что собой представляет
частота дискретизации на самом деле.
Сглаживающие фильтры, которые присутствуют в воспроизводящей
технике, в воздухе, в наших ушах, позволяют услышать только результат
погрешностей, которые возникают из-за недостоверной информации,
передающейся на ЦАП. Чем больше частота дискретизации, тем
качественнее и естественнее мы будем ощущать звук.
Теорема Котельникова (теорема Найквиста) звучит:
Если аналоговый сигнал x(t) имеет ограниченный спектр, т.е. не
имеет составляющих выше максимальной частоты, то он может быть
восстановлен однозначно и без потерь по своим дискретным отсчётам,
взятым с частотой более, чем удвоенная максимальной частоты
спектра Fmax.
Другими словами: для дискретизации аналогового сигнала без
потери информации частота отсчетов должна быть в два раза выше
верхней граничной частоты спектра сигнала.
Download