MIDI: МУЗЫКА ДЛЯ ВАС

advertisement
MIDI: МУЗЫКА ДЛЯ ВАС
Электронные музыкальные инструменты в последнее время стремительно
развивались, и теперь они представляют собой сложные «интеллектуальные»
электронные устройства. Сегодня с помощью одного мультимедийного
компьютера можно создавать и воспроизводить музыкальные мелодии, для
которых раньше потребовался бы целый оркестр. Как же может компьютер
одновременно
воспроизводить
звучание
различных
музыкальных
инструментов, каждый из которых обладает собственным музыкальным
голосом? Ответ прост: с помощью MIDI (Musical Instrument Digital Interface —
цифровой интерфейс музыкальных инструментов). MIDI может управлять не
только музыкальными инструментами, но и различными электронными
устройствами: осветительной аппаратурой, пиротехническими устройствами
для создания фейерверков, видеооборудованием и другими средствами. С
помощью MIDI можно управлять любой аппаратурой, которая способна
воспринимать командный язык MIDI
Что такое MIDI?
MIDI представляет собой так называемый событийно-ориентированный
протокол связи между инструментами. Всякий раз, когда исполнитель
производит какое-либо воздействие на органы управления (нажатие
/отпускание клавиш, педалей, изменение положений регуляторов и т.п.),
инструмент формирует соответствующее MIDI-сообщение, в тот же момент
посылаемое по интерфейсу. Другие инструменты, получая сообщения,
отрабатывают их так же, как и при воздействии на их собственные органы
управления. Таким образом, поток MIDI-сообщений представляет собой как
бы слепок с действий исполнителя, сохраняя присущий ему стиль исполнения
- динамику, технические приемы и т.п. При записи на устройства хранения
информации MIDI-сообщения снабжаются временными метками, образуя
своеобразный способ представления партитуры. При воспроизведении по этим
меткам полностью и однозначно восстанавливается исходный MIDI-поток.
Спецификация MIDI состоит из аппаратной спецификации самого интерфейса
и спецификации формата данных - описания системы передаваемых
сообщений. Соответственно, различается аппаратный MIDI-интерфейс и
формат MIDI-данных (так называемая MIDI-партитура); интерфейс
используется для физического соединения источника и приемника сообщений,
формат данных - для создания, хранения и передачи MIDI-сообщений. В
настоящее время эти понятия стали самостоятельными и обычно используются
отдельно друг от друга - по MIDI-интерфейсу могут передаваться данные
любого другого формата, а MIDI-формат может использоваться только для
обработки партитур, без вывода на устройство синтеза.
Истории создания MIDI
MIDI разработан в 1982 году ведущими производителями электронных
музыкальных инструментов - Yamaha, Roland, Korg, E-mu и др. Изначально
был предназначен для замены принятого в то время управления музыкальными
инструментами при помощи аналоговых сигналов управлением при помощи
информационных сообщений, передаваемых по цифровому интерфейсу.
Первоначально производителями электронных музыкальных инструментов
был необходим метод, позволяющий осуществлять гармоничную работу
нескольких музыкальных синтезаторов, так как еще в 70-х годах музыканты
обнаружили, что более богатый и полный звук получается при одновременной
игре на нескольких клавишных (этот метод игры известен как наложение).
Для удовлетворения потребностей музыкантов производители оборудования начали разработку синтезаторов, которые могли бы связываться
между собой для получения эффекта наложения. Каждый разработчик
создавал свой собственный интерфейс, и их взаимная несовместимость
вызвала путаницу и неразбериху. Поэтому MIDI оказался своего рода
спасательным кругом, так как однозначно определил формат данных (был
введен стандарт на формат данных) и способ подключения MIDI-устройств
(была осуществлена стандартизация разъемов соединительных кабелей).
MIDI сегодня
Большинство электронных инструментов и мультимедийных программ
придерживаются стандарта MIDI. Вот три причины успеха MIDI в мультимедийных приложениях:
• Меньший размер музыкальных файлов. MIDI-файлы хранят команды,
задающие характеристики звука, а не цифровые коды самой звуковой волны.
Поэтому MIDI-файлы занимают значительно меньший объем памяти.
• Простота редактирования. Легче редактировать MIDI-команды, чем
график звуковой волны.
• Возможность фонового звучания. MIDI-устройство может исполнять
музыку одновременно с другой работой компьютера (демонстрацией картинок,
видео, мультипликации и др.). Такая фоновая музыка может непрерывно
звучать во время мультимедийной презентации.
Мультимедийные презентации с использованием MIDI легче создавать и
их звучание более профессионально. Эффективность программы также выше,
поскольку MIDI-файлы меньших размеров и требуют меньших ресурсов для
их обработки.
Что содержат MIDI-файлы
MIDI представляет собой гораздо больше, чем совокупность интерфейсных кабелей и портов ввода-вывода. В стандарт MIDI входит подробное
описание структур данных, которые дают возможность устройствам
обмениваться инструкциями и командами.
Подобно возможности кабельного телевидения обеспечивать прием нескольких программ с помощью одного телевизионного кабеля, подключенного
к телевизору, MIDI также обеспечивает несколько каналов на одном кабеле.
Стандарт MIDI предусматривает 16(32) каналов(а), которые нумеруются
с 1 по 16(32). Вы можете приписывать этим каналам различные устройства.
Таким образом, управление MIDI-устройством может осуществляться не
только через порты IN, OUT и THRU, но и через специально выделенный для
этого устройства канал. Данные об этом канале помещаются внутри MIDIфайла. Каждое MIDI-устройство последовательно считывает поступающие
данные и определяет, следует ли ему выполнять эту команду. Если не следует,
то устройство ее игнорирует, но дает возможность проходить к следующему
устройству через порт THRU.
В первое время распределение инструментов по каналам не было
внесено в стандарт и каждый, естественно, распределял каналы и MIDIустройства по-своему, что привело к проблемам, связанным не только с
различным распределением каналов, но и с другими параметрами
конфигурирования MIDI, определяемыми пользователем. Для устранения
возникающих конфликтов была создана спецификация General MIDI.
Стандарты MIDI: GM, GS, XG, GM2
Обычно рассматривается лишь один из существующих стандартов General MIDI (GM), в то время как уже довольно давно существуют два
расширения этой спецификации: GS, предложенный фирмой Roland, и XG от
фирмы Yamaha. Кроме того, начинает продвигаться новый общий стандарт
GM2, предложенный в 1999 году MMA (MIDI Manufacturers Association).
General MIDI (GM)
Первый общий стандарт был предложен в 1991 году ассоциацией
производителей MIDI-оборудования. Он объединил изделия разношерстных
производителей под именем General MIDI (System) Level 1. Сейчас его
поддерживает абсолютное большинство моделей электронных синтезаторов,
звуковых карт и клавиатур. Так как требования этого стандарта уже давно
морально устарели, то, обычно, современные электронные инструменты
поддерживают его лишь для базовой совместимости.GM-файлы звучат на
различных моделях существенно по разному. Дело в том, что определяя
количество и состав мелодических инструментов не были точно описаны
тембровые характеристики GM-инструментов.
Особенностью GM является то, что команда MIDI содержит в себе
больше информации, чем просто указание на воспроизведение определенной
ноты. Устройству еще нужно указать, как нота должна быть сыграна. Поэтому
в команду включается следующая информация:
• Delay. Задержка — время, которое должно пройти прежде, чем нота
будет сыграна.
• Attack. Нарастание — как увеличивать звук до полной громкости.
• Hold. Длительность — как долго удерживать громкость звучания.
• Decey. Спад — насколько уменьшить громкость звучания.
• Sustain. Регулирование скорости затухания звука.
• Release. Как остановить звук.
Команды MIDI включают не только команды управления музыкальными
звуками. Существуют также специальные команды system exclusive (sys-ex),
которые предназначены для настройки и конфигурирования звуковых
устройств. Эти команды используются в основном разработчиками
программного и аппаратного обеспечения. Простым примером использования
sys-ex команды является команда bulk dumps (пересылка массива данных в
память). Вы можете сделать настройку клавиш синтезатора и сохранить эту
конфигурацию в памяти компьютера. Всякий раз, когда вам потребуется эта
настройка, вы можете пересылать ее из компьютера к клавишным.
GS и XG
Два похожих друг на друга стандарта предложили фирмы Roland и
Yamaha. GS начал развиваться в 1991 году сразу за GM и в последующем
неоднократно расширялся в связи с выпуском новых моделей. XG от Ямахи
начал активно продвигаться в 1996 году, и при его разработке, видимо, были
учтены наработки Роланда.
General MIDI 2 (GM2)
В 1999 году MMA наконец выпустила расширение GM, получившее
наименование General MIDI Level 2 (GM2). В новом стандарте расширили
полифонию и палитру доступных инструментов до 256, добавили ряд новых
контроллеров. В GM2 прослеживается влияние стандартов Роланда и Ямахи.
Несмотря на соглашение между этими фирмами General MIDI Level 2 пока не
получил широкого распространения. В таблице 1 сведены глобальные
характеристики указанных стандартов:
Таблица 1
Для GS и XG возможны различные значения параметров в зависимости
от конкретной реализации MIDI-устройства, например, количество доступных
каналов может достигать 32, количество инструментов у старших моделей свыше тысячи.
Программное обеспечение MIDI
Обычно программное обеспечение MIDI приобретается отдельно от
аппаратных средств. Оно обеспечивает дополнительные возможности для
работы с MIDI-устройствами. С помощью, так называемых, секвенсорных
программ вы можете сочинять музыку. Наиболее подходящей аналогией при
описании секвенсорной программы MIDI является редактор текстов. Для
MIDI секвенсор является тем же, чем для текстов — текстовый процессор.
Секвенсор позволяет записывать, редактировать, проигрывать и
комбинировать записи точно так, как это позволяет делать текстовый
редактор с текстом. Вы даже можете выполнять такие стандартные
действия, как удаление, копирование и вставка.
На сегодняшний день музыкальный редактор CAKEWALK AUDIO
для Windows фирмы Twelve Tone Systems является одним из самых мощных
программных секвенсоров для создания MIDI музыки, а также MIDI с
использованием звуковых семплов. Также распространена такая
секвенсорная программа, как Power Chords Pro от Howling Dog Systems, а в
среде нотных редакторов - Musicator, Cubase Score, Personal Composer,
Encore, Finale и другие. Как правило, функции распечатки партитур и
нотной записи есть в любой программе-секвенсоре, однако, они не обладают
достаточной гибкостью и универсальностью, ограничены в числе
возможностей. Такое положение дел заставляет пользователей искать
программы, специально предназначенные для нотной записи и
редактирования записанного материала, называемые нотными редакторами.
Иногда необходимо нечто большее, чем секвенсор. Вам может понадобиться программа, позволяющая создавать новый голос (инструмент)
MIDI. В этом вам поможет редактор WAV-файлов. Из наиболее популярных
можно упомянуть Wave SE фирмы Turtle Beach Systems, Wavetable от Turtle
Beach Systems.
Аппаратные средства MIDI
MIDI-устройства можно разделить на пассивные (исполнители) и активные (управляющие). Пассивное устройство настраивается только на прием
управляющих команд по специально выделенному для него каналу. Сигнал
(через порт IN или THRU) поступает в устройство, и если устройство определяет в сигнале номер своего канала, то команда адресована ему и будет
выполнена. Если вы назначили. Исполняющему устройству канал 3, а посылаете команду по каналу 4, то устройство проигнорирует эту команду.
Пошлите эту же команду по каналу 3, и команда будет выполнена. Уп-
равляющее устройство выдает команды для исполняющего устройства через
порты OUT и THRU. Существуют разветвленные цепочки (daisy-chained)
MIDI-устройств, соединенных через порты THRU. В таких цепях существует
строгая иерархия: пассивные устройства реагируют только на инструкции
своих «управляющих», а активные устройства управляют только закрепленными за ними «подчиненными» устройствами.
Мультимедийный компьютер может быть простым и относительно дешевым, а может быть сложным и достаточно дорогим. Система MIDI также
может состоять из обычной звуковой платы в компьютере, способной проигрывать MIDI-файлы, или из целого комплекса тщательно подобранных
устройств: синтезаторов, колонок, микшерского пульта, клавишных, преобразователя частот и множества программного обеспечения.
В зависимости от потребностей вам необходимо иметь хотя бы одно из
трех перечисленных ниже устройств:
• Звуковую плату
• Клавишный синтезатор
• Звуковой модуль
MIDI-синтезаторы
Качество звука MIDI полностью зависит от качества синтезатора
акустической системы. Существует два основных типа синтезаторов:
• на основе частотной модуляции (FM);
• на основе таблицы волн (Wavetable или сокращенно WT), т.е. таблицы
образцов звуков.
FM-синтезаторы только имитируют звуки музыкальных инструментов, в
то время как WT синтезаторы хранят выборки (образцы) сигналов настоящих
музыкальных инструментов.
FM-синтезаторы.
Используются с 1970 года. Они разработаны Джоном Чоунингом (John
Chowning) из Стенфордского университета. Фирма Yamaha имеет
исключительные права на эту лицензию и производит микросхемы
синтезаторов с использованием этой технологии. FM (Frequency Modulation частотная модуляция) - синтез при помощи нескольких генераторов сигнала
(обычно синусоидального) со взаимной модуляцией. Каждый генератор
снабжается схемой управления частотой и амплитудой сигнала и образует
"оператор" - базовую единицу синтеза.
Чаще всего в звуковых картах применяется 2-операторный (OPL2)
синтез и иногда - 4-операторный (OPL3). Схема соединения операторов
(алгоритм) и параметры каждого оператора (частота, амплитуда и закон их
изменения во времени) определяет тембр звучания; количество операторов и
степень тонкости управления ими определяет предельное количество
синтезируемых тембров.
Достоинства метода - отсутствие заранее записанных звуков и памяти
для них, большое разнообразие получаемых звучаний, повторяемость тембров
на различных картах с совместимыми синтезаторами. Недостатки - очень
малое количество "благозвучных" тембров во всем возможном диапазоне
звучаний, отсутствие какого-либо алгоритма для их поиска, крайне
грубая имитация звучания реальных инструментов, сложность реализации
тонкого управления операторами, из-за чего в звуковых картах
используется сильно упрощенная схема со значительно меньшим диапазоном
возможных звучаний.
WM-синтезаторы.
Эти синтезаторы используют оцифрованные образцы звучания
настоящих инструментов. WT (WaveTable - таблица волн) - воспроизведение
заранее записанных в цифровом виде звучаний (образцов (оригиналов)
звуковых волн различных музыкальных инструментов) - самплов (samples).
Оригиналы этих звуков (таблица волн) либо хранятся в ROM синтезатора,
либо программно загружаются в RAM звуковой платы. Инструменты с малой
длительностью звучания обычно записываются полностью, а для остальных
может записываться лишь начало/конец звука и небольшая "средняя" часть,
которая затем проигрывается в цикле в течение нужного времени.
Для изменения высоты звука оцифровка проигрывается с разной
скоростью, а чтобы при этом сильно не изменялся характер звучания –
инструменты составляются из нескольких фрагментов для разных диапазонов
нот. В сложных синтезаторах используется параллельное проигрывание
нескольких самплов на одну ноту и дополнительная обработка звука
(модуляция, фильтрование, различные "оживляющие" эффекты и т.п.).
Большинство плат содержит встроенный набор инструментов в ПЗУ,
некоторые платы позволяют дополнительно загружать собственные
инструменты в ОЗУ платы, а платы семейства GUS (кроме GUS PnP) содержат
только ОЗУ и набор стандартных инструментов на диске. Некоторые модели
PCI-плат позволяют использовать для загрузки инструментов общее ОЗУ
компьютера (UMA - Unified Memory Architecture, унифицированная
архитектура памяти).
Достоинства метода - предельная реалистичность звучания классических
инструментов и простота получения звука. Недостатки - наличие жесткого
набора заранее подготовленных тембров, многие параметры которых нельзя
изменять в реальном времени, большие объемы памяти для самплов (иногда до мегабайт на инструмент), различия в звучаниях разных синтезаторов из-за
разных наборов стандартных инструментов.
Надо заметить, что в большинстве музыкальных плат, для которых
заявлен метод синтеза WT, в том числе - наиболее популярных семейств GUS
и AWE32, на самом деле реализован более старый и простой "самплерный"
метод, поскольку звук в них формируется из непрерывных во времени
самплов, отчего атака и затухание звука звучат всегда с одинаковой
длительностью, и только средняя часть может быть произвольной
длительности. В "настоящем" WT звук формируется как из параллельных, так
и из последовательных участков, что дает значительно большее разнообразие,
а главное - выразительность звуков.
При использовании в музыке звучаний реальных инструментов для
синтеза лучше всего подходит метод WT; для создания же новых тембров
более удобен FM, хотя возможности FM-синтезаторов звуковых карт сильно
ограничены из-за своей простоты.
MIDI-клавиатура (keyboard controller)
Другим устройством, работу которого тоже следует рассмотреть, является MIDI-клавиатура (keyboard controller) (Рис.1). Она не имеет встроенного
синтезатора, а лишь генерирует MIDI-команды. Образно говоря - устройство
MIDI-ввода. Звуковому модулю или звуковой плате требуется только
правильно интерпретировать MIDI-команды, набираемые на MIDI-клавиатуре.
Содержит собственно клавиатуру (4-6 октав), схему преобразования
воздействий в MIDI-сообщения и адаптер с выходом MIDI Out. Некоторым
пользователям нравится то, что есть возможность купить качественную
профессиональную MIDI-клавиатуру отдельно от звукового модуля. В этом
случае для улучшения качества звучания вам потребуется только купить
другой звуковой модуль. И не нужно осваивать работу с новой клавиатурой.
Надо заметим, что обычно качество MIDI-клавиатуры довольно высокое и
игра на ней практически ничем не отличается от игры на пианино.
Рисунок 1
Дочерняя MIDI-плата (Wavetable Connector)
Дополнительный MIDI-синтезатор, подключаемый к специальному 26контактному разъему на основной карте, который обычно называется
Wavetable Connector (название происходит от того, что большинство дочерних
плат использует метод синтеза WT и предназначены для расширения простых
карт с методом FM) или Daughterboard Connector. Еще одно название разъема Waveblaster Connector (разъем был введен в модели Creative SB 16 и
предназначался для подключения платы Creative Waveblaster).
Интерфейс для дочерней платы состоит из цепей питания, MIDI-выхода
(иногда - и MIDI-входа), и стереофонического аналогового входа для
звукового сигнала с платы. Плата получает MIDI-сообщения, посылаемые
основной картой, на их основе синтезирует звук и передает его по звуковым
цепям в микшер основной карты.
Конструктивно дочерние платы выполняются таким образом, чтобы их
можно было непосредственно надеть на разъем основной карты, закрепив
специальными штифтами, для которых в большинстве карт предусмотрены
отверстия. Однако существуют карты, разъемы для дочерних плат на которых
рассчитаны только на миниатюрные платы и расположены нестандартно, что
не позволяет надеть на них плату стандартного формата (140 x 90 мм).
Поскольку дочерняя карта представляет собой самостоятельный
синтезатор, аналогичный по принципу работы музыкальным тонгенераторам,
эффект от подключения платы полностью аналогичен эффекту от
подключения внешнего синтезатора или тонгенератора к разъему
MIDI/Joystick.
Никакого дополнительного программного обеспечения для работы с
дочерней платой не требуется - предназначенные ей MIDI-сообщения просто
посылаются на внешний MIDI-порт основной карты (на картах с раздельными
MIDI-портами для этого нужно выбрать внутренний). Однако любая дочерняя
плата, как и любой синтезатор, может иметь свои особенности в настройке,
поэтому для удобства работы с такими платами могут существовать
специальные драйверы и управляющие программы.
Поскольку большинство дочерних плат работают только на прием MIDIсообщений, для них не существует возможности программно определить
наличие платы на разъеме. Это означает, что после подключения карты
никакие системные установки или списки ресурсов не могут измениться сами
собой - необходима ручная перенастройка системы.
Так как подключение дочерней платы фактически добавляет в систему
еще один независимый синтезатор, при этом расширяется набор встроенных
инструментов, увеличивается количество одновременно звучащих нот,
становятся доступными новые возможности и т.п. Появляется возможность
использовать более одного синтезатора при проигрывании MIDI-файлов - для
этого нужно поменять раскладку инструментов по каналам (например, в
Windows это делается при помощи закладки MIDI в Control Panel ->
Multimedia).
К сожалению, практически не имеет смысла подключать качественные
дочерние платы к простым основным картам, поскольку у них чаще всего
низкокачественные аналоговые цепи, и хороший звук с дочерней платы будет
безнадежно испорчен.
Имеется большое разнообразие MIDI-инструментов: имитирующие гитару, духовые, клавишные, пианино, барабаны и т.д. На выставке
музыкального оборудование NAMM фирмой WaveAccess был представлен
революционный продукт - WaveRider. Он подсоединяется к вашему телу,
снимает данные мышечной, сердечной, кожной активности и биотоки мозга, и
переводит их в MIDI данные (например, ритм сердца - в темп песни).
Если вы играете на каком-либо из этих инструментов, у вас может
появиться желание приобрести его MIDI эквивалент. Некоторые инструменты,
например гитары, можно модернизировать для работы с MIDI. Чтобы
прослушать сочиненную музыку, вам даже не понадобится играть на самом
инструменте. Вашими инструментами станут клавиатура и мышь компьютера.
Установка аппаратных средств MIDI
Установка аппаратных средств MIDI состоит, главным образом, в соединении MIDI-устройств между собой. Исключением можно считать установку звуковой платы.
Общие рекомендации:
Существуют различные сценарии, которых вы можете придерживаться
при создании MIDI-системы. В каждом из них есть свои плюсы и минусы.
Приведем несколько общих замечаний:
• Определите «активные» и «пассивные» MIDI-устройства, Важным
моментом является точное знание того, какое устройство работает как
управляющее (посылает команды), а какое — как исполняющее (выполняет
команды). От этого зависит их конфигурация.
• Имейте под рукой подробную документацию. Так как здесь имеется
масса вариантов системных установок, то необходимо иметь понятную и
подробную документацию на подключаемые устройства. В документации
могут быть описаны параметры установки секвенсорного программного
обеспечения, аппаратные установки, используемые драйверы и другие
настройки.
Соединение MIDI-устройств
Знание правил соединения и принципов взаимодействия MIDI-устройств
является особенно важным. Существует три вида портов, через которые
соединяются MIDI-устройства: In (вход), Out (выход) и Thru (копия сигнала с
In через буфер). Контакты 4 и 5 - сигнальные, контакт 2 - экран. Полярность
сигналов дается относительно источника тока: контакт 4 - плюс (ток вытекает
из вывода), контакт 5 - минус (ток втекает в вывод) (рис.2). Таким образом, для
разъемов Out и Thru назначение то же, для разъема In - обратное. Для
соединения используется двужильный экранированный кабель длиной до 50
футов (около 15 м). Экран необходим только для защиты от излучаемых помех
- кабель практически нечувствителен к наводкам извне. Соединение разъемов
на двух концах кабеля - прямое (2-2, 4-4, 5-5).
Рисунок 2
Один MIDI-передатчик допускает подключение до четырех приемников.
Описанная схема позволяет создавать сеть MIDI-устройств, подключая
их по цепочке и нескольким направлениям:
Рисунок 3
В этой схеме устройство 1 служит источником сообщений, которые
получает устройство 2 и через его ретранслятор - устройство 3. Устройство 4
получает сообщения, посылаемые устройством 2 (они могут как включать, так
и не включать получаемые самим устройством 2) и ретранслирует их на вход
устройства 5.
Надо отметить, что интерфейс MIDI - старт-стопный последовательный
"токовая петля" (активный передатчик, 5 мА, токовая посылка - 0, бестоковая 1), скоростью передачи 31250 +/- 1% бит/с и протоколом 8-N-1 (один
стартовый бит, 8 битов данных, один бит стопа, без четности).
В целом, в зависимости от соединения и конфигурации каждое из
устройств может выполнять функцию управляющего, исполняющего или того
и другого устройства одновременно.
Критерии, которыми следует руководствоваться при
покупке MIDI
Правильно подобранное оборудование может превратить ваш компьютер в домашнюю записывающую студию. С помощью звуковой платы,
синтезатора, стереосистемы и подходящего программного обеспечения
увлеченный человек может слушать музыку, а также пробовать создавать ее. С
другой стороны, профессиональные музыканты могут записывать,
редактировать, аранжировать, распечатывать и исполнять свои произведения.
Какое количество аппаратных средств вам необходимо, зависит от ваших
требований. Самое минимальное, что нужно для создания качественной
музыки, это звуковой редактор, поддерживающий стандартный формат MIDIфайла, и программа-секвенсор, позволяющая воспроизводить содержимое этих
файлов. Секвенсоры могут также обрабатывать «живую» музыку, записанную
с помощью специальных программ в формате WAV и MP3-файлов.
Можно перечислить несколько основных характеристик MIDI –
устройств:

Полифония
При покупке синтезатора обратите внимание, сколько нот на нем можно
исполнять одновременно. Это называется полифония. Максимально
возможное количество нот полифонии — 64, но наиболее распространены
синтезаторы, которые могут одновременно воспроизводить 24 или 32 ноты.

Multitimbrality (многотембровость)
Обращайте также внимание, сколько устройств вы сможете задействовать, т.е. по скольким каналам могут одновременно передаваться команды
MIDI. Это называется multitimbrality.
Чем больше это число, тем лучше, так как не случится «кражи ноты»,
когда вы воспроизводите созданную вами музыку.
Потеря ноты зависит от того, как поступает синтезатор, если число
используемых каналов превысило критический рубеж. Способ, который
использует большинство синтезаторов, заключается в том, что первая нота
аккорда просто не играется. Некоторые синтезаторы поступают более
интеллектуально, выбирая какой из нот можно пожертвовать, так что
отсутствие «украденной» ноты ощущается не так сильно.

Качество звучания
Кроме количества проигрываемых нот вам следует учесть качество их
воспроизведения, которое сильно зависит от производителя синтезатора и его
модели. Не забывайте также о том, что качество звучания — понятие
субъективное. Некоторые производители стремятся придать своим моделям
синтезаторов некоторую «индивидуальность». Например, считается, что
клавишные синтезаторы фирмы Korg имеют «пониженный» или «хриплый»
звук, в то время как продукцию Roland считают «повышенной» или «ясной».
Перед покупкой синтезатора обязательно «прослушайте» его.

Число клавиш
При покупке клавишного MIDI-устройства (автономный клавишный
синтезатор, MIDI-клавиатура) обращайте внимание на то, сколько оно имеет
клавиш. Некоторые клавишные имеют 49 клавиш, в то время как у других их
число составляет 51, 61, 76 или 88. Музыканты предпочитают устройства с 76
клавишами или, в крайнем случае, с 61 клавишей.
Число клавиш, которое вам необходимо, зависит от характера вашей
работы на клавишном MIDI-устройстве. Если вы собираетесь вводить только
основные ноты, то вам достаточно 49 клавиш. Стиль музыки, которую вы
планируете исполнять, тоже влияет на это. Для популярной музыки, где можно
ограничиться исполнением аккордов одной рукой, подойдет 61-клавишный
синтезатор. А любому, кто пользовался синтезатором с 76 клавишами, вряд ли
будет недоставать 88-клавишной клавиатуры.

Размер клавиш
Существуют полноразмерные (full-size) или уменьшенные клавиши.
Предпочтения в этой области у каждого человека индивидуальны.

Механические характеристики
К данным характеристикам относятся такие свойства, как упругость
клавиш, реакция на воздействие, конструкция привода. Различаются простая
пружинная конструкция, "взвешенные" (weighted) клавиши с грузиками
различной массы на ближнем и дальнем концах, и клавиши с молоточковой
системой (hammer action), наиболее близкие по ощущению к фортепианным.

Наличие основных и дополнительных органов управления и
индикации
У различных моделей MIDI-устройств присутствуют различные
комбинации органов управления (основных и дополнительных) и индикации:
колес (wheels) глубины модуляции (modulation) и смещения по высоте (pitch
bend), педали удержания нот (sustain); движка ввода данных (data entry);
индикатора режимов работы, средств передачи дополнительных MIDI-команд,
октавной перестройки (transpose), дополнительных педалей и т.п.

Специальные эффекты
Синтезаторы могут создавать звуковые эффекты, главными из которых
являются реверберация звука, хорус и задержка. Некоторые синтезаторы также
могут осуществлять растяжение или изменение типов фаз. Однако эти
эффекты влияют сразу на все каналы, а не какой-то отдельный.

Несколько аудио выходов
Вам следует поискать MIDI-устройство, которое имеет несколько аудио
выходов. Только тогда вы сможете передавать на них партии определенных
музыкальных инструментов, например, струнных или басовых. Затем можно
пропустить их, скажем, через микшер или ревербератор для получения
желательного музыкального эффекта.
«СКАНИРОВАНИЕ»
Введение.
Сканером называется устройство, позволяющее вводить в компьютер
образы изображений, представленных в виде текста, рисунков, слайдов,
фотографий или другой графической информации. Кстати, несмотря на обилие
различных моделей сканеров, в первом приближении их классификацию
можно провести всего по нескольким признакам (или критериям). Во-первых,
по степени прозрачности вводимого оригинала изображения, во-вторых, по
кинематическому механизму сканера (конструкции; механизма движения), втретьих, по типу вводимого изображения, в-четвертых, по особенностям
программного и аппаратного обеспечения сканера.
Оригиналы изображений.
Вообще говоря, изображения (или оригиналы) можно условно разделить
на две большие группы. К первой из них относятся называемые непрозрачные
оригиналы: всевозможные фотографии, рисунки, страницы журналов и
буклетов. Если вспомнить курс школьной физики, то известно, что
изображения с подобных оригиналов мы видим в отраженном свете. Другое
дело прозрачные оригиналы — цветные и черно-белые слайды и негативы; в
этом случае глаз (как оптическая система) обрабатывает свет, прошедший
через оригинал. Таким образом, прежде всего, следует обратить внимание на
то, с какими типами оригиналов сканер может работать. В частности, для
работы со слайдами существуют специальные приставки.
Механизм движения.
Определяющим фактором для данного параметра является способ
перемещения считывающей головки сканера и бумаги относительно друг
друга. В настоящее время все известные сканеры о этому критерию можно
разбить на два основных типа: ручной (hand-held) и настольный (desktop). Тем
не менее, существуют также комбинированные устройства, которые сочетают
в себе возможности настольных и ручных сканеров. В качестве примера
можно привести модель Niscan Page американской фирмы Nisca.
Ручные сканеры.
Ручной сканер, как правило, чем-то напоминает увеличению в размерах
электробритву. Для того чтобы ввести в компьютер какой-либо документ при
помощи этого устройства, надо без резких движений провести сканирующей
головкой по соответствующему изображению. Таким образом, проблема
перемещения считывающей головки относительно бумаги целиком ложится на
пользователя. Кстати, равномерность перемещения сканера существенно
сказывается на качестве вводимого в компьютер изображения. В ряде моделей
для подтверждения нормального ввода имеется специальный индикатор.
Ширина вводимого изображения для ручных сканеров не превышает обычно 4
дюймов (10 см). В некоторых моделях ручных сканеров в году повышения
разрешающей способности уменьшают ширину вводимого изображения.
Современные ручные сканеры могут обеспечивать автоматическую "склейку"
вводимого изображения, то есть формируют целое изображение из отдельно
водимых его частей. Это, в частности, связано с тем, что при помощи ручного
сканера невозможно ввести изображения даже формата А4 за один проход. К
основным достоинствам такого дна сканеров относятся небольшие габаритные
размеры и сравнительно низкая цена.
Настольные сканеры.
Настольные сканеры называют и страничными, и. планшетными, и даже
авто сканерами. Такие сканеры позволяют вводить изображения размерами 8,5
на 11 или 8,5 на 14 дюймов. Существуют три разновидности настольных
сканеров: планшетные (flatbed), рулонные (sheet-fed) и проекционные
(overhead).
Основным отличием планшетных сканеров является то, что сканирующая
головка перемещается относительно бумаги с помощью шагового двигателя.
Планшетные сканеры — обычно , достаточно дорогие устройства, но,
пожалуй, и наиболее "способные". Внешне они чем-то могут напоминать
копировальные машины — "ксероксы", внешний вид которых известен,
конечно, многим. Для сканирования изображения (чего-нибудь) необходимо
открыть крышку сканера, подключить сканируемый лист на стеклянную
пластину изображением вниз, после чего закрыть крышку. Все дальнейшее
управление процессом сканирования осуществляется с клавиатуры
компьютера — при работе с одной из специальных программ, поставляемых
вместе с таким сканером. Понятно, что рассмотренная конструкция изделия
позволяет (подобно "ксероксу") сканировать не только отдельные листы, но и
страницы журнала или книги. Наиболее популярными сканерами этого типа на
российском рынке являются модели фирмы Hewlett Packard.
Работа рулонных сканеров чем-то напоминает работу обыкновенной
факс-машины. Отдельные листы документов протягиваются через такое
устройство, при этом и осуществляется их сканирование. Таким образом, в
данном случае сканирующая головка остается на месте, а уже относительно
нее перемещается бумага. Понятно, что в этом случае копирование страниц
книг и журналов просто невозможно. Рассматриваемые сканеры достаточно
широко используются в областях, связанных с оптическим распознаванием
символов ОСR (Optiсаl Character Recognition). Для удобства работы рулонные
сканеры обычно оснащаются устройствами для автоматической подачи
страниц.
Третья разновидность настольных сканеров — проекционные сканеры,
которые больше всего напоминают своеобразный проекционный аппарат (или
фотоувеличитель). Вводимый документ кладется на поверхность сканирования
изображением вверх, блок сканирования находится при этом также сверху.
Перемещается только сканирующее устройство. Основной особенностью
данных сканеров является возможность сканирования проекций трехмерных
проекций.
Упоминаемый выше комбинированный сканер Niscan Page обеспечивает
работу в двух режимах: протягивания листов (сканирование оригиналов
форматом от визитной карточки до21,6 см) и самодвижущегося сканера. Для
реализации последнего режима сканера необходимо снять нижнюю крышку.
При этом валики, которые обычно протягивают бумагу, служат своеобразными
кодами, на которых сканер и движется по сканируемой поверхности. Хотя
понятно, что ширина вводимого сканером изображения в обоих режимах не
изменяется (чуть больше формата А4), однако в самодвижущемся режиме
можно сканировать изображение с листа бумаги, превышающего этот формат,
или вводить формацию со страниц книги.
Типы вводимого изображения.
По данному критерию все существующие сканеры можно подразделить
на черно-белые и цветные. Черно-белые сканеры в свою очередь могут
подразделяться на штриховые и полутоновые («серые»). Однако, как мы
увидим в дальнейшем, полутона изображения могут также эмулироваться.
Итак, первые модели черно-белых сканеров могли работать только в
двухуровневом (bilevel) режиме, воспринимая или черный, или белый цвет.
Таким образом, сканироваться могли либо штриховые рисунки (например,
чертежи), либо двух тоновые изображения. Хотя эти сканеры и не могли
работать с действительными оттенками серого цвета, выход для сканирования
полутоновых изображений такими сканерами был найден. Псевдополутоновой
режим, или режим растрирования (dithering), сканера имитирует оттенки
серого цвета, группируя, несколько точек вводимого изображения в так
называемые gray-scale-пиксели. Такие пиксели могут иметь размеры 2х2 (4
точки), 3х3 (9 точек) или 4х4 (16 точек) и т.д. Отношение количества черных
точек к белым и выделяет уровень серого цвета. Например, gray-scale-пиксель
размером 4х4 позволяет воспроизводить 17 уровней серого цвета (включая и
полностью белый цвет). Не следует, правда, забывать, что разрешающая
способность сканера при использовании gray-scale-пикселя снижается (в
последнем случае в 4 раза).
Полутоновые сканеры используют максимальную разрешающую
способность, как правило, только в двухуровневом режиме. Обычно они
поддерживают 16, 64 или 256 оттенков серого цвета для 4-, 6- и 8-разрядного
кода, который ставится при этом в соответствие каждой точке изображения.
Разрешающая способность сканера измеряется в количестве различаемых
точек на дюйм изображения — dpi (dot per inch). Если в первых моделях
сканеров разрешающая способность была 200—300 dpi, то в современных
моделях это, как правило, 400, а то и 800 dpi. Некоторые сканеры
обеспечивают аппаратное разрешение 600х1200 dpi. В ряде случаев
разрешение сканера может устанавливаться программным путем в процессе
работы из ряда значений: 75, 1 150, 200, 300 и 400 dpi.
Надо сказать, что благодаря операции интерполяции, выполняемой, как
правило, программно, современные сканеры могут иметь разрешение 800 и
даже 1600 dpi. В результате интерполяции на получаемом при сканировании
изображении сглаживаются кривые линии и исчезают неровности
диагональных линий. Напомним, что интерполяция позволяет отыскивать
значения промежуточных величин по уже известным значениям. Например, в
результате сканирования один из пикселов имеет значение уровня серого цвета
48, а соседний с ним — 76. Использование простейшей линейной
интерполяции позволяет сделать предположение о том, что значение уровня
серого цвета для промежуточного пикселя могло бы быть равно 62. Если
вставить все оценочные значения пикселов в файл отсканированного
изображения, то разрешающая способность сканера как бы удвоится, то есть
вместо обычных 400 dpi станет равной 800 dpi.
Черно-белые сканеры.
Попробуем объяснить принцип работы черно-белого сканера.
Сканируемое изображение освещается белым светом, получаемым, как
правило, от флуоресцентной лампы. Отраженный свет через редуцирующую
(уменьшающую) линзу попадает на фоточувствительный полупроводниковый
элемент, называемый прибором с зарядовой связью ПЗС (Change- Coupled
Device, CCD), в основу которого положена чувствительность проводимости pn-перехода обыкновенного полупроводникового диода к степени его
освещенности. На p-n-переходе создается заряд, который рассасывается со
скоростью, зависящей от освещенности. Чем выше скорость рассасывания, тем
больший ток проходит через диод.
Рис.1. Блок схема черно-белого сканера.
Каждая строка сканирования изображения соответствует определенным
значениям напряжения на ПЗС. Эти значения напряжения преобразуются в
цифровую форму либо через аналого-цифровой преобразователь АЦП (для
полутоновых сканеров), либо через компаратор (для двухуровневых сканеров).
Компаратор сравнивает два значения (напряжение или ток) от ПЗС и опорное
(рис. 1), причем в зависимости от результата сравнения на его выходе
формируется сигнал 0 (черный цвет) или 1 (белый). Разрядность АЦП для
полутоновых сканеров зависит от количества поддерживаемых уровней серого
цвета. Например, сканер, поддерживающий 64 уровня серого, должен иметь 6разрядный АЦП. Каким образом сканируется каждая следующая строка
изображения, целиком зависит от типа используемого сканера. Напомним, что
у планшетных сканеров движется сканирующая головка, а в рулонных
сканерах она остается неподвижной, потому что движется носитель с
изображением — бумага.
Цветные сканеры.
В настоящее время существует несколько технологий для получения
цветных сканируемых изображений. Один из наиболее общих принципов
работы цветного сканера заключается в следующем. Сканируемое
изображение освещается уже не белым цветом, а через вращающийся RGBсветофильтр (рис. 2). Для каждого из основных цветов (красного, зеленого и
синего) последовательность операций практически не отличается от
последовательности действий при сканировании черно-белого изображения.
Исключение составляет, пожалуй, только этап предварительной обработки и
гамма-коррекции цветов, перед тем как информация передается в компьютер.
Понятно, что этот этап является общим для всех цветных сканеров.
В результате трех проходов сканирования получается файл, содержащий
образ изображения в трех основных цветах — RGB (образ композитного
сигнала). Если используется восьмиразрядный АЦП, который поддерживает
256 оттенков для одного цвета, то каждой точке изображения ставится в
соответствие один из 16,7 миллиона возможных цветов (24 разряда). Сканеры,
использующие подобный принцип действия, выпускаются, например, фирмой
Microtek.
Рис.2. Блок-схема цветного сканера с вращающимся RGB-фильтром.
Надо отметить, что наиболее существенным недостатком описанного
выше метода является увеличение времени сканирования в три раза. Проблему
может представлять также «выравнивание» пикселов при каждом из трех
проходов, так как в противном случае возможно размывание оттенков и
«смазывание» цветов.
В сканерах известных японских фирм Epson и Sharp, как правило, вместо
одного источника света используется три, для каждого цвета отдельно. Это
позволяет сканировать изображение всего за один проход и исключает
неверное «выравнивание» пикселов. Сложности этого метода заключаются
обычно в подборе источников света со стабильными характеристиками.
Другая японская фирма — Seiko Instruments — разработала Цветной
планшетный сканер SpectraPoint, в котором элементы ПЗС были заменены
фототранзисторами.
На
ширине
8,5
дюйма
размещено
10200
фототранзисторов, расположенных в три колонки по 3400 в каждой. Три
цветных фильтра (RGB) устроены так, что каждая колонка фототранзисторов
воспринимает только один основной цвет. Высокая плотность интегральных
фототранзисторов позволяет достигать хорошей разрешающей способности
— 400 dpi (3400/8,5) — без использования редуцирующей линзы.
Принцип действия цветного сканера ScanJet Iic фирмы Hewlett Packard
несколько иной. Источник белого света освещает сканируемое изображение, а
отраженный свет через редуцирующую линзу попадает на трех полосную ПЗС
через систему специальных фильтров, которые и разделяют белый свет на три
компонента: красный, зеленый и синий (рис. 3). Физика работы подобных
фильтров связана с явлением дихроизма, заключающегося в различной окраске
одноосных кристаллов в проходящем белом свете в зависимости от положения
оптической оси. В рассматриваемом случае фильтрация осуществляется парой
таких фильтров, каждый из которых представляет собой «сэндвич» из двух
тонких и одного более толстого слоя кристаллов. Первый слой первого
фильтра отражает синий свет, но пропускает зеленый и красный. Второй слой
отражает зеленый свет и пропускает красный, который отражается только от
третьего слоя. Во втором фильтре, наоборот, от первого слоя отражается
красный свет, от второго — зеленый, а от третьего — синий. После системы
фильтров разделенный красный, зеленый и синий свет попадает на
собственную полосу ПЗС, каждый элемент которого имеет размер около 8
мкм. Дальнейшая обработка сигналов цветности практически не отличается от
обычной. Заметим, что подобный принцип работы (с некоторыми отличиями,
разумеется) используется и в цветных сканерах фирмы Ricoh.
Рис.3. Блок-схема сканера с dichroic-фильтрами.
Аппаратные интерфейсы сканеров.
Для связи с компьютером сканеры могут использовать специальную 8или 16-разрядную интерфейсную плату, вставляемую в соответствующий слот
расширения. Для портативных компьютеров подходит устройство PC Card.
Кроме того, в настоящее время достаточно широкое распространение
получили стандартные интерфейсы, применяемые в IBM PC-совместимых
компьютерах (последовательный и параллельный порты, а также интерфейс
SCSI). Стоит отметить, что в случае стандартного интерфейса у пользователя
не возникает проблем с разделением системных ресурсов: портов вводавывода, прерываний IRQ и каналов прямого доступа DMA.
По понятным причинам наиболее медленно передача данных
осуществляется через последовательный порт (RS-232C). Именно поэтому в
ряде последних ручных или комбинированных моделей сканеров для связи с
компьютером применяется стандартный параллельный порт. Это очень
удобно, например, при работе с портативным компьютером.
Программные интерфейсы и TWAIN.
Программный интерфейс сканера Mustek Scan Express 6000SP.
Программный интерфейс TWAIN.
Для управления работой сканера (впрочем, как и иного устройства)
необходима соответствующая программа — драйвер. В этом случае
управление идет не на уровне "железа" (портов ввода-вывода), а через
функции или точки входа драйвера. До недавнего времени каждый драйвер
для сканера имел свой собственный интерфейс. Это было достаточно
неудобно, поскольку для каждой модели сканера требовалась своя прикладная
программа. Логичнее было бы наоборот, если бы с одной прикладной
программой могли работать несколько моделей сканеров. Это стало
возможным благодаря TWAIN.
TWAIN — это стандарт, согласно которому осуществляется обмен
данными между прикладной программой и внешним устройством (читай —
его драйвером). Напомним, что консорциум TWAIN был организован с
участием представителей компаний Aldus, Caere, Eastman Kodak, Hewlett
Packard & Logitech. Основной целью создания TWAIN-спецификации было
решение проблемы совместимости, то есть легкого объединения различных
устройств ввода с любым программным обеспечением. Конкретизируя, можно
выделить несколько основных вопросов: во-первых, поддержку различных
платформ компьютеров; во-вторых, поддержку различных устройств, включая
разнообразные сканеры и устройства ввода видео; в-третьих, возможность
работы с различными формата данных. Благодаря использованию TWAINинтерфейса можно вводить изображение одновременно с работой в
прикладной программе, поддерживающей TWAIN, например CorelDraw,
Picture Publisher, PhotoFinish. Таким образом, любая TWAIN -совместимая
программа будет работать с TWAIN-совместимым сканером.
В заключение стоит отметить, что образы изображений в компьютере
могут храниться в графических файлах различных форматов, например TIFF,
РСХ, ВМР, GIF и других. Надо иметь в ввиду, что при сканировании
изображений файлы получаются достаточно громоздкими и могут достигать
десятков и сотен мегабайт. Для уменьшения объема хранимой информации
используется обычно процесс компрессии (сжатия) таких файлов.
Сканер Mustek ScanExpress 6000 SP
Фирма «Mustek Optic Computers» является крупнейшим производителем
сканеров в мире. Mustek производит полный спектр сканеров для домашнего
(серия ScanExpress), офисного (серия Paragon) и полупрофессионального
(серия Paragon Pro) использования.
Рассмотрим работу сканеров данной фирмы на примере модели
ScanExpress 6000 SP. Эта модель относится к новой серии планшетных
сканеров, начало которой положил Mustek Paragon 600 SEP.
Новый сканер отличается от аналогичных моделей эргономичным
исполнением, удобным программным обеспечением и простотой эксплуатации
при небольшой цене. Mustek ScanExpress 6000 SP, сохранив все достоинства
своего предшественника, приобрел улучшенную цветопередачу благодаря
внутреннему 30-битному представлению цвета. Этот однопроходный сканер
имеет оптическое разрешение 300x600 точка/дюйм, которое методами
интерполяции увеличивается до 4800 точка/дюйм. ScanExpress 6000 SP имеет
интерфейс SCSI, что позволяет использовать его как с IBM-совместимыми ПК,
так и с компьютерами Macintosh.
В этом сканере, как и во многих других, применяется белая
флюоресцентная лампа с холодным катодом. Возможно, кого-то удивит то
обстоятельство, что она не выключается автоматически в то время, когда
сканер не используется, но подключен к сети. Дело в том, что лампы с
холодным катодом имеют срок наработки на отказ около 35 тыс. часов (четыре
года непрерывной работы), поэтому нет ничего страшного в том, что такая
лампа горит в течение всего дня.
Потребляемая сканером мощность составляет 15 Вт.
Размеры сканера ScanExpress 6000 SP невелики - 470x298x100 мм. При
этом максимальный размер сканируемого оригинала составляет 216x292 мм.
Невелика и масса аппарата - 3 кг.
Встроенный датчик, срабатывающий при открывании крышки устройства,
и утилита ScanWizard упрощают процедуры копирования, отправки
факсимильных сообщений и ввода изображений в компьютер. Интуитивно
понятный программный интерфейс позволяет производить автоматическую
коррекцию цвета сканируемого оригинала и настройку цветопередачи,
устранять муар, осуществлять пакетное сканирование и накладывать
встроенные фильтры.
Сканер ScanExpress 6000 SP достаточно производителен. Времена
сканирования изображений формата A4 (210x297 мм), полученные на машине
с 200-МГц процессором Pentium, 64-Мбайт ОЗУ и 5,1-Гбайт НЖМД Western
Digital, приведены в таблице.
Цветная фотография
Разрешение,
точка/дюйм
Мин:с
Размер файла,
Кбайт
300
72
2:35
0:35
25934
1494
Полутоновое
изображение
Мин:с Размер файла,
Кбайт
0:45
0:14
8645
498
Черно-белый текст
Мин:с
Размер файла,
Кбайт
0:40
0:12
1081
62
Объем внутреннего буфера сканера составляет 32 Кбайт. По-видимому,
этого недостаточно, так как в процессе сканирования вся система как бы
зависает, о чем можно судить по отсутствию реакции мыши. Другое
неудобство состоит в том, что, если включить сканер после того, как
завершилась загрузка операционной системы, последняя не опознает его. Для
нормальной работы необходимо загружать операционную систему при
включенном сканере.
Стоит также отметить особенность, которая касается совместной работы
программы Fine Reader версии 3.0 и данного сканера. В этой версии
сканирование приходится осуществлять не напрямую из программы, а через
TWAIN-диалог, что несколько неудобно. Однако в четвертой версии Fine
Reader указанный недостаток устранен.
В целом, несмотря на недостатки, ScanExpress 6000 SP - достаточно
удобный аппарат, который вполне оправдывает средства, затраченные на его
приобретение.
Выбор сканера.
В офисе сканер может эффективно использоваться для работы как с
текстами (OCR), так и с изображениями. В первом случае можно
ориентироваться на недорогую черно-белую модель с разрешением 200—300
dpi. Для ввода коротких документов может пригодиться даже ручной сканер.
При больших объемах следует остановиться на сканере с автоматической
подачей оригиналов. В зависимости от сложности вводимых в компьютер
изображений может потребоваться сканер с разрешением 300—600 dpi (с
интерполяцией до 1200 dpi), с возможностью восприятия до 16,7 миллиона
оттенков цветов (24-разрядное кодирование) и производительным
интерфейсом (SCSI-2). Во всех случаях надо удостовериться, что в комплект
со сканером входит соответствующее программное обеспечение, будь то OCRпрограммы или графический пакет. Не стоит забывать также и о TWAINсовместимости.
Задание для самопроверки:
1.
С помощью программного средства
“Imaging” попробуйте
произвести сканирование графического объекта.
2.
С помощью стандартного программного интерфейса сканера
попробуйте произвести:
а) сканирование графического объекта (письма (текста), фотографии).
б) сканирование в память печатающего устройства.
3. Изменить уровень разрешения сканирования графического объекта.
4. Сохранить отсканированный графический объект в различных
форматах.
ВВЕДЕНИЕ
Рано или поздно счастливый обладатель видеокамеры в своем стремлении к
самовыражению посредством видео сталкивается с проблемой превращения отснятого им
видеоматериала в законченный фильм. Дело в том, что мало кто остается удовлетворенным
отснятым "сырым" видеоматериалом – обычно требуется его пост-обработка: "обрезка"
лишних фрагментов, перестановка и гладкая склейка удачных сюжетов и построение
эффектных переходов между ними, наложение титров, включение заставок и т.д.
Для того чтобы лучше понять преимущества цифровых технологий редактирования и
монтажа, активно используемых в настоящее время в производстве видеопродукции,
необходимо вернуться на несколько лет назад и рассмотреть старую классическую схему,
отточенную практикой предыдущих десятилетий. Базовая монтажная система состояла из
двух видеомагнитофонов (Player-Recorder) и управляющего ими монтажного контроллера.
При этом собственно процесс монтажа выглядел следующим образом:
Отбираемая пользователем "полезная" видеоинформация (фрагменты A и B) с
исходной ленты (источника) на первом магнитофоне (Player) переписывалась на
результирующую ленту на втором магнитофоне (Recorder), в то время как неудачная или
избыточная информация оставалась на источнике.
Получаемая в результате новая запись становилась так называемой Мастер
кассетой. Если же было необходимо не просто последовательно собрать (стык в стык)
отдельные видеофрагменты в единое целое, но построить между ними плавные переходы со
шторками и/или реализовать другие эффекты, добавить титры, наложить звук, то
требовалось уже видеомонтажная студия. Отметим, что она включала в себя набор
независимых дорогостоящих устройств (порой различных производителей), которые для
достижения необходимого результата должны были работать абсолютно синхронно,
прецизионно точно и в реальном времени. При этом неизбежна была потеря качества на
ленте с результатом в сравнении с лентой исходного материала.
Несколько лет назад появилась возможность выполнения видеомонтажа и
редактирования "внутри" компьютера. Эта технология получила название нелинейного
монтажа, поскольку позволила операторам прямое обращение к необходимым
кадрам/фрагментам видео, записанным на жесткий диск компьютера, т.е. позволила
избегать утомительного процесса постоянной (линейной) перемотки ленты вперед-назад
при просмотре/поиске этих фрагментов. Подчеркнем, что оцифрованные фрагменты видео
перед записью на диск подвергаются компрессии (как правило, MJPEG) в 3-10 раз, что
неизбежно приводит к определенной потере качества (тем меньшей, чем меньше степень
компрессии). Развитие технологии цифрового редактирования наряду с наращиванием
производительности персональных компьютеров, в том числе методов компрессии, привело
к реальной возможности создания профессиональной по качеству видеопродукции на базе
стандартного компьютера.
Каковы основные преимущества цифрового нелинейного монтажа? Прежде
всего, это сохранение исходного уровня качества записанных на диск фрагментов при их
копировании (вне зависимости от числа копий).
Кроме того, это:
 Отсутствие выпадений из-за дефектов ленты,
 "Мгновенный" доступ к любому фрагменту,
 Более широкие возможности контроля процесса монтажа,
 Более высокое качество конечной продукции,
 Возможность использования новых творческих решений и создания новых
визуальных эффектов, обусловленных именно цифровыми возможностями
манипулирования с видео (например, трехмерная анимация, виртуальная студия),
 Автоматическая синхронизация видео со звуком.
При этом собственно процесс обработки предваряет преобразование исходного видео в
цифровой сигнал и его запись на жесткий диск компьютера. Одним словом, возникает
задача перевода аналогового видеосигнала в цифровую форму доступную для дальнейшего
компьютерного монтажа и просмотра.
Если раньше оборудование для решения этой задачи могли позволить себе только
профессионалы, то теперь появляются варианты доступные по цене домашнему
пользователю. В качестве одного из вариантов, для оцифровывания видеосигнала могут
быть использованы комбинированные видеокарты.
Ведущие производители графических плат добавляют к своим трехмерным платам
ряд функциональных возможностей, которые позволяют записывать и обрабатывать
видеосигнал. В этом отчете сравниваются функциональные возможности и эффективность
видеообработки при использовании плат 3dfx Voodoo3 3500TV, Matrox Marvel G400TV, ATI
All-in-Wonder 128 , Elsa Erazor III Video и Asus AGP-V3800 Ultra Deluxe. Сравниваются
качество видеоизображения этих продуктов, их требования к объему памяти и удобство
использования.
Качество видео и методы сжатия
Существенным моментом в задаче оцифровывания видеофрагмента является требуемое
качество видео. Конечно, хотелось бы как можно выше, но это вступает в противоречие с
требованием минимизации затрат. Кроме того, само понятие качества и тем более его
оценка весьма субъективны. В поиске разумного компромисса будем опираться на
классификацию качества видео, обеспечиваемого потребительскими камерами различных
форматов записи на магнитную ленту. Весьма условно, здесь можно выделить 2 уровня:
Стандартное Видео (VHS, C-VHS, Video8), Супер-Видео (SVHS, C-SVHS, Hi8). Для
простоты в дальнейшем будем обозначать их как Video и S-Video. Количественно они
обычно характеризуются горизонтальным разрешением (числом различаемых в строке
элементов – телевизионных линий). Считается, что Video обеспечивает разрешение до 280
линий, а S-Video – до 400 линий. Важно отметить, что телевизионный кадр (здесь и далее
PAL стандарта) содержит 576 активных строк (всего их 625, но часть из них служебные),
причем согласно рекомендации ITU-R BT.601 международного профессионального
телевизионного сообщества (ITU – International Telecommunications Union) каждая строка
содержит 720 независимых отсчетов. Таким образом, принципиально телевизионный кадр
представляет собой матрицу 720v (будем называть такое разрешение – TV-разрешением, а
320x288 – половинным TV разрешением).
В телевидении всегда кадр состоит из двух разных по содержанию картинок (полей):
четные строки формируют одно изображение, а нечетные другое, отснятое на 1/50 сек
раньше (позже). Телевизор и показывает эти полукадры в режиме черезстрочной развертки
один за другим, - разные картинки высвечиваются в разные моменты времени. Глаз не
успевает отреагировать на быструю смену четных и нечетных полей, и воспринимает всю
картинку как видео с частотой повторения "кадров" 50 Гц. Это дает иллюзию плавного
движения при ширине полосы пропускания вещательного канала, соответствующей только
25 полным кадрам в секунду. Компьютеры работают в режиме прогрессивной развертки, и
показывают всегда полный кадр. То есть на экране сразу показывают оба поля кадра. Это
неправильно и с точки зрения последовательности смены картинок, и воспринимается как
зазубрины на краях.
Бороться с этим бессмыссленно, никаких решений, кроме отбрасывания одного поля
целиком, не существует. Такое отбрасывание делается при размере захватываемого кадра
288 или меньше строк. Четные (или нечетные) поля просто игнорируются. Движения
получаются немного дерганые, особенно на сценах с поворотом камеры.
Известно, что телевизионный сигнал представляет собой совокупность сигнала
яркости Y и двух цветоразностных сигналов U и V. Вариации их значений допускают 256
градаций (от 0 до 255 для Y, и от –128 до 127 для U/V), что в двоичном исчислении
соответствует 8 битам (bit) или 1 байту (Byte). Теоретически каждый элемент кадра имеет
собственные значения YUV, т.е. требует 3 байт. Такое представление, когда как яркость, так
и сигналы цветности имеют равное число независимых значений, обычно обозначают как
4:4:4. Однако, было установлено, что зрительная система человека менее чувствительна к
цветовым пространственным изменениям, чем к яркостным. И без видимой потери качества
число цветовых отсчетов в каждой строке можно уменьшить вдвое. Именно такое
представление, обозначаемое как 4:2:2, было принято в профессиональном телевидении.
При этом U- V-матрицы уменьшаются до 360, а для передачи полного значения
телевизионного сигнала в каждом отсчете кадра достаточно 2 байт (чередуя через отсчет
независимые значения U и V). Но для целей потребительского видео было признано
допустимым уменьшить вдвое и вертикальное цветовое разрешение, т.е. перейти к
представлению 4:2:0. Это уменьшает цветовые матрицы до 360, а приведенное число байт
на отсчет – до 1,5 (см. таблицу ниже) Именно такое представление было заложено в DVформат цифровых камер.
Форматы представления YUV данных телевизионного сигнала
4:4:4
4:2:2
4:2:0
YUV YUV YUV YUV YU
YV
YU
YV
YU
YV
YU
YV
YUV YUV YUV YUV YU
YV
YU
YV
Y
Y
Y
Y
YUV YUV YUV YUV YU
YV
YU
YV
YU
YV
YU
YV
YUV YUV YUV YUV YU
YV
YU
YV
Y
Y
Y
Y
Таким образом, принимая во внимание телевизионную кадровую частоту в 25 Гц,
приходим к выводу, что одна секунда цифрового видео в представлении 4:2:2 требует
25x2x720x576 736000 байт, т.е. поток данных составляет 21 MBps (MegaByte Per Second), но
4:2:0 представление уменьшает поток на 25% - до 16 MBps. Запись подобных потоков
технически осуществима, но сложна, дорогостояща и неэффективна с точки зрения
последующей обработки. Реальные возможности практики требуют значительного
уменьшения потоков, т.е. вынуждают применять различные виды компрессии. Известно
множество алгоритмов, осуществляющих компрессию без потери информации, но даже
самые эффективные из них на типичных изображениях не обеспечивают сжатия более 2 раз.
Среди алгоритмов с потерей данных одним из наиболее известных является MJPEG
(Motion-JPEG). Он пришел из цифровой фотографии, где под именем JPEG был разработан
для эффективного сжатия отдельных кадров (JPEG – это аббревиатура от названия
утвердившего его международного объединения Joint Photographic Experts Group).
Приставка Motion всего лишь отражает его приложение для последовательности кадров,
хотя при этом каждый из них обрабатывается совершенно независимо. В этом алгоритме
кадр разбивается на блоки размером 16_, каждый из которых с помощью обратного
дискретного преобразования Фурье (ОДПФ) переводится в частотную область. В результате
распределение сигналов яркости и цветности (используется представление 4:2:2) переходит
в соответствующие частотные коэффициенты, которые затем подвергаются квантованию
(округлению значений с задаваемым интервалом). Само по себе ОДПФ обратимо, т.е. не
приводит к потере данных, но вот квантование коэффициентов вызывает огрубление
изображения. Операция квантования выполняется с переменным интервалом – наиболее
точно передается низкочастотная информация, поскольку соответствующие искажения
изображения зрительно наиболее заметны. В то же время многие высокочастотные
коэффициенты, ответственные за "тонкие" детали изображения, после нее принимают
нулевые значения. Таким образом, JPEG-компрессия приводит к снижению эффективного
разрешения и возможному появлению незначительных ложных деталей (в частности, на
границе блоков), но обеспечивает значительное сжатие потока данных. Компромисс
очевиден – чем больше сжатие, тем ниже качество. Установлено, что уровню Video
соответствует MJPEG поток около 2 MBps, а S-Video – 4 MBps.
Дальнейшее снижение объема данных может быть достигнуто переходом к
алгоритму MPEG компрессии (MPEG – Motion Pictures Experts Group). Он принципиально
ориентирован на обработку последовательностей кадров и использует высокую
избыточность информации в изображениях, разделенных малым временным интервалом.
Действительно, между смежными изображениями обычно меняется только малая часть
сцены – например, происходит плавное смещение небольшого объекта на фоне
фиксированного заднего плана. В этом случае полную информацию о сцене нужно
сохранять только выборочно - для опорных изображений. Для остальных достаточно
передавать только разностную информацию: о положении объекта, направлении и величине
смещения, о новых элементах фона (открывающихся за объектом по мере его движения).
Причем эти разности можно формировать не только по сравнению с предыдущими
изображениями, но и с последующими (поскольку именно в них по мере движения объекта
открывается часть фона, ранее скрытая за объектом). Таким образом, в MPEG кодировке
принципиально формируются три типа кадров: I (Intra), выполняющие роль опорных и
сохраняющие полный объем информации о структуре изображения; P (Predictive), несущие
информацию об изменениях в структуре изображения по сравнению с предыдущим кадром
(типов I или P); B (Bi-directional), сохраняющие только самую существенную часть
информацию об отличиях от предыдущего и последующего изображений (только I или P).
Принципиальная схема последующей компрессии I-кадров, также как и разностных P- и Bкадров, аналогична MJPEG, но, с адаптивной подстройкой таблиц квантования.
Последовательности I-, P-, B-кадров объединяются в фиксированные по длине и
структуре группы кадров - GOP (Group of Pictures). Каждая GOP обязательно начинается с I
и с определенной периодичностью содержит P кадры. Ее структуру описывают как M/N, где
M – общее число кадров в группе, а N – интервал между P-кадрами. Так, типичная для
Video-CD и DVD IPB группа 15/3 имеет следующий вид: IBBPBBPBBPBBPBB. Здесь
каждый B кадр восстанавливается по окружающим его P кадрам (в начале и конце группы по I и Р), а в свою очередь каждый Р кадр – по предыдущему Р (или I) кадру. В то же время
I кадры самодостаточны и могут быть восстановлены независимо от других, но являются
опорными для всех P и тем более B кадров группы. Соответственно у I наименьшая степень
компрессии, у В – наибольшая. Установлено, что по размеру типичный Р-кадр составляет
1/3 от I, а B – 1/8 часть. В результате MPEG последовательность IPPP (GOP 4/1)
обеспечивает 2-кратное уменьшение требуемого потока данных (при том же качестве) по
сравнению с последовательностью только из I кадров, а использование GOP 15/3 позволяет
достичь 4-кратного сжатия.
Завершая рассказ о MPEG, необходимо подчеркнуть, что это алгоритм допускает
вариацию и многих других параметров кодирования, в частности, пространственного
разрешения.
В1988 году был основан комитет Moving Pictures Expert Group, что на русский
переводится примерно как экспертная группы кинематографии (движущихся изображений),
аббревиатура которого - MPEG известна теперь любому, кто имел дело с мультимедиа компьютерами или с цифровым телевидением. В этом же году была начата разработка
формата MPEG-1, который в окончательном виде был выпущен в 1993 году. Несмотря на
все очевидные недостатки этого формата, MPEG-1 по-прежнему является одним из
наиболее массовых форматов видеосжатия, лишь в последнее время, начиная постепенно
сдавать позиции под натиском более новых и совершенных форматов видеокомпрессии, по
большей части из этого же семейства.
Надо сказать, что практически все новаторские по тем временам разработки легшие в
основу формата MPEG-1, в том или ином виде встречаются и более совершенных форматах
данного ряда, поэтому, рассмотрев в подробностях первого представителя этого семейства
форматов видеосжатия можно получить общее представление о том, как же работают
алгоритмы MPEG.
Формат MPEG-1 начал разрабатываться в те трудно вообразимые времена, когда не
было широкодоступных носителей большого объема, в то время, как видеоданные, даже и
сжатые, занимали совершенно колоссальные для конца 80-х объемы - средней
продолжительности фильм имел размер больше гигабайта. Но это была эпоха 286 и 386
процессоров, 4 Мб оперативной памяти и 250 Мб винчестер считались роскошью, а не
убогостью, как сейчас, Windows была примочкой для DOS, а не наоборот, а в качестве легко
переносимых носителей информации доминировали 5 дюймовые дискеты и только-только
появившиеся 3,5" дискеты от фирмы SONY. В таких условиях необходимо было найти
носитель, на который можно было бы записать гигабайт информации, при этом этот
носитель должен был быть недорогим, иначе ни о какой массовости не могло быть и речи.
И такой носитель был найден. Как раз в эти годы впервые на платформе PC появился
такой новый тип носителей информации как CD-ROM диски, которые смогли обеспечить
необходимый объем информации. Правда, на один диск фильм в формате MPEG-1 все-таки
не вмещался, но что мешало записать его на 2 CD, тем более, что новинка стоила очень
недорого? Разумеется, первые CD-ROM проигрыватели были односкоростными, поэтому не
стоит удивляться, что максимальная скорость пересылки потока данных (bitstream) в
формате MPEG-1 ограничена 150 Кб/сек., что соответствует одной скорости CD-ROM.
Надо сказать, что возможности MPEG-1 не ограничены тем низким разрешением,
которое вы все видели при просмотре VIDEO-CD. В самом формате была заложена
возможность сжатия и воспроизведения видеоинформации с разрешением вплоть до
4095х4095 и частотой смены кадров до 60 Гц. Но из-за того, что поток передачи данных был
ограничен 150 Кб/сек., то есть так называемый Constrained Parameters Bitstream (CPB) зафиксированная ширина потока передачи данных, разработчики формата, а в дальнейшем
и создатели кодеков на его основе, были вынуждены использовать разрешения кадра,
оптимизированные под данный CPB. Наиболее широко распространенными являются два
таких оптимизированных формата - это формат SIF 352х240, 30 кадров в секунду и
урезанный формат PAL/SECAM 352х288, 25 кадров в секунду.
Ну вот, с разрешением определились, теперь можно и посмотреть, как это все
сжимается.
Принципы cжатия информации в MPEG-1.
В качестве примера рассмотрим урезанный формат PAL/SECAM, который более
распространен, чем SIF, хотя оба эти формата за исключением разрешения и частоты смены
кадров ничем друг от друга не отличаются.
Урезанная версия формата PAL/SECAM содержит 352 ppl (point per line - точек на линию),
288 lpf (line per frame - линий на кадр) и 25 fps (frame per second - кадров в секунду). Надо
сказать, что полноценный стандарт PAL/SECAM имеет параметры в 4 раза большие, чем
аналогичные у MPEG-1 (кроме fps). Поэтому принято говорить, что VIDEO-CD имеет
четкость в четыре раза хуже, по сравнению с обычным видео.
Что касается глубины цвета, то тут не все так просто, как в компьютерной графике, где на
каждый пиксел отводится определенное фиксированное число бит. MPEG-1 использует
цветовую схему YСbCr, где Y - это яркостная плоскость, Сb и Cr - плоскости цветовые. Эти
плоскости кодируются с разным разрешением. Существуют несколько вариантов
кодирования, которые можно представить с следующем виде:
Вариант
Отношение разрешений Сb/Y
Отношение разрешений Сb/Y
кодирования
(Сr/Y) по горизонтали
(Сr/Y) по вертикали
4:4:4
1:1
1:1
4:2:2
1:2
1:1
4:2:0
1:2
1:2
4:1:1
1:4
1:1
4:1:0
1:4
1:4
Как видно из таблицы Сb и Cr практически всегда кодируются с меньшим разрешением,
чем Y. Чем меньше разрешение цветовых плоскостей, тем грубее и неестественнее
цветопередача в видеоролике. Разумеется, самым некачественным, но и самым компактным
будет последний вариант.
Перед началом кодирования происходит анализ видеоинформации, выбираются ключевые
кадры, которые не будут изменяться при сжатии, а так же кадры, при кодировании которых
часть информации будет удаляться. Всего выделяется три типа кадров:
1. Кадры типа I - Intra frame. Ключевые кадры, которые сжимаются без изменений.
2. Кадры типа P - Predirected frame. При кодировании этих кадров часть информации
удаляется. При воспроизведении P кадра используется информация от предыдущих I
или P кадров.
3. Кадры типа В - Bidirectional frame. При кодировании этих кадров потери
информации еще более значительны. При воспроизведении В кадра используется
информация уже от двух предыдущих I или P кадров. Наличие В кадров в
видеоролике - тот самый фактор, благодаря которому MPEG-1 имеет высокий
коэффициент сжатия (но и не очень высокое качество).
При кодировании формируется цепочка кадров разных типов. Наиболее типичная
последовательность может выглядеть следующим образом: IBBPBBPBBIBBPBBPBB...
Соответственно очередь воспроизведения по номерам кадров будет выглядеть так:
1423765...
По окончании разбивки кадров на разные типы начинается процесс подготовки к
кодированию.
С I кадрами процесс подготовки к кодированию происходит достаточно просто - кадр
разбивается на блоки. В MPEG-1 блоки имеют размер 8х8 пикселов.
А для кадров типа P и B подготовка происходит гораздо сложнее. Для того, чтобы
сильнее сжать кадры указанных типов используется алгоритм предсказания движения.
В качестве входной информации алгоритм предсказания движения получает блок 8х8
пикселов текущего кадра и аналогичные блоки от предыдущих кадров (I или P типа). На
выходе данного алгоритма имеем следующую информацию о вышеуказанном блоке:
1. Вектор движения текущего блока относительно предыдущих
2. Разницу между текущим и предыдущими блоками, которая собственно и будет
подвергаться дальнейшему кодированию.
Вся избыточная информация подлежит удалению, благодаря чему и достигается
столь высокий коэффициент сжатия, невозможный при сжатии без потерь.
Но у алгоритма предсказания движения есть ограничения. Зачастую в фильмах
бывают статические сцены, в которых движения нет или оно незначительно и возникают
блоки или целые кадры, в которых невозможно использовать алгоритм предсказания
движения. Думаю, вы замечали, что у видеороликов сжатых MPEG-1 качество сцен с
небольшим количеством двигающихся объектов заметно выше, чем в сценах с интенсивным
движением. Это объясняется тем, что в статических сценах P и B кадры, по сути,
представляют собой копии I кадров, потерь практически нет, но и сжатие информации
незначительно.
В случае же корректного срабатывания алгоритма предсказания движения, объемы
кадров разного типа в байтах соотносятся друг с другом примерно следующим образом I:P:B как 15:5:2. Как вы видите из данного соотношения, уменьшение объема
видеоинформации налицо уже на стадии подготовки к кодированию.
По окончании этой стадии начинается собственно само кодирование. Процесс
кодирования содержит в себе 3 стадии:
1. Discrete Cosine Transformation - DTC, дискретное преобразование косинусов,
преобразование Фурье.
2. Quantization - квантование. Перевод данных из непрерывной формы в прерывистую,
дискретную.
3. Преобразование полученных блоков данных в последовательность, то есть
преобразование из матричной формы в линейную.
При кодировании блоки пикселов или вычисленная разница между блоками обрабатывается
первым из преобразующим алгоритмов - DTC (дискретное преобразование косинусов).
Обычно пиксела в блоке и сами блоки изображения каким-то образом связаны между собой
- например однотонный фон, равномерный градиент освещения, повторяющийся узор и т.д.
Такая связь называется корреляцией. Алгоритм DTC, используя коррелирующие эффекты,
производит преобразование блоков в частотные фурье-компоненты. При этом часть
информации теряется за счет выравнивания сильно выделяющихся участков, которые не
подчиняются корреляции. После этой процедуры в действие вступает алгоритм Quantization
- квантование, который формирует Quantization matrix. Quantization matrix - это матрица
квантования, элементами которой являются преобразованные из непрерывной в дискретную
форму данные, то есть числа, которые представляют собой значения амплитуды частотных
фурье-компонентов. После формирования quantization matrix происходит разбивка
частотных коэффициентов на конкретное число значений. Точность частотных
коэффициентов фиксирована и составляет 8 бит. После квантования многие коэффициенты
в матрице обнуляются. И в качестве завершающей стадии происходит преобразование
матрицы в линейную форму.
Все эти преобразования касаются только изображения. Но кроме изображения в
практически любом видеофрагменте присутствует так же и звук. Кодирование звука
осуществляется отдельным звуковым кодером. По мере развития формата MPEG, звуковые
кодеры неоднократно переделывались, становясь все эффективнее. К моменту
окончательной стандартизации формата MPEG-1 было создано три звуковых кодера этого
семейства - MPEG-1 Layer I, Layer II и Layer 3 (тот самый знаменитый MP3). Принципы
кодирования всех этих кодеков основаны на психоакустической модели, которая
становилась все более и более совершенной и достигла своего апофеоза для семейства
MPEG-1 в алгоритмах Layer-3.
Синхронизация аудио- и видеоданных осуществляется с помощью специально
выделенного потока данных под названием System stream. Этот поток содержит встроенный
таймер, который работает со скоростью 90 КГц и содержит 2 слоя - системный слой с
таймером и служебной информацией для синхронизации кадров с аудиотреком и
компрессионный слой с видео- и аудиопотоками.
Под служебной информацией понимаются несколько видов меток, наиболее
важными из которых являются метки SCR (System Clock Reference) - инкремент увеличения
временного счетчика кодека и PDS (Presentation Data Stamp) - метка начала воспроизведения
видеокадра или аудиофрейма.
Качество аудиотреков в MPEG-1 может варьироваться в очень больших пределах - от
высококачественных до безобразных. Окончательно все форматы сжатия аудиоданных
были стандартизированы в 1992 году европейской комиссией по стандартам ISO.
В зависимости от используемого кодера и степени сжатия аудиоинформация
видеоролика может быть представлена в следующем виде: моно, dual mono, стерео,
интенсивное стерео (стереосигналы, чьи частоты превышают 2 КГц объединяются в моно),
m/s стерео (один канал - сумма сигналов, другой - разница) и по частоте дискретизации
могут быть: 48, 44.1и 32 КГц.
Системы видеоизображения
Система NTSC
Система NTSC была разработана и внедрена в США в 1953 году и явилась первой
совместимой системой цветного телевидения. Это одновременная совместимая система
цветного ТВ, в которой передается яркостной сигнал и расположенная в пределах его
спектра поднесущая, квадратурно модулированная двумя цветоразностными сигналами. В
приемнике осуществляется синхронное детектирование цветоразностных сигналов, для чего
в пределах гасящего строчного импульса передается частота поднесущего колебания с
опорной фазой.
Принцип квадратурной модуляции заключается в том, что оба цветоразностных
сигнала Еr-у и Eb-y модулируют по амплитуде две составляющие одной и той же
поднесущей, сдвинутые одна относительно другой по фазе на 90 градусов. Частота
поднесущей равна f0 = 3,579545 МГц. Модуляция осуществляется с помощью балансных
модуляторов, в которых поднесущая цветности подавляется, а остаются лишь боковые
полосы.
Подавление цветовой поднесущей существенно уменьшает помехи на экране
телевизора. Затем выходные сигналы складываются, образуя геометрическую сумму этих
сигналов, т. е. полный сигнал цветности, который будет изменяться как по амплитуде, так и
по фазе. При этом амплитуда этого сигнала определяет насыщенность, а фаза - цветовой тон
передаваемого изображения. В передающем устройстве сигнал цветности складывается с
яркостным сигналом, куда поступают также строчные и кадровые синхроимпульсы,
гасящие импульсы и сигнал цветовой синхронизации, который необходим на приемной
стороне, чтобы восстановить подавленную поднесущую для последующего детектирования
сигналов активности.
Так образуется полный цветовой телевизионный сигнал (ПЦТС). В цветных
телевизорах системы NTSC полный сигнал цветности разделяется на два цветоразностных
сигнала с помощью синхронных детекторов. Синхронные детекторы, в отличие от ранее
применяемых амплитудных, обладают более высокой линейностью преобразования при
малых уровнях сигнала.
Итак, для нормального синхронного детектирования необходимо восстановить
подавленную поднесущую. Для этого в составе ПЦТС передается сигнал цветовой
синхронизаций, который представляет собой колебание поднесущей из 8-10 периодов,
размещенных на задней площадке строчного гасящего импульса. Этот сигнал называют
сигналом вспышки. Система NTSC обеспечивает высокую четкость цветного изображения,
легко осуществляет разделение цветоразностных сигналов без применения линии задержки,
но обладает большой чувствительностью к фазовым
искажениям, которые приводят к зависимости цветового тона от амплитуды сигнала
яркости.
Кроме фазовых искажений, система NTSC подвержена амплитудно-частотным
искажениям,
которые вызывают изменение насыщенности цвета темных и светлых участков
изображения.
Система NTSC обеспечивает самое высокое качество цветного изображения, но
требует
высокого технического качества приемопередающей аппаратуры.
Европейский вариант NTSC: число строк 525, частота полей 60 Гц, поднесущая
цветности 4.42 МГц, ширина полосы 1.3 МГц, несущая звука 6.5 МГц. Американский
вариант NTSC: число строк 525, частота полей 60 Гц, поднесущая цветности 3.58 МГц,
ширина полосы 1.3 и 0.5 МГц, несущая звука 4.5 МГц.
Особенности кодирования и декодирования системы PAL.
Система PAL была разработана и внедрена в начале 60-х годов фирмой
"Телефункен" (ФРГ).
Система PAL является более совершенной, чем NTSC. Она позволяет существенно
уменьшить присущие системе NTSC фазовые искажения.
Впоследствии выяснился еще ряд преимуществ этой системы. Основные
характеристики системы PAL: число строк 525, частота полей 60 Гц, поднесущая цветности
4.433 618 МГц, ширина полосы 1.3 МГц, несущая звука 4.5 МГц
Рассмотрим эту систему более подробно. Как и в системе NTSC, в системе PAL
применена
квадратурная модуляция (цветовой) поднесущей, но в отличие от нее фаза составляющей
поднесущей, которая модулируется красным цветоразностным сигналом, меняется от
строки к строке на 180 градусов (рис.4). Модуляция осуществляется сигналами Еu =
0,493Eb-y и Еv = 0,877Еr-y.
Составляющая поднесущей, модулируемая синим цветоразностным сигналом, имеет
постоянную фазу. Частота поднесущей выбрана равной f0 = 4,43361875 МГц с учетом
минимальной заметности этой поднесущей на окрашенных участках цветного изображения.
На черно-белых участках изображения помеха от поднесущей отсутствует, так как
она подавляется при передаче черно-белого изображения. Модуляция поднесущей
осуществляется с помощью балансных модуляторов (рис.5).
Сигналы, получаемые на выходах балансных модуляторов, складываются в
суммирующем устройстве, образуя результирующий сигнал цветности Vрез . Из рис.5
видно, что поднесущая, которая подается на модулятор "В-Y" с генератора Г, подается
непосредственно (фаза 0 градусов), а на модулятор "R-Y" через электронный коммутатор
ЭК, переключаемый сигналом полустрочной частоты fстр : 2. Причем в одной строке
поднесущая поступает на модулятор через фазовращатель 90 градусов, а в другой - через
инвертор 180 градусов.
Как и в системе NTSC, результирующее колебание Vрез имеет одновременно
амплитудную и фазовую модуляции. При этом амплитуда сигнала цветности определяет
насыщенность, а
фаза - цветовой тон передаваемого изображения.
Для восстановления в телевизоре подавленной поднесущеи цветности, как и в
системе NTSC, на задней площадке строчного гасящего импульса передается вспышка
поднесущей, состоящая из десяти периодов цветовой поднесущей. В отличие от NTSC фаза
вспышки равна +45 градусов и - 45 градусов относительно отрицательного направления оси
R-Y в четной и нечетной строках соответственно. По фазе вспышки в телевизоре
определяется знак составляющей Uv.
Рассмотрим упрощенную структурную схему одного из вариантов декодера PAL
(рис.6).
Полный цветовой телевизионный сигнал поступает на полосовой фильтр ПФ,
настроенный на полосу частот, которую занимает сигнал цветности в спектре видеосигнала.
Выделенный полосовым фильтром сигнал цветности поступает на вход ультразвуковой
линии задержки УЛЗ на время одной строки (64 мкс), на электронный ключ К, выделяющий
сигнал цветовой синхронизации (вспышку), и на устройство сложения (+) и вычитания (-).
В результате сложения прямого сигнала U0 с задержанным подавляются составляющие Uv
и выделяются удвоенные составляющие Uu с постоянным знаком. При вычитании
задержанного сигнала из прямого подавляются составляющие Uu и выделяются удвоенные
составляющие Uv. Знак Uu чередуется от строки к строке. На рис.7 показаны
векторограммы, поясняющие принцип разделения сигналов цветности PAL.
Для получения из компонент Uv и Uu цветоразностных сигналов необходимо их
продетектировать. Применяется синхронное детектирование. Для его работы нужно иметь
опорный сигнал, частота и фаза которого равны сигналу подавленной цветовой
поднесущей. Сигнал формируется из вспышки, которая выделяется с помощью
электронного ключа К из ПЦТС. Вспышка подается на генератор, выполненный по системе
фазовой автоматической подстройки частоты ФАПЧ (рис.8).
Система ФАПЧ состоит из генератора, управляемого напряжением ГУН, фазового
детектора ФД и фильтра нижних частот ФНЧ.
Напряжение ГУН воздействует на один из входов фазового детектора, на другой
вход - сигнал вспышки. Если частота ГУН близка частоте вспышки, то происходит захват
ГУН по частоте и фазе. В установившемся режиме опорный сигнал на выходе ГУН равен
частоте вспышки, т. е. частоте цветовой поднесущей, а его фаза совпадает с осью R-Y и
равна 90°.
Для повышения стабильности работы ФАПЧ а также его помехозащищенности
частоту ГУН стабилизируют кварцем. Разделенные сигналы цветности поступают на входы
синхронных детекторов СД.
В установившемся режиме фаза опорной поднесущей на выходе ГУН совпадает с
осью
выхода R-Y и равна 90 градусам.
Для правильного детектирования необходимо обеспечить совпадение фаз опорного
сигнала с сигналами цветности. Для этого на СД сигнала цветности (В-Y) опорный сигнал
необходимо подавать через фазовращатель на 90 градусов, на СД сигнала цветности (R-Y)
опорный сигнал подают на один из входов электронного коммутатора ЭК непосредственно,
а на другой - через фазоинвертор на 180 градусов.
ЭК переключается с помощью сигнала полустрочной частоты fстр /2. Фаза работы
ЭК
засинхронизирована с помощью блока цветовой синхронизации (на рис.6 не показан).
Если во входном сигнале есть фазовые искажения, то при сложении (вычитании)
прямого и
задержанного сигналов во время их разделения эти искажения компенсируются.
Система PAL обладает рядом достоинств:
 Отсутствует помеха от поднесущей на неокрашенных участках изображения, так как
поднесущая не передается.
 Фазовые искажения отсутствуют и поэтому не вызывают нарушений цветового тона.
 Малая чувствительность к "асимметрии" полосы пропускания канала цветности.
 При разделении сигналов цветности выделяется удвоенная амплитуда составляющих
Uv и Uu , что повышает отношение сигнал/шум.
 Уменьшаются "перекрестные" искажения, возникающие между сигналами яркости и
цветности (определяется оптимальным выбором частота поднесущей).
Недостатком системы PAL является понижение четкости изображения из-за усреднения
сигнала цветности в двух последующих строках.
Особенности кодирования системы SECAM.
Система SECAM была предложена французским инженером Анри де Франсом в
1958
году,
затем велись совместные работы советских и французских инженеров, и 1 октября 1967
года
система была введена в эксплуатацию в СССР и Франции.
Основные характеристики системы SECAM: число строк 625, частота полей 50 Гц,
поднесущая цветности B-Y 4.25 МГц ± 230 кГц, R-Y 4.406 МГц ± 280 кГц, несущая звука
6.5 МГц В этой системе цветоразностные сигналы передаются поочередно: в течении одной
строки
передаются, например, красный, в течении следующей - синий цветоразностный сигнал и
т.д.
Цветоразностные сигналы передаются с помощью двух поднесущих частот:
for=4,406 МГц
fob=4,250 МГц.
Эти частоты являются гармониками строчной развертки (первая в 282 раза, а вторая в
272
раза выше частоты строчной развертки). Выбор частот поднесущих, как было отмечено
ранее, произведен из условий максимального подавления помех от поднесущих на экранах
телевизоров.
На рис.9 показана структурная схема кодирующего устройства системы SECAM.
С помошью специальных цветоделительных зеркал, входящих в состав передающей
камеры,
изображение раскладываетсяна три основные составляющие светового потока - красную R,
зеленую G и синюю B.
В передающей камере световые потоки с помощью трех передающих трубок
преобразуются в электрические сигналы Er, Eg и Eb, несущие информацию только об
определенном
цвете.
Сигналы Er, Eg и Eb проходят через гамма-корректор ГК, где происходит компенсация
искажений, вызванных нелинейной зависимостью яркости свечения экрана кинескопа от
амплитуды модулирующего сигнала. (Сигналы, прошедшие через гамма-корректоры ГК
принято обозначать со штрихом. В дальнейшем для упрощения штрихи в тексте опущены.)
В матрице М все три сигнала Er, Eg, Eb складываются в определенной пропорции для
получения яркостного сигнала Ey.
В вычитающих устройствах из сигналов основных цветов Er и Eb вычитается сигнал
яркости Ey, в результате чего на выходах образуются цветоразностные сигналы Er-y и Eb-y.
Сигнал Er-y поступает на смеситель и фазоинвертор. Здесь сигнал Er-y усиливается и
преобразуется в сигнал Dr = -1,9 Er-y. Сигнал же Еb-y преобразуется в сигнал Db = 1,5 Eb-y
(см.
рис.10
а).
Использование несколько видоизмененных цветоразностных сигналов значительно
улучшает совместимость и помехоустойчивость системы. В смесителях сигналы Dr и Db
вводят
сигналы цветовой синхронизации (сигналы опознавания строк), необходимые для
правильной работы электронного коммутатора в телевизоре.
Сигналы цветовой синхронизации представляют собой девять импульсов в форме
усеченной трапеции с полярностью, изменяющейся от строки к строке (рис.11а). Эти
импульсы модулируют по частоте поднесущие цветности for и fob, увеличивая в красных
строках
или
уменьшая в синих строках их частоту (рис.116).
Сигналы цветовой синхронизации передаются во время кадрового гасящего импульса КГИ
в строках 7-15 и 320-328 (рис.11б). Согласно рекомендации международной
консультативной комиссии - МККР, покадровая цветовая синхронизация в дальнейшем
будет исключена, чтобы освободить место для передачи другой информации, например,
сигналов
телетекста.
В качестве сигналов цветовой синхронизации можно использовать защитные пакеты
(вспышки), передаваемые на задней площадке строчного гасящего импульса (рис.11в).
Защитные пакеты имеют частоту поднесущих сигналов цветности for и fob и служат для
завершения переходных процессов в канале цветности телевизора до начала активной части
строки. Используются защитные пакеты и для формирования в цветоразностных сигналах
плоских участков для фиксации уровня черного. Затем сигналы Dr и Db проходят фильтры
нижних частот - ФНЧ, в которых спектр этих сигналов ограничивается до 1,5 МГц.
С выхода ФНЧ сигналы поступают на устройство НЧ предыскажений НЧП, где происходит
подъем высокочастотных составляющих сигналов Dr и Db. Предварительная коррекция
этих
сигналов производится с целью повышения их помехоустойчивости. На рис.12 показана
цепь,
выполняющая подобную коррекцию.
На рис.13 приведена амплитудно-частотная характеристика
Форма сигналов Dr и Db после НЧ-коррекции представлена на рис.10б.
этой
цепи.
Врезультате
НЧкоррекции
в
сигналах
появляются
выбросы
на
переходах.
Амплитуда
выбросов ограничивается таким образом, чтобы не допустить чрезмерного увеличения
девиации
частоты поднесущих. Далее сигналы Dr и Db поступают на частотный модулятор ЧМ через
электронный коммутатор ЭК, управляемый импульсами полустрочной частоты.
Коммутатор ЭК попеременно подключает цветоразностные сигналы к частотному
модулятору. На второй вход модулятора через другой коммутатор поступают, также
попеременно, поднесущие частоты красного и синего цветоразностных сигналов.
Оба коммутатора работают синхронно, поэтому, когда передается красный
цветоразностный
сигнал, на модулятор поступает поднесущая частотой for = 4,406 МГц, а когда передается
синий цветоразностный сигнал, на модулятор поступает соответственно поднесущая
частотой fob = 4,250 МГц. Следует отметить, что поскольку поднесущие частоты for и fob
передаются поочередно, то усматривается целесообразность выбора значения одной
частоты.
Так,
собственно,
и
было
сделано
в
первом
варианте
системы
SECAM.
Однако дальнейший опыт эксплуатации показал, что наилучшие условия
помехозащищенности возникают, когда цветоразностные сигналы модулируют свою
поднесушую. Этим и объясняется использование двух поднесущих частот for и fob.
Для уменьшения заметности на экране телевизора помех от поднесущих в коммутаторе
фазы осуществляется переключение фазы каждой из поднесущих на 180 градусов через две
строки.
В блоке высокочастотных предыскажений ВЧП сигналы цветности пропускаются через
специальный фильтр, в котором поднесущие подавляются, также с целью ослабления
видимости
этих
поднесущих
на
черно-белом
изображении.
Амплитудно-частотная характеристика (рис.14) этого фильтра имеет форму перевернутого
колокола - "антиклеш" (франц.).
После прохождения через цепь ВЧ-предыскажений амплитуда сигналов цветности
делается зависимой от частоты девиации (при частотной модуляции частота
модулированного колебания отклоняется от своего среднего значения, равного несущей
частоте f0, в большую и меньшую сторону на определенную величину, называемую
девиацией частоты). Форма сигналов цветности после высокочастотных предыскажений
показана на рис.15а. Далее сигналы цветности подвергаются дополнительной амплитудной
модуляции. Для этого в специальном устройстве (на структурной схеме не указано) из
сигнала Еу вырабатывается напряжение с частотами, близкими к частотам поднесущих. Эти
напряжения и подаются на амплитудный модулятор. Дополнительная амплитудная
модуляция сигналов цветности уменьшает помехи, вызываемые сигналом яркости Еу в
канале цветности телевизора. Сигнал яркости Еу с выхода матрицы М поступает на
смеситель, где смешивается с синхроимпульсами. Затем сигнал яркости проходит линию
задержки
на
0,4
мкс,
чтобы
компенсировать запаздывание сигналов цветности. В блоке сложения сигнал яркости
смешивается с сигналами цветности, образуя полный цветовой телевизионный сигнал
(рис.15б).
Следует добавить, что перед поступлением в блок сложения сигналы цветности
проходят
коммутатор К, где происходит подавление поднесущих при поступлении кадровых и
строчных синхроимпульсов. Таким образом, цветовые поднесущие присутствуют постоянно
во
время
передачи видеосигнала, кроме моментов времени, когда передаются синхросигналы. Это
необходимо для нормальной работы строчной и кадровой разверток в телевизоре.
Страна
Россия, Болгария,
Венгрия, Польша
Саудовская Аравия,
Греция, Иран, Египет,
Ливия
Полоса
fиз видеокаМВ ДМВ
fн.зв.,
нала,
МГц
МГц
Полоса
ТВ
канала,
МГц
Модуляция
несущей
звука,
МГц
Полярность
модуляции
Вариант
несущей
стандарта
изображения
D
K
6
6,5
8
ЧМ
Негатив
I
B
G
5
5,5
7
ЧМ
Негатив
II
Франция
L
L
6
6,5
8
АМ
Негатив
III
Бения,Кабон,Конго,
Мадагаскар, Новая
Каледония, Того,
Kl Kl
6
6,5
8
Марокко, Сирия
B
5
5,5
7
ЧМ
Негатив
IV
H
Особенности декодирования системы SECAM
На рис.16 показана структурная схема декодирующего устройства системы SECAM.
Полный цветовой телевизионный сигнал поступает на полосовой фильтр "Клеш" (или
корректор высокочастотных предыскажений КВП), настроенный на частоту 4,286 МГц.
Фильтр выделяет сигналы цветности из ПЦТС и, кроме того, производит обратную
коррекцию высокочастотных предыскажений, вводимых на передатчике для повышения
помехоустойчивости системы. После фильтра "Клеш" сигналы цветности поступают на
усилитель-ограничитель, где они усиливаются и ограничиваются по амплитуде. Затем
сигналы цветности поступают одновременно в прямой и задержанный каналы. По прямому
каналу сигналы поступают на вход 1 электронного коммутатора, а в задержанном канале
сигналы цветности попадают на ультразвуковую линию задержки УЛЗ, где задерживаются
на длительность одной строки 64 мкс, затем поступают на вход 2 коммутатора ЭК.
Коммутатор ЭК переключается с помощью симметричного триггера Тр, который
вырабатывает прямоугольные импульсы длительностью в одну строку. Триггер запускается
специальными стробирующими импульсами, чередующимися с частотой строк fстр. В
течение одной строки ЭК находится в положении, когда соединен вход 1 с выходом 1' и
вход 2 с выходом 2', а в течение следующей строки вход 1 соединен с выходом 2' и вход 2 с выходом 1'.
Так как УЛЗ задерживает сигнал цветности на время строки, то на входах
электронного коммутатора будут всегда действовать одновременно сигнал цветности
красной строки и сигнал цветности синей строки. При правильной фазе работы триггера Тр
электронный коммутатор будет направлять в канал "красного" сигнал цветности красной
строки, а в канал "синего" - сигнал цветности синей строки. Для правильной работы
триггера, чтобы сигналы попадали в "свои" каналы, на него подаются импульсы с блока
цветовой синхронизации БЦС. Напомним, что импульсы цветовой синхронизации
передаются в течение девяти строк на задней площадке кадрового гасящего импульса. Блок
цветовой синхронизации отпирается кадровыми гасящими импульсами КГИ, т. е. во время
действия импульсов опознавания. На второй вход БЦС поступают сигналы опознавания из
канала "красного" (можно использовать сигналы опознавания из канала "синего"). При
правильной фазе работы триггера на блок цветовой синхронизации будут поступать
сигналы опознавания красной строки (частотой 4,67 МГц), на выходе БЦС будут
действовать импульсы с полярностью, которая не повлияет на работу триггера. При
неправильной фазе работы триггера на БЦС будет поступать сигнал опознавания синей
строки (частотой 3,9 МГц). Тогда на выходе БЦС будут действовать импульсы с
полярностью, которая изменит фазу работы триггера Тр. Итак, с выхода электронного
коммутатора сигналы цветности поступают на соответствующие частотные детекторы ЧД.
Так как на входе частотного детектора красного действует сигнал Er-y, а на входе детектора
синего - сигнал Еb-y, то наклоны амплитудных характеристик частотных детекторов
должны иметь противоположное значение, для того чтобы на их выходах образовались
цветоразностные сигналы одной полярности.
С выхода частотных детекторов цветоразностные сигналы Er-y и Eb-y поступают на
корректоры низкочастотных предыскажений КНЧ, после которых форма цветоразностных
сигналов будет соответствовать форме исходных цветоразностных сигналов Еr-y и Eb-y.
После усиления в усилителях У1 и У2 цветоразностные сигналы поступают на матрицу М1,
где в результате их сложе-ния в определенной пропорции выделяется цветоразностный
сигнал
Eg-y. В матрицах М2, M3, М4 в результате сложения цветоразностных сигналов с
яркостным
сигналом Еу выделя-ются сигналы основных цветов Еr, Еg и Eb. С выходов матриц сигналы
Еr, Еg и Eb поступают на выходные усилители, где усиливаются до уровня, необходимого
для модуляции токов лучей кинескопа. Система SECAM, как и другие системы цветного
телевидения, имеет свои достоинства и недостатки. Так, например, по сравнению с NTSC
фазовые искажения не приводят к искажению цветового тона изображения. Однако в
системе
SECAM
цветовая
четкость
снижена вдвое, так как сигналы цветности передаются через строку и в телевизионном
приемнике недостающий сигнал занимается из предыдущей строки. Сравнивая между собой
все три системы по разрешающей способности, можно отметить, что самую высокую
цветовую четкость по вертикали имеет система NTSC, за ней следует система PAL, а
система SECAM занимает третье место.
Бытовые видео форматы
Рассмотрим качественные характеристики таких популярных видеоформатов, как
VHS, S-VHS, Video8, Hi8.
В современном стандарте телевещания принято передвать телевизионный сигнал с
разрешением 625 строк по горизонтали, с шириной полосы видеосигнала порядка 6,5 МГц.
Для того, чтобы осуществить запись на магнитную ленту сигнала с таким спектром
необходимо достичь огромной скорости перемещения магнитной головки вдоль ленты >=
55 м/с! (200 км/ч)! Современные технологии изготовления бытовых лентопротяжных
механизмов (ЛПМ) с барабанами вращающихся головок (БВГ) позволяют достичь скорости
порядка 4,2 м/с. Поэтому, естественно, встает вопрос о сужении спектра видеосигнала в
бытовой видеоаппаратуре.
Создатели бытовой видеоаппаратуры пошли на компромисс и предложили
ограничиться поначалу шириной полосы в 2,5 МГц. Это означает потерю четкости
(размытие) изображения по строке развертки, так как именно высокочастотные
составляющие видеосигнала образуются различимыми мелкими деталями исходного
изображения. Так первый серийный бытовой видеоформат системы VHS (Video Home
System) как раз и регламентирует ширину спектра видеосигнала в 2,5 МГц. Поэтому
бытовые видеомагнитофоны системы VHS позволяют записывать и воспроизводить
изображение с разрешением порядка 200-240 линий по горизонтали. Формат VHS был
разработан еще в начале 70-х годов, за это время видеоиндустрия предложила более
совершенные аналоговые видеоформаты. Так продолжением VHS стал формат супер-VHS
(S-VHS), в котором благодаря применению более современных типов лент и механизмов
ЛПМ было достигнуто разрешение по горизонтали порядка 400 линий.
Но простого сужения спектра сигнала недостаточно для нормального
функционирования видеосистемы, так как на частоте 4,43 МГц расположена цветоносная
поднесущая. Ясно, что при записи информация о цвете будет обрезана, поэтому приходится
производить "хирургические операции": для этого сигналы цветности выделяют и
переносят в низкочастотную часть спектра. Мало того, чтобы избавиться от неприятных
искажений, при записи применяют частотную модуляцию сигнала. Поэтому спектр
записываемого и воспроизводимого сигнала в два раза шире, чем спектр исходного.
Формат
видеозаписи
Ширина спектра
модулированного
видеосигнала, МГц
Потенциальное
максимальное
разрешение по
горизонтали, число
линий
VHS
3,8~4,8
<=268
S-VHS
5,3~7 МГц
<=392
Video8
4.2~5.4 МГц
<=302
Hi8
5,8~7,7 МГц
<=431
Заявленное
горизонтальное
разрешение по
паспорту, число линий
200 (240 HQ - High
Quality)
400
250 (280 XR eXtended Resolution)
400 (420 XR)
Можно заметить противоречивые данные в таблице для S-VHS, мы можем объяснить
это только погрешностью расчета, любо неточными паспортными данными. Но как бы там
ни было, можно сделать один вывод: аппараты формата S-VHS функционируют на пределе
своих возможностей.
«Воруем» изображение с помощью плат захвата
видеокадров.
Точно так же, как звуковая плата позволяет вам записывать звук на своем ПК, плата
видеозахвата (или видеограббер) позволяет записывать изображение.
Платы захвата видеокадров бывают двух типов. Первый тип предназначен для
захвата неподвижных изображений, их еще называют грабберы кадров. Принцип работы
платы такой же, как и у пленки в фотоаппарате. Более дорогие платы второго типа могут
захватывать целые фильмы.
При записи фильмов компьютеры сжимают поступающую информацию в файл
минимальных размеров, зачастую в сотни раз меньший первоначального, путем различных
ухищрений. Мы подошли к рассказу о КОДЕКЕ. При записи в файл компьютеры
выполняют КОмпрессию видеоданных, а при воспроизведении - обратную операцию ДЕКомпрессию (отсюда КО-ДЕК). Одни кодеки реализованы аппаратно, на основе
специальных микросхем, встроенных в плату захвата, другие - программно, имеются и
смешанные программно-аппаратные варианты. Есть платы, которые захватывают всю
поступающую информацию, сохраняют ее в огромном файле на диске и лишь когда
входной поток заканчивается, плата, наконец, выполняет компрессию и файл приобретает
нормальный размер. Другие платы, как например Smart Video Recorder фирмы Intel
содержат в своем составе суперскоростные микросхемы захвата и компрессии видеоданных
«на лету». Часто используемыми являются кодеки представленные в таблице 1. В таблице 2
приведен список доступных сегодня аппаратных расширений для работы с видео.
Таблица 1
Кодеки
Это самый распространенный кодек, он обычно
справляется с большинством задач. Свою популярность
Microsoft Video
приобрел благодаря тому, что распространяется с
1
бесплатно с пакетом Video for Windows фирмы
Microsoft
Microsoft RLE
Microsoft RLE поддерживает только 8 разрядов цвета,
максимум 256 цветов. Использует алгоритм
последовательного кодирования длины.Используйте
этот кодек для видео с низкой степенью детализации
при воспроизведении на маломощных компьютерах
(процессор 386SX или 16-цветная видеоплата). Лучше
всего применять для видео с "говорящими головами"
(дикторами) - количество движений здесь минимально.
Intel Indeo
Этот кодек всегда захватывает 16 млн. цветов и затем
адаптирует изображение под конкретную аппаратуру
при воспроизведении. Платы со специальной
встроенной микросхемой видеозахвата фирмы Intel
(i750) существенно ускоряют процесс захвата и
воспроизведения. Чисто программным способом
достичь такой скорости невозможно.
Intel Indeo 3.1/3.2
Один из старейших кодеков, появившихся на рынке.
Качество сжатого видеоизображения немного лучше,
чем у Cinepak. Однако, кодек более требователен к
ресурсам процессора. Indeo 3.1/3.2 представляет собой
менее асимметричный кодек – время компрессии и
декомпрессии видеоизображения примерно равны.
Максимальный коэффициент компрессии составляет
15:1. Кодирует видеоизображение в 24-битном
разрешении цвета. Алгоритм сжатия использует
векторную квантизацию и межкадровую разность.
Кодек наиболее подходит для сжатия изображения с
“говорящими головами”. Процесс сжатия
видеоизображения на порядок быстрее, чем у Cinepak.
Видеоизображение, сжатое при помощи кодека Indeo
R3.2, имеет цветовые артефакты – изображение
расплывается и получает красно-синий оттенок.
Indeo 4.1
Indeo Indeo Video Interactive, Indeo 4.1, является
следующей принципиально новой версией кодека от
Intel, основанной на гибридном алгоритме DWT. Indeo
4.1 поддерживает множество особенностей в
дополнение к новому алгоритму сжатия, например
прозрачность. При низкой скорости передачи данных
при применении алгоритмов , использующих
дискретное преобразование элементарной волны
(DWT), проявляется размытие в гранях объектов и
также артефакты "окружения" около граней, но нет
блочныех артефактов, явно видимых при ДКП.
Indeo Video Interactive 5.x
Indeo 5.1 использует новый улучшенный алгоритм
DWT для увеличения качества видео. Indeo 5.х
включает такие особенности как прогрессивная
загрузки для Internet, прозрачность, спрайты, и т.д.
Хронология выпуска Indeo Видео 5.x:
Intel Indeo 5.10 (02 февраля 1999г.)
Intel Indeo 5.06 (1998г.)
Intel Indeo 5.0 (1997)
Все выпуски Indeo 5.x, используют четырехсимвольный
код IV50.
MPEG (Motion
Picture Expert
Group)
Метод MPEG считается одним из лучших методов
компрессии. Он также один из самых сложных методов,
поэтому для записи и воспроизведения видео требуется
дорогостоящие MPEG-платы (значительно дешевле
обойдутся MPEG-проигрыватели (MPEG-playback),
которые позволяют только воспроизводить сжатые
таким образом файлы (обычно с компакт дисков,
которые могут содержать видеопродукцию от
видеоклипов до полнометражных фильмов). Прим. ред.)
JPEG (Joint
Photographic
Expert Group)
Первоначально этот метод применялся только для
неподвижных изображений. Теперь он также
используется и для видеозаписи
Motion JPEG
Большинство систем захвата и редактирования видео на
PC используют стандарт сжатия видео Motion JPEG. В
Motion JPEG, каждый кадр видео сжимается отдельно,
используя алгоритм JPEG сжатия неподвижных
изображений. Алгоритмы, аналогичные разности
кадров или компенсации движения не используются.
Это позволяет производить точное редактирование
кадров без потери качества изображения при
возможном редактировании.
Ситуация в отношении стандарта для Motion JPEG
усложнена тем, что отсутствует промышленный
стандарт для Motion JPEG. Microsoft имеет Motion
Microsoft JPEG кодекер и JPEG DIB. Расширения
OpenDML Avi формата AVI также включают
поддержку Motion JPEG. Motion JPEG обычно
использует четырехсимвольный код 'MJPG'.
Motion JPEG используется при редактировании и
создании видео, но редко для его распространения.
Editable MPEG
По крайней мере две компании определили стандарт
Editable MPEG в AVI файлах. Xing Technology editable
MPEG AVI использует четырехсимвольный код XMPG.
Компания Sigma Design определяет его, используя
четырехсимвольный код MPGI. Данный стандарт
соответствует стандарту MPEG, за исключением
компенсации движения. Во многом он похож на Motion
JPEG.
VDOWave или
VDOLIVE от
VDONET
Основанный на преобразовании элементарной волны
кодек видео. Microsoft лицензировал VDOWAVE как
часть NetShow . Имеются две версии VDOWAVE кодердекодера. VDOWave 2.0 - кодек фиксированной
задержки пакетов в канале , который использует
Microsoft, четырехсимвольный код VDOM.. VDOWave
3.0 - "масштабируемый" кодек видео. Этот кодек
использует Microsoft четырехсивольный код (FOURCC)
VDOW. В NetShow 2.0, автономная установка клиентов
устанавливает VDOWAVE декодер. VDOWave
использует комбинацию алгоритмов сжатия
элементарной волны и компенсации движения.
Cinepak
Один из старейших кодеков, появившихся на рынке.
Первоначально был разработан фирмой SuperMatch.
Однако, впоследствии был переработан другой фирмой
– Radius. Свою популярность кодек получил благодаря
использованию минимальных ресурсов процессора.
Максимальный коэффициент компрессии составляет
10:1. Кодек выдает среднее качество видеоизображения
из-за чрезмерной пикселеризации (изображение
выглядит “шероховатым”). К недостаткам кодека также
относится изменение насыщенности цвета в
видеоизображении, что влечет за собой определенный
визуальный эффект – изображение становится более
желтым. Cinepak – наиболее асимметричный кодек.
Кодирует видеоизображение в 8- и 24-битном
разрешении цвета. Алгоритм сжатия использует
векторную квантизацию (vector quantization) и
межкадровую разность. Плохо работает с
видеоизображением, частота воспроизведения которого
превышает 15 кадров в секунду. Кодек хорошо сжимает
синтезированное динамическое видеоизображения – 2D
и 3D анимацию. В случае черно-белого
видеоизображения, кодек представляет возможность
произвести сжатие в 8-битном режиме с 256 оттенками
серого.
В настоящее время корпорация Compression
Technologies продает улучшенный кодек CinepakPro, в
котором усранены основные проблемы, которые
встречались у стандартного Cinepak. CinepakPro
полностью совместим с Cinepak.
Spigot
Эти кодеки работают с платами видеозахвата компании
Creativ Labs
Ultimotion
Кодек, разработанный фирмой IBM для применения в
операционной системе OS/2 (технология мультимедиа
здесь имеет особое название - ultimedia). Результат
выглядит замечательно, на вам необходима для работы
OS/2
ClearVideo
(RealVideo)
ClearVideo - кодек видео от Iterated Systems. Компания
Iterated Systems также лицензировала технологию
ClearVideo технологию Progressive Networks,
изготовителю RealAudio, под названием RealVideo.
ClearVideo использует рекурсивное сжатие.
Рекурсивное кодирование видео достаточно медленное
(требовательно к вычислительным ресурсам). Качество
видео аналогично или несколько выше MPEG-1.
SFM (Surface
Fitting Method)
Корпорация Crystal Net стремится лицензировать
технологию SFM. Этот кодек рассчитан на
использование при большой задержке пакетов в канале
для IDSN и коммутируемого соединения.SFM
использует алгоритм контур-основанного кодирования
изображения.
QPEG
Q-group производит avi кодек известный как QPEG. На
6/27/97, QPEG поддерживал 8 разряда цвета. Известно,
что Q-группа планирует поддержку 16 и 24 разряда
цвета, MMX поддержку, и другие дополнительные
особенности в будущем. Q-группа также работает НАД
MPEG-4 для PC.
H.261
H.261 - рекомендация, разработанная и
оптимизированная для передачи цветного
видеоизображения по каналам данных системы IDSN со
скоростями px64 Кбит/с и фиксированными значениями
задержек пакетов в канале. В H.261 реализована
комбинация алгоритмов ДКП и компенсации движения
движения В алгоритме применяется формат CIF(
Common Intermediate format) c разрешением 352
пикселей для яркостного сигнала илиQCIF ( Quarter
CIF) с четвертной частью разрешения CIF (то есть
176D). Скорость кадровой развертки равна 29.97 кадра
в секунду. Необходимо отметить, что при
использовании формата CIF, цветоразностные сигналы
передаются с разрешением 176D пиксела, каждый
пиксел описывается восемью битами.
H.263
H.263 - стандарт, основанный на ДКП и компенсации
движения. H.263 имеет множество
усовершенствований, главным образом в области
компенсации движения, по сравнению с более раним
стандартом H.261. Это позволяет добится еще более
высокого сжатия видео.
MPEG-4
MPEG-4 - новый международный стандарт от
Международной Организации Стандартизации.
Алгоритм MPEG-4 близок к рекомендации H.263.
Имеются три версии MPEG-4 для Windows от Microsoft.
Самой современной, от 25 октября, 1999 г., является
Microsoft MPEG-4 Версия 3 . Аудиовизуальный сигнал
в MPEG-4 можно передавать в реальном времени
потоком не более 48-64 кбит/с.
Lightning Strike Infinop предлагает основанный на алгоритме
(Infinop)
преобразования элементарной волны кодек видео под
названием Lightning Strike (удар молнии). Декодер
Lightning Strike, совместимый с Microsoft NetShow
доступен на Веб сайте Infinop. Насколько известно,
кодер Lightning Strike не распространяется свободно.
VxTreme
VxTreme был приобретен Microsoft в сентябре 1997.
Microsoft вложил капитал в несколько компаний,
занимающихся разработкой кодеков с большими
значениями задержек пакетов в канале в течение второй
половины 1997, таких как VxTreme, VDONet,
Progressive Networks/Real Networks, и Lernout и Hauspie
Speech Products. VxTreme использует алгорим сжатия,
основанный на преобразовании элементарной волны.
Субъективное качество изображения сжатого VxTreme
достаточно хорошее, намного выше кодеков,
основанных на ДКП и VDOWAVE. Текст типа
заголовков кинофильма и титров кодирует очень
хорошо, в отличие от ДКП, где основной проблемой
является сохранение острых граней текста. Вообще,
wavelet сжатие изображения сталкивается с проблемами
острых граней тоже. По качеству изображения VxTreme
не сильно отличается от MPEG-4 или H.261.
Таблица 2
Аппаратные расширения для работы с видео
Название
Функциональное назначение
Genius HiVideo
Захватчик кадров, 640*480 Hi color
AVer Video Commander 1
Захватчик кадров, 3 входа VHS, PAL, NTSC
AVer Video Commander 2
Захватчик кадров, 2 входа VHS, SVHS, PAL, NTSC,
SECAM
Aver Video Commander 3
Захват и воспроизведение видеопоследовательностей
MJPEG 25 кадр/с и отдельных кадров с разрешением
768*576
PrimeTime TV tuner
ТВ-тюнер+захватчик кадра (эфир или видеовход), PAL,
NTSC, SECAM D/K
TEKRAM TV Capture
M200
ТВ-тюнер+захватчик кадра (эфир или видеовход),
PAL/SECAM с пультом ДУ
TOP OAK
VGA/TV/CAPTURE card
ТВ-тюнер PAL/SECAM совмещенный с видеоадаптером
Aver FunTV
ТВ-тюнер
miro Video DC20 PCI
Аппаратный MJPEG кодер/декодер (PAL, NTSC, SECAM
для сигналов SVHS) для записи на диск и последующего
нелинейного монтажа
FAST AV Master
То же, но имеет возможность записи и воспроизведения
звука и может быть задатчиком на шине PCI
FAST F60
То же, но только ISA
PVR DPS
Две платы, одна из которых поддерживает автономное
использовани е SCSI винчестера, аппаратный MJPEG
кодер/декодер (PAL, NTSC, SECAM) соответствует
стандарту BETACAM SP
MPEG ENCODER VITEC
NT PRO
Аппаратный MPEG-1 кодер видео и звука
MPEG MASTER SE95
Воспроизведение только полноэкранного MPEG-1,
выходные сигналы для монитора VGA и ТВ (SVHS в
формате PAL)
MPEG MASTER DRAMA
То же, но в окне произвольного размера
MPEG LABWAY, MPEG
GRAND
Аналогичны прешествующей модели
AVer KEY+
Преобразователь сигналов VGA (800*600 HI color) в ТВ
формат PAL - SVHS и RGB
AVer KEY 3 PRO
То же, но с пультом ДУ, памятью на кадр 800*600,
аппаратное масштабирование, полностью аппаратное
преобразование
AVer KEY 5 PRO
То же с дистанционной мышью и развитыми функциями
управления
VGA Aver PRO
Совмещенный с видеоадаптером преобразовтель в формат
VHS, SVHS с наложением титров и графики на
проходящий видеосигнал (с видеовхода на видеовыход),
есть версия для BETACAM
AVer Title Mate
То же но в формате VHS, наложение графики 256 цветов,
800*600
Критерии оценки плат видеозахвата.
1.Компьютерная платформа.
Первое, что нужно для себя решить - на какой платформе вы собираетесь работать PC или MAC (более мощные платформы - тема отдельного разговора). При нынешнем
развитии персональных компьютеров, производительность и возможности обеих платформ
весьма близки, поэтому на чем работать - в большой степени дело вкуса. Однако следует
учесть,что средняя стоимость аналогичных по возможностям систем для MAC несколько
выше, как и стоимость технической поддержки.
2.Системы телевидения.
Одним из важных показателей платы является то, в какой системе телевидения она
может работать. Лучше всего, чтобы плата была мультисистемной, то есть поддерживала бы
PAL, NTSC и SECAM. Однако надо учитывать (особенно при покупке за рубежом), что
некоторые платы имеют свою версию для каждой из систем, в этом случае надо
естественно, брать PAL-версию. Небольшое количество плат поддерживают простейшие
функции транскодирования, однако качество преобразования чаще всего оставляет желать
лучшего.
3.Виды сигналов.
Следующая важная характеристика - с какими видами сигналов работает плата. Здесь
выбор зависит прежде всего от имеющейся у вас видеоаппаратуры. Например если вы
работаете со стандартом S-VHS, нет смысла переплачивать за компонентные (YUV/RGB)
входы/выходы, наверняка можно найти более приемлимое решение. Некоторые платы
имеют версию с S-Video входами с возможностью upgrade до компонентной или цифровой
(как правило D1) версии и, если вы расчитываете на перспективу, это может стать неплохим
выбором.
Отдельный разговор - о формате DV. Многие фирмы выпустили недорогие
видеокамеры этого формата, но в данном случае имеет смысл говорить лишь о тех, которые
поддерживают стандартный интерфейс IEEE 1394 FireWare. Для того, чтобы вводить в
компьютер данные в цифровой форме, сушествует два готовых решения. Первое - помимо
платы видеозахвата, использовать отдельную плату интерфейса FireWare - такие платы
выпустили по крайней мере три производителя. В этом случае для получения доступа к
видеоматериалу надо сначала ввести видеоданные с камеры (кассеты) в компьютер по
цифровому каналу, после чего программно сконвертировать их в формат "понятный" вашей
плате видеозахвата. Время конвертации - 5-8 "реальных времен", кроме того из-за
рекомпрессии возможно некоторое падение качества. После этого видеоматериал можно
обработать на компьютере и сбросить на ленту уже в аналоговой форме. Такая
конфигурация хорошо подходит тем, у кого уже есть плата видеозахвата.
Второе решение более предпочтительно, хотя может оказаться несколько дороже приобрести плату видеозахвата, которая уже имеет интерфейс FireWare и может
непосредственно работать в формате DV, то есть осуществлять ввод/вывод и нелинейный
монтаж в этом формате. В этом случае конвертации и рекомпрессии не требуется. На
момент написания статьи на рынке была доступна только одна такая плата и, по крайней
мере две должны были появиться в ближайшее время.
4.Компрессия.
Этот параметр один из наиболее важных, определяющих качество оцифровки
видеосигнала платой, поэтому расскажем о нем подробнее. Полный поток видеоданных
слишком велик, чтобы быть записанным напрямую (если использовать для записи один
жесткий диск), и для его уменьшения применяют сжатие (компрессию). Естественно, при
этом снижается качество видеоматериала, поэтому чем меньше сжатие, тем лучше качество,
но тем больше места на диске занимает каждый кадр, поэтому нужно найти приемлимый
компромисс. Чтобы лучше разобраться с этим параметром необходимо знать следующее:
Один видеокадр стандарта PAL полного разрешения содержит 768x576D2368 точек. В
большинстве современных плат используется кодировка выборкой 4:2:2 YUV. При этом
яркости сигнала (Y) соответствует 8 бит и по четыре бита приходится на каждую из
цветоразностных составляющих (U и V), всего получается 16бит(2 байта) на точку. Значит
один кадр занимает 442368x26Байт=0.84375МБайт. Поскольку в стандарте PAL
используется частота 25 кадр/с, то полный поток некомпрессированных видеоданных
составит 0.84375x25!.1МБайт/с, а для стандарта NTSC - 17.6Мбайт/с. На эту разницу
следует обратить внимание, поскольку фирмы - производители обычно указывают
минимальную компрессию для стандарта NTSC, а так как поток там меньше, то и степень
компрессии ниже.
Если данные о компрессии не доступны, то о ней можно судить косвенно - по
максимальному потоку или по объему видео, помещающегося на 1 Гбайт, для чего можно
воспользоваться формулой Ккомпр = 21.1 / P (где Ккомпр - коэфициент компрессии P поток для данной платы, МБайт/с) или таблицей :
Поток видеоданных,
Максимально
Объем видео на 1ГБайт
Степень
МБайт/с
достижимое
компрессии
PAL
NTSC
PAL
NTSC
качество
1:1
49 сек.
58 сек.
Исходное
21.1
17.6
2:1
1мин.38сек. 1мин.56сек.
105
8.8
4:1
3мин.14сек. 3мин.53сек.
Betacam SP
5.3
4.4
5:1
4мин.02сек. 4мин.51сек.
4.2
3.5
8:1
6мин.28сек. 7мин.46сек.
2.6
2.2
10:1
8мин.05сек. 9мин.42сек.
2.1
1.76
12:1
9мин.54сек. 11мин.34сек.
S-VHS,Hi8
1.7
1.5
15:1
12мин.08сек. 14мин.34сек.
1.4
1.2
20:1
16мин.10сек. 19мин.25сек.
VHS,Video8
1
0.88
Данные конечно приблизительные, но параметры большинства плат оцифровки не
должны отличаться от них блолее чем на 5-10%.
Сейчас существует несколько плат, с помощью которых можно записывать видео в
цифровой форме без компрессии. Все они используют встроенные сдвоенные контроллеры
и требуют для работы минимум четыре жестких диска AV(AudioVideo) формата SCSI
(WIDE SCSI). При современной цене на эти диски область применения таких плат довольно
узка.
5.Режим overley.
Если плата поддерживает этот режим, то вы можете просматривать "живое"
полноэкранное видео на компьютерном мониторе. Данная возможность позволяет сделать
работу более простой и наглядной, кроме того отпадаает необходимость постоянно
пользоваться видеомонитором (или телевизором) для просмотра видеоматериала.
Запомните - оверлей должен быть "чистым" - без подёргиваний и стробирования. Если
такой режим есть, следует узнать, при каких разрешениях и с какими графическими
адаптерами он обеспечивается, иначе возможно, понадобится менять SVGA-карту.
6.Звуковые возможности.
Естественно, вы хотите оцифровывать видео совместно со звуком. В недорогих
платах видеозахвата для этой цели требуется использовать отдельную звуковую карту,
которая, впрочем сегодня имеется в большинстве компьютеров. При этом могут иногда
возникать проблемы с синхронизацией звук-видео ( обычно при воспроизведении звук
постепенно опережает видео). Чтобы этого не случилось, необходимо узнать с какими
именно звуковыми картами нормально работает данная плата захвата видео. Некоторые из
них имеют специализированную звуковую плату, поставляющуюся отдельно. Конечно
лучше всего, если звук встроен в саму плату видеозахвата, тогда большинство прблем
снимается.
7.Программное обеспечение и ускорители.
Плату оцифровки видео приобретают, как правило, для нелинейного видеомонтажа.
Для этого используются видеомонтажные пакеты, которае помогут украсить ваш
видеоматериал эффектами, фильтрами, титрами и т.д. Многие платы уже включают в
комплект поставки подобные пакеты. При покупке надо также выяснить, с каким еще
программным обеспечением плата может работать и где его можно приобрести.
Пакеты видеомонтажа можно условно разделить на три типа. Первый тип - пакеты,
работающие в просчете. Это означает, что конечный продукт монтажа в этих пакетах - это
файл, являющийся результатом пересчёта нескольких файлов исходного материала с
использованием спецэффектов, титров и т.д. Чтобы монтировать в таких пакетах, нужно
иметь много свободного времени, так как окончательных результатов монтажа приходится
иногда ждать несколько часов, и даже суток, в зависимости от сложности монтажа. Надо
также учесть, что дисковое пространство используется и под исходный видеоматериал, и
под просчитанный, поэтому нужно иметь, как минимум двойной запас места на дисках.
Поэтому такие программы пригодны, как правило, для монтажа небольших фрагментов,
например рекламных роликов или заставок.
В пакетах второго типа результат монтажа - всего лишь монтажный лист, то есть
система временных ссылок, которые указывают, где, когда и с какого места должен
воспроизводиться данный видеофрагмент. В таком пакете монтаж происходит практически
в реальном времени - просчитываются только эффекты, а не весь видеофрагмент, поэтому
он более универсален и подходит для монтажа большого объёма видеоматериала, например
передач или программ новостей. В то же время просчет некоторых "длинных" эффектов,
таких как картинка-в-картинке, занимает довольно много времени. В связи с этим надо
упомянуть, что некоторые платы видеозахвата имеют встроенный аппаратный акселлератор
просчета эффектов. Иногда он выпускается как отдельное устройство (за отдельные
деньги). Если акселлератор присутствует, следует узнать, ускорение просчета каких именно
эффектов и во сколько раз он обеспечивает.
Третий, и наиболее мощный, тип видеомонтажных пакетов можно назвать "all in real
time". Эти пакеты позволяют делать в реальном времени видеоэффекты, титры, иногда
цветокоррекцию. Естественно, такие пакеты стоят дороже и могут работать только с теми
платами, которые позволяют делать эффекты аппаратно (в двух предыдущих типах пакетов
эффекты делатются программно), зато они абсолютно универсальны и могут быть
использованы для видеомонтажа любой сложности. Некоторые платы видеозахвата имеют
разъем Movie2bus - скоростная шина видеоданных, позволяющая подключать к плате
внешние акселлераторы эффектов реального времени и других устройств обработки видео,
которые могут являться разработками третьих фирм.
8.Жесткие диски.
При покупки платы видеозахвата нужно зарание выяснить, с каким типом
винчестеров данная плата будет обеспечивать необходимую вам производительность. Дело
в том, что некоторые платы, особенно имеющие встроенный контроллер, нормально
работают лишь со строго определёнными дисками, а их стоимость может приближаться к
стоимости самой платы.
9.Установка и наладка.
Ещё один критерий оценки платы - удобство и простота установки. В некоторых
фирмах установка платы может стоить до 20% от цены, у других это входит в стоимость,
третьи вобще этим не занимаются, предпочитая "продавать коробки". Поэтому многие
ставят платы самостоятельно. В этом случае нужно зарание проконсультироваться со
специалистом фирмы и заручиться его поддержкой, хотя бы телефонной. Если вам в этом
откажут, пусть и вежливо, подумайте, следует ли здесь делать покупку. Иногда бывает, что
плата не помещается в компьютер чисто физически - или корпус слишком мал, или мешает
процессорный вентилятор (правда некоторые платы имеют под него специальный вырез).
Сразу узнайте, "встанет" ли плата в ваш компьютер, иначе придется менять материнскую
плату или корпус. Изредка случается что конкретная плата видеозахвата несовместима с
конкретной материнской платой или графическим адаптером. Чтобы избежать всех этих
проблем, лучше всего заказать и компьютер, и плату видеозахвата всборе в одной фирме.
10.Лучше один раз увидеть...
Прочитав в рекламе или обзоре о какой-либо плате видеозахвата, не спешите
хвататься за кошелёк, даже если все её характеристики, в том числе и цена, вас устраивают.
Обязательно убедитесь лично в том, что плата работает именно так, как описано в рекламе.
Большинство фирм имеют демонстрационные центры, где это можно сделать. Например,
если написано, что плата обеспечивает режим оверлей - попросите это продемонстрировать.
Также посмотрите настройки компрессии и потока видеоданных. Мне довелось работать с
платой, которая была анонсирована, как "обеспечивающая качество BETACAM при
компрессии 5:1". При ближайшем рассмотрении выяснилось, что эта цифра указана для
разрешения 320 NTSC. При полном разрешении 640 плата давала компрессию 9:1, а в
стандарте PAL(768x576) компрессия возрастала до 12:1, что обычно считается нижней
границей S-VHS. Как видим, в данном случае даже никого нельзя обвинить в
недобросовестной рекламе. Поэтому нужно узнать,при каком именно разрешении и в каком
стандарте достигается данная степень компрессии. Заявление "качество соответствует
стандарту BETACAM SP" подразумевает работу с компонентными (YUV/RGB) сигналами,
поэтому, если плата не имеет компонентных вохода/выхода, то такое утверждение, мягко
говоря, не соответствует действительности (конечно и с магнитофоном BETACAM можно
работать по S-Video входу, но это означает заведомо ухудшить параметры сигнала).
Попросите, если возможно, оцифровать при вас небольшой видеофрагмент, после чего
оцените качество визуально (оцифрованный с кассеты BETACAM SP видеоматериал, при
компрессии 4:1 на глаз практически неотличим от оригинала). Здесь есть небольшая
хитрость - при демонстрации обычно цифруют крупные планы с высокой контрастностью и
плавным дваижением, так как на такой картинке шумы от компрессии наименее заметны.
Чтобы действительно оценить качество, надо выбирать планы с большим числом мелких
деталей и слабой контрастностью, непример пейзаж в сумерки - в этом случае дефекты от
компрессии заметнее всего. Поэтому лучше всего принести свою кассету, где у вас есть
такие фрагменты и вести оцифровку с неё. Можно даже попросить записать оцифрованный
материал на вашу кассету для более детального рассмотрения в последствии (вполне хватит
10-15-ти секунд хорошо подобранного видеоряда). Конечно никто не обязан вам всё это
делать, но и вы не обязаны покупать "кота в мешке". Если вам говорят, что одна плата хуже
(лучше) другой, узнайте по каким именно параметрам они сравниваются, после чего
сходите и посмотрите конкурирующий продукт. Может случиться, что близкие, казалось бы
по характеристикам платы, существенно отличаются по цене - выясните почему это так и
постарайтесь выбрать оптимальный продукт по соотношению цена/производительность.
Требования к PC.
При оцифровывании видеосигналов, наиболее важный компонент PC, помимо
графической платы, - жесткий диск. Рекомендуем жесткий диск емкостью не менее 10 Gb.
Верхних ограничений здесь нет.
Прежде, чем начнете устанавливать графическую плату и ее программное
обеспечение, убедитесь, что в вашей системе режим DMA (Прямой доступ в память)
включен для EIDE жестких дисков. Эта опция выставляется в Панели Управления (Control
Panel), как показано на рисунке.
Без прямого доступа к памяти не возможно обрабатывать большие потоки данных,
получаемые при оцифровывании видеосигналов. Владельцы SCSI-жесткого диска могут
игнорировать эту отметку. Скорость передачи данных для SCSI систем настолько высока,
что при меньшей частоте центрального процессора PC производительность системы не
изменится.
Здесь же необходимо коснуться вопроса телевизионных стандартов кодирования
цвета. Если на Вашей плате будет поддерживаться только система NTSC (СевероАмериканский стандарт), то Вы не сможете обрабатывать видеосигналы в форматах PAL и
SECAM (распространены в Европе и России). Часто платы позволяют выбрать один из
нескольких форматов. Это возможно посредством перемычек на плате или с помощью
программного обеспечения. Проверьте установки вашей платы, чтобы убедиться, что
установлена необходимая Вам система кодировки.
РОЛЬ КОМПЬЮТЕРА В МУЛЬТИМЕДИЙНЫХ ТЕХНОЛОГИЯ,
ТРЕБОВАНИЯ К ПК, НУЖНА ЛИ МОДЕРНИЗАЦИЯ ВАШЕГО ПК.
ИСТОРИЯ РАЗВИТИЯ МУЛЬТИМЕДИА
Мультимедиа (multimedia) - это современная компьютерная информационная
технология, позволяющая объединить в компьютерной системе текст, звук,
видеоизображение, графическое изображение и анимацию (мультипликацию).
Мультимедиа-это сумма технологий, позволяющих компьютеру вводить, обрабатывать,
хранить, передавать и отображать (выводить) такие типы данных, как текст, графика,
анимация, оцифрованные неподвижные изображения, видео, звук, речь.
20 лет назад мультимедиа ограничивалась пишущей машинкой " Консул ", которая не
только печатала, но и могла привлечь внимание заснувшего оператора мелодичным
треском. Чуть позже компьютеры уменьшились до бытовой аппаратуры, что позволило
собирать их в гаражах и комнатах. Нашествие любителей дало новый толчок развития
мультимедиа (компьютерный гороскоп 1980 года который при помощи динамика и
программируемого таймера синтезировал расплывчатые устные угрозы на каждый день да
еще перемещал по экрану звезды (зачатки анимации)). Примерно в это время появился и
сам термин мультимедиа. Скорее всего, он служил ширмой, отгораживавшей лаборатории
от взглядов непосвященных ("А что это у тебя там звенит ? ". " Да, это мультимедиа ").
Критическая масса технологий накапливается. Появляются бластеры, "сиди ромы" и другие
плоды эволюции, появляется интернет, WWW, микроэлектроника. Человечество
переживает информационную революцию. И вот мы становимся свидетелями того, как
общественная потребность в средствах передачи и отображения информации вызывает к
жизни новую технологию, за неимением более корректного термина называя ее
мультимедиа. В наши дни это понятие может полностью заменить компьютер
практически в любом контексте. В английском языке уже приживается новый
термин information appliance - " информационное приспособление".
Совсем другое развитие получило мультимедиа у нас в стране: В России
мультимедиа появилась примерно в конце 80х годов, и она не использовалась
на домашних компьютерах, а использовалась только специалистами. Поэтому
в статьях газет и журналов тех лет она упоминалась редко. Слово мультимедиа
не вызывало ничего кроме недоумения или шуточек "Какая еще вам, -говорили
мультимедиа! Посмотрите, что в стране делается!" Только в 1993 году многие
поняли или начали понимать важность направления, осознавать роль, которую
технология мультимедиа предстоит сыграть в 90е годы. Слово мультимедиа
стало вдруг таким модным и в нашей стране, и все новые команды и
организации поднимают этот флаг. Образовались новые коллективы
разработчиков систем и конечных продуктов мультимедиа; появились
потребители таких систем и продуктов, при чем весьма нетерпеливые.
Конференция, состоящая 25-26 февраля 1993 года, как бы открыла сезон
мультимедиа в России. 1994 год можно смело назвать годом начала бума
домашнего мультимедиа на российском компьютерном рынке. А в наши дни
мультимедиа - есть почти у всех, у кого есть компьютер и программное
обеспечение на мультимедиа продаются везде разных типов, то есть она вошла
в обиход.
Появление систем мультимедиа, безусловно, производит революционные
изменения в таких областях, как образование, компьютерный тренинг, во
многих сферах профессиональной деятельности, науки, искусства, в
компьютерных играх и т.д.
Резкий рывок в направлении развития мультимедиа, произошедший за
последние несколько лет, обеспечен прежде всего развитием технических и
системных средств. Это и прогресс в развитии ПЭВМ: резко возросшие объем
памяти, быстродействие, графические возможности, характеристики внешней
памяти, и достижения в области видеотехники, лазерных дисков —
аналоговых и CD-ROM, а также их массовое внедрение. Важную роль сыграла
так же разработка методов быстрого и эффективного сжатия / развертки
данных.
Современный
мультимедиа–ПК
укомплектован
активными
стереофоническими колонками, микрофоном и дисководом для оптических
компакт–дисков CD–ROM. Кроме того, внутри компьютера укрыто новое для
ПК устройство — аудиоадаптер, позволивший перейти к прослушиванию
чистых стереофонических звуков через акустические колонки с встроенными
усилителями.
Рассмотрим некоторые технические вопросы, касающиеся мультимедиа.
Основная проблема, из которой “растут” все основные — совместная
обработка разнородных данных: цифровых и аналоговых, “живого” видео и
неподвижных изображений и т.п. В компьютере все данные хранятся в
цифровой форме, в то время как теле-, видео- и большинство аудиоаппаратуры
имеет дело с аналоговым сигналом. Однако выходные устройства компьютера
— мониторы и динамики имеют аналоговый выход. Поэтому простейший и
наиболее дешевый путь построения первых систем мультимедиа состоял в
стыковке разнородной аппаратуры с компьютером, предоставлении
компьютеру возможностей управления этими устройствами, совмещении
выходных сигналов компьютера и видео- и аудиоустройств и обеспечении их
нормальной совместной работы. Дальнейшее развитие мультимедиа
происходит в направлении объединения разнородных типов данных в
цифровой форме на одной среде-носителе, в рамках одной системы.
ВИДЕО
При смешении сигналов основные проблемы возникают с видео–изображением. Различные ТВ–стандарты, существующие в мире (NTSC, PAL, SECAM), применение разных мониторов и видеоконтроллеров диктует
разнообразие подходов в разрешении возникающих проблем. Однако в любом
случае требуется синхронизация двух изображений, для чего служит
устройство генлок (genlock). С его помощью на экране монитора могут быть
совмещены изображение, сгенерированное компьютером (анимированная или
неподвижная графика, текст, титры), и “живое” видео. Если добавить еще одно
устройство — кодер (encoder), компьютерное изображение может быть
преобразовано в форму ТВ–сигнала и записано на видеопленку. "Настольные
видео–студии”, являющиеся одним из примеров применения систем
мультимедиа, позволяют готовить совмещенные видео–компьютерные клипы,
титры для видеофильмов, помогают при монтаже кинофильмов.
Системы такого рода не позволяют как-то обрабатывать или редактировать само аналоговое изображение. Для того, чтобы это стало возможным,
его необходимо оцифровать и ввести в память компьютера. Для этого служат
так называемые платы захвата (capture board, frame grabbers). Оцифровка
аналоговых сигналов порождает огромные массивы данных.. Оцифрованный
кадр может затем быть изменен, отредактирован обычным графическим
редактором, могут быть убраны или добавлены детали, изменены цвета,
масштабы, добавлены спецэффекты, типа мозаики, инверсии и т.д.
Естественно, интерактивная экранная обработка возможна лишь в пределах
разрешения, обеспечиваемого данным конкретным видеоадаптером.
Обработанные кадры могут быть записаны на диск в каком–либо графическом
формате и затем использоваться в качестве реалистического неподвижного
фона для компьютерной анимации. Возможна также покадровая обработка
исходного изображения и вывод обратно на видеопленку для создания
псевдореалистического мультфильма.
Запись последовательности кадров в цифровом виде требует от
компьютера больших объемов внешней памяти: частота кадров в
американском ТВ–стандарте NTSC — 30 кадров/с (PAL, SECAM — 25
кадров/с), так что для запоминания одной секунды полноцветного
полноэкранного видео требуется 20–30 Мбайт, а оптический диск емкостью
600 Мбайт вместит менее полминуты изображения. Но последовательность
кадров недостаточно только запомнить, ее надо еще вывести на экран в
соответствующем темпе. Чтобы выводить на экран компьютера оцифрованное
видео, приходится идти на уменьшение объема передаваемых данных, (вывод
уменьшенного изображения в небольшом окне, снижение частоты кадровой
развертки, уменьшение числа бит / пиксель), что, в свою очередь приводит к
ухудшению качества изображения.
Более радикально обе проблемы — памяти и пропускной способности —
решаются с помощью методов сжатия / развертки данных, которые позволяют
сжимать информацию перед записью на внешнее устройство, а затем
считывать и разворачивать в реальном режиме времени при выводе на экран.
Так, для движущихся видео–изображений существующие адаптивные
разностные алгоритмы, что позволяет разместить на CD–ROM около часа
полноценного озвученного видео. Работа этих алгоритмов основана на том,
что обычно последующий кадр отличается от предыдущего лишь некоторыми
деталями, поэтому, взяв какой–то кадр за базовый, для следующих можно
хранить только относительные изменения. При значительных изменениях
кадра, например, при монтажной склейке, наезде или панорамировании
камеры, автоматически выбирается новый базовый кадр. Для статических
изображений коэффициент сжатия, естественно, ниже. Для аудиоданных
применяют свои методы компрессии.
При использовании специальных видео–адаптеров (видеобластеров)
мультимедиа–ПК
становятся
центром
бытовой
видео–системы,
конкурирующей
с
самым
совершенным
телевизором.
АУДИО
Любой мультимедиа–ПК имеет в своем составе плату–аудиоадаптер. Для
чего она нужна? С легкой руки фирмы Creative Labs (Сингапур), назвавшей
свои первые аудиоадаптеры звонким словом Sound Blaster, эти устройства
часто именуются “саундбластерами”. Аудиоадаптер дал компьютеру не только
стереофоническое звучание, но и возможность записи на внешние носители
звуковых сигналов. Как уже было сказано ранее, дисковые накопители ПК
совсем не подходят для записи обычных (аналоговых) звуковых сигналов, так
как рассчитаны для записи только цифровых сигналов, которые практически
не искажаются при их передаче по линиям связи.
Аудиоадаптер имеет аналого–цифровой преобразователь (АЦП),
периодически определяющий уровень звукового сигнала и превращающий
этот отсчет в цифровой код. Он и записывается на внешний носитель уже как
цифровой сигнал.
Цифровые выборки реального звукового сигнала хранятся в памяти
компьютера (например, в виде WAV–файлов). Считанный с диска цифровой
сигнал подается на цифро–аналоговый преобразователь (ЦАП), который
преобразует цифровые сигналы в аналоговые. После фильтрации их можно
усилить и подать на акустические колонки для воспроизведения. Важными
параметрами аудиоадаптера являются частота квантования звуковых сигналов
и разрядность квантования.
Частоты квантования показывают, сколько раз в секунду берутся выборки
сигнала для преобразования в цифровой код. Обычно они лежат в пределах от
4–5 КГц до 45–48 КГц.
Разрядность квантования характеризует число ступеней квантования и
изменяется степенью числа 2. Так, 8–разрядные аудиоадаптеры имеют 28=256
степеней, что явно недостаточно для высококачественного кодирования
звуковых сигналов. Поэтому сейчас применяются в основном 16-разрядные
аудиоадаптеры, имеющие 216 =65536 ступеней квантования — как у
звукового компакт–диска.
Таблица 1.
Частотный диапазон Вид сигнала
Частота квантования
400 – 3500 Гц
Речь (едва разборчива)
5.5
КГц
250 – 5500 Гц
Речь (среднее качество)
11.025 КГц
40 – 10000 Гц
Качество звучания
22.040 КГц
УКВ–приемника
20 – 20000 Гц
Звук высокого качества
44.100 КГц
Другой способ воспроизведения звука заключается в его синтезе. При
поступлении на синтезатор некоторой управляющей информации по ней
формируется
соответствующий
выходной
сигнал.
Современные
аудиоадаптеры синтезируют музыкальные звуки двумя способами: методом
частотной модуляции FM (Frequency Modulation) и с помощью волнового
синтеза (выбирая звуки из таблицы звуков, Wave Table). Второй способ
обеспечивает более натуральное звучание.
Частотный синтез (FM) появился в 1974 году (PC–Speaker). В 1985 году
появился AdLib, который, используя частотную модуляцию, был способен
играть музыку. Новая звуковая карта SoundBlaster уже могла записывать и
воспроизводить звук. Стандартный FM–синтез имеет средние звуковые
характеристики, поэтому на картах устанавливаются сложные системы
фильтров против возможных звуковых помех.
Суть технологии WT–синтеза состоит в следующем. На самой звуковой
карте устанавливается модуль ПЗУ с “зашитыми” в него образцами звучания
настоящих музыкальных инструментов — сэмплами, а WT–процессор с
помощью специальных алгоритмов даже по одному тону инструмента
воспроизводит все его остальные звуки. Кроме того многие производители
оснащают свои звуковые карты модуляторами ОЗУ, так что есть возможность
не только записывать произвольные сэмплы, но и подгружать новые
инструменты.
Кстати, управляющие команды для синтеза звука могут поступать на
звуковую карту не только от компьютера, но и от другого, например, MIDI
(Musical Instruments Digital Interface) устройства. Собственно MIDI определяет
протокол передачи команд по стандартному интерфейсу. MIDI–сообщение
содержит ссылки на ноты, а не запись музыки как таковой. В частности, когда
звуковая карта получает подобное сообщение, оно расшифровывается (какие
ноты каких инструментов должны звучать) и отрабатывается на синтезаторе. В
свою очередь компьютер может через MIDI управлять различными
“интеллектуальными” музыкальными инструментами с соответствующим
интерфейсом.
Для электронных синтезаторов обычно указывается число одновременно
звучащих инструментов и их общее число (от 20 до 32). Также важна и
программная совместимость аудиоадаптера с типовыми звуковыми
платформами (SoundBlaster, Roland, AdLib, Microsoft Sound System, Gravis
Ultrasound и др.).
В качестве примера рассмотрим состав узлов одного из мощных
аудиоадаптеров — SoundBlaster AWE 32 Value. Он содержит два
микрофонных малошумящих усилителя с автоматической регулировкой
усиления для сигналов, поступающих от микрофона, два линейных усилителя
для сигналов, поступающих с линии, с проигрывателя звуковых дисков или
музыкального синтезатора. Кроме того, сюда входят программно–
управляемый электронный микшер, обеспечивающий смешение сигналов от
различных источников и регулировку их уровня и стереобаланса, 20-голосый
синтезатор музыкальных звуков частотной модуляции FM, программно
управляемый волновой (табличный) синтезатор музыкальных звуков и
звуковых эффектов (16 каналов, 32 голоса, 128 инструментов), аналого–
цифровой 16-разрядный преобразователь для превращения аналогового
сигнала с выхода микшера в цифровой сигнал, систему сжатия цифровой
информации с возможностью применения расширенного звукового процессора
ASP. Наконец, аудиоадаптер имеет цифро–аналоговый преобразователь (ЦАП)
для превращения цифровых сигналов, несущих информацию о звуке, в
аналоговый сигнал, адаптивный электронный фильтр на выходе ЦАП,
снижающий помехи от квантования сигнала, двухканальный усилитель
мощности по 4 Вт на канал с ручным и программно–управляемым
регулятором громкости и MIDI–разъем для подключения музыкальных
инструментов.
Как видно из этого перечня, аудиоадаптер — достаточно сложное
техническое устройство, построенное на основе использования последних
достижений в аналоговой и цифровой аудиотехнике.
В новейшие звуковые карты входит цифровой сигнальный процессор DSP
(Digital Signal Processor) или расширенный сигнальный процессор ASP
(Advanced Signal Processor). Они используют совершенные алгоритмы для
цифровой компрессии и декомпрессии звуковых сигналов, для расширения
базы стереозвука, создания эха и обеспечения объемного (квадрофонического)
звучания. Программа поддержки ASP QSound поставляется бесплатно фирмой
Intel на CD-ROM “Software Developer CD”. Важно отметить, что процессор
ASP используется при обычных двухканальных стереофонических записи и
воспроизведении звука. Его применение не загружает акустические тракты
мультимедиа компьютеров.
Звуковые карты.
С течением времени перечень задач выполняемых на ПК вышел за рамки
просто использования электронных таблиц или текстовых редакторов.
Компакт- диски со звуковыми файлами, подготовка мультимедиа презентаций,
проведение видео конференций и телефонные средства, а также игры и
прослушивание аудио CD для всего этого необходимо чтобы звук стал
неотъемлемой частью ПК. Для этого необходима звуковая карта. Любители
игр будут удовлетворены новыми возможностями объемного звучания.
Для звуковых карт IBM совместимых компьютеров прослеживаются
следующие тенденции:
Вопервых, для воспроизведения звука вместо частотной модуляции (FM)
теперь все больше используют табличный (wavetable) или WTсинтез, сигнал
полученный таким образом, более похож на звук реальных инструментов, чем
при FMсинтезе. Используя соответствующие алгоритмы, даже только по
одному тону музыкального инструмента можно воспроизводить все остальное,
то есть восстановить его полное звучание.
Выборки таких сигналов хранятся либо в постоянно запоминающем
устройстве (ROM) устройства, либо программно загружается в оперативную
память (RAM) звуковой карты.
В более дешевых платах чаще реализован частотно модулированный
синтез с использованием синусоидальным колебаний, что в результате при
водит к не совсем точному звучанию инструментов, отражение звука и рева,
характерных для последнего поколения игр в игровых залах. Расположенная
на плате микросхема для волнового синтеза хранит записанные заранее
оцифрованные образцы (Samples) звучания музыкальных инструментов и
звуковых эффектов. Достигаемые результаты очевидны, музыкальные записи
получаются более убедительны, а азартные игроки более впечатлительны.
Пионером в реализации WTсинтеза стала в 1984 году фирма Ensoning.
Вскоре WTсинтезаторы стали производить такие известные фирмы, как Emu,
Korg, Roland и Yamaha. Фирмы производители звуковых карт добавляют
WTсинтез двумя способами либо встраивают на звуковую карту в виде
микросхем, либо реализуя в виде дочерней платы. Во втором случае звуковая
карта дешевле, но суммарная стоимость основной и дочерней платы выше.
Во-вторых, это совместимость звуковых карт. За сравнительно не долгую
историю развития средств мультимедиа появилось уже несколько основных
стандартов де-факто на звуковые карты. Так почти все звуковые карты,
предназначенные для игр и развлечений, поддерживают совместимость с Adlib
и Sound Blaster. Все звуковые карты, ориентированные на бизнес- приложения,
совместимы обычно с MS Windows Sound Sistem фирмы Microsoft.
В третьих, одним из компонентов современных звуковых карт стал
сигнальный процессор SP(Digital Signal Processor) к возможности
функциональным обязанностям этого устройства можно отнести : распознание
речи, трехмерное звучание, WTсинтез, сжатие и декомпрессия аудиосигналов.
Количество звуковых карт, оснащенных DSP, не так велико. Причина этого то
что такое достаточно мощное устройство помогает только при решении строго
определенных задач. Как правило, DSP устройство достаточно дорогое,
поэтому сразу устанавливается только на профессиональных музыкальных
картах. Одним из мощных DSP производителей сейчас является фирма Texas
Instruments.
В-четвертых, появилась устойчивая тенденция интегрирования функций
звуковых карт на системной плате. Несмотря на то, что ряд производителей
материнских плат уже включают в свои изделия микросхемы для
воспроизводства звука, обеспокоиности в рядах поставщиков звуковых карт
незаметно.
Потенциальная проблема при использовании встроенных средств
обработки звука состоит в ограниченности системных ресурсов IBM PC
совместимых компьютеров, а именно в возможности конфликтов по каналам
прямого доступа к памяти (DMA). Пример такой платы это системная плата
OPTi495 SLC, в которой используется 16-разрядный звуковой стереокодек AD
1848 фирмы ANALOG DEVICES.
В-пятых, стремление к более естественному воспроизведению звука
заставляет фирмы производителей использовать технологии объемного или
трехмерного (3D) звучания. Самое модное направление в области
воспроизведения звука в наши дни предоставляет так называемые объемность
звучания. Применение этих эффектов объемного звучания позволяет
расширить стерео пространство, что в свою очередь придает большую
голубизну ограниченного поля воспроизведения, присущем не большим
близко расположенным друг к другу колонок.
В-шестых, это подключение приводов CD-ROM.Практически все
звуковые карты имеют встроенные интерфейсы для подключения приводов
CD-ROM одной или сразу всех трех фирм Sony, Panasonic/Matsushita и
Mitsumi.Тем не менее, большинство звуковых карт рассчитано на
подключение приводов Sony. Появились карты и приводы, поддерживающие
стандартный интерфейс ATA(IDE), используемый для компьютеров с
винчестером.
В-седьмых, на картах используется режим DualDMA, то есть двойной
прямой доступ к памяти. С помощью двух каналов DMA можно реализовать
одновременно запись и воспроизведение.
И последнее - это устойчивое внедрение звуковых технологий в
телекомуникации.
Звуковые карты приобретаются в 90% случаев для игр, из оставшихся
10% для речевого сопровождения мультимедиа программ. В таком случае
потребительские качества зависят только от ЦАП (цифро-аналогового
преобразователя ) и от усилителя звуковой частоты. Еще более важным
является совместимость со стандартом Sound Blaster, так как далеко не все
программы будут поддерживать менее распространенные стандарты.
В набор Звуковых карт входят драйвера, утилиты, программы записи и
воспроизведения звука, средства для подготовления и произведения
презентаций, энциклопедий, игр.
Акустические системы.
Хотя на большинстве звуковых карт предусмотрен встроенный усилитель,
входной сигнал даже у лучших из них очень мал, обычно 40 ватт. Для
устранения этого нужны акустические колонки со встроенным усилителем и
источником питания. Лучше всего трехкомпонентная акустическая система,
состоящая из двух небольших колонок, стерлингов, рассчитанных на
воспроизведение средних и высоких частот (150Гц-20КГц) и отдельно
низкочастотного динамика для воспроизведения низких частот (20-150Гц).
Динамик низкой частоты обеспечивает звучание бассов, которые не
воспроизводятся двух компонентной системой. Динамики ПК в настоящее
время пользуются повышенным спросом, и вы можете потратить на них 250
долларов. Однако если для вас не важно звучание подбирайте колонки
мощностью 30 ватт.
МОНИТОРЫ ДЛЯ МУЛЬТИМЕДИА.
Модернизация видеоплаты и монитора — это два важнейших шага, которые
вы можете предпринять, готовя компьютер к работе с мультимедиа. При этом
важно не допустить ошибок. Укажем на несколько важных моментов.

Монитор должен быть большим, как минимум 17-дюймовым, но
предпочтительнее 20- или 21-дюймовым.

Убедитесь, что характеристики вашего монитора соответствуют
возможностям видеоплаты, включая разрешающую способность, скорость
регенерации изображения и интенсивность цвета. Убедитесь также, что
изображение на экране четкое и чистое (шаг точки не более 0.28 мм). Кроме
того, монитор должен обладать способностями мультисканирования или
мультисинхронизации — этот термин является торговой маркой фирмы NEC
— Nippon Electronic Company. Избегайте мультирежимных мониторов.
Мультисканирующий монитор может автоматически в процессе работы (onthe-fly) изменять частоты синхронизации, а мультирежимный монитор
требует установки и переключения режимов вручную, к тому же у них более
низкий стандарт.

Монитор должен иметь прогрессивную (построчную) развертку.
Ищите монитор с высоким качеством изображения
Качество изображения на мониторе определяется тем, насколько четко каждая
отдельная точка воспроизводится на экране. Экран состоит из тысяч
маленьких точек люминофора, которых настолько много и они располагаются
так близко друг к другу, что начинают выглядеть как одна сплошная
картинка.
Каждый видимый на экране цвет состоит из трех основных цветов —
красного, зеленого и синего. Различные комбинации интенсивности этих трех
цветов создают 16 миллионов оттенков, различаемых человеческим глазом.
Эти тысячи разноцветных точек (пикселов) и составляют изображение на
дисплее.
Несколько слов о пикселе. Самый маленький элемент компьютерного экрана,
видимый человеком, называется пиксел (pixel — это сокращение от picture
element, что означает элемент изображения). Хороший монитор обычно
откалиброван так, что каждый луч красного, зеленого и синего цвета четко
попадает в цель: люминесцентную точку своего цвета. В противном случае
бывает то, что называется плохим сведением, проявляющемся в том, что
границы линий оттеняются каким-то другим цветом. При хорошем сведении
лучей цвета будут четкими, чистыми и правильными при условии правильной
настройки баланса цветов (проверяется на белом и черном цветах).
Чтобы получать на экране реалистические изображения, необходимо оценить
качество свечения монитора. Лучший способ определения качества свечения
— внимательно посмотреть на белый цвет на экране. Заметный оттенок
(желтый или синий) указывает на плохое качество. Если же экран выглядит
однородно белым, как белье после прачечной, то его качество хорошее.
В дополнение к тому, как выглядят изображения, немаловажным является
вопрос о том, сколько информации вы сможете увидеть на экране. Поскольку
изображение состоит из пикселов, логично прийти к заключению, что чем
больше пикселов, тем больше можно воспроизвести информации. Количество
пикселов на экране отождествляется с разрешающей способностью
(разрешением) монитора.
Разрешающая способность монитора.
Разрешение монитора выражается двумя числами, указывающими, сколько
пикселов содержится по горизонтали и по вертикали (х, у). Вероятно, вам
нередко приходилось видеть такие параметры монитора, как 1024x768 или
800x600. Это и есть количество пикселов по горизонтали (х) и по вертикали
(у). Перемножив эти числа, можно получить общее количество пикселов на
экране. Например, 800x600 = 480000.
Еще одна немаловажная характеристика — размер экрана дисплея. Как
отмечалось ранее, 21-дюймовый монитор является идеальным, так как при
этом более высокому разрешению соответствуют большая площадь экрана.
Попытка работать с таким разрешением на 14-дюймовом мониторе была бы
эквивалентна чтению микрофильма невооруженным глазом. Более высокие
разрешения и больший размер монитора позволят вам с большим удобством
увидеть гораздо больший объем информации.
Содержимое экрана.
Вместимость экрана — это пространство, которым вы реально располагаете
на экране. Действительно, на 21-дюймовом мониторе можно увидеть на 35%
больше, чем даже на 17-дюймовом.
При высоком разрешении монитор может воспроизводить больше информации по сравнению с монитором в режиме низкого разрешения из-за
большего количества пикселов (компактности пикселов). При этом
изображение также становится более компактным и уменьшается в размерах.
Для увеличения изображения необходим монитор большего размера. Чем
больше размер монитора и чем выше его разрешение, тем больше
информации он может одновременно вывести на экран .
Однако больше — не всегда означает лучше. Например, экран с разрешением
800x600 лучше воспроизводит подвижное видео по сравнению с 1024x768 по
двум причинам. Во-первых, изображение получается крупнее, а, во-вторых,
воспроизводится больше цветов с большей скоростью, так как процессору
нужно обрабатывать меньшее число точек. Если повышение разрешения
делает изображение более четким, то увеличение количества цветов делает
изображение более реалистичным. Таким образом, важен хороший баланс
между цветом, скоростью и разрешением.
Следует подчеркнуть, что воспроизведение качественной графики зависит не
только от монитора. Вам следует также убедиться, что имеющаяся у вас
видеоплата способна обеспечить вывод графики на монитор с приемлемыми
скоростями и разрешением.
Каналы передачи видеоизображения.
Как мы установили выше, между видеомонитором и видеоплатой существует тесная взаимосвязь. Кроме того, тесная взаимосвязь существует
между видеоплатой и системной шиной расширения, а также между
имеющимся объемом оперативной памяти RAM на видеоплате и на основной
системной плате. Покупка монитора аналогична покупке любого другого
внешнего устройства, т.е. при покупке монитора вы должны:
1. Приобрести (или иметь заранее) соответствующую адаптерную плату,
которая позволит монитору общаться с компьютером.
2. Если у вас есть «лучший в мире» монитор и «лучшая в мире» видеоплата,
то вам необходимо также использовать «лучшую в мире» шину данных для
подключения. Высокоэффективная видеоплата обычно требует современной
шины расширения: типа VL-bus или PCI. Таким образом, системная плата
должна иметь свободный разъем нужной шины данных. Если на системной
плате есть необходимый разъем, то вы должны также удостовериться в том,
что на видеоплате достаточно памяти для хранения всего объема информации,
необходимой для выдачи на экран монитора. Отметим, что большие экраны с
более высоким разрешением требуют гораздо большего информационного
обеспечения, следовательно, вам необходима большая емкость оперативной
памяти (RAM). Ограниченная RAM чрезмерно обременительна для
центрального процессора — CPU, поскольку CPU при отсутствии
достаточного количества RАМ использует память на жестком диске, которая
значительно медленнее оперативной памяти в силу своей механической
природы.
Сравнение VRAM с DRAM. Устройство оперативной памяти на видеоплате
обычно идентично динамической оперативной памяти на микросхемах
(DRAM) на материнской плате старых компьютеров. Микросхемы DRAM
довольно медленные и не удовлетворяют требованиям работы с графикой.
Вследствие этого разработан новый тип RAM, названный VideoRAM
(видеопамять — VRAM). Память VRAM позволяет
одновременно записывать и считывать данные, что повышает производительность. Большинство новых плат используют VRAM.
После решения вопроса с RAM удостоверьтесь, что имеющийся у вас
центральный процессор в состоянии выполнять обработку такого большого
количества видеоинформации. Производительность и качество всегда
являются слабым звеном в этой цепи.
Выбор монитора.
Мы часто воспринимаем свой монитор как нечто само собой разумеющееся.
При работе с компьютером мы постоянно смотрим на монитор и даже не
подозреваем, насколько он действительно важен. С точки зрения мультимедиа
монитор — это ключ к получению удовольствия от высокого качества
мультимедийных презентаций и игровых программ.
Весь смысл состоит в том, чтобы подобрать монитор, эффективно работающий с выбранной видеоплатой. Можно сэкономить деньги, приобретя
монитор и соответствующую ему видеоплату единого стандарта (с
фиксированной частотой). Например, можно заказать монитор VGA и видеоплату VGA. Для большей гибкости приобретайте мультисканирующий
(или мультисинхронизирующий) монитор, который может поддерживать
сразу несколько режимов работы (стандартов).
Критерии выбора монитора
Как известно, стоимость монитора может составлять до 50 % от стоимости
компьютера. Поэтому остановимся подробнее на критериях, которые следует
учитывать при выборе монитора. Монитор можно выбирать исходя из
следующих характеристик:

Размера экрана

Разрешающей способности

Шага точки

Параметров электронно-лучевой трубки

Средств настройки и регулировки

Типа развертки (чересстрочная или прогрессивная)
Размер экрана монитора. При работе в Windows наличие большого монитора
способствует увеличению производительности работы пользователя.
Например, переход от 14-дюймового монитора к 17-дюймовому позволяет без
уменьшения размеров графических элементов увеличить разрешающую
способность от 640x480 до 800x600 или даже до 1024x768, что соответствует
увеличению реального пространства на экране примерно на 60%. При
использовании большего монитора у вас не будут болеть глаза от напряжения
из-за чтения мелкого шрифта.
Размер мониторов варьируется от 12 дюймов у монохромных мониторов до 42
дюймов у цветных. Очевидно, что чем больше размер монитора, тем выше его
цена. Наиболее распространенными являются 15, 17 и 21-дюймовые модели.
К сожалению, эти диагональные измерения относятся не к видимому нами
экрану, а к электронно-лучевой трубке. Поэтому сопоставление 15-дюймовых
мониторов, предлагаемых разными фирмами, будет некорректным без
измерения активной площади экрана. Например, 15-дюймовый монитор одной
фирмы может формировать 13,8-дюймовое изображение, в то время как 14дюймовый монитор другой фирмы — 13,5-дюймовое изображение. Поэтому
советуем вам брать с собой линейку, чтобы не попасть впросак.Высокое
разрешение. Разрешение — это количество элементов изображения (точек),
которое может воспроизводить монитор, выраженное в пикселах. Хотя
разрешение VGA, равное 640x480, согласно спецификации МРС2 допустимо
для работы с мультимедиа, желательно все же использовать большее
разрешение. А для работы, скажем, с разрешением 1024x768 лучше
приобрести 17-дюймовый монитор, чтобы ваши глаза не страдали от слишком
мелких деталей на экране.
Шаг точки. Еще одним немаловажным моментом является шаг точки
электронно-лучевой трубки — измеренное в миллиметрах расстояние между
триадами люминофора, составляющими экран монитора. Триада представляет
собой «красную», «зеленую» и «синюю» точки люминофора, образующие
пиксел. Очевидно, что экраны с меньшим точечным шагом, т.е. с меньшим
расстоянием между триадами, дают более четкое изображение.Большинство
мониторов имеют шаг точки в пределах от 0,25 до 0,52 мм. Во избежание
зернистых изображений он не должен превышать 0,28 мм у 14- и 15дюймовых мониторов и 0,31 мм у мониторов размером в 16 дюймов и более.
На данный момент современные мониторы, предлагаемые пользователю,
имеют точечный шаг, не превышающий 0,28 мм.
Можно несколько сэкономить, выбрав либо монитор меньшего размера, либо
монитор с большим точечным шагом. Но главным критерием все же остается
четкость изображения. Не будьте слишком уж разборчивы. Так, отдав
предпочтение монитору с точечным шагом 0,31 мм, а
не 0,28 мм, можно, конечно, сэкономить деньги, но никогда не стоит покупать
монитор с точечным шагом больше 0,31 мм. Если же вам приходится
проводить много времени за монитором ПК, то точечный шаг должен быть
0,28 мм или еще меньшим.
Устройство электронно-лучевой трубки. Многие экраны недорогих мониторов
искривлены (выпуклые), поскольку в таком случае проще управлять
электронными лучами, вызывающими свечение экрана. Мониторы с плоскими
экранами, которые стоят дороже, более привлекательны для большинства
пользователей. Как правило, чем меньше кривизна экрана, тем меньше света
он будет отражать, т.е. тем меньше будет бликов.
Компромиссом между двумя указанными типами электронно-лучевых трубок
являются тринитроновые трубки. Они имеют профиль, плоский по вертикали
и искривленный по горизонтали (цилиндрическая поверхность).
Тринитроновые электронно-лучевые трубки имеют приемлемое по стоимости
устройство с меньшими бликами по сравнению с традиционными
сферическими мониторами. Истинно плоские мониторы являются плоскими
во всех направлениях, в то время как более новые плоские (flat-square)
электронно-лучевые трубки все же имеют минимальную кривизну.
Популярность этой новой технологии на рынке 17-дюймовых мониторов
непрерывно возрастает. Сейчас она используется при изготовлении
большинства мониторов.
Средства регулировки. Весьма важным является наличие системы регулировки монитора, позволяющей осуществлять настройку размера изображения, его расположения по горизонтали и вертикали, цвета и других
параметров. Выбирайте монитор с легкими средствами регулировки, которые
управляют не только контрастностью и яркостью изображения. Некоторые
мониторы позволяют регулировать ширину и высоту изображений таким
образом, что можно увеличивать изображение до размера полного экрана или
как угодно его искажать.
Лучшие мониторы позволяют сохранить отрегулированные установки
изображения, включая цвет. Каждому разрешению соответствует свой набор
идеальных параметров изображения. У мониторов высокого класса с
цифровым управлением микропроцессорная схема позволяет выбирать
наилучшие установки изображения при определенном разрешении, а затем
автоматически сохранять их в памяти. Когда же компьютер меняет
разрешения, монитор получает соответствующие горизонтальные и
вертикальные установки, поступающие на его микропроцессорную схему.
Процессор обращается к электрически стираемому программируемому
постоянному запоминающему устройству (EEPROM) для получения параметров наилучшего размера, расположения и других установок, соответствующих заданным частотам, а затем автоматически настраивает изображение.
Цветовое соответствие (color matching) обеспечивается не на всех мониторах.
Эта технология появилась в ответ на возрастающую популярность цветной
печати и последовавшего недовольства пользователей тем, что получаемые
при печати цвета не соответствуют тем, что были на мониторе. Color matching
позволяет регулировать (посредством цифрового управления) интенсивность
«красных», «зеленых» и «синих» электронных лучей так, чтобы цвета на
экране как можно лучше соответствовали цветам после печати, независимо от
того, какая схема печати цветов (CMYK, Pantone и т.д.) используется. Будьте
осторожны, поскольку технология color matching улучшается, но пока еще
далека от совершенства.
Некоторые мониторы, такие как NEC MultiSync 4FGe, имеют кнопку
размагничивания экрана, устраняющую искажения цветов, которые могут
возникнуть в результате воздействия электромагнитных полей. Другие мониторы по примеру VCR обеспечивают отображение шкал регулировки непосредственно на изображении в процессе регулировки. К ним относится,
например, цветной монитор ViewMagic JCA-1565LSP фирмы ETC Computer
Inc. При этом можно менять регулировки различных установок монитора,
например, яркость и контрастность изображения.Чересстрочная и построчная
(прогрессивная) развертки. Чтобы поддерживать частоту горизонтальной
(строчной) развертки на низком уровне, некоторые видеоплаты используют
чересстрочную технологию кадровой развертки. При этом на экране
поочередно возникает половина линий изображения (четные или нечетные
линии), что может вызывать мерцания. Поэтому для устранения этого
эффекта монитор должен быть синхронизирован с двойной частотой
вертикальной (кадровой) развертки видеоплаты. Например, видеостандарт
IBM XGA использует частоту передачи кадров 43,5 Гц. Для полного
соответствия этому стандарту, монитор должен принимать частоту
вертикальной развертки 87 Гц, а горизонтальной развертки 35,5 кГц.
При покупке VGA-монитора убедитесь, что монитор поддерживает частоту
горизонтальной развертки, по крайней мере, на уровне 31,5 кГц. Это тот
минимум, который необходим для того, чтобы видеоплата могла обеспечить
разрешение экрана 640x480 пикселов. Стандарту VESA super-VGA (800x600)
соответствует частота вертикальной развертки 72 Гц, а горизонтальной
развертки — 48 кГц. Для более высокого разрешения экрана — 1024x768
пикселов — необходима частота вертикальной развертки 60 Гц, а
горизонтальной — 58 кГц. Однако при применении в последнем случае
монитора с чересстрочной разверткой достаточно, чтобы частота
вертикальной развертки составляла 43,5 Гц, а горизонтальной — 35,5 кГц.
Энергосбережение и безопасность. Хорошим приобретением являются
энергосберегающие мониторы. Многие изготовители мониторов стараются
удовлетворить требования стандарта Energy Star агентства по защите окружающей среды (ЕРА, Environmental Protection Agency). Любой персональный компьютер с монитором, потребляющий в режиме ожидания менее
70 Вт (при этом системный блок и монитор должны потреблять не более 35 Вт
каждый) может использовать знак Energy Star в своей рекламе. Такой ПК
называется «green (зеленый)». По некоторым подсчетам каждый «зеленый»
ПК может уменьшить ваш годовой счет за электроэнергию примерно на $70.
Поскольку монитор является одним из основных потребителей энергии из
всех комплектующих элементов ПК, то их энергосберегающие модели могут
внести свою немаловажную лепту в эту экономию. Вероятно, наиболее
известным энергосберегающим стандартом для мониторов является
спецификация DPMS (Display Power-Management Signaling — Сигнализация
для управления энергопотреблением дисплеев) ассоциации VESA,
устанавливающая сигналы, которые компьютер должен посылать монитору,
чтобы указать момент перехода на холостой ход. Когда компьютер
простаивает, экран монитора гасится, что способствует сбережению энергии.
Другим важным моментом в конструкции «зеленого» монитора является
сведение к минимуму воздействия на пользователя вредных
электромагнитных полей. Излучения очень низких частот (ОНЧ) (VLF — very
low frequency) и крайне низких частот (КНЧ) (ELF — ех-tremly low frequency)
могут вызывать выкидыши у беременных женщин, дефекты у новорожденных
и онкологические заболевания.
Эти две частоты определяются новым шведским стандартом излучения
мониторов, названным SWEDAC (по названию шведского регулирующего
агентства). Во многих европейских странах правительственные агентства и
коммерческие фирмы покупают только малоизлучающие (low emission)
мониторы. Стандарт MPR II, установленный в 1990 году, определяет уровень
защиты в малоизлучающих мониторах на сегодняшний день. Более строгий
стандарт 1992 года, названный ТСО, еще более ужесточает требования
стандарта MPR П.
Малоизлучающие мониторы обычно на $20-100 дороже по сравнению с
обычными мониторами. При поисках малоизлучающего монитора не просто
спрашивайте монитор с низким излучением, а руководствуясь тремя
рассмотренными выше стандартами по электромагнитному излучению,
выясните, ограничивает ли выбранный вами монитор специфические типы
излучения.
Избранные мониторы.
Выбор монитора зависит от вашего бюджета и потребностей. Для
мультимедиа необходим, как минимум, 17-дюймовый монитор. Однако если
вы ограничены в средствах и имеете разумные запросы, то можно
остановиться и на 15-дюймовом мониторе.
Наиболее современные 20- и 21-дюймовые мониторы могут представить в
совершенно новом свете видео, анимацию и графику, которые и делают
средства мультимедиа столь привлекательными. Большие экраны предлагают
идеальное сочетание высокого разрешения (1280x1024 и выше) и обширной
полезной площади экрана для того, чтобы одновременно представить
множество окон и приложений в среде Windows. Подобные большие
мониторы должны соответствовать стандарту Energy Star агентства ЕРА или
каким-либо другим энергосберегающим стандартам, поскольку на них
затрачивается до 80% энергии, потребляемой компьютером в целом.
Скорее всего, 17-дюймовый монитор является золотой серединой для работы
с мультимедиа. 17-дюймовые мониторы гораздо более легкие и менее
громоздкие по сравнению с 19- и 21-дюймовыми моделями.
В таблице 9.2 представлены наиболее важные характеристики ряда лучших с
позиций мультимедиа мониторов.
Таблица 9.2. Мониторы (размером от 15 дюймов)
Моде Фирм Раз
ль
амер
изгото дис
виплея
тель
(дю
ймы
)
Точеч
ный
шаг
(мм)
Макс,
разреш
. (при
постро
чной
разверт
ке)
Макс,
разреш.
(при
чересстрочно
й
развертк
е)
Макс,
частота
гориз.
разверт
ки
(кГц)
Макс, MP
частота RII
вертик.
разверт
ки (Гц)
Плоский
экран
Multi NEC 15
sync Techn
4FGe ologies
0.28
1024x7 1024x76 31-62
68
8
55-90
Да
Да
Brilli Philips 15
ance
15
Muttl Nokia 15
graph
449 6
0.28
1024x7 L
68
30-58
50-100
Да
Да
0.28
1024x7 1024x76 30-62
68
8
48-100
Да
Да
Multi NEC 17
sync Techn
SFGe ologies
0.28
1024x7 1024x76 31-62
68
8
55-90
Да
Да
Nana
o
550IW
Nana
o
560IW
Multi
graph
447X
Nanao 17
USA
0.28
1024x7 1024x76 27-65
68
8
55-90
Да
Да
Nanao 17
USA
0.26
1280x1 1024x76 30-82
024
8
55-90
Да
Да
Nokia 17
0.26
1600x1 1024x76 30-82
280
8
50-110
Да
Да
MuKI NEC 21
Sync Techn
6FGp ologies
0.28
1280x1 1024x76 27-79
024
8
55-90
Да
Да
MuKI NEC 27
Sync Techn
4PG ologies
0.28
800x60 800x600 15.5-50 40-100
0
-»-
Да
Монитор NEC MultiSync 4FGe фирмы NEC Technologies. Имеет 15-дюймовую
плоскую (flat square) электронно-лучевую трубку. Этот монитор соответствует
стандарту MPR II и снабжен «интеллектуальным диспетчером питания» (IPM
— Intelligent Power Manager), обеспечивающим совместно с видеоплатой
экономию энергии. Монитор поставляется с превосходной технической
документацией и имеет трехлетнюю гарантию на все оборудование, включая
комплектующие элементы.
Монитор рассчитан на формирование изображений с более высоким
разрешением по сравнению с большинством других моделей того же класса.
Так, он может работать с разрешением до 1024x768 при частоте регенерации
76 Гц, что устраняет эффект мерцания.
Единственным недостатком монитора является возникновение бликов на
экране», от которых можно избавиться, если приобрести серый антибликовый
светофильтр фирмы NEC Technologies (стоимостью около $70).
MultiSync 4FGe оснащен цифровыми средствами регулировки размера и
положения изображения на экране. Эти же средства управления используются
для настройки цвета и исправления искажений изображения, при которых его
стороны становятся вогнутыми (подушкообразные искажения).
Предусмотрены три варианта установки цветов — один из них заводской, а два
других определяются пользователем. Кроме того, имеется кнопка
размагничивания для защиты от электромагнитных излучений (которая
используется и для изменения режимов управления), а также ручки для
аналогового управления яркостью и контрастностью изображения. Монитор
поставляется с прекрасным техническим описанием, содержащим полезную
информацию по теории цвета.
Адрес фирмы-изготовителя:
NEC Technologies Inc. (дочерняя фирма NEC Corp.)
1414 Massachusetts Ave.
Boxborough, MA 01719-2298
508-264-8000
FAX: 508-264-8245
Техническое обеспечение, BBS: 508-635-4706.
Монитор Philips Brilliance 15. Привлекательный монитор (стоимостью $499),
сочетающий звуковые возможности с видео. Он выполнен на основе 15дюймовой плоской электронно-лучевой трубки. Точечный шаг составляет 0,28
мм. Монитор обладает разрешением до 1024x768 пикселов при частоте
регенерации 72 Гц, а также соответствует стандарту MPR II по уровням
излучения, хотя и не удовлетворяет стандарту Energy Star по экономному
потреблению электроэнергии.
Два стереодинамика встроены в привлекательный корпус Philips Brilliance 15,
а на передней панели имеется мини-гнездо для подключения наушников
индивидуального прослушивания и регулятор громкости. На задней крышке
монитора находятся два аудиогнезда типа RCA для подсоединения монитора к
звуковой плате PC. Придавая своему монитору аудиовозможности, фирма
Philips пожертвовала двумя его характеристиками, в результате чего монитор
не обладает энергосберегающими возможностями и имеет стандартные
аналоговые (с помощью потенциометров) средства регулировки изображения.
Все ручки регулировки изображения расположены на передней панели, но при
этом отсутствует микропроцессор для хранения установок изображения для
разных режимов работы. Кроме того, отсутствуют средства регулировки,
позволяющие корректировать подушкообразные и трапецеидальные
искажения изображения. Трапецеидальные искажения называют также
бочкообразными, поскольку при этом края изображения оказываются
выпуклыми, как стенки бочонка.
Аудиовозможности монитора Brilliance 15 позволяют использовать его для
удовлетворения общих потребностей в аудио в сфере бизнеса. Однако такие
колонки не пригодны для профессиональных мультимедийных презентаций
или для высококачественного воспроизведения звука, поскольку у встроенных
колонок недостаточно качественный басовый диапазон и, хотя они
обеспечивают достаточную громкость для небольшой комнаты, все же, когда
звук становится сильнее, появляются заметные искажения. Несмотря на
сказанное, устройство прекрасно подходит для новичков в области
мультимедиа.
Адрес фирмы-изготовителя:
Philips Consumer Electronics Co. (подразделение корпорации North American
Philips Corp.)
One Philips Dr., P. O. Box 14810
Knoxville, TN 37914-1810
615-521-4316
Непосредственно распродажа: 615-475-8869
FAX: 615-521-4406
Монитор Nokia Multigraph 449E фирмы Nokia Corporation. Представляет собой
15-дюймовый монитор, обеспечивающий высокое качество изображения при
пониженном уровне электромагнитного излучения. Эта модель отвечает
требованиям шведских стандартов. Маска из инвара (Multigraph’s Invar mask),
полоса частот видеотракта, равная 80 Мгц, и точечный шаг, равный 0,28 мм,
обеспечивают четкое изображение без каких-либо бликов с разрешением
1024x768 пикселов.
Многообразие средств цифрового управления позволяет пользователям
манипулировать размером и положением изображения на экране, регулировать
его яркость и контрастность, а также осуществлять выбор различных экранных
опций. Компактный монитор обладает и другими важными свойствами,
такими как антибликовое и антистатическое покрытия и соответствие
стандарту энергосбережения Energy Star.
Адрес фирмы-изготовителя:
Nokia Display Products, Inc. (подразделение фирмы Nokia Consumer Electronics)
3000 Bridgeway Blvd. Sausalito, CA 94965 800-BY-NOKIA; 415-331-0322
FAX: 415-331-0424
Монитор NEC MultiSync 5FGe фирмы NEC. Отличный 17-дюймовый монитор.
Характеризуется цифровыми средствами регулировки, включающими
устранение подушкообразных искажений, большим плоским экраном и малым
точечным шагом.
Цифровые средства регулировки размеров, вертикального и горизонтального
смещения изображения на экране занимают большую часть панели
управления. Есть и другие органы управления на передней панели: кнопка
размагничивания, которая также выполняет функцию переключения на
режимы коррекции подушкообразных искажений, переключатель режимов
синхронизации на нормальный режим, композитный или для приема
«зеленых» сигналов, связанных с экономным энергопитанием. Настройка
яркости и контрастности изображения осуществляется с помощью вращаемых
регуляторов так, что невозможно точно вернуться к заводской настройке.
Кнопка включения монитора удобно размещена в переднем правом углу и
имеет заметный, но не отвлекающий внимания узкий горизонтальный
световой индикатор.
MultiSync 5FGe — монитор среднего диапазона с максимальным разрешением
экрана 1024x768 и полосой частот видеотракта 80 Мгц. Однако большинство
пользователей Windows работают именно в этом режиме и только иногда с
меньшими разрешениями, а производительность монитора совсем не падает
при тех задачах, для которых он предназначался. Более того, стоимость
монитора, по мнению фирмы, делает егс привлекательным для всех, кто хотел
бы приобрести 17-дюймовый монитор. Точечный шаг составляет 0,28 мм,
четкость изображения отличная. Предлагаемый фирмой экранный фильтр
превращает большой экран почти в идеальный, сохраняя яркость и четкость
изображения при смягчении отражения.
Адрес фирмы-изготовителя:
NEC Technologies Inc. (дочерняя фирма NEC Corporation)
1414 Massachusetts Ave.
Boxborotts Ave.
Boxboro98
508-264-8000
FAX: 508-264-8245
Техническое обеспечение BBS: 508-635-4706.
Мониторы Nanao FlexScan F5501-W и F5601-W. Имеют идентичные внешний
вид и средства регулировки, но различаются характеристиками и
возможностями. Эти мониторы имеют энергосберегающий режим в сочетании
со средствами настройки цвета, цифровой регулировки искажений и
соответствием стандарту MPR-II.
Диапазон синхронизации частот монитора F550i-W вполне подходит для
современного видеоадаптера, в то время как монитор F5601-W обладает
расширенным диапазоном синхронизации частот, рассчитанным на будущие
видеорежимы.
Изображение F5601-W лучше, поскольку его расширенный диапазон
синхронизации частот и меньший точечный шаг формируют более четкое и
точное изображение. Для этого монитора подходят все режимы super-VGA,
что же касается режима 1024x768, то он особенно хорошо подходит для
модели F5501-W. Монитор F5601-W с максимальным разрешением 1280x1024
при прогрессивной развертке способен обеспечивать и более высокие
разрешения и демонстрирует большую четкость и удобство по сравнению с
младшей моделью.
Монитор F5501-W хорошо подходит для общих приложений Windows, в то
время как модель F5601-W, обладающая лучшими характеристиками и малым
точечным шагом, равным 0,26 мм, прекрасно подходит для всех приложений.
Адрес фирмы-изготовителя: NANAO USA Corp. 23535 Telo Ave. Torrance,
CA 90505 310-325-5202 FAX: 310-530-1679
Монитор Nokia Multigraph 447X фирмы Nokia. Обеспечивает четкое
изображение и имеет удобное экранное меню со средствами управления. Этот
17-дюймовый монитор обладает электронно-лучевой трубкой «Три-нитрон» с
шагом точки 0.26 мм, обеспечивающей высококонтрастное изображение.
Кроме того, монитор имеет силиконовое покрытие фирмы Sony,
способствующее эффективному уменьшению бликов.
Multigraph 447X формирует немерцающее изображение при разрешении
1280x1024 в режиме прогрессивной развертки с частотой регенерации 75 Гц,
хотя большинство пользователей предпочитают разрешение 1024x768 при
частоте регенерации 95 Гц.
Multigraph 44 7Х оснащен сложными средствами настройки изображения,
включающими коррекцию трапецеидальных и ортогональных искажений,
регулировку наклона и установку оттенков цветов. Все эти настройки
осуществляются с помощью экранного меню, похожего на аналогичное меню
телевизора и кассетного видеомагнитофона, что довольно редко встречается у
мониторов.
Multigraph 44 7Х соответствует стандартам Energy Star агентства ЕРА и
выполняет требования стандарта MPR II по электромагнитным излучениям.
Фирма Nokia планирует удовлетворить требования и более строгого шведского
стандарта ТСО.
Адрес фирмы-изготовителя:
Nokia Display Products, Inc. (подразделение фирмы Nokia Consumer Electronics)
3000 Bridgeway Blvd.
Sausalito, CA 94965
415-331-0322
FAX: 415-331-0424
Техническое обеспечение: используйте бесплатный
номер
Монитор NEC MultiSync 6FGp. 21-дюймовый монитор фирмы NEC
обеспечивает разрешения до 1280x1024 пикселов при частоте регенерации
экрана 74 Гц. Этот монитор пришел на смену более ранней модели 6FG. Новая
модель имеет противобликовую поверхность, уменьшающую интенсивность
отраженного света и повышающую контрастность изображения. Кроме того,
NEC 6FGp оснащен системой управления энергопотреблением,
способствующей уменьшению энергозатрат на холостом ходу до 70%.
Монитор MultiSync 6FGp имеет шаг точки электронно-лучевой трубки, равный
0,28 мм. На передней панели расположены цифровые средства регулировки
яркости и контрастности изображения, его размера и положения на экране, а
также корректировки подушкообразных искажений.
Адрес фирмы-изготовителя:
NEC Technologies Inc. (дочерняя фирма NEC Corporation)
1414 Massachusetts Ave.
Boxborough, MA 01719-2298
508-264-8000
FAX: 508-264-8245
Техническое обеспечение BBS: 508-635-4706.
Мультимедийный монитор NEC MultiSync 4PG. 27-дюймовый мультимедийный монитор фирмы NEC представляет собой два монитора в одном.
Этот видео и RGB (Red-Green-Blue — красный-зеленый-синий) монитор
может быть либо монитором для многоцелевых презентаций в вашем офисе,
либо монитором для обучения и для демонстрации программных средств.
Цена в $3499 не позволяет купить его большинству обычных пользователей
ПК, однако он и не предназначен для массового использования.
Обладая двумя входами для RGB-сигналов и двумя входами для видеосигналов, монитор 4PG можно одновременно подсоединить к телевизору и
кассетному видеомагнитофону или видеокамере и к двум компьютерам
(монитор поддерживает сигналы как ПК, так и Macintosh). Оба видеовхода и
один из входов RGB оснащены каналами для ввода стереозвука,
обеспечивающими качественный звук сопровождения, который может
воспроизводиться с помощью встроенных стереоколонок или выводиться на
внешний усилитель или динамики. Каждый вход и выход имеют
соответствующий набор кабелей, позволяющий соединить до 50 мониторов
для эффектных презентаций в большом зале.
Монитор 4PG оснащен беспроводным дистанционным управлением (он также
может работать с имеющимся 12-футовым кабелем) для выбора дисплея,
настройки размера изображения и его положения на экране, корректировки
подушкообразных искажений, регулировки цвета, наклона, контрастности,
яркости и четкости изображения. Дистанционное управление также включает в
себя кнопку размагничивания и настройку громкости.
В основе 110-фунтового монитора 4PG использована электронно-лучевая
трубка с плоским экраном и теневой маской. 4PG — мультисинхронизирующий монитор с частотой горизонтальной развертки от 15,5 до 50 кГц и
частотой кадров от 40 до 120 Гц. Максимальное разрешение составляет
1024x768 пикселов при частоте регенерации 60 Гц. Поддерживает входные
сигналы VGA, XGA2, NTSC, M-NTSC, PAL (Европа) и S-Video.
Монитор 4PG является лучшим монитором, предназначенным для
многоцелевых презентаций. Независимо от того, с помощью каких средств
была подготовлена презентация, т.е. является ли она результатом
использования программных средств типа Lotus Freelance Graphics или
Microsoft PowerPoint, компьютерных демонстрационных программ,
телевидения, видеокамеры или видеомагнитофона, 4PG воспроизводит
большое, яркое изображение и позволяет легко переходить от одного
устройства ввода информации к другому.
Адрес фирмы-изготовителя:
NEC Technologies Inc. (дочерняя фирма NEC Corporation)
1414 Massachusetts Ave.
Boxborough, MA 01719-2298
508-264-8000
FAX: 508-264-8245
Техническое обеспечение BBS: 508-635-4706.
Проверка монитора.
Монитор является настолько важным элементом компьютера, что нельзя
ограничиваться только чтением его технической документации. Так,
информация о том, что точечный шаг монитора составляет 0.28 мм вовсе не
означает, что этот монитор является идеальным.
После того как вы выбрали монитор, его необходимо протестировать. Это
можно сделать следующим образом:

Нарисуйте круг с помощью программы графического редактора.
Если вместо круга получится овал, то этот монитор требует настройки или
даже не годится для работы с графическим или проектным программным
обеспечением.
Напечатайте несколько слов, когда размер шрифта равняется 8 или 10 точкам
(одна точка равна 1/72 дюйма). Если буквы получаются нерезкими или же
черные символы имеют цветную кайму, покупайте другой монитор.
Изменяйте яркость в пределах всего ее диапазона и при этом внимательно
изучайте углы экранного изображения. При высоких уровнях яркости
изображение может увеличиваться, отсвечивать другими цветами или
оказаться не в фокусе.
Загрузите Microsoft Windows для проверки фокусировки изображения.
Проверьте, являются ли пиктограммы в углах экрана такими же четкими, как и
в других местах. Если монитор дает хорошо сфокусированное изображение в
центре экрана и довольно расплывчатое по его краям, то его конструкция не
очень удачна. Проверьте также, не искривлены ли линии. Изогнутые линии
могут быть также результатом не очень хорошей графический платы, поэтому
прежде чем отказаться от такого монитора, проверьте его еще раз с другой
платой.
Мультимедиа технологии в туристическом бизнесе
Начнем со службы безопасности. Первая задача службы безопасности - это
обеспечение правопорядка в гостинице или офисе фирмы, особенно в
стратегических местах (энергоузлы, местные АТС, водопровод и т.д.) и в
прилегающих (относящихся к ней) территориях. Технической основой для
этого служат телекамеры различных типов, детекторы металла и другая
вспомогательная аппаратура. Координация работы телекамер наблюдения
может осуществляться как со своеобразного микшерского пульта, так и с
помощью компьютера, причем разработчики программного обеспечения
ориентируются на человека, имеющего определенные представления о
компьютере, а не на специалиста по вычислительной технике (ведь требование
к охраннику быть специалистом в области вычислительной технике стоит
далеко не на первом месте, если вообще стоит).
Информация о условиях отдыха
При наличии устройств мультимедиа, компьютер можно использовать в
качестве кино-, видеопроектора или проектора двух- или трехмерной графики
(информация о странах, курортах, гостиницах и даже о планировке номеров в
гостиницах).
Виртуальный туризм.
Памятный многим фильм с участием Арнольда Шварценеггера
“Вспомнить все”, если абстрагироваться от вопросов этического плана,
рассказывает о предполагаемом виртуальном туризме будущего, как говорится
“с полным погружением”. Вполне возможно, что нечто подобное может
появиться в будущем, а пока...
...А пока, так называемый виртуальный туризм вполне доступен и в наше
время - это, к примеру, путеводители по музеям мира на цифровых носителях
(компакт-диски, в том числе интерактивные) или путешествия по тем же
музеям или памятникам архитектуры с помощью сети Интернет, в частности с
помощью гипертекстовой и мультимедийной World Wide Web.
Посредством Интернет можно “полазить” не только по Лувру, например,
но и даже по московскому Кремлю.
Интернет предоставляет также возможность побывать практически
“вживую” во многих уголках земного шара - по обоим полушариям разбросаны
сотни телевизионных камер, с определенной периодичностью (от нескольких
минут до нескольких часов) транслирующих в Сеть полученную ими картинку.
Их принадлежность самая разнообразная - от частных лиц и организаций до
“компетентных органов”. Кстати, такие камеры не зря называют
“шпионскими”.
Можно выбрать камеры для наблюдения за дорожным движением и
статические камеры, направленные на какую-либо природную или иную
достопримечательность или просто передающие панораму какого-нибудь
исторического города, например, Лондона или Кембриджа.
Многие серверы, транслирующие картинки с камер, предлагают еще и
короткие “фильмы” в формате Quick Time или Animated GIF, состоящие из
кадров, отснятых в течение последнего часа. Некоторые из серверов такого
рода :
EarthCam (http://www.eartcam)
WorldCam (http://www.ovd.com)
Random Camera (http://www.xmission.com/~bill/randcamera.html)
NASA (http://204.97.92.3/~brickman/nasacams)
Kat’z Kams Konnections (http://www.teleport.com/~kdrieck/cameras.htm)
Организация бизнеса с помощью мультимедиа
технологий
Видеокиоски.
Видеокиоски (или информационные киоски) дают возможность поновому организовать и автоматизировать сервис в рамках одной организации.
Особенно это важно для розничных магазинов, автомобильных салонов, банков
и музеев. Продавец не всегда способен уделить достаточно внимания сразу
нескольким клиентам, зачастую от не имеет возможности подробно рассказать
обо всех особенностях того или иного продукта или наглядно и эффектно его
продемонстрировать. А видеокиоск всегда под рукой. В нем можно разместить
не только подробную информацию об имеющихся продуктах и услугах, но и
включить туда интерактивные видеофильмы, позволяющие просто и наглядно
ответить на многие вопросы. К примеру: «Какие у вас имеются модели
автомобилей?«, »Расскажите об их особенностях», «Какой цвет я могу
выбрать?». Информация, которая выводилась в виде слайдов и
сопроводительного текста, теперь становится более доступной и эффектной
благодаря внедрению полноэкранного видео. Используя MPEG-1, разработчик
регулярно и без особых дополнительных затрат обновлять содержимое
видеокиоска. Развитие программных средств и эволюция пользовательского
интерфейса ведут к все более впечатляющим возможностям интерактивности.
Видео по требованию (Video on Demand) .
Термин «видео по требованию» появился сравнительно недавно. В
начале подобный сервис можно было встретить только в дорогих отелях ,а
теперь уже полным ходом идет реализация глобальной идеи об интерактивной
цифровой системе, благодаря которой любой пользователь сможет запросить
какой-либо фильм или передачу в определенное время и прямо на дом.
Современные технологии позволяют говорить об этом проекте как о грядущей
реальности, хотя до появления подобного устройства в широком потреблении
пройдет еще несколько лет.
Видео по телефону.
Некоторые телефонные компании сейчас разрабатывают системы,
позволяющие получать фильмы по обыкновенной телефонной линии. Правда,
приходиться учитывать ограниченную пропускную способность имеющихся
телефонных коммуникаций, но повсеместное внедрение стандарта ISDN и
других новых технологий связи поможет решить эту проблему.
Обучение.
Рынок тренажеров и интерактивных учебных комплексов сейчас бурно
развивается. Раньше для подобных задач используется аналоговые видеосистем
и лазерные диски. Стандарт MPEG стал идеальной альтернативой, так как эта
технология при более низких затратах дает целый ряд преимуществ:
транспортабельность и компактность, простота модернизации и возможность
работать в сети. Мне кажется, что для российских фирм этот рынок сегодня
представляет большой интерес.
Презентации.
Корпоративный рынок становиться все более требовательные к качеству
и техническим возможностям презентационного оборудования. Большинство
новых программных пакетов, предназначенных для подобных целей,
поддерживают работы в видео, в том числе и в формате MPEG. Однако многие
пользователи пока недооценивают возможности, которые предоставляют нам
современные мультимедиа-системы. Ведь даже если написать хороший,
аргументированный проект или доклад, то без эффектного сопровождения и
интерактивных иллюстраций ваши идеи могут остаться непонятными или
невостребованными. Многие менеджеры уже убедились в этом на собственном
опыте.
Видеобиблиотеки.
Организации, имеющие большие видеоархивы, могут существенно
выиграть, перекодировав их в цифровой формат и поместив их на CD-носители
или на специальный сервер. В отличие от аналоговых носителей данный метод
гарантирует длительное хранение, многократное проигрывание без потери
качества и быстрый доступ к любому фрагменту. К тому же, обладая подобным
видеоматериалом, вы легко можете открыть удаленный доступ к нему через
локальную сеть (интранет) или через WWW. Поэтому музеи, библиотеки,
государственные предприятия и научные учреждения, так же как рекламные
фирмы и информационные агентства, переходят сейчас на цифровое видео.
Информационно-развлекательный бизнес
Спецификация MPEG-2 подразумевает использование высоких
разрешений для достижения максимального качества изображения, поэтому
этот формат применяется в первую очередь профессионалами.
Кабельное телевидение (CATV: Cable Television)
Идея перевести кабельное телевидение на цифровое вещание
напрашивается сама собой. Имеющиеся магистрали для передачи видеосигнала
вполне могут выдержать интенсивность и объем данных, необходимые для
вещания MPEG-видео высокого разрешения (MPEG-2) . Уже в ближайшее
время должны появиться первые подобные системы, и тогда пользователь
реально сможет принимать телепередачи в высоком разрешении со
стереозвуком и даже Dolby Surround.
Направленное спутниковое вещание (DBS: Direct Broadcast Satellite).
Консорциум Hughes/USSB
собирается использовать MPEG-2 для
направленного вещания. Компания Thomson уже производит специальные
декодеры, установив которые вы сможете принимать до 150 каналов. Правда,
такие системы работают пока только в Северной Америке.
ТВЧ – телевидение высокой четкости (HDTV: High-Definition Television)
В США создан консорциум компаний (U.S. Grand Alliance), который
разрабатывает новый стандарт HDVN для телевидения высокого разрешения. В
нем будет использоваться MPEG-2 с поддержкой с поддержкой следующих
режимов: 1440х960 при 30 гц и 1280х720 при 60 гц. Легко себе представить,
сколь высокое качество изображения и звука в подобных телепередачах.
Домашние средства мультимедиа
Носителем цифрового видео может быть ваш винчестер или гибкий диск,
но винчестер далеко не унесешь, а на дискету не поместится достаточное
количество видео, да к тому же воспроизвести с дискеты видео вряд ли
удастся. В мире для переноски и распространения видеопродукции
используется ряд форматов компакт дисков.
Video-CD
Video-CD –это формат, который позволяет записывать MPEG-видео на
CD-диск и воспроизводить его на любом оборудовании, поддерживающем
формат.
DVD
Технология DVD (Digital versatile/Video disc)1 заняла достойное место в
зале компьютерной славы. После года активной рекламы DVD-плеер вышел на
рынок мультимедиа- и видеопродукции. DVD-плеер это устройство
стоимостью 600-800 долларов, которое можно подключать к телевизору или PC
для проигрывания дисков емкостью 4,7 Гбайт с высоким качеством
воспроизведения аудио- и видеоинформации. В связи с тем, что диск имеет
большой объем, появился новый вид видеопродукции - интерактивное видео.
Интерактивное видео-это фильм длиной около часа, причем главный герой
фильма каждые пять-десять минут попадает в ситуации, в которых ему надо
сделать выбор, что делать дальше. Выбор продолжения сюжета (одного из 3-4
предложенных) ложится на плечи зрителя. Эта технология позволяет
превратить очередной просмотр фильма.
Для записи на DVD или на любой другой носитель информации сжатого
видео необходимо иметь систему, состоящую из мощного процессора, платы
для аппаратного сжатия
видео (можно пользоваться программными
средствами, но качество и скорость их работы значительно хуже).
Мультимедиа-технологии в образовании
Интенсивное развитие процесса информатизации образования влечет за
собой расширение сферы применения мультимедиа-технологий. В настоящее
время можно уже вполне определенно выделить успешно и активно
развивающиеся
направления
использования
современных
информационных технологий в образовании. Кратко охарактеризуем их.
1. Реализация возможностей программных средств учебного
назначения (проблемно - ориентированных, объектно - ориентированных,
предметно - ориентированных) в качестве средства обучения, объекта
изучения, средства управления, средства коммуникации, средства обработки
информации.
2. Интеграция возможностей сенсорики, средств для регистрации и
измерения некоторых физических величин, устройств, обеспечивающих ввод и
вывод аналоговых и дискретных сигналов для связи с комплектом
оборудования, сопрягаемого с ЭВМ, и учебного, демонстрационного
оборудования при создании аппаратно - программных комплексов.
Использование таких комплексов предоставляет обучаемому инструмент
исследования, с помощью которого можно осуществлять регистрацию, сбор,
накопление информации об изучаемом или исследуемом реально протекающем
процессе; создавать и исследовать модели изучаемых процессов;
визуализировать закономерности процессов, в том числе и реально
протекающих;
автоматизировать
процессы
обработки
результатов
эксперимента; управлять объектами реальной действительности. Применение
этих
комплексов,
учебного,
демонстрационного
оборудования,
функционирующего
на
базе
мультимедиа-технологий,
позволяет
организовывать экспериментально - исследовательскую деятельность - как
индивидуальную (на каждом рабочем месте), так и групповую, коллективную с
реальными объектами изучения, их моделями и отображениями. Это
обеспечивает широкое внедрение исследовательского метода обучения,
подводящего
ученика
к
самостоятельному
"открытию
изучаемой
закономерности, способствует актуализации процесса усвоения основ наук,
развитию интеллектуального потенциала, творческих способностей.
3. Интеграция возможностей компьютера и различных средств
передачи
аудиовизуальной
информации
при
разработке
видеокомпьютерных систем, систем Мультимедиа.
Эти системы представляют собой комплекс программно - аппаратных
средств и оборудования, который позволяет объединять различные виды
информации (текст, рисованная графика, слайды, музыка, реалистические
изображения, движущиеся изображения, звук) и реализовывать при этом
интерактивный
диалог
пользователя
с
системой.
Использование
видеокомпьютерных систем, систем Мультимедиа обеспечивает реализацию
интенсивных форм и методов обучения, организацию самостоятельной учебной
деятельности, способствует повышению мотивации обучения за счет
возможности
использования
современных
средств
комплексного
представления и манипулирования аудиовизуальной информацией, повышения
уровня эмоционального восприятия информации.
4. Реализация возможностей систем искусственного интеллекта при
разработке так называемых интеллектуальных обучающих систем
(Intelligent Tutoring Systems) типа экспертных систем, баз данных, баз знаний,
ориентированных на некоторую предметную область.
Использование возможностей систем искусственного интеллекта создает
веские предпосылки для организации процесса самообучения; формирует
умения самостоятельного представления и извлечения знаний; способствует
интеллектуализации учебной деятельности; инициирует развитие аналитико синтетических видов мышления, формирование элементов теоретического
мышления. Все это является основой интенсификации процессов развития
личности обучаемого.
5. Использование средств телекоммуникаций, реализующих
информационный обмен на уровне общения через компьютерные сети
(локальные или глобальные), обмен текстовой, графической информацией в
виде запросов пользователя и получения им ответов из центрального
информационного банка данных.
Телекоммуникационная связь (синхронная, асинхронная) позволяет в
кратчайшие сроки тиражировать передовые педагогические технологии,
способствует общему развитию обучаемого.
6.
Новая
технология
неконтактного
информационного
взаимодействия, реализующая иллюзию непосредственного вхождения и
присутствия в реальном времени в стереоскопически представленном
"экранном мире" - система "Виртуальная реальность".
Использование этой системы позволяет обеспечить аудиовизуальный и
тактильный
контакт
между
пользователем
и
стереоскопически
представленными объектами виртуальной реальности при наличии обратной
связи и использовании средств управления.
Перспективами использования системы "Виртуальная реальность" в
сфере образования являются: профессиональная подготовка будущих
специалистов в областях, в которых необходимо стереоскопически
представлять изучаемые или исследуемые объекты; стереометрии, черчению,
инженерной графике, машинной графике; организация досуга, развивающих
игр; развитие наглядно - образного, наглядно- действенного, интуитивного,
творческого видов мышления.
7. Как показывает отечественный и зарубежный опыт применения
мультимедиа-технологий, реализация вышеизложенных возможностей
позволяет обеспечить:
*
предоставление
обучаемому
инструмента
исследования,
конструирования, формализации знаний о предметном мире и вместе с тем
активного компонента предметного мира, инструмента измерения,
отображения и воздействия на предметный мир;
*
расширение и углубление изучаемой предметной области за счет
возможности моделирования, имитации изучаемых процессов и явлений;
организации экспериментально - исследовательской деятельности; экономии
учебного времени при автоматизации рутинных операций вычислительного,
поискового характера;
*
расширение сферы самостоятельной деятельности обучаемых за
счет возможности организации разнообразных видов учебной деятельности
(экспериментально - исследовательская, учебно - игровая, информационно учебная деятельность, а также деятельность по обработке информации, в
частности и аудиовизуальной), в том числе индивидуальной, на каждом
рабочем месте, групповой, коллективной;
*
индивидуализацию и дифференциацию процесса обучения за счет
реализации возможностей интерактивного диалога, самостоятельного выбора
режима учебной деятельности и организационных форм обучения;
*
вооружение обучаемого стратегией усвоения учебного материала
или решения задач определенного класса за счет реализации возможностей
систем искусственного интеллекта;
*
формирование информационной культуры, компоненты культуры
индивида, члена информационного общества, за счет осуществления
информационно - учебной деятельности, работы с объектно ориентированными программными средствами и системами;
CD-RECORD
ВВЕДЕНИЕ: НЕСКОЛЬКО СЛОВ ПО ТЕМЕ
Записываемые компакт-диски или CD-R это диски, произведенные по технологии,
позволяющей пользователю самому записать свой собственный компакт-диск в одном из
индустриальных форматов. Для того, чтобы произвести запись необходимо
соответствующее устройство CD-R – рекордер (recorder), подключенное к персональному
компьютеру, и соответствующее программное обеспечение.
В основном здесь применяются технологии, основанные на изменении отражающих
свойств вещества подложки компакт-диска под действием луча лазера. Кстати, заметим, что
перезаписываемые компакт-диски в несколько раз дороже обычных. Дело в том, что в
качестве светоотражающего слоя в них используется уже не алюминий, а золото. Между
прочим, подобные компакт-диски обычно служат как мастерные для дальнейшего
тиражирования. Тем не менее в ряде случаев CD-R-диски можно использовать и для
долговременного архивирования какой-либо ценной информации. Заметим, что читать CDR-диск можно и на обычном приводе, но, разумеется, только первый сеанс записи. Когда
смотришь на не полностью записанный CD-R, область с информацией выглядит более
темной и она легко различима. Писать информацию привод начинает от внутренних
логических дорожек к внешним (от меньших по диаметру к большим).
На этих носителях можно создавать компакт-диски всех индустриальных стандартов,
включая аудио и видео CD, диски с данными CD-ROM. Записываемые CD-R диски
позволяют хранить весьма большой объем информации: до 650 Мб данных или 74 минуты
высококачественного звучания. Это приблизительно столько же информации, сколько
содержат 470 трехдюймовых дискет высокой плотности или 240 тысяч страниц
машинописного текста.
Сегодня устройства для записи CD - CD recorder'ы, в том числе благодоря сильному
удешевлению, приобретают все большее распространение. Среди их применений наиболее
интересные это хранение и перенос больших объемов информации, надежное архивирование
данных, хранение видео и аудио информации, резервные копии важного ПО. Для
однократной записи используются так назыаемые "золотые" диски. Их покрытие позволяет
осуществлять однократную запись информации лазерным лучом. Длинна волны лазерного
луча (как и при чтении) составляет 780нм, а интенсивность более чем в 10 раз сильнее.
Стандартный объем диска составляет 74 минуты или 650 Мбайт. Пожалуй самым
интересным является стоимость - около $0.003 за 1 Мегабайт еще и с теоретически вечным
сроком хранения! Однако даже по сравнению с традиционно используемыми ленточными
накопителями технология CD-R (а тем более и новая CD-RW - многократная запись на CD)
интереснее по цене, возможностям, часто скорости.
Общее представление о работе привода
Считывание информации с компакт-диска, так же как и запись, происходит при
помощи лазерного луча, но, разумеется, меньшей мощности. Сервомотор по команде
внутреннего микропроцессора привода перемещает отражающее зеркало. Это позволяет
точно позиционировать лазерный луч на конкретную дорожку. Такой луч, попадая на
отражающий свет островок, через расщепляющую линзу отклоняется на фотодетектор,
который интерпретирует это как двоичную единицу. Луч лазера, попадающий во впадину,
рассеивается и поглощается - фотодетектор фиксирует двоичный ноль (цифровая
информация представляется чередованием впадин (неотражающих пятен) и отражающих
свет островков).
В то время как все магнитные диски вращаются с постоянным числом оборотов в
минуту, то есть с неизменной угловой скоростью (CAV, Constant Angular Velocity), компакт-
диск вращается обычно с переменной угловой скоростью, чтобы обеспечить постоянную
линейную скорость при чтении (CLV, Constant Linear Velocity). Таким образом, чтение
внутренних сторон осуществляется с увеличенным, а наружных - с уменьшенным числом
оборотов. Именно этим обуславливается достаточно низкая скорость доступа к даным для
компакт-дисков по сравнению, например, с винчестерами.
Принципы однократной записи и перезаписи
Для однократной записи используются так называемые "болванки", представляющие
собой обычный компакт-диск, в котором отражающий слой выполнен преимущественно из
золотой или серебряной пленки, а между ним и поликарбонатной основой расположен
регистрирующий слой из органического материала, темнеющего при нагревании. В процессе
записи лазерный луч нагревает выбранные точки слоя, которые темнеют и перестают
пропускать свет к отражающему слою, образуя участки, аналогичные питам.
Для облегчения слежения за инфоpмационной доpожкой в пpоцессе записи диски CDR изготовляются со вспомогательной pазметкой. Пpи считывании слежение пpоизводится,
как обычно, по записанной доpожке питов. Hекотоpые веpсии пpогpаммного обеспечения
(напpимеp, CDR Publisher) позволяют записывать загpужаемые диски. Для загpузки с таких
дисков BIOS компьютеpа должен поддеpживать эту возможность (последние веpсии
AWARD и Phoenix BIOS).
На CD-R организуется та же информационная структура, что и на штампованных
дисках - TOC и набор дорожек различных типов. Это позволяет при помощи
соответствующего программного обеспечения записывать звуковые, фото- и видеодиски,
которые могут затем проигрываться в бытовых звуковых и видеопроигрывателях. Однако
отражающая способность зеркального слоя и четкость питов у дисков CD-R ниже обычного,
отчего некоторые устройства могут работать с ними неуверенно.
В перезаписываемых дисках используется промежуточный слой из органической
пленки, изменяющей под воздействием луча свое фазовое состояние с аморфного на
кристаллическое и обратно, в результате чего меняется прозрачность слоя. Фиксация
изменений состояния происходит благодаря тому, что материал регистрирующего слоя при
нагреве свыше критической температуры переходит в аморфное состояние и остается в нем
после остывания, а при нагреве до температуры значительно ниже критической
восстанавливает кристаллическое состояние. Существующие диски выдерживают от тысяч
до десятков тысяч циклов перезаписи. Однако их отражающая способность существенно
ниже штампованных и однократных CD, что затрудняет их считывание в обычных приводах.
Для чтения CD-RW формально необходим привод с автоматической регулировкой усиления
фотоприемника (Auto Gain Control), хотя некоторые обычные приводы CD-ROM и бытовые
проигрыватели способны читать их наравне с обычными дисками. Способность привода
читать CD-RW носит название Multiread; ранние приводы маркировались "CD-E Enabled".
Перезаписываемый диск может иметь такую же структуру дорожек и файловую
систему, что и CD-R, либо на нем может быть организована специальная файловая система
UDF (Universal Disk Format - универсальный дисковый формат), позволяющая динамически
создавать и уничтожать отдельные файлы на диске.
Физические форматы CD-R дисков (секторов)
Благодоря своему происхождению, количество и местонахождение информации на
CD измеряется в форме минута:секунда:сектор. Каждая секунда содержит 75 секторов.
Объем информации, записываемой на диск зависит от физического формата диска, который
вы записываете.
Ниже приведены форматы физических секторов для различных типов дисков (объем всегда
дополняется до 2352 байт).
CD-DA (CD-Digital Audio )
2352 bytes user data (music)
CD-ROM Mode 1
12 bytes sync 4 bytes header 2048 bytes user data 4 bytes EDC 8 bytes blank 276 bytes ECC
CD-ROM Mode 2 (этот формат реально не используется)
12 bytes sync
4 bytes header
2336 bytes user data
CD-ROM XA / CD-I (Mode 2 Form 1 – часто называется "Mode 2")
12 bytes 4
bytes 8
bytes 2048
bytes 4 bytes 276 bytes
sync
header
subheader
user data
ECD
ECC
CD-ROM XA / CD-I (Mode 2 Form 2)
12 bytes sync
4 bytes header
2324 bytes user data
4 bytes ECD
Самая главная информация из этой таблицы, что сектор данных (не музыки или
видео) всегда содержит 2048 байт информации. Т.е. для любых сегодняшних дисков с
файлами (записываемых в форматах CD-ROM Mode 1 или CD-ROM XA Mode 2 Form 1)
всегда имеем 2048 байт на сектор. Таким образом для 74-минутного записываемого диска
получаем 74 мин x 60 сек x 75 секторов x 2 kb = 660.000 kb = 650 Mb. Хотя для
мультимедийных данных (в основном видео - CD-I) можно применить CD-ROM XA Mode 2
Form 2, формально получив больший объем. Однако в этом случае информация
записывается без ECC, что нормально для видео и недопустимо для данных.
Запись на CD-R и CD-RW
Запись дисков CD-R выполняется только при помощи специальных программ - Easy
CD, CD Creator, CD Publisher и т.п. Процесс записи одной сессии представляет собой единую
операцию, которая не может быть прервана, иначе диск будет испорчен. Для обеспечения
равномерности поступления записываемой информации на лазер все приводы имеют буфер,
исчерпание данных в котором (Underrun) приводит к аварийному прерыванию записи.
Исчерпание данных в буфере может быть вызвано запуском параллельных процессов,
работой системы виртуальной памяти (swapping), захватом процессора "нечестными"
драйверами устройств, зависанием программы или ОС. К сбою записи приводят также
механические толчки привода.
Различается два основных режима записи CD-R: DAO (Disk At Once - весь диск за
один прием) и TAO (Track At Once - одна дорожка (сессия) за один прием). При записи
методом TAO лазер включается в начале каждой дорожки и отключается в ее конце; в
точках включения и выключения лазера формируются серии специальных кадров - run-in,
run-out и link, предназначенные для связывания дорожек между собой. Стандартный
промежуток содержит 150 таких кадров (2 секунды). При записи методом DAO лазер
включен на протяжении записи всего диска.
Диск, записанный за один прием, является наиболее универсальным и считывается
любыми CD-ROM с любым файловым диспетчером, однако после записи невозможно
дописывание новых данных на диск, а режим DAO поддерживается не всеми
записывающими приводами. Этот режим также не желателен для записи мастер-дисков для
последующего тиражирования путем штамповки - большинство типовых станков для
изготовления матриц воспринимают только непрерывно записанные оригиналы.
В режиме TAO пишутся многосессионные диски, допускающие последующую
дозапись данных; при этом для сессии записывается только зона Lead In (открытая сессия).
При записи каждой последующей сессии предыдущая закрывается путем записи зоны Lead
Out, за которой следует Lead In новой сессии. На эти две зоны расходуется дополнительно
13.5 Мб (6750 кадров) дискового пространства.
По стандарту, чтобы нормально считываться во всех устройствах, диск должен быть
закрыт (Closed) путем записи выводной зоны. Закрытие диска повышает вероятность его
успешного считывания в других приводах (подавляющее большинство современных
приводов не обращают внимания на закрытость диска), однако лишает возможности
дописывания дополнительных сессий.
Перед началом записи необходимо сформировать полный список входящих в сессию
файлов; последующее добавление файлов на диск возможно лишь в виде дополнительных
сессий. Приводы CD-ROM, не поддерживающие многосессионную запись, считывают с
диска только первую TOC - соответственно, с их помощью можно считывать лишь файлы
первой сессии. Многосессионные CD-ROM считывают только последнюю TOC, поэтому
последняя TOC в многосессионном диске должна содержать ссылки и на файлы
предыдущих сессий. Для этого при записи очередной сессии применяется опция
импортирования сессий (Import Track) для создания полной общей TOC. Совпадающие по
именам каталоги при этом объединяются, как при дописывании на обычный диск.
Адресация файлов в любом случае ведется в пределах всего диска, поэтому объединению
подвергаются только TOC. Файлы сессий, которые не были импортированы при создании
очередной сессии, в результирующем каталоге присутствовать не будут и обычное
обращение к ним будет невозможным, однако многие программы записи на CD-R позволяют
выборочно считывать отдельные сессии диска. То же самое позволяет делать одна из версий
MSCDEX - MDCDEX, или Adaptec Session Selector (из комплекта Easy CD Creator), при
условии поддержки со стороны привода.
Если запись на однократный многосессионный диск по какой-либо причине была
прервана, в ряде случаев имеется возможность использовать оставшееся свободным
пространство диска. Для этого требуется программа записи, имеющая опцию закрытия
сессии (Close Track/Session), после чего нужные данные записываются очередной сессией
без импорта прерванной сессии (предшествующие ей сессии могут быть импортированы).
Поскольку конечная видимость каждого файла определяется процессом импорта
TOC, возможно исключение из каталога отдельных файлов и выборочная замена файлов с
совпадающими именами. Старая копия файла продолжает оставаться на диске в одной из
предшествующих сессий, однако в новый каталог помещается ссылка на новый экземпляр.
Выборочное исключение файлов предыдущих сессий в каталог новой сессии дает эффект их
"удаления". Видимость "удаленных" таким образом файлов впоследствии может быть
"восстановлена" путем их импорта в новые сессии.
Для записи CD-RW может применяться их предварительное форматирование разбивка на секторы, подобно магнитным дискам. После форматирования диск CD-RW
может использоваться, как обычный сменный диск - стандартные файловые операции
копирования, удаления и переименования преобразуются драйвером привода CD-RW в
серии операций перезаписи секторов диска. Благодаря этому для работы с дисками CD-RW
не требуется специального программного обеспечения, кроме драйвера привода с
поддержкой UDF (например, Adaptec DirectCD) и программы начальной разметки.
Некоторые версии записывающих программ (например, CDR Publisher, WinOnCD с
версии 3.0 или Adaptec Easy CD Creator с версии 3.0) позволяют записывать загружаемые
диски. Для загрузки с таких дисков BIOS компьютера должен поддерживать эту
возможность (последние версии AWARD и Phoenix BIOS). Загружаемая часть CD-ROM
записывается в виде образа загрузочной дискеты или винчестера, из которого при загрузке
BIOS системной платы эмулирует диск A:.
МЕТОДЫ ЗАПИСИ: TRACK-AT-ONCE, DISC-AT-ONCE, И PA
WRITING
Существуют три основных метода записи на компакт диски. Они очень связаны с
физическим и логическим (или файловой системой) форматами в котором записывается
диск. Эти методы:



I.
Track-at-Once (включая Variable-Gap Track-at-Once)
Disc-at-Once (включая Session-at-Once)
Packet Writing
Track-at-Once
В режиме Track-at-Once, записывающий лазер выключается после записи каждой
дорожки и снова включается, если надо записать еще одну, даже если несколько
дорожек записываются подряд в одной операции записи. Дорожки, записанные в
режиме Track-at-Once разделены промежутками (gaps). Если за музыкальной
дорожкой следует дорожка с данными, промежуток составляет 2 или 3 секунды.
Между музыкальными дорожками промежуток обычно 2 секунды. Все современные
CD recorder'ы поддерживают этот режим.
II.
Variable-Gap Track-at-Once
Некоторые новые рекордеры позволяют вручную установить размер промежутка
между дорожками в режиме Track-at-Once. Эту возможность также должно
поддерживать ПО. Обычно этот параметр можно установить в диапазоне от 0.03 до 8
секунд.
III.
Disc-at-Once
В режиме записи Disc-at-Once, одна или более дорожек записываются без
выключения лазера, и диск закрывается (closed). Запись Disc-at-Once требует чистый
диск и не может быть использована для multisession дисков. Не все CD рекордеры
поддерживают этот режим, а некоторые требуют новоге firmware для правильной
поддержки. Этот режим нужен, например, для записи аудиодисков без промежутков
между дорожками (хотя признаем, что такие встречаются не редко). Частично это
можно компенсировать использованием Variable-Gap Track-at-Once.
Формат Disk-at-Once просто необходим при изготовлении мастер-копии (т.е. если с
золота будет штамповаться аллюминий - на самом деле не совсем верно, но смысл
этот), т.к. устройства для изготовления матриц обычно не переносят GAP-ов.
IV.
Session-at-Once
Режим Session-at-Once используется в основном для CD Extra. В этом режиме сначала
в один проход записывается первая сессия с несколькими аудио дорожками, затем
лазер выключается, но диск не закрывается. Затем записывается вторая сессия (с
данными) и диск закрывается.
V.
Packet Writing
Это новый метод записи на CD небольшими порциями, снимающий многие
ограничения. Программа Adaptec DirectCD поддерживает этот режим в соответствии
со стандартной UDF спецификацией. Не все CD рекордеры поддерживают packet
writing. Не все современные устройства CD-ROM могут читать записанные в этом
режиме диски, в некоторых ситуациях может потребоваться драйвер UDF.
VI.
Fixed-Length и Variable-Length Packets
В режиме packet writing можно записывать информацию двумя способами: пакеты
могут быть фиксированной длинны (fixed-length) или переменной (variable-length).
Пакеты фиксированной длинны больше подходят для дисков CD-RW для поддержки
выборочного стирания (random erase). Недостаток такого метода в том, что
использование длинны пакета 32Кб (как требует стандарт), вызывает слишком
расточительное использование места на диске. Стандартная емкость дисков CD-RW,
отформатированных с fixed-length packets составляет около 500Мб.
Пакеты переменной длинны (Variable-length packets) экономят место, т.к. размер
пакета может изменяться в зависимости от количества записываемых данных. Это
более полезно при записи на стандартные CD-R диски, поскольку они являются writeonce, и нет необходимости отслеживать свободное пространство, когда файлы
"удаляются" (на CD-R дисках файлы не могут быть физически удалены, однако
можно сделать их невидимыми).
КАК УСТРОЕН ПРИВОД CD-ROM?
Типовой пpивод состоит из:

платы электроники
Hа плате электpоники pазмещены все упpавляющие схемы пpивода, интеpфейс с
контpоллеpом компьютеpа, pазъемы интеpфейса и выхода звукового сигнала. Большинство
пpиводов использует одну плату электpоники, однако в некотоpых моделях отдельные
схемы выносятся на вспомогательные небольшие платы.

шпиндельного двигателя
Шпиндельный двигатель служит для приведения диска во вращение с постоянной или
пеpеменной линейной скоpостью. Сохpанение постоянной линейной скоpости тpебует
изменения угловой скоpости диска в зависимости от положения оптической головки. Пpи
поиске фpагментов диск может вpащаться с большей скоpостью, нежели пpи считывании,
поэтому от шпиндельного двигателя тpебуется хоpошая динамическая хаpактеpистика;
двигатель используется как для pазгона, так и для тоpможения диска. Hа оси шпиндельного
двигателя закpеплена подставка, к котоpой после загpузки пpижимается диск. Повеpхность
подставки обычно покpыта pезиной или мягким пластиком для устpанения пpоскальзывания
диска. Пpижим диска к подставке осуществляется пpи помощи шайбы, pасположенной с
дpугой стоpоны диска; подставка и шайба содеpжат постоянные магниты, сила пpитяжения
котоpых пpижимает шайбу чеpез диск к подставке.

системы оптической считывающей головки
Система оптической головки состоит из самой головки и системы ее пеpемещения. В
головке pазмещены лазеpный излучатель, на основе инфpакpасного лазеpного светодиода,
система фокусиpовки, фотопpиемник и пpедваpительный усилитель. Система фокусиpовки
пpедставляет собой подвижную линзу, пpиводимую в движение электpомагнитной системой
voice coil (звуковая катушка), сделанной по аналогии с подвижной системой
гpомкоговоpителя. Изменение напpяженности магнитного поля вызывают пеpемещение
линзы и пеpефокусиpовку лазеpного луча. Благодаpя малой инеpционности такая система
эффективно отслеживает веpтикальные биения диска даже пpи значительных скоpостях
вpащения. Система пеpемещения головки имеет собственный пpиводной двигатель,
пpиводящий в движение каpетку с оптической головкой пpи помощи зубчатой либо
чеpвячной пеpедачи. Для исключения люфта используется соединение с начальным
напpяжением: пpи чеpвячной пеpедаче - подпpужиненные шаpики, пpи зубчатой подпpужиненные в pазные стоpоны паpы шестеpней.

системы загpузки диска
Система загpузки диска выполняется в двух ваpиантах: с использованием
специального футляpа для диска (caddy), вставляемого в пpиемное отвеpстие пpивода, и с
использованием выдвижного лотка (tray) - 4, на котоpый кладется сам диск. В обоих случаях
система содеpжит двигатель, пpиводящий в движение лоток или футляp, а также механизм
пеpемещения pамы, на котоpой закpеплена вся механическая система вместе со
шпиндельным двигателем и пpиводом оптической головки, в pабочее положение, когда диск
ложится на подставку шпиндельного двигателя. Пpи использовании обычного лотка пpивод
невозможно установить в иное положение, кpоме гоpизонтального. В пpиводах,
допускающих монтаж в веpтикальном положении, констpукция лотка пpедусматpивает
фиксатоpы, удеpживающие диск пpи выдвинутом лотке.
Hа пеpедней панели пpивода обычно pасположены кнопка Eject - 6 для
загpузки/выгpузки диска, индикатоp обpащения к пpиводу - 7 и гнездо для подключения
наушников - 1 с электpонным или механическим pегулятоpом гpомкости - 2. В pяде моделей
добавлена кнопка Play/Next - 5 для запуска пpоигpывания звуковых дисков и пеpехода
между звуковыми доpожками; кнопка Eject пpи этом обычно используется для остановки
пpоигpывания без выбpасывания диска. Hа некотоpых моделях с механическим pегулятоpом
гpомкости, выполненным в виде pучки, пpоигpывание и пеpеход осуществляются пpи
нажатии на тоpец pегулятоpа.
Большинство пpиводов также имеет на пеpедней панели небольшое отвеpстие - 3,
пpедназначенное для аваpийного извлечения диска в тех случаях, когда обычным способом
это сделать невозможно - напpимеp, пpи выходе из стpоя пpивода лотка или всего CD-ROM,
пpи пpопадании питания и т.п. В отвеpстие нужно вставить шпильку или pаспpямленную
скpепку и аккуpатно нажать - пpи этом снимается блокиpовка лотка или дискового футляpа,
и его можно выдвинуть вpучную.
Технические аспекты CD-R дисков
CD-R диск вполне может быть уподоблен
многослойному пирогу: кроме весьма важного
активного слоя, на котором собственно и
производится запись информации, существует
еще светоотражающий слой, располагающийся
над активным. Именно от него в той или иной
степени отражается при чтении луч лазера,
проходящий
через
активный
слой.
Соответственно, в зависимости от силы
отраженного
луча,
читающее
устройство
воспринимает результат в виде логического 0 или
логической 1. В качестве отражающего слоя
используется
тончайшая
пластинка
из
промышленного золота, однако в последнее
время имеется выраженная тенденция на переход к серебру. Ведь серебро не только
значительно дешевле золота, но и обладает большим коэффициентом светоотражения (70 и
80 процентов соответственно). Таким образом, при замене золота на серебро решается
задача улучшения совместимости (часто употребляется разговорный термин “читаемость”)
дисков с одновременным их удешевлением.
Защитный слой – слой, наносимый поверх светоотражающего и используемый для
механической защиты CD-R диска. Тут тоже возможны варианты: в простейшем случае
защитный слой являет собой покрытие лаком. Это мало надежно не только с точки зрения
механики – лак легко обдирается, – но и с точки зрения химии: надпись, сделанная на диске
маркером, может привести к потере информации из-за проникновения чернил сквозь тонкий
слой лака – начнется химическая реакция, столь пагубная для диска.
Более серьезные защитные покрытия состоят в нанесении дополнительного слоя,
ограждающего другие слои CD-R диска как от механических, так и от неблагоприятных
химических воздействий. Как пример можно привести покрытие InfoGuard носителей фирмы
Kodak. Оно не только защищает диск и придает ему привлекательный внешний вид, но и
позволяет безбоязненно делать на нем надписи.
Особое
место
занимают
покрытия для печати. Они
наносятся на внешнюю сторону
диска в случае, если они
предназначены, в основном, для
производства. Printable Surface –
поверхность,
впитывающая
чернила, наносимые при печати
на
специальных
струйных
принтерах, Thermal Transfer
Surface – поверхность для термической печати.
Завершая рассмотрение структуры строения CD-R диска следует упомянуть и об основе на
которой, собственно, располагаются активный, светоотражающий и защитный слои. Это
обычный пластиковый кружок, за исключением того, что характеристики пластмассы
должны быть таковы, чтобы луч лазера, проходящий сквозь него, должным образом
фокусировался и не вызывал разрушений основы.
Все CD-ROM имеют один и тот же физический формат изготовления и емкость 650
Мбайт. Диск диаметром 120 мм, толщиной 1,2 мм и центральным отверстием диаметром 15
мм. Центральная область вокруг отверстия шириной 6 мм называется зоной крепления
(clamping area). За ней непосредственно следует заголовочная область (lead in area),
содержащая оглавление диска (table of content). Далее расположена область шириной 33 мм,
предназначенная для хранения данных и физически представляющая собой единый трек.
Завершающей является терминальная область (lead out) шириной 1 мм. Внешний обод диска
шириной 3 мм.
Область хранения данных логически может содержать от 1 до 99 треков, однако
разнородная информация не может быть смешанна на одном треке. Цифровая информация
хранится на CD-ROM в виде чередующихся по ходу спирали ямок, нанесенных на
поверхность полиуглеродного пластика. Ямка воспринимается лучом лазера как логический
ноль, а гладкая поверхность как логическая единица. В отличие от, например, винчестеров,
дорожки которых представляют собой концентрические окружности, компакт-диск имеет
всего одну физическую дорожку в форме непрерывной спирали, идущей от внутреннего
диаметра к наружному. Тем не менее, одна физическая дорожка может быть разбита на
несколько логических.
Разновидности CD-R дисков
В общем и целом все множество CD-R дисков делятся на brand-name (BN) версии и
версии для производства (OEM). Диски BN-версий характеризует то, что они выпускаются с
уже нанесенным на поверхность диска логотипом производителя и полиграфической
вставкой. Такие диски обычно продаются в розницу и являются приемлемым решением для
тех, кто собирается хранить на них архивы данных, время от времени создавать
музыкальные сборники и т.п. Надписи на таких дисках возможно наносить специальным
маркером или фломастером. Диски BN продаются упакованными в пластиковые коробки
(jewel case), затянутые защитной пластиковой пленкой. 10 дисков обычно собираются в
коробку.
Диски для производства или OEM, не имеют на своей внешней поверхности ни
логотипа, ни каких прочих надписей и графических элементов. Поверхность “чистая”. И
хотя на ней так же как и на поверхности дисков BN можно делать надписи маркером, OEMдиски предназначены все же для печати на их поверхности текста и графики с помощью
специальных CD-принтеров или нанесения собственного логотипа методом шелкографии
или офсетной печати. Упаковываются OEM-диски таким образом, чтобы было возможно
максимально удобно включить их в производственную технологическую цепочку. Наиболее
распространенным типом упаковки являются стопки (bulk) и стопки на осях (spindle): в
первом случае некоторое количество дисков (обычно 100) упакованы в термоусадочную
пленку, в картонной коробке 6 стопок, а, следовательно, 600 дисков; во втором случае диски
насажаны на специальную ось (обычно это 125 дисков) и собраны в коробки по 500 дисков в
каждой.
Следует отметить, что диски для производства (OEM) более многофункциональны в
смысле нанесения на них надписей тем или иным способом и дешевы, нежели диски brandname, которые имеет смысл приобретать только тогда, когда общая месячная потребность в
дисках не превосходит нескольких десятков штук и нет никаких специальных требований к
их оформлению.
Используемые интерфейсы: IDE и SCSI
Попробуем посмотреть, чем отличаются устройства CDROM с IDE (ATAPI) и SCSI
интерфейсами. Для сравнения была выбрана 12x модель фирмы Pioneer, поскольку
существуют ее модификации для обоих интерфейсов. Заметим, что не всегда хорошая
модель на IDE является хорошей и для SCSI. Например самый быстрый (в свое время)
жесткий диск серии Quantum Fireball в SCSI варианте показывает производительность ниже
среднего среди недорогих SCSI дисков. В большинстве случаев SCSI устройства, которые
"произошли" от своих IDE - двойников скорее всего не реализуют все возможности
интерфейса и поэтому проигрывают по скорости. В то же время сравнимые по объему
жесткие диски SCSI существенно дороже чем IDE.
ЧТО ЛУЧШЕ?
IDE-привод
Достоинства
-
низкая цена
простая установка
-
SCSI-привод
надежная работа
возможность работы в фоновом
режиме
практически полное отсутствие
проблемы "опустошения
буфера"
не занимает второй IDEконтроллер
более качественная запись
не требует оптимизации ОС
возможность безопасной записи
на более высоких скоростях
-
Недостатки
-
единолично занимает
второй IDEконтроллер
требует оптимизации
ОС
отнимает все
процессорные
ресурсы при
осуществлении записи
-
более сложная установка
высокая цена
необходимость в дополнительном
контроллере
Возможности
Кроме очень специальных приложений IDE и SCSI устройства
обеспечивают абсолютно одинаковые возможности и поддерживают одни и теже стандарты. Отличия могу быть только обусловленные интерфейсом, а не
самим устройством. Например, количество подключаемых устройств,
необходимые драйвера, пиковая скорость передачи и т.д.
Параметры CD-приводов
Скорость передачи данных и время доступа к информации
Максимальная скорость вращения диска определяет скорость передачи данных с
диска. Скорость передачи данных (dats-transfer rate) зависит от двух факторов - плотности
данных и скорости вращения диска. Под плотностью в данном случае понимают количество
бит (впадин) на дюйм (или миллиметр). Так, для 16-битного стереосигнала качества аудиоCD (частота 44.1 кГц) скорость должна быть 1.4 Мбита/с. Разделив это значени на число бит
в байте (8), мы получим 176.4 Кбайта/с - усредненное значение для скорости передачи
данных. Стандарт МСР1 определяет скорость передачи данных как 150 Кбайт/с, МСР 2 - 300
Кбайт/с. В настоящее время наибольшее распространение получили приводы, использующие
технологию удвоения скорости вращения диска. Именно в этом случае скорость передачи
достигает значения 300 Кбайт/с. Подобные устройства удовлетворяют спецификации МСР 2,
поскольку имеют время поиска менее 400 мс. Сравнительно недавно появились модели
приводов с утроенной, учетверенной и даже ушестеренной скоростью вращения. Пионером в
технологии увеличения скорости являются, например, фирмы NEC и Plextor.
При выполнении реальных прикладных задач большая часть времени тратится на
поиск данных или на доступ к определенной части диска с требуемой информацией.
Поэтому время доступа к информации существенно влияет на производительность привода
CD-ROM и является определяющим фактором. Сейчас по скорости передачи данных
приводы CD-ROM уже вплотную приблизились к жестким магнитным дискам, а по скорости
доступа к информации они по-прежнему уступают им. Поэтому гораздо выгоднее считывать
с CD-ROM большие файлы, чем работать с множеством мелких файлов, разбросанных по
всему диску.
Для существенного ускорения передачи данных от CD-ROM разработчиками
используется технология кэширования, т.е. такая технология, когда привод и/или компьютер
заранее производят чтение нужной информации и хранят ее во временном буфере, чтобы
потом без задержек переслать процессору. Реализация этой технологии существенно влияет
на общую производительность устройства.
Скорость записи
Термин “скорость записи” определяет, насколько быстро данные могут быть записаны
на CD-R диск. Маркировка 1х, 2х, 4x показывает, во сколько раз быстрее устройство
записывает данные по сравнению с односкоростным эталоном. Под одной скоростью
понимается скорость передачи данных равная 150 Кб/сек. Таким образом, маркировка 2х
значит, что данные могут записываться со скоростью 300 Кб/сек, а 4х – 600 Кб/сек.
Необходимо принять во внимание, что реальная скорость может различаться в зависимости
от режимов записи, так как к примеру данные записываются в режиме 2048 байт на блок, а
звуковая информация в режиме 2352 байта на блок.
Обычно маркировка приводов CD-ROM состоит из одной цифры, показывающей с
какой скоростью данные могут быть считаны. Маркировка CD-рекордеров содержит две
цифры: первая – скорость записи, вторая – скорость считывания (например 4x8 для CDрекордера Panasonic 7502B). Если же маркировка состоит из трех цифр, то это значит, что
такой привод может работать еще и с CD-RW дисками, возможная скорость записи на
которые – вторая цифра в маркировке.
Объем хранимой информации
На большинстве дисков указана их максимальная вместимость в мегабайтах данных
(обычно 650 при размере блока 2048 байт). На дисках некоторых производителей (например,
Maxell) вместимость в рекламных целях указывается в миллионах байтов (680), что означает
те же 650 Мб. Отдельные диски маркируются цифрой 780, что обозначает емкость диска в
звуковых секторах (74 минуты по 176 кб). При записи в формате mode 2 за счет большей
величины блока данных возможна запись более 650 Мб. 63- и 74-минутные компакт-диски
позволяют хранить различный объем данных. 74-минутные диски, соответственно,
позволяют хранить больше информации, чем 63-минутные. В самых первых устройствах
записи использовались только 63-минутные диски. Современное же поколение устройств
записи может работать с обоими типами дисков. Вряд ли можно что-либо сэкономить при
использовании 63-минутных дисков, так как в настоящее время почти все производители
предлагают оба типа дисков по одной цене.
Размер блока данных и внутреннего буфера
Под размером блока данных (data block size) понимают минимальное количество байт,
которые передаются на компьютер через интерфейсную карту. Иначе говоря, это единица
информации, с которой оперирует контроллер привода. Минимальный размер блока данных
в соответствии со спецификацией МРС равен 16 Кбайт. Поскольку файлы на компакт-диске
обычно достаточно большие, то промежутки между блоками данных ничтожно малы.
Размер буфера - размер внутреннего буфера (кэш-памяти),в который считываются
файлы перед их передачей. Стандарт МРС устанавливает размер буфера в 64 Кбайт, а это в
буфере будет находиться около 0.4 секунды 16-битного стереосигнала качества CD-Audio
(частоты 44.1 кГц). Для скоростных устройств размер буфера может достигать 256 Кбайт и
даже 2 Мбайта.
DVD и дисковые комбайны
Цифровой универсальный диск DVD (Digital Versatile Disc) считается самым
перспективным форматом архивирования и записи больших объемов информации. Он был
специально разработан, чтобы преодолеть ограничения по качеству записи и емкости Video
CD, аудио-компакт-дисков и даже кассет домашних видеомагнитофонов. Требования к
формату DVD сложились еще в сентябре 1995 года и основывались на соглашении между
несколькими крупнейшими компаниями в области цифрового видео, такими как Sony,
Philips, Toshiba и Matsushita. DVD внешне похож на обычные CD. На самом деле,
единственное, что их объединяет, это диаметр, равный 12 см (есть и 8 см, но он куда менее
распространен), и оптическая природа хранения информации.
DVD (тогда еще Digital Video Disc) задумывался как цифровой носитель для
видеофильмов и лишь потом был назван универсальным. Тогда казалось, что с приходом
DVD у кинопрокатчиков появится прекрасная возможность защитить фирменную
продукцию от пиратов, которая (на мой взгляд, благодаря «встречным» технологиям
азиатских фирм) с треском провалилась (и слава богу!), не успев родиться. Как всегда, ктото вкладывает сотни миллиардов в разработку самолета-невидимки, а кому-то требуются
всего десятки миллионов на разработку технологии его обнаружения. Краткая история
такова: разработчики DVD придумали размещать на видеодисках зональный код, который
мог бы распознаваться плейером и MPEG-декодером. Предполагалось, что воспроизведение
диска, купленного в Америке, будет блокироваться плейером, установленным в Восточной
Европе или Азии. Но на практике это могло нанести удар, пожалуй, только по легальным
пользователям. Например, честно купленный в США видеофильм не будет
воспроизводиться в России. Ну разве так делается?
Сегодня существует уже около полутора десятков официальных форматов
цифровых универсальных дисков, включая различные типоразмеры. Самыми
распространенными (потому что стандарты утверждены) можно считать DVD-Video и DVDROM. Диск DVD-Video может содержать целый фильм с цифровым звуком и изображением
и может быть просмотрен как на соответствующем проигрывателе, подсоединенном к
телевизору, так и на компьютере с DVD-приводом. Для комфортного просмотра
видеофильмов в формате DVD необходим MPEG-2-декодер или мощный процессор,
позволяющий работать с программным проигрывателем (программно декодировать MPEG2). На видеокомпакт-диске DVD имеется также специальная звуковая дорожка с
возможностью записи нескольких каналов (левого, правого, центрального, двух каналов
объемного звучания и сабвуфера). Эта система аналогична Dolby Digital AC-3. Помимо этого
имеется и стандартный стереоканал. Воспроизведение DVD-видеофильмов производится на
стандартной скорости 1х, которая для DVD составляет 1385 Кбайт/с. Здесь главное — не
перепутать с 1х для CD-ROM, которая составляет 150 Кбайт/с. Современные приводы DVDROM для работы с данными используют скорости около 12х, достигая пиковой скорости
передачи данных в 16,6 Мбайт/с.
Диски DVD-ROM содержат только информацию, так что их можно использовать
исключительно на компьютере. Поддержка файловой структуры на физическом уровне
одинакова у обоих типов, но отличается от традиционных дисков CD-ROM. При этом DVDдиски могут быть разной емкости. Как мы знаем, классические CD-ROM-диски содержат до
650 Мбайт информации или 74 минуты музыки. Емкость же DVD зависит от их
конструкции.
CD и DVD сохраняют информацию при помощи серии микроуглублений,
формирующих спиральные дорожки начиная от центра диска. Однако на DVD эти
микроуглубления более маленькие и, следовательно, более плотно прилегают друг к другу.
Кроме того, сами треки (дорожки) DVD располагаются гораздо плотнее, что позволяет
разместить на диске почти в семь раз больше данных, чем на обычном CD-ROM. Для чтения
данных с DVD применяется точно сфокусированный лазер с меньшей длиной волны, чем
излучают диоды обычных приводов CD-ROM (635-650 нанометров против 780 нм у CD).
Каждый DVD-диск может иметь на одной стороне два слоя, хранящих информацию,
один над другим. Первый слой полупрозрачен, и лазер читает его без проблем. Для чтения
содержимого второго слоя необходимо так перефокусировать лазер, чтобы луч проходил
через первый слой и отражался только от второго. Таким образом, емкость диска
увеличивается вдвое, а сложность конструкции привода существенно возрастает. И наконец,
информацию на DVD можно записывать с двух сторон (а каждая из сторон может содержать
два уровня). Теперь уже емкость диска увеличена в четыре раза по сравнению с
классическими однослойным и односторонним. Единственное неудобство заключается в
том, что переворачивать диск приходится вручную. Сводка о форматах 12-сантиметровых
DVD приведена в таблице.
DVD и дисковые комбайны DRW
Для объединения дисководов оптических дисков CD и DVD в одном
приводе около года назад были разработаны так называемые дисковые
комбайны (combo-drive), именуемые также DRW (что удобно, но, строго
говоря, неправильно). Напомним, что современные комбайны совмещают в
себе сразу четыре функции: обычный CD-проигрыватель, средство
однократной записи CD-R, устройство для перезаписи дисков CD-RW и DVDпроигрыватель
Первые дисковые комбайны DRW, способные записывать диски CD-R/RW и
воспроизводить носители форматов CD-ROM и DVD, появились на рынке менее года назад.
Эти модели были довольно сырыми, и в них чувствовался конфликт технологий — между
DVD- и CD-составляющими. В современных дисковых комбайнах разработчикам удалось
добиться совместимости различных механизмов чтения/записи, но при этом пришлось пойти
на компромисс. В частности, DVD имеют более высокое время доступа (в 2-3 раза), чем CDприводы. Это закономерно, поскольку DVD изначально проектировался для быстрого
чтения непрерывных потоков данных, то есть длинных файлов — видео например. А чтобы
резво перескакивать с одного участка диска на другой, нужна поистине прецизионная
механика и интеллектуальная головка. Поэтому в дисковых комбайнах первой волны время
поиска при чтении CD-ROM всегда существенно большее, чем на специализированных CDприводах. Вообще, режимы работы с CD у комбайна еще долго будут несколько уступать по
производительности отдельным специализированным дисководам СD-ROM/R/RW.
Впрочем, задача дискового комбайна — не обеспечить производительность,
достойную Книги рекордов Гиннесса, а стать комплексным, совместимым решением,
заведомо более дешевым и удобным, чем покупка и размещение нескольких отдельных
специализированных дисководов. Один из первых дисковых комбайнов AOpen DRW-6424,
испытанный в тестовой лаборатории «КомпьютерПресс», обладал следующими
показательными техническими характеристиками: время доступа для CD-ROM < 120 мс
(очень плохо), а для DVD-ROM < 200 мс; производительность при записи: CD-R — 6х (1х =
150 Кбайт/с), CD-RW — 4х (1х = 150 Кбайт/с); производительность при чтении: DVD — до
4х (для DVD 1х = 1385 Кбайт/с), CD — до 24х (1х = 150 Кбайт/с).
Сегодня модели дисковых комбайнов можно пересчитать по пальцам. Усредненная
модель современного комбайна условно обладает следующими характеристиками:
внутренний E-IDE/ATAPI-интерфейс, буфер объемом 2 Мбайт, работа на скоростях 4х CDR, 4х CD-RW, 24х CD Read и 4х DVD. Несколько лучше характеристики модели от фирмы
Ricoh (модель MP9120A), которая способна записывать в режиме CD-R со скоростью 12х, в
режиме CD-RW — 10х, читать лазерные диски при 32х и имеет 8х DVD. Фаворитом у
авторов аппаратных Web-ресурсов на сегодняшний день является недавно выпущенный
внешний комбайн от компании Addonics MOBILE DVD/CD-RW. Он отличается не только
тем, что является единственным внешним дисководом со столь широким спектром функций,
но и тем, что способен работать на высоких скоростях: 12х CD-R, 10х CD-RW, 32х CD-ROM
и 8х DVD. Подключаться к компьютеру DRW от Addonics может через различные
интерфейсы — это и ATAPI PCMCIA (PC Card), и USB, и даже FireWire.
Справочная информация
Какие диски являются лучшими для записи: "золотые", синие или
зеленые ?
Цвет диска определяется типом органического материала, который прожигается
лазером CD-рекордера и цветом прозрачной основы . Тип органического материала , в свою
очередь определяется технологией производства той или иной фирмы. Исторически
сложилось так, что диски определенного типа (то бишь цвета) начали производиться раньше
и, соответственно, первые модели CD-рекордеров были оптимизированы именно под них.
Выпускаемые в настоящее время профессиональные модели CD-рекордеров , например
фирмы "YAMAHA", перед каждым сеансом записи калибруют и оптимизируют мощность
луча лазера под определенную скорость записи на специальной служебной области CD-R
диска, поэтому для таких CD-рекордеров практически нет проблем совместимости с теми
или иными типами дисков и , соответственно , нет особых предпочтений.
Что означают цифры, нанесенные на CD-R диске ?
Указанная на CD-R диске цифра (цифры) скорости записи обычно означает , если не
указано иное , не максимальную скорость , а лишь ту скорость (скорости) записи, на
которую этот диск сертифицирован,. Дело в том, что процессы , происходящие в CD-R диске
при записи на различных скоростях несколько отличаются друг от друга; и CD-R диск
великолепно записывающийся на 4-ех кратной (4х) скорости совсем не обязательно даст
хорошие результаты при скоростях записи 1х и 2х, если конечно он не сертифицирован на
эти скорости; соответственно верно и обратное. Несмотря на то, что как правило запись
ведется на максимальной для данного CD-рекордера скорости , может возникнуть ситуация,
когда по каким либо причинам (например при нехватке времени или места на винчестере)
придется записывать диск "на лету" и для гарантированно надежной записи придется
снизить скорость до 2х , а то и до 1х - вы должны быть уверены, что ваш диск
сертифицирован и для этих скоростей записи.
Какова надежность и длительность хранения данных, записанных на CDR диск ?
CD-R диск по своим оптическим свойствам максимально приближен к дискам
,произведенным заводским способом ("штампованным") дискам. Поэтому качественный CDR диск , записанный на соответствующей скорости на качественном CD-рекордере должен и
будет читаться на любом качественном CD-ROMе на любой скорости. С точки зрения же
долговечности и сохранности данных CD-R диски превосходят "штампованные" диски уже
хотя бы потому, что в качестве отражающего слоя в первых применяются стабильные и
долговечные благородные металлы в отличие от легко окисляющегося алюминия в
"штампованных" дисках. Ведущие производители CD-R дисков обычно приводят
гарантированный срок хранения данных не менее 100 лет, при условии надлежащего
обращения.
Насколько CD-R диски защищены от механических повреждений ?
На первый взгляд компакт-диск вообще и CD-R диск в частности вещь хрупкая - его
легко поцарапать или "заляпать" пальцами. Это верно лишь отчасти, на самом деле следы от
пальцев не самое страшное для диска, не столь страшны даже царапины на прозрачной
основе диска. Дело в том, что структура CD-R диска представляет из себя своего рода
многослойный пирог: прозрачная основа; тонкая органическая пленка, прожигаемая
лазером; отражающий металлизированный слой; защитные лаковые слои; слой с логотипом
и маркировкой диска. Как видно из вышесказанного, считывающий луч лазера фокусируется
в глубине прозрачной основы диска и поэтому практически "не замечает" царапины, обычно
затрагивающие лишь верхний слой основы. Правда надо учитывать следующее - речь идет о
небольших и в основном о поперечных царапинах(т.е. идущих по радиусу диска). Длинные
продольные(идущие по окружности) царапины все же могут вызвать ошибки записи/чтения
из-за сбоев в системе слежения луча лазера за дорожкой. Как это ни странно звучит, гораздо
легче серьезно повредить CD диск со стороны маркировки - ведь именно там, всего лишь в
сотых долях миллиметра от поверхности находятся отражающий и прожигаемый слои.
Достаточно чиркнуть ручкой или провести с легким усилием ногтем по поверхности
слабозащищенного диска и вы либо соскоблите все информационные слои, либо продавите
их , что в итоге приведет к порче диска.
К счастью, существуют диски, сводящие практически к "нулю" возможность
повреждения диска подобным образом. Например диски фирмы "Traxdata" имеют 2 слоя
защиты от механических и тепловых воздействий. Один из этих слоев наносится с
использованием метода ульрафиолетового отверждения (аналогично применяемого в
стоматологии при пломбировании). Даже тонкий слой материала, полученного таким
образом, обладает уникальной твердостью, препятствующей случайной механической порче
диска. Конечно, не рекомендуется писать по поверхности даже таких дисков обычным
карандашом или ручкой; разумнее использовать специальный CD-R маркер, имеющий
мягкий стержень и заправленный специальными быстровысыхающими чернилами, не
разрушающими защитные слои дисков.
Можно ли дозаписывать информацию на CD-R диск и насколько это удобно?
Действительно, до последнего времени запись на CD-R диски можно было
осуществлять только с помощью специализированых программ. Каждая так называемая
сессия дозаписи на CD-R диск отнимала до 17 МБ под служебную информацию. С
появлением новых моделей CD-рекордеров, поддерживающих режим пакетной записи,
многие из вышеперечисленных неудобств были устранены. Пользователь, имея один из этих
CD-рекордеров может установить специальный драйвер для ОС Windows 95; после этого
CD-рекордер становится виден ОС и всем программам как логический диск, доступный не
только для чтения , но и для записи. При этом пользователь может загрузить например свой
документ c CD-R диска в текстовый редактор, внести изменения и сохранить его как обычно
на том же CD-R диске; или же например указать программе BackUp CD-рекордер как
логический диск для хранения данных. При пакетной записи проявляется главное
преимущество пакетной записи - CD-R диски дополняются сколь угодно малыми пакетами
данных (информации) сколь угодно много раз, не расходуя при этом напрасно служебную
информацию.
ВОСПРОИЗВЕДЕНИЕ ЗВУКА
Запись и воспроизведение звука – это область, в которой наука сочетается с искусством
(звукорежиссера). Здесь есть две важные стороны: верность воспроизведения (как
отсутствие нежелательных искажений) и пространственно-временная организация звучаний,
поскольку задача воспроизведения звука электромеханическими средствами состоит не
только в том, чтобы воссоздать звук, максимально приближенный к воспринимаемому в
студии или концертном зале, но и в том, чтобы преобразовать его с учетом той акустической
обстановки, в которой он будет прослушиваться.
В графическом представлении простейшую форму имеют звуковых колебания чистых тонов
типа создаваемых камертоном. Им соответствуют синусоидальные кривые. Но большинство
реальных звучаний имеет неправильную форму, которая однозначно характеризует
звучание, так же, как отпечатки пальцев – человека. Всякое звучание может быть разложено
на чистые тона разных частот (рис. 1). Эти тона состоят из основного тона и обертонов
(гармоник). Основным тоном (с низшей частотой) определяется высота ноты. По обертонам
мы различаем музыкальные инструменты, даже когда на них берется одна и та же нота.
Обертоны особенно важны тем, что они создают тембр инструмента и определяют характер
его звучания.
Рис. 1. ФОРМА ЗВУКОВОЙ ВОЛНЫ и ее разложение на составные частоты, т.е. на
основной тон и обертоны (гармоники).
Диапазон основных тонов большинства источников звука довольно узок, благодаря чему
можно легко понимать речь и улавливать мотив, даже если у воспроизводящей аппаратуры
ограниченная частотная полоса. Полнота же звучания обеспечивается лишь при наличии
всех обертонов, а для их воспроизведения необходимо, чтобы не искажались соотношения
между уровнями основного тона и обертонов, т.е. частотная характеристика
воспроизводящей системы должна быть линейной во всем диапазоне слышимых частот.
Именно такую характеристику (наряду с отсутствием искажений) и имеют в виду, когда
говорят о высокой точности звуковоспроизведения (системы hi-fi).
Громкость. Восприятие громкости звука зависит не только от его интенсивности, но и от
многих других факторов, в число которых входят и субъективные, не поддающиеся
количественной оценке. Важное значение имеет обстановка, окружающая слушателя,
уровень внешнего шума, высота и гармоническая структура звучания, громкость
предыдущего звучания, эффект «маскирования» (под впечатлением предыдущего звучания
ухо становится менее чувствительным к другим звучаниям близкой частоты) и даже
эстетическое отношение слушателя к музыкальному материалу. Нежелательные звуки
(шумы) могут казаться более громкими, чем желательные той же интенсивности. Даже
восприятие высоты звучания может зависеть от интенсивности звука.
Восприятие различий в высоте музыкальных тонов определяется не абсолютной величиной
частотных интервалов, а их отношением. Например, отношение двух частот, различающихся
на октаву, в любой части звукоряда равно 2:1. Точно так же наша оценка изменений
громкости определяется отношением (а не разностью) интенсивностей, так что изменения
громкости воспринимаются как одинаковые, если одинаковы изменения логарифма
интенсивности звука.
Поэтому уровень громкости звука измеряется по логарифмической шкале (на практике – в
децибелах). Уши человека способны воспринимать звук в колоссальном диапазоне
мощности от порога слышимости (0 дБ) до порога болевого ощущения (120 дБ),
соответствующего отношению интенсивностей 1012. Современное оборудование способно
воспроизводить изменения громкости в пределах порядка 90 дБ. Но воспроизводить весь
диапазон слышимости практически и не требуется. Большинство слушает музыку примерно
на уровне негромкой речи, и вряд ли кому-нибудь было бы по себе в домашних условиях
при нормальной громкости оркестра или рок-группы.
Поэтому необходимо регулировать диапазон громкости, особенно при воспроизведении
классической музыки. Это можно делать, постепенно понижая громкость перед крещендо
(по партитуре) при сохранении нужного динамического диапазона. Для других музыкальных
материалов, таких, как рок- и поп-музыка, широко применяются компрессоры,
автоматически сужающие динамический диапазон усиливаемых сигналов. Но в дискотеках
уровень звука нередко превышает 120 дБ, что может вызвать повреждение слуха и привести
к полной глухоте. В этом отношении группа повышенного риска – поп-музыканты и
звукооператоры. Особенно опасны наушники, так как они концентрируют звук.
Большинство слушателей широковещательных программ предпочитают, чтобы все
программы озвучивались примерно на одном и том же уровне громкости и им самим не
нужно было регулировать громкость. Но громкость – субъективное восприятие. Некоторым
громкая музыка способна досаждать больше, чем речь, хотя неразборчивая речь иногда
сильнее раздражает, чем музыка той же громкости.
Балансировка звука. В основе хорошего звуковоспроизведения лежит сбалансированность
разных источников звука. Проще говоря, в случае одного источника звука суть хорошего
звуковоспроизведения в том, чтобы сбалансировать прямой звук, приходящий к микрофону,
с влиянием окружающей акустики и обеспечить правильный баланс между прозрачностью
звучания и его полнотой, допускающий нужную степень подчеркивания в тех местах, где это
требуется.
Бинауральный слух. Человек легко определяет направление на источник звука, поскольку
звук обычно достигает одного уха раньше, чем другого. Мозг улавливает эту малую разницу
во времени и небольшое различие в интенсивности звучания и по ним определяет
направление на источник звука.
Мы можем также определять, что звук пришел спереди, сзади, сверху или снизу. Это
объясняется тем, что наши уши по-разному передают частотный состав звуков, приходящих
в разных направлениях (а также тем, что слушатель редко держит голову абсолютно
неподвижно и в вертикальном положении). Этим объясняется и то, что люди с глухотой на
одно ухо сохраняют все-таки некоторую способность судить о направлении на источник
звука.
Бинауральный слух выработался у человека в качестве защитного механизма, но эта
способность разделять звуки – важное условие понимания музыки. Если эту способность
использовать при звукозаписи, то увеличивается впечатление верности и чистоты при
воспроизведении.
ЗВУКОЗАПИСЬ
В идеале процесс записи звука от входа записывающего устройства до выхода устройства
воспроизведения должен быть «прозрачным», т.е. ничто не должно изменяться, кроме
времени воспроизведения. Многие годы эта цель казалась недостижимой. Системы
звукозаписи были ограничены в диапазоне и неизбежно вносили те или иные искажения. Но
исследования привели к огромным улучшениям, и, наконец, с появлением цифровой
звукозаписи достигнут почти идеальный результат.
Цифровая звукозапись. При цифровой звукозаписи аналоговый звуковой сигнал
преобразуется в код из последовательностей импульсов, которые соответствуют двоичным
числам (0 и 1) и характеризуют амплитуду волны в каждый момент времени. Цифровые
аудиосистемы обладают огромными преимуществами перед аналоговыми системами в
отношении динамического диапазона, робастности (информационной надежности) и
сохранения качества при записи и копировании, передаче на расстояние и
мультиплексировании и т.п.
Аналого-цифровое преобразование. Процесс преобразования из аналоговой формы в
цифровую состоит из нескольких шагов.
Дискретизация. Периодически с фиксированной частотой повторения делаются дискретные
отсчеты мгновенных значений волнового процесса. Чем выше частота отсчетов, тем лучше.
По теореме Найквиста, частота дискретизации должна не менее чем вдвое превышать
наивысшую частоту в спектре обрабатываемого сигнала. Чтобы не допустить искажений,
связанных с дискретизацией, на входе преобразователя необходимо установить фильтр
нижних частот с очень крутой характеристикой и частотой отсечки, равной половине
частоты дискретизации. К сожалению, идеальных фильтров нижних частот не существует, и
фильтр с очень крутой характеристикой будет вносить искажения, которые могут свести на
нет преимущества цифровой техники. Дискретизацию обычно проводят с частотой 44,1 кГц,
которая позволяет применять практически приемлемый фильтр для защиты от искажений.
Частота 44,1 кГц была выбрана потому, что она совместима с частотой строчной развертки
телевидения, а все ранние цифровые записи производились на видеомагнитофонах.
Эта же частота 44,1 кГц является стандартной частотой дискретизации для проигрывателей
компакт-дисков и большей части бытовой аппаратуры, за исключением устройств записи на
цифровую аудиоленту (DAT), в которых используется частота 48 кГц. Такая частота выбрана
специально для того, чтобы воспрепятствовать нелегальному переписыванию компактдисков на цифровую магнитную ленту. В профессиональном оборудовании используется
главным образом частота 48 кГц. В цифровых системах, применяемых для целей вещания,
обычно работают с частотой 32 кГц; при таком выборе полезный диапазон частот
ограничивается величиной 15 кГц (из-за предела дискретизации), но частота 15 кГц
считается достаточной для целей вещания.
Квантование. Следующий шаг состоит в том, чтобы преобразовать дискретные отсчеты в
код. Это преобразование выполняется путем измерения амплитуды каждого отсчета и
сравнения ее со шкалой дискретных уровней, называемых уровнями квантования, величина
каждого из которых представлена числом. Амплитуда отсчета и уровень квантования редко
в точности совпадают друг с другом. Чем больше уровней квантования, тем выше точность
измерений. Различия между амплитудами отсчетов и квантования проявляются в
воспроизводимом звуке как шум.
Кодирование. Уровни квантования считаются в виде единиц и нулей. 16-разрядный
двоичный код (такой же, как используемый для компакт-дисков) дает 65536 уровней
квантования, что позволяет иметь отношение сигнал/шум квантования выше 90 дБ.
Получаемый сигнал отличается высокой робастностью, так как от воспроизводящего
оборудования требуется лишь распознать два состояния сигнала, т.е. определять, превышает
ли он половину максимально возможного значения. Поэтому цифровые сигналы можно
многократно записывать и усиливать, не опасаясь ухудшения их качества.
Цифро-аналоговое преобразование. Чтобы цифровой сигнал преобразовать в звуковой, его
нужно сначала преобразовать в аналоговую форму. Такое преобразование обратно аналогоцифровому преобразованию. Цифровой код преобразуется в последовательность уровней
(соответствующих исходным уровням дискретизации), которые сохраняются и считываются
с использованием исходной частоты дискретизации.
Передискретизация. Аналоговый выходной сигнал цифро-аналогового преобразователя
непосредственно использовать нельзя. Его нужно сначала пропустить через фильтр нижних
частот, чтобы не допустить искажений, связанных с гармониками частоты дискретизации.
Один из способов устранения этой трудности – передискретизация: частота дискретизации
повышается путем интерполяции, что дает дополнительные отсчеты.
Коррекция ошибок. Одно из основных преимуществ цифровых систем состоит в
возможности исправлять или маскировать ошибки и дефектные места, причиной которых
могут быть грязь или недостаточное количество магнитных частиц при записи, что вызывает
щелчки и пропуски звука, к которым человеческое ухо особенно чувствительно. Для
исправления ошибок предусматривается проверка на четность, для чего к каждому
двоичному числу добавляется бит проверки на четность, чтобы число единиц было четным
(или нечетным). Если из-за ошибки произошла инверсия, то число единиц не будет четным
(или нечетным). Проверка на четность обнаружит это, и либо будет повторен предыдущий
отсчет, либо будет выдано значение, промежуточное между предыдущим и следующим
отсчетами. Такая процедура называется маскировкой ошибок.
Компакт-диск (CD). Компакт-диск оказался первой общедоступной цифровой
аудиосистемой. Это миниатюрная грампластинка диаметром 120 мм с цифровой записью на
одной стороне, воспроизводимой на лазерном проигрывателе.
Полностью записанный диск звучит 74 мин. Он дает почти идеальное воспроизведение с
частотной характеристикой от 20 Гц до 20 кГц и с превышающими 90 дБ динамическим
диапазоном, отношением сигнал/шум и разделением между каналами. Проблема
детонационного искажения звука для него не существует, так же как и проблема износа.
Диски прочны, не требуют особой осторожности в обращении, не боятся пыли (в небольших
количествах) и даже царапин, так как все это не наносит ущерба качеству воспроизведения.
Первый оригинал компакт-диска (мастер-диск) изготавливают методом фотолитографии,
используя лазер для выжигания питов (микроуглублений) на поверхности фоторезиста,
нанесенного на стеклянный диск. В процессе производства питы становятся выступами
отражающей нижней поверхности пластиковых дисков, на которую затем наносится слой
прозрачного пластика толщиной 1,2 мм.
Длина питов и расстояние между ними несут цифровую информацию. Питы идут по спирали
длиной 5,7 км, которая начинается в центральной части диска, закручивается по часовой
стрелке и доходит до края. Шаг спирали равен 1,6 мкм (примерно 1/40 диаметра
человеческого волоса и около 1/60 среднего шага канавок записи на долгоиграющей
пластинке). Информация в цифровом коде считывается лазерным лучом. Там, где луч
попадает в промежутки между выступами, он отражается обратно и светоделительной
призмой направляется на фотоприемник. Когда же считывающий лазерный луч попадает на
выступ, он при отражении диффузно рассеивается (рис. 3). Поскольку компакт-диск
представляет собой цифровую систему, выходной сигнал фотоприемника имеет лишь два
значения: 0 и 1.
Рис. 3. КОМПАКТ-ДИСК, увеличенный разрез вдоль дорожки. Сфокусированный
лазерный луч, падающий на участок между двумя выступами (слева), отражается обратно.
Луч же, падающий на выступ (справа), рассеивается во все стороны.
Принцип действия компакт-диска требует предельной точности фокусировки лазерного луча
и трекинга (отслеживания дорожки). Обе функции осуществляются оптическими
средствами. Сервомеханизмы фокусировки и трекинга должны очень быстро действовать,
чтобы компенсировать деформацию диска, его эксцентриситет и другие физические
дефекты. В одном из конструктивных решений используется двухкоординатное устройство с
двумя катушками, установленными под прямым углом в магнитном поле. Они обеспечивают
перемещение объектива по вертикали для фокусировки и по горизонтали для трекинга.
Специальная система кодирования преобразует 8-разрядный звуковой сигнал в 14разрядный. Такое преобразование, уменьшая требуемую полосу, облегчает выполнение
операций записи и воспроизведения, вводя при этом дополнительную информацию,
необходимую для синхронизации. Здесь же проводится исправление ошибок, благодаря
чему компакт-диск еще менее восприимчив к мелким дефектам. В большинстве
проигрывателей для улучшения цифро-аналогового преобразования предусматривается
передискретизация.
В начале музыкальной программы на компакт-диск записывается сообщение о содержании
диска, точках начала отдельных отрывков, а также о их числе и длительности звучания
каждого отрывка. Между отрывками размещаются метки начала музыки, которые могут
быть пронумерованы от 1 до 99. Длительность воспроизведения, выраженная в минутах,
секундах и 1/75 долях секунды, закодирована на диске и считывается в обратном порядке
перед каждым отрывком. Присваивание имен и автоматический выбор дорожек
выполняются с помощью двух субкодов, указываемых в сообщении. Сообщение выдается
при вставлении диска в проигрыватель (рис. 4).
Компакт-диск легко тиражировать. Как только сделан первый оригинал записи, копии
можно штамповать в больших количествах.
В 1997 появилась и к концу века получила распространение оптическая технология хранения
информации на многослойных двусторонних цифровых универсальных дисках DVD. Это,
по-существу, более емкий (до 4Гб) и более быстрый компакт-диск, который может
содержать аудио, видео и компьютерные данные. DVD-ROM читается соответствующим
дисководом, подключенным к компьютеру.
Трехмерный Звук
Для чего нужен и где применяется трехмерный звук
В повседневной реальности мы слышим звуки, приходящие со всех сторон - сверху, снизу,
слева и справа. Наш слуховой аппарат может более или менее точно определять направление
на источник звука и расстояние до него. Поэтому вполне разумно желание, чтобы
радиоприемники, телевизоры, магнитофоны, музыкальные центры, компьютеры и другие
воспроизводящие звук аппараты максимально воссоздавали реальное (или похожее на
реальное) трехмерное звуковое поле. Представьте себе такую картину. Вы смотрите по
телевизору фильм ужасов. Главный герой, "окруженный" таинственными звуками,
пробирается через заброшенное кладбище. Однако отождествлять себя с героем,
сопереживать ему сильно мешает то обстоятельство, что таинственные звуки не окружают
вас, а исходят из одной точки - телевизора. Из-за этого мгновенно разрушается вся аура
таинственности, "настрашниться" в полной мере будет проблематично. С другой стороны,
оправданность применения объемного звука в музыкальной звукозаписи не столь очевидна.
Дотошное воспроизведение трехмерных шумов концертного зала действительно впечатляет.
Но все это больше курьезы, чем серьезные музыкальные произведения, изготовленные по
технологии объемного звука. А вот компьютерные игры значительно оживляются
трехмерным звуком. Потребители-геймеры и разработчики компьютерных игр однозначно
проголосовали за объемный звук. Что и нашло отражение в созданном Microsoft
программном обеспечении поддержки игровых приложений DirectX, позволяющим
разработчику создавать объемное звуковое сопровождение с использование (или без
использования) аппаратных ускорителей обработки звука наподобие звуковой карты Monster
Sound 3D, Turtle Beach Montego A3DXStream или SoundBlaster Live. В принципе
использование DirectX/DirectSound совместимых звуковых карт должно позволять
расставлять виртуальные источники звука в любой точке пространства, например, вокруг
рабочего места журналиста, программиста или верстальщика. Причем в минимальной, но
полнофункциональной конфигурации требуется всего два реальных (колонки или
стереотелефоны) источника звука. Таким образом, можно улучшить обычный стерео звук
от близко стоящих друг к другу колонок (обычно слева и справа от дисплея) виртуально
разместив их на оптимальном для проявления стерео эффекта расстоянии от слушателя.
Заметьте, что при этом реальные колонки вообще не надо передвигать, все сделает 3D
звуковой процессор.
Развитие методов воспроизведения и записи объемного звука.
Большинство современных дешёвых и не очень звуковоспроизводящих устройств, включая
звуковые карты для персональных мультимедиа компьютеров, позволяют воспроизводить
звук в режиме “3D Sound” или “Suround”, что можно перевести как “объёмный звук”. Что же
это такое и для чего это нужно? Системы объёмного воспроизведения звука были
разработаны потому, что качество звучания, реализуемое обычной стереофонической
системой или головными телефонами, перестало удовлетворять взыскательных слушателей.
Хотя стерео системы и создают эффект пространственного звучания за счет синтеза
панорамы мнимых источников звука (МИЗ) между двумя громковорителями (рис. 1), все же
стереозвучание имеет существенный недостаток. Стереопанорама получается плоской и
ограничена углом между направлениями на громкоговорители.
Рис. 1. Стереопанорама.
Такое звучание в значительной степени лишено естественности, свойственной тому, что
достигается в реальном звуковом поле, когда человек способен воспринимать реальные
источники практически со всех направлений как в горизонтальной так и в вертикальной
плоскостях и оценивать, хотя порой и с ошибками, расстояние до источников звука.
Считается, что восприятие звуков с разных направлений и расстояний имеет важное
значение не только как факт их пространственного расположения. Оно создаёт у слушателя
ощущение звучащего объёма (трёхмерного звукового поля), существенно обогащает тембры
музыкальных инструментов и голосов, восстанавливая реверберационный процесс,
свойственный первичному помещению (концерному залу). Обычная стереофония создаёт
эффект пространственного звучания в очень ограниченной области перед слушателем, не
позволяет в полной мере выявить названные особенности восприятия звуков в реальном
звуковом поле и, следовательно, снижает качество звучания.
Квадрофонические системы также не обеспечивают полную имитацию реального звукового
поля. Во-первых, при квадрофонии не получается круговая стереопанорама - слушатель
ощущает обычную стерео панораму перед собой и заднюю стерео панораму сзади себя. Вовторых, все мнимые источники звука располагаются в одной плоскости и на линии между
динамиками, т.е. нет глубины и нет, собственно, 3-го измерения и трёхмерного объемного
звучания (Рис. 2).
Рис. 2. Квадропанорама.
Головные стерео телефоны также не позволяют получить естественное звучание
воспроизводимой фонограммы. Дело в том, что возникающее при этом впечатление
бесконечной ширины стереобазы и четкая локализация звукового изображения внутри
головы слушателя не могут удовлетворить требовательных меломанов. Для устранения
эффекта локализации звука внутри головы применяются схемы подобные приведенной на
Рис. 3.
Рис. 3. Блок схема устройства создания объемного звука для стереотелефонов.
Здесь сигналы левого и правого каналов через входные устройства А1 и А2 поступают
соответственно на делители напряжения А3 и А6 и на входы перекрестных каналов,
состоящих из линий задержки (ЛЗ) А4, А5, согласующих устройств А8, А9 и фильтров
нижних частот (ФНЧ) Z1, Z2. С делителей А3, А6 сигналы подаются на корректоры АЧХ А7
и А10 и далее - на один из входов сумматоров, а с них - на входы усилителей мощности для
стереотелефонов. Таким образом, на выходе каждого канала формируется сигнал, состоящий
из ослабленного и скорректированного сигнала своего канала и задержанного и
соответствующим образом скорректированного сигнала другого канала. Подобными
устройствами, выполненными в виде приставок или встроенных устройств в настоящее
время оснащены многие музыкальные центры.
После неудач с квадрофонией разработчики видимо решили, что все дело в недостаточном
количестве каналов воспроизведения и на свет появились очень многоканальные монстры.
Рис. 2 Многоканальная система звуковоспроизведения.
Лидерство в создании многоканальных систем звуковоспроизведения захватила фирма
Dolby. Ее система под названием "Multichannel Surround Sound" установлена (по сведениям с
www.dolby.com) более чем в 14000 кинотеатрах. Вскоре бум на супер многоканальность
прошел и Dolby разработала гораздо более аскетичную систему "Dolby Digital Surround",
состоящую всего из шести громкоговорителей (левого, центрального, правого, сабвуфера,
левого и правого "surround") и предназначенную для домашнего применения.
Рис. 3 Система звуковоспроизведения "домашнего театра" Dolby.
Самое смешное, что Dolby Digital удивительно похожа на разработанную в России в 70-х
годах систему звуковоспроизведения ABC. Основной, видимо, незапатентованный должным
образом признак (и отличие от квадрофонии) которой заключается в размещении тыловых
громкоговорителей не за слушателем, а точно слева и справа. Именно такое размещение
динамиков позволяет создавать круговую звуковую панораму и именно на таком
расположение динамиков настаивает Dolby. Совпадение?! Естественно, эти системы
звуковоспроизведения не имеют третьего измерения. Наиболее совершенный метод
имитации реального трёхмерного звукового поля это бинауральная звукозапись.
Бинауральный метод состоит в том, что звуковая информация воспринимается
микрофонами, размещёнными в ушных раковинах человека или “искусственной головы” модели, симулирующей слуховое восприятие человека.
Сигналы, поступающие с каждого микрофона, усиливаются раздельными усилителями
низкой частоты и воспроизводятся стереотелефонами. В идеале такая система позволяет
создать полную иллюзию естественного звучания. Она как бы переносит слушателя из
помещения прослушивания в помещение, откуда ведётся передача. Однако полноценно
прослушивать её можно только с помощью стереотелефонов и при условии, что в качестве
образца для создания искусственной головы использовалась именно ваша голова. Поэтому
для получения максимально возможного эффекта рекомендуется использовать специальные
микрофоны, помещаемые в ваши собственные уши.
Рис. 4 3D микрофон для использования с живой человеческой головой.
Следует отметить, что записи, сделанные с помощью микрофонов, помещенных в ваши
собственные уши, будут иметь ценность в основном только для вас. При прослушивании
таких записей другими людьми могут ощущаться значительные отклонения в структуре
воображаемого звукового поля от оригинала из-за возможных аномалий, значительных
отклонений характеристик вашего (или других людей) слуха от средних значений.
При воспроизведении бинаурального сигнала через звуковые колонки из-за попадания
сигнала правого канала в левое ухо слушателя и наоборот возникают перекрёстные
искажения, в конечном счете сводящие на нет все преимущества бинаурального
звуковоспроизведения. Указанные недостатки в значительной мере удаётся устранить с
помощью специальных устройств обработки звуковых сигналов, позволяющих получить
бинауральный эффект при прослушивании бинауральной записи через колонки. Такие
устройства получили название бифонических процессоров. Запись производится с
микрофонов, расположенных в искусственной голове, а воспроизводится после обработки
бифоническим процессором, в котором точно рассчитанная величина сфазированного,
задержанного и скорректированного по частоте сигнала левого канала вычитается из сигнала
правого канала и наоборот. После обработки бифоническим процессором сигналы,
приходящие из колонок в уши слушателя, суммируются так, что левое ухо слышит только
сигналы левого канала, а правое - правого. Таким образом, можно сказать, что бифонический
эффект подобен бинауральному и отличается от него только способом воспроизведения
бинауральной записи. И хотя площадь, где он отчётливо проявляется, невелика, зато,
находясь в её пределах, слушатель может иметь представление о расстоянии до источников
звука и их взаимном расположении в пространстве в момент записи. Этого не удаётся
достигнуть при стереофоническом звуковоспроизведении, дающем представление только о
расположении источников звука на линии между звуковыми колонками. Другое интересное
свойство бифонического процессора - это возможность расширения с его помощью стерео
базы обычных стереофонических записей. Конечно, бифонический процессор может быть
реализован чисто программными методами с использованием методов цифровой обработки
сигналов в реальном времени.
Теоретические основы 3-х мерного звука
Реальные источники звука (поющая птичка, работающий трактор и т.д.) довольно часто
можно приближенно считать точечными. То есть это моно источники. Стерео эффект
возникает при восприятии звука левым и правым ухом. В зависимости от азимутального,
широтного расположения и дальности до источника звука изменяются частотные
характеристики человеческих ушей. Причем изменяются они не синхронно, по-разному. То
есть усредненные частотные характеристики ушей одинаковы только при расположении
источника звука точно в плоскости симметрии головы. На рис. 5 хорошо видна большая
разница в форме импульсных реакций и амплитудно-частотных характеристик, полученных
с помощью помещенных внутри ушей микрофонов и смещенного относительно оси
симметрии головы источника звука.
Рис. 6 Частотные характеристики человеческих ушей при несимметричном
расположении источника звука.
Многочисленные измерения показывают значительные изменения частотных характеристик
в зависимости от расстояния и направления на источник звука. Наиболее очевидна разная
задержка сигналов и разница в амплитудах. Видимо, наш мозг каким-то образом
анализирует эти изменения и разницу характеристик и делает вывод о расположении
источника звука в 3-х мерном пространстве. Таким образом, ощущение местоположения
источника звука в пространстве тесно связано с характеристиками звуковоспринимающего
аппарата человека (амплитудно-частотной характеристикой и относительной задержкой
сигнала). Для имитации таких свойств можно произвести достаточно подробные измерения
усредненных характеристик нашего слухового аппарата и построить на их основе цифровые
фильтры. Чем детальнее моделируется пространственная частотная характеристика
слухового аппарата, тем сложнее получаются фильтры. После этого создание
искусственного объемного звукового поля будет заключаться в обработке сигналов от моно
источников парами (для левого и правого уха) цифровых фильтров с параметрами,
соответствующими желаемому направлению на источники звука.
Трехмерный звук и персональные компьютеры
В последние несколько лет на рынке появились дешевые и очень мощные процессоры
обработки сигналов (DSP). Фирма Analog Devices (см. www.analog.com) выпускает один из
самых интересных на сегодня процессоров AD21160 SHARC. Это 32-битное устройство с
производительностью 1000 MIPS (миллионов инструкций в секунду), способное
обрабатывать целые числа и числа с плавающей точкой. Система команд этого DSP весьма
совершенна и очень удобна для программистов и позволяет легко решать как системные, так
и специфические вычислительные задачи типа цифровых адаптивных рекурсивных и
нерекурсивных фильтров для трехмерного звука, БПФ и операций с матрицами. Имеется
компилятор с языка C. На кристалле размещается быстрая RAM объемом от 250 кБ до 2 МБ
и масочное ПЗУ, процессоры ввода вывода, DMA контроллеры и быстрые последовательные
порты. Возможна организация многопроцессорной системы. SHARC имеет небольшие
габариты (27 mm * 27 mm) и потребляет всего 9 ватт. Столь малая потребляемая мощность
позволяет устанавливать несколько таких DSP на малогабаритные PCI карты. Менее
совершенные предшественники AD21160 широко используются в звуковых картах Monster
Sound 3D. SHARC в настоящее время, применяется в основном в мощной современной
студийной аппаратуре (например, DSP/FX cards).
Рис. 7 Процессор обработки сигналов SHARC
Приборы обработки звуковых сигналов более узкого назначения выпускаются фирмами
Vortex Chips (Aueral AU8820, 330 MIPS) и E-mu (EMU10k, 1000 MIPS). Первый из них
используется в звуковой карте Turtle Beach Montego A3DXStream, второй в SoundBlaster Live
от Creative Labs. Кстати, забавные сплетни о стремлении Creative Labs. запатентовать даже
самые банальные вещи типа 8-точечной интерполяции, кэширования данных и табличного
синтеза можно прочитать по адресу www3.techstocks.com/~wsapi/investor/repliestothis3560864. Система команд AU8820 и EMU10k значительно проще набора инструкций
AD21160 и ориентирована на табличный синтез музыкальных звуков (64..128 голосов),
электронные эффекты реверберации, флэнжера, хоруса, разнообразной фильтрации и
трехмерного звука (до 32 источников звука). DSP производятся также фирмами Motorola и
Texas Instruments и имеют параметры, незначительно уступающие характеристикам выше
перечисленных устройств. Наличие на рынке столь совершенных устройств позволило
создавать относительно недорогие звуковые карты, оснащенные DSP и способные в
реальном времени реализовывать бифонические процессоры и цифровые фильтры,
необходимые для качественного моделирования человеческого слухового аппарата. Таким
образом, 3-х мерный звук из экзотики превращается в стандартную функцию практически
любой современной звуковой карты среднего ценового диапазона. В дополнение к
цифровым имитирующим фильтрам такие звуковые карты позволяют реализовывать эффект
Доплера (смещение высоты звука движущегося источника), придающий еще большую
реалистичность компьютерным играм. Некоторые звуковые карты с DSP (www.sblive.com)
имеют богатый набор звуковых эффектов, ревербераторов и фильтров, иногда существенно
улучшающих звучание компакт дисков (но это все же дело вкуса). Любители домашней
компьютерной звукозаписи также имеют возможность поэкспериментировать с 3-х мерным
звуком. Практически для всех популярных программ редактирования звуковых файлов
имеются так называемые plug-ins,
произведений (см. www.qsound.com).
поддерживающие
создание
объемно
звучащих
ПРОБЛЕМЫ И МЕТОДЫ АНАЛОГО-ЦИФРОВЫХ И ЦИФРОАНАЛОГОВЫХ ПРЕОБРАЗОВАНИЙ.
Аналоговый сигнал представляет собой непрерывный во времени и по амплитуде
процесс (с точностью до понятий квантовой теории, но не будем сейчас “копать” столь
глубоко), а его цифровое представление есть последовательность или ряд чисел, состоящих
из конечного числа бит. Поэтому преобразование аналогового сигнала в цифровой состоит
из двух этапов: дискретизации по времени и квантовании по амплитуде. Дискретизация по
времени обычно означает, что сигнал представляется рядом своих отсчётов (дискретов)
непрерывных по амплитуде и взятых через равные промежутки времени (хотя в некоторых
специальных случаях может применяться и неравномерная по времени дискретизация,
например при оцифровке узкополосных сигналов). Основной вопрос на первом этапе
преобразования аналогового сигнала в цифровой (оцифровки) состоит в выборе частоты
дискретизации аналогового процесса. Ответ на него даёт известная теорема Найквиста,
утверждающая, что для того чтобы аналоговый (непрерывный по времени) сигнал
занимающий полосу частот от 0 Гц до F Гц можно было абсолютно точно восстановить по
его отсчётам, частота дискретизации должна быть не меньше 2*F Гц или отсчёты сигнала
должны браться не реже чем через 1/(2*F) секунды. Таким образом, если реальный
аналоговый сигнал, который мы собираемся преобразовать в цифровую форму содержит
частотные компоненты от 0 Гц до 20 кГц, то частота дискретизации такого сигнала должна
быть не меньше чем 40 кГц. Если же мы хотим дискретизировать сигнал с полосой больше,
чем частота дискретизации делённая на 2, то предварительно необходимо с помощью
аналогового фильтра низких частот подавить ту высокочастотную “часть” сигнала,
спектральные компоненты которой находятся выше по частоте, чем частота дискретизации
делённая на два. Частотный спектр дискретизированного сигнала такой же по форме, как и
спектр аналогового (непрерывного) сигнала и повторяется на частотах, кратных частоте
дискретизации. Например, если аналоговый сигнал занимает полосу 0..20 кГц и
дискретизирован с частотой 50 кГц, то копии спектра (alias или алиазинг) появятся на
частотах 30..70 кГц, 80..120 кГц и т.д. Для точного восстановления непрерывного
аналогового сигнала по его дискретным отсчётам алиазинговые спектры не должны
искажать (накладываться) друг друга, из чего и следует требование дискретизации сигнала
на частоте равной удвоенной полосе аналогового сигнала.
К сожалению, реальные аналоговые сигналы содержат компоненты (полезные и
помехи), имеющие частотные составляющие, расположенные выше по частоте, чем часто
применяемые на практике частоты дискретизации 44.1 кГц или 48.0 кГц делённые на два.
Поэтому перед дискретизацией необходима аналоговая фильтрация, представляющая собой
довольно сложную задачу. Аналоговые фильтры не могут пропустить, скажем, все частоты
от 0 Гц до 24 кГц и подавить все частоты выше 24 кГц. Любой аналоговый фильтр имеет
ненулевую переходную от пропускания к подавлению область и, следовательно, вместе с
“вредными” компонентами будут подавлены и полезные сигналы из области частот ниже 24
кГц. Кроме того, ещё одна неприятность состоит в том, что чем уже мы пытаемся сделать
переходную область между полосой пропускания и полосой подавления, тем сильнее
вносимые фазовые искажения, длиннее переходный процесс (фильтр начинает “звенеть”) и
тем сложнее и капризнее в настройке такой аналоговый фильтр.
В современных АЦП эта проблема решается методом «Oversampling». По этому
методу диапазон частот входного аналоговый сигнала ограничивается с помощью
сравнительно несложного аналогового фильтра. Причём частота среза фильтра выбирается
значительно выше высшей полезной частоты, а переходная полоса фильтра делается
достаточно широкой. Таким образом, исключаются и завал “полезных” высших частот, и
фазовые искажения характерные для аналоговых фильтров с узкой переходной полосой.
Далее отфильтрованный, с ограниченным по частоте спектром сигнал дискретизируется на
достаточно высокой частоте, исключающей наложение и искажение спектра (алиазинг).
Затем дискретные отсчёты сигнала преобразуются в последовательность чисел с помощью
АЦП. После этого мы имеем поток цифровых данных, представляющих аналоговый сигнал,
включая и нежелательные высокочастотные компоненты и помехи. Эти цифровые данные
пропускаются через цифровой фильтр с очень узкой переходной полосой и очень большим
подавлением нежелательных высокочастотных компонент. Сегодня расчёт и создание таких
цифровых фильтров, к тому же не вносящих никаких фазовых искажений, не представляет
больших трудностей. После цифрового фильтра получается цифровое представление
сигнала, имеющего спектр, правильно ограниченный по частоте. Применяя к такому сигналу
теорему Найквиста, мы можем резко понизить частоту его дискретизации до удвоенной
величины наивысшей полезной частотной составляющей, чего мы и хотели добиться! Надо
отметить, что часто цифровые фильтры находятся в том же корпусе (микросхеме), что и
другие узлы АЦП. Применяется Oversampling и в цифро-аналоговых преобразователях
(ЦАП). В ЦАП также есть проблема сложности аналоговых восстанавливающих
(интерполирующих) фильтров. Ведь сразу после ЦАП сигнал представляет собой серию
дискретных импульсов имеющих многочисленные алиазинговые спектральные компоненты.
На аналоговый фильтр в этом случае возлагается задача полностью пропустить сигнал
нужного частотного диапазона (скажем 0..24 кГц) и, по возможности, наиболее полно
подавить ненужные высокочастотные компоненты. И конечно, чисто аналоговому фильтру
выполнить такие противоречивые требования очень сложно. Поэтому сначала цифровой
сигнал интерполируют, т.е. вставляют дополнительные отсчёты, вычисленные по
специальным алгоритмам и, тем самым резко увеличивают частоту дискретизации. При этом
исходный спектр полезного сигнала не искажается, но сигнал уже дискретизирован на
значительно более высокой частоте. Это приводит к тому, что алиазинговые спектральные
компоненты на выходе ЦАП далеко отстоят от частотных компонент основного сигнала и,
соответственно, чтобы отфильтровать (подавить) их достаточно применить простой
аналоговый фильтр.
Квантование амплитуды аналогового сигнала,
разрядность АЦП
Напомним, что преобразование аналогового сигнала в цифровой поток данных
происходит в два этапа. Первый этап это дискретизация сигнала на основе теоремы
Найквиста с использованием oversampling. Второй этап это квантование амплитуды
дискретных отсчётов, полученных на первом этапе. Представим себе что дискрет
представляет собой некий столбик или полоску, наподобие той, что мы видим на студийном
индикаторе уровня сигнала. Длина этой полоски и есть амплитуда сигнала в данном
дискрете. Процесс квантования амплитуды тогда можно представить как измерение длины
полоски с помощью линейки. Чем чаще идут метки на линейке, тем точнее мы можем
измерить длину полоски (амплитуду) и тем меньше будут ошибки измерений (шумы
квантования). Однако чем чаще расположены метки на линейки тем больше бит нам
потребуется для записи числа, соответствующего измеренной нами длине полоски
(амплитуде сигнала в дискрете). Например, если на линейке 32 метки то для представления
длины полоски (амплитуды) в виде числа понадобится максимум 5 бит (32=2**5). В данном
случае 5 бит и будет разрядностью АЦП. Таким образом процесс квантования амплитуд
дискретов фактически заключается в измерении их величин по отношению к некоторому
опорному источнику напряжения (линейка в предыдущих объяснениях), обычно
имеющемуся внутри корпуса микросхемы АЦП и выражении этих величин в виде чисел
состоящих из конечного числа бит. Причём числа могут быть не только целые, например,
16,18,20,24-битные, но и 24 или 32- битные с плавающей точкой или другой кодировкой
(например в кодах с исправлением ошибок), зависящий от конкретной реализации
устройства АЦП. Довольно часто используется всё же кодирование результатов измерения
амплитуд дискретов в виде целых чисел в так называемом “дополнительном коде”. В
обычном АЦП число бит на один дискрет (разрядность числа) выходного цифрового потока
данных непосредственно с квантователя амплитуд дискретов и на выходе всего АЦП равны,
так как числа с квантователя амплитуд поступают непосредственно на выход устройства. В
случае входного аналогового сигнала в виде случайного процесса типа белого шума ошибки
процесса квантования некорелированны с самим сигналом и отношение сигнал шум на
выходе АЦП в этом случае (если все остальные элементы идеальны) будет 6*N дБ, где N
есть число бит на один дискрет или разрядность чисел (для дополнительного кода)
сопоставляемых величинам амплитудам дискретов. Например для 16-битного АЦП с
частотой дискретизации 44.1 кГц в идеальном случае шум квантования будет находится на
уровне -96 дБ по отношению к цифровому синусоидальному сигналу амплитудой 32767 и
спектр шума квантования будет равномерен (постоянен) в диапазоне 0..22.05 кГц. Если АЦП
будет дискретизировать сигнал с большей частотой, то полная мощность шумов квантования
останется неизменной, но его спектр будет шире (он будет простираться от 0 Гц до новой,
большей частоты дискретизации делённой на 2). Например, если частота дискретизации
удваивается до 88.2 кГц, то спектр шумов квантования будет простираться уже до 44.1 кГц
(вместо 22.05 кГц). А наш полезный сигнал, конечно, будет иметь спектр (как и раньше)
простирающийся от 0 Гц до 22.05 кГц, т.е. спектр шума станет в два раза шире спектра
сигнала при прежней мощности шума. Таким образом мощность шумов квантования
“внутри” спектра полезного сигнала упадёт в два раза. Другими словами отношение
сигнал/шум квантования в полосе 0 Гц - 22.05 кГц улучшиться в два раза (на 3 дБ) ! Теперь
можно с помощью цифрового фильтра с большим ослаблением шума полосе задержания и
узкой переходной полосой (а сделать такой цифровой фильтр не представляет большого
труда) отфильтровать (подавить) полосу от 22.05 Гц до 44.1 содержащую только шумы
квантования и получить реально лучшее на 3 дБ отношение сигнал/шумы квантования. Этот
процесс можно продолжать. В случае 4-х кратного увеличения частоты дискретизации (4-х
кратный oversampling) произойдёт улучшение сигнал/шум на 6 дБ. Судя по технической
документации на рынке можно встретить АЦП и со 128/256-ми кратным oversampling
(+21..24 дБ к исходному сигнал/шум). Поэтому же принципу, если мы будем использовать
15-битный квантователь на частоте дискретизации 44.1*4 кГц мы получим такое же
отношение сигнал/шум как и для 16 битного квантователя и частоты дискретизации 44.1
кГц. Далее с помощью цифровых фильтров можно подавить все лишние частотные
составляющие в полосе от 22.05 кГц до 44.1*(4 в степени 15) /2 кГц и далее в полном
соответствии с теоремой Найквиста понизить частоту дискретизации до 44.1 кГц. Таким
образом квантователь АЦП не обязательно должен иметь высокую разрядность для того
чтобы выходной поток цифровых данных АЦП имел таковую. Увеличение эффективной
разрядности АЦП может быть достигнуто использованием метода оверсэмплинга и
цифровой фильтрации. Применение метода оверсэмплинга при цифро-аналоговом
преобразовании также даёт выигрыш. Для каждого увеличения частоты дискретизации
входного потока поступающего на ЦАП разрядность чисел представляющих амплитуду
дискретов может быть уменьшена на 1 бит без потери качества выходного аналогового
сигнала.
DITHERING, DITHER (Диферинг или Дитер)
Реальные музыкальные сигналы далеки от белого шума. Из-за этого шумы квантования
оказываются коррелированы с сигналом. Человеческое слуховое восприятие чётко реагирует
на это возникновением ощущения “грязного звука”. Особенно ярко этот эффект проявляется
для 8-битных отсчётов сигнала. Другими словами если сигнал с обычного компакт диска
(16-битный) уменьшится по громкости на 48 дБ (на 8 бит) от своего номинального уровня, то
он станет “грязным” и непригодным для прослушивания. То есть вместо заявленного для
компакт дисков отношения сигнал/шум 96 дБ реальный динамический диапазон из-за
эффекта корреляции шумов квантования составляет всего 48 дБ ! Получается что перед
записью на компакт диск исходный музыкальный материал должен быть скомпрессирован
тем или иным способом с целью уменьшения его динамического диапазона и
предотвращения “грязного” звучания на слишком маленьких уровнях громкости. Однако
сжатие динамического диапазона исходного музыкального материала, достигающего порой
100 и более дБ (например для электрогитары) на 48 дБ без заметных на слух искажений
представляется крайне сложной задачей. Поэтому иногда применяется диттеринг,
позволяющий частично “обменять” эффект грязного звучания на незначительное увеличения
высокочастотного шума. Метод дитеринга заключается в добавлении небольшого шумового
(обычно высокочастотного) сигнала во входной сигнал АЦП или уже к цифровому сигналу в
момент перехода от оцифрованного с разрядностью 20 и более бит исходного музыкального
материала к 16-битному предназначенному для записи на компакт диск. Это приводит к
декореляции шумов квантования и сигнала, однако общий уровень шумов немного
возрастает.
NOISE SHAPING (Нойс шейпинг)
В результате процесса дискретизации и квантования (оцифровки или аналоговоцифрового преобразования) входного аналогового сигнала с применением дитеринга к
сигналу добавляется шум квантования. Его спектр равномерен и простирается начиная от 0
Гц и до половины частоты дискретизации. Равномерность по частоте и некорелированность
шума с сигналом достигается применением дитеринга и правилом квантования, при котором
округление амплитуды в дискрете происходит к ближайшей опорной величине. Применение
более сложных правил округления позволяет получить другие (неравномерные)
спектральные характеристики шумов округления при сохранении полной мощности шумов
неизменной. Учитывая, что человеческий слуховой аппарат имеет спад чувствительности на
высоких частотах, возможно, используя специальные правила округления при квантовании,
получить спектр шумов округления большей частью сосредоточенный в области частот,
которые наименее заметны на слух ( выше 20кГц). Частота Найквиста для ЦАП с 256-ти
кратным оверсэмплингом около 11.2мгц, и следовательно мы имеем возможность
“переместить” весь шум квантования в область частот практически неслышимую
человеческим ухом (от 20 кГц до 5.6 Мгц). Таким образом можно значительно улучшить
отношение сигнал/шум в диапазоне слышимых частот в цифровом сигнале не увеличивая
количество бит на один дискрет. Это и есть нойс шейпинг.
Мультимедиа (Multimedia)
o - это современная компьютерная информационная технология, позволяющая объединить в компьютерной
системе текст, звук, видеоизображение, графическое изображение и анимацию(мультипликацию).
o - это сумма технологий, позволяющих компьютеру вводить, обрабатывать, хранить, передавать и
отображать (выводить) такие типы данных, как текст, графика, анимация, оцифрованные неподвижные
изображения, видео, звук, речь.
Мультимедиа в буквальном переводе означает многие среды. Иными словами, мультимедиа - это
совокупность аппаратных и программных средств, позволяющая пользователю одновременно
использовать все богатство представления информации в самых различных ее формах - в текстовой,
числовой, графической, звуковой, анимационной и видео.
В общем, мультимедиа - это ни компьютер, ни сам по себе аудио-или видеоадаптер и ни CD-ROM-драйв и
даже ни программное обеспечение, а все это вместе взятое и бесконфликтно работающее!
Если главным внешним отличием Windows 95 от прежних версий Windows является пользовательский
интерфейс, то особенно значительным внутренним (и не сразу бросающимся в глаза) отличием являются
существенно переработанные и дополненные средства мультимедиа. Все они стали 32-разрядными и благодаря
режиму Plug and Play инсталлируются без всяких головных болей. При этом дело не столько в упрощении
установки аппаратных средств (увы, многие из них все еще не поддерживают спецификацию Plug and Play),
сколько в установке внушительного множества современных драйверов устройств мультмедиа с резко
уменьшенным риском конфликта между ними.
Предназначенные для мультимедиа-приложений ПК должны удовлетворять определенному стандарту - в
настоящее время наиболее распространен стандарт MPC-2 (MPC - сокращение от слов Multimedia Personal
Computer). Он, в частности, определяет, что мультимедиа-ПК класса не ниже 386SX должен быть
дополнительно оснащен платой аудиоадаптера и дисководом для работы с лазерными компакт-дисками,
допускающими только считывание информации - CD-ROM. Такие накопители принято называть CD-ROMдрайвами.
Мультимедиа сегодня - это прекрасные игры с мощной графикой и квадрофоническим звуковым
сопровождением, превращение ПК в управляющий центр бытовой акустической и видео-аппаратуры,
возможность работы с энциклопедиями и справочниками на маленьких дисках с огромным объемом
информации и ее быстрым поиском, это легко доступное программное обеспечение.
В начале своего развития мультимедиа не признавалось профессионалами. Сейчас напротив, трудно
представить себе профессиональный персональный ПК без развитых средств мультимедиа. Кто, например,
предпочтет хранить программы и данные на тысячах дискеток - их хранению всего на нескольких
миниатюрных компакт-дисках?
Венцом развития мультимедиа стала виртуальная реальность. Под ней подразумевается создание с
помощью ПК некоторого виртуального (кажущегося) мира, в который (с помощью специальных устройств шлемов, очков, перчаток и даже костюмов) "помещается" пользователь и начинает активно "жить" по законам
этого мира, принимая участие в происходящих в нем событиях и получая при этом достаточно полный
комплекс ощущений.
Три направления мультимедиа
Мультимедиа слово красивое, непонятное и изысканное. Его хотелось лишний раз выговорить, показав
этим свою образованность, а большинство тех кто уже был с ним знаком, норовили на английский лад сказать
мальтимедиа и куда-нибудь пристроить его в виде прилагательного. В результате слово использовалось весьма
свободно и не всегда точно.
Сегодня сложилось три различных понимания слова мультимедиа:
1) Первое это "мультимедиа как идея" т.е. это новый подход к хранению информации различного типа.
По мере развития компьютерной техники становилась возможность обработки все более разнообразной
информации: начав с чисел компьютер освоил работу с текстом, затем в сферу его интересов попали звук и
изображение, сегодня компьютер свободно обращается с озвучением, фрагментами видео.
Однако до последнего времени казалось, что текст - это текст, числа - нечто другое, даже оцифрованные и
введенные в компьютер звуки и изображения продолжали восприниматься как совершенно различные вещи,
работой с ними занимались разные люди в разных специализированных учреждениях.
Сейчас кажется даже странным, что только более через 10 лет после начала компьютерной обработки
изображения, речи, синтеза музыки возникла идея, которая получила название мультимедиа.
2) Второе значение мультимедиа - это так называемое оборудование, которое позволяет работать с
информацией различной природы. Это мультимедиа платы, мультимедиа комплексы, и, наконец, мультимедиа
центры.
3) А третье значение мультимедиа это "мультимедиа продукт". Продукт, составленный из данных
всевозможных типов, да еще такой, в котором можно сориентироваться; каталог, энциклопедия - вот то лицо
мультимедиа, что повернуто к пользователю. Чаще всего такой продукт ассоциируется с CD(DVD)-ROM.
Мультимедиа продукт может содержать не меньше информации, чем довольно большой музей или
библиотека, а поскольку в принципе он доступен любому, значит он должен быть организован так, чтобы в нем
можно было разобраться без специального образования. Для этого создается система меню и перекрестных
ссылок, которая служит путеводителем в море данных. По главному меню можно оценить структуру материала
и быстро отыскать нужный раздел, при желании легко можно пропустить неинтересное, получить справку,
если вдруг встретилось непонятное слово или углубится в детали.
История развития мультимедиа
20 лет назад мультимедиа ограничивалась пишущей машинкой "Консул", которая не только печатала но и
могла привлечь внимание заснувшего оператора мелодичным треском. Чуть позже компьютеры уменьшились
до бытовой аппаратуры, что позволило собирать их в гаражах и комнатах. Нашествие любителей дало новый
толчок развития мультимедиа (компьютерный гороскоп 1980 года который при помощи динамика и
программируемого таймера синтезировал расплывчатые устные угрозы на каждый день да еще перемещал по
экрану звезды (зачатки анимации)). Примерно в это время появился и сам термин мультимедиа. Скорее всего,
он служил ширмой, отгораживавшей лаборатории от взглядов непосвященных ("А что это у тебя там
звинит"."Да это мультимедиа" ).
Критическая масса технологий накапливается. Появляются бластеры, "сидиромы" и другие плоды
эволюции, появляется Интернет, WWW…. Человечество переживает информационную революцию. И вот мы
становимся свидетелями того как общественная потребность в средствах передачи и отображения информации
вызывает к жизни новую технологию, за неимением более корректного термина называя ее мультимедиа. В
наши дни это понятие может полностью заменить компьютер практически в любом контексте.
В английском языке уже приживается новый термин information appliance - " информационное
приспособление".
Совсем другое развитие получило мультимедиа у нас в стране:
В России мультимедиа появилась примерно в конце 80х годов, и она не использовалась на домашних
компьютерах, а использовалась только специалистами.Поэтому в статьях газет и журналов тех лет она
упоминалась редко. Слово мультимедиа не вызывало ничего кроме недоумения или шуточек "Какая еще вам, говорили-мультимедиа! Посмотрите, что в стране делается!"
Только в 1993 году многие поняли или начали понимать важность направления, осознавать роль, которую
технология мультимедиа предстоит сыграть в 90е годы. Слово мультимедиа стало вдруг таким модным и в
нашей стране, и все новые команды и организации поднимают этот флаг. Образовались новые коллективы
разработчиков систем и конечных продуктов мультимедиа; появились потребители таких систем и продуктов,
при чем весьма нетерпеливые. Конференция, состоявшаяся 25-26 февраля 1993 года, как бы открыла сезон
мультимедиа в России.
А в наши дни мультимедиа есть почти у всех у кого есть компьютер и программное обеспечение на
мультимедиа продаются везде, то есть она вошла в нашу жизнь.
ВИДЕО
При смешении сигналов основные проблемы возникают с видео–изображением. Различные
ТВ–стандарты, существующие в мире (NTSC, PAL, SECAM), применение разных мониторов и
видеоконтроллеров диктует разнообразие подходов в разрешении возникающих проблем. Однако в
любом случае требуется синхронизация двух изображений, для чего служит устройство генлок
(genlock). С его помощью на экране монитора могут быть совмещены изображение, сгенерированное
компьютером (анимированная или неподвижная графика, текст, титры), и “живое” видео. Если
добавить еще одно устройство — кодер (encoder), компьютерное изображение может быть
преобразовано в форму ТВ–сигнала и записано на видеопленку. "Настольные видео–студии”,
являющиеся одним из примеров применения систем мультимедиа, позволяют готовить совмещенные
видео–компьютерные клипы, титры для видеофильмов, помогают при монтаже кинофильмов.
Системы такого рода не позволяют как-то обрабатывать или редактировать само аналоговое
изображение. Для того, чтобы это стало возможным, его необходимо оцифровать и ввести в память
компьютера. Для этого служат так называемые платы захвата (capture board, frame grabbers).
Оцифровка аналоговых сигналов порождает огромные массивы данных. Так, кадр стандарта NTSC
(525 строк), преобразованный платой типа Truevision, превращается в компьютерное изображение с
разрешением 512x482 пиксель. Если каждая точка представлена 8 битами, то для хранения всей
картинки требуется около 250 Кбайт памяти, причем падает качество изображения, так как
обеспечивается только 256 различных цветов. Считается, что для адекватной передачи исходного
изображения требуется 16 млн. оттенков, поэтому используется 24-битовый формат хранения
цветной картинки, а необходимый размер памяти возрастает. Оцифрованный кадр может затем быть
изменен, отредактирован обычным графическим редактором, могут быть убраны или добавлены
детали, изменены цвета, масштабы, добавлены спецэффекты, типа мозаики, инверсии и т.д.
Естественно, интерактивная экранная обработка возможна лишь в пределах разрешения,
обеспечиваемого данным конкретным видеоадаптером. Обработанные кадры могут быть записаны на
диск в каком–либо графическом формате и затем использоваться в качестве реалистического
неподвижного фона для компьютерной анимации. Возможна также
покадровая обработка
исходного изображения и вывод обратно на видеопленку для создания псевдореалистического
мультфильма.
Запись последовательности кадров в цифровом виде требует от компьютера больших объемов
внешней памяти: частота кадров в американском ТВ–стандарте NTSC — 30 кадров/с (PAL, SECAM
— 25 кадров/с), так что для запоминания одной секунды полноцветного полноэкранного видео
требуется 20–30 Мбайт, а оптический диск емкостью 600 Мбайт вместит менее полминуты
изображения. Но последовательность кадров недостаточно только запомнить, ее надо еще вывести на
экран в соответствующем темпе. Подобной скоростью передачи информации — около 30 Мбайт / с
— не обладает ни одно из существующих внешних запоминающих устройств. Чтобы выводить на
экран компьютера оцифрованное видео, приходится идти на уменьшение объема передаваемых
данных, (вывод уменьшенного изображения в небольшом окне, снижение частоты кадровой
развертки до 10–15 кадров / с, уменьшение числа бит / пиксель), что, в свою очередь приводит к
ухудшению качества изображения.
Более радикально обе проблемы — памяти и пропускной способности — решаются с помощью
методов сжатия / развертки данных, которые позволяют сжимать информацию перед записью на
внешнее устройство, а затем считывать и разворачивать в реальном режиме времени при выводе на
экран. Так, для движущихся видео–изображений существующие адаптивные разностные алгоритмы
могут сжимать данные с коэффициентом порядка 100:1— 160:1, что позволяет разместить на CD–
ROM около часа полноценного озвученного видео. Работа этих алгоритмов основана на том, что
обычно последующий кадр отличается от предыдущего лишь некоторыми деталями, поэтому, взяв
какой–то кадр за базовый, для следующих можно хранить только относительные изменения. При
значительных изменениях кадра, например, при монтажной склейке, наезде или панорамировании
камеры, автоматически выбирается новый базовый кадр. Для статических изображений коэффициент
сжатия, естественно, ниже — порядка 20–30:1. Для аудиоданных применяют свои методы
компрессии.
Существует симметричная и асимметричная схемы сжатия данных. При асимметричной схеме
информация сжимается в автономном режиме (т.е. одна секунда исходного видео сжимается в
течение нескольких секунд или даже минут мощными параллельными компьютерами и помещается
на внешний носитель, например CD–ROM. На машинах пользователей устанавливаются
сравнительно дешевые платы декодирования, обеспечивающие воспроизведение информации
мультимедиа в реальном времени. Использование такой схемы увеличивает коэффициент сжатия,
улучшает качество изображения, однако пользователь лишен возможности разрабатывать
собственные продукты мультимедиа. При симметричной схеме сжатие и развертка происходят в
реальном времени на машине пользователя, благодаря чему за персональными компьютерами и в
этом случае сохраняется их основополагающее достоинство: с их помощью любой пользователь
имеет возможность производить собственную продукцию, в том числе и коммерческую, не выходя из
дома. Правда, при симметричной схеме несколько падает качество изображения: появляются
“смазанные” цвета, картинка как бы расфокусируется. С развитием технологии эта проблема
постепенно уходит, однако пока иногда предпочитают смешанную схему, при которой разработчик
продукта готовит, отлаживает и испытывает продукт мультимедиа на своей машине с симметричной
схемой, а затем “полуфабрикат” в стандартном формате отсылается на фирму, где его подвергают
сжатию на мощном компьютере, с использованием более совершенных алгоритмов и помещают
результирующий продукт на CD–ROM.
В настоящее время целый ряд фирм активно ведет разработку алгоритмов сжатия
видеоинформации, стремясь достичь коэффициента сжатия порядка 200:1 и выше. В основе наиболее
эффективных алгоритмов лежат различные адаптивные варианты: DCT (Discrete Cosine Transform,
дискретное косинус–преобразование), DPCM (Differential Pulse Code Modulation, разностная
импульсно–кодовая модуляция), а также фрактальные методы. Алгоритмы реализуются аппаратно
— в виде специальных микросхем, или “firmware” — записанной в ПЗУ программы, либо чисто
программно.
Разностные алгоритмы сжатия применимы не только к видео–изображениям, но и к
компьютерной графике, что дает возможность применять на обычных персональных компьютерах
новый для них вид анимации, а именно покадровую запись рисованных мультфильмов большой
продолжительности. Эти мультфильмы могут хранится на диске, а при воспроизведении считываться,
распаковываться и выдаваться на экран в реальном времени, обеспечивая те же необходимые для
плавного изображения 25–30 кадров в секунду.
При использовании специальных видео–адаптеров мультимедиа–ПК становятся центром
бытовой видео–системы, конкурирующей с самым совершенным телевизором.
АУДИО
Любой мультимедиа–ПК имеет в своем составе плату–аудиоадаптер. Для чего она нужна? С легкой руки
фирмы Creative Labs, назвавшей свои первые аудиоадаптеры звонким словом Sound Blaster, эти устройства
часто именуются “саундбластерами”. Аудиоадаптер дал компьютеру не только стерео(квадро, 5.1)фоническое
звучание, но и возможность записи на внешние носители звуковых сигналов. Дисковые накопители ПК не
подходят для записи обычных (аналоговых) звуковых сигналов, так как рассчитаны для записи только
цифровых сигналов, которые практически не искажаются при их передаче по линиям связи.
Аудиоадаптер имеет аналого–цифровой преобразователь (АЦП), периодически определяющий
уровень звукового сигнала и превращающий этот отсчет в цифровой код. Он и записывается на внешний
носитель уже как цифровой сигнал.
Цифровые выборки реального звукового сигнала хранятся в памяти компьютера (например, в виде
WAV–файлов). Считанный с диска цифровой сигнал подается на цифро–аналоговый преобразователь
(ЦАП), который преобразует цифровые сигналы в аналоговые. После фильтрации их можно усилить и подать на
акустические колонки для воспроизведения. Важными параметрами аудиоадаптера являются частота
квантования звуковых сигналов и разрядность квантования.
Частоты квантования показывают, сколько раз в секунду берутся выборки сигнала для преобразования в
цифровой код. Обычно они лежат в пределах от 4–5 КГц до 45–48 КГц.
Разрядность квантования характеризует число ступеней квантования и изменяется степенью числа 2. Так,
8–разрядные аудиоадаптеры имеют 28=256 степеней, что явно недостаточно для высококачественного
кодирования звуковых сигналов. Поэтому сейчас применяются в основном 16-разрядные аудиоадаптеры,
имеющие 216 =65536 ступеней квантования — как у звукового компакт–диска.
Таблица 1.
Частотный диапазон
Вид сигнала
Частота квантования
400 – 3500 Гц
Речь (едва разборчива)
5.5 КГц
250 – 5500 Гц
Речь (среднее качество)
11.025 КГц
40 – 10000 Гц
Качество звучания УКВ-приемника
22.040 КГц
20 – 20000 Гц
Звук высокого качества
44.100 КГц
Другой способ воспроизведения звука заключается в его синтезе. При поступлении на синтезатор
некоторой управляющей информации по ней формируется соответствующий выходной сигнал. Современные
аудиоадаптеры синтезируют музыкальные звуки двумя способами: методом частотной модуляции FM
(Frequency Modulation) и с помощью волнового синтеза (выбирая звуки из таблицы звуков, Wave Table).
Второй способ обеспечивает более натуральное звучание.
Частотный синтез (FM) появился в 1974 году (PC–Speaker). В 1985 году появился AdLib, который,
используя частотную модуляцию, был способен играть музыку. Новая звуковая карта SoundBlaster уже могла
записывать и воспроизводить звук. Стандартный FM–синтез имеет средние звуковые характеристики, поэтому
на картах устанавливаются сложные системы фильтров против возможных звуковых помех.
Суть технологии WT–синтеза состоит в следующем. На самой звуковой карте устанавливается модуль
ПЗУ с “зашитыми” в него образцами звучания настоящих музыкальных инструментов — сэмплами, а WT–
процессор с помощью специальных алгоритмов даже по одному тону инструмента воспроизводит все его
остальные звуки. Кроме того многие производители оснащают свои звуковые карты модуляторами ОЗУ, так
что есть возможность не только записывать произвольные сэмплы, но и подгружать новые инструменты.
Кстати, управляющие команды для синтеза звука могут поступать на звуковую карту не только от
компьютера, но и от другого, например, MIDI (Musical Instruments Digital Interface) устройства. Собственно
MIDI определяет протокол передачи команд по стандартному интерфейсу. MIDI–сообщение содержит ссылки
на ноты, а не запись музыки как таковой. В частности, когда звуковая карта получает подобное сообщение, оно
расшифровывается (какие ноты каких инструментов должны звучать) и отрабатывается на синтезаторе. В свою
очередь компьютер может через MIDI управлять различными “интеллектуальными” музыкальными
инструментами с соответствующим интерфейсом.
Для электронных синтезаторов обычно указывается число одновременно звучащих инструментов и их
общее число (от 20 до 32). Также важна и программная совместимость аудиоадаптера с типовыми звуковыми
платформами (SoundBlaster, Roland, AdLib, Microsoft Sound System, Gravis Ultrasound и др.).
В качестве примера рассмотрим состав узлов аудиоадаптера — SoundBlaster AWE 32 Value.
Он содержит два микрофонных малошумящих усилителя с автоматической регулировкой усиления
для сигналов, поступающих от микрофона, два линейных усилителя для сигналов, поступающих с
линии, с проигрывателя звуковых дисков или музыкального синтезатора. Кроме того, сюда входят
программно–управляемый электронный микшер, обеспечивающий смешение сигналов от различных
источников и регулировку их уровня и стереобаланса, 20-голосый синтезатор музыкальных звуков
частотной модуляции FM, программно управляемый волновой (табличный) синтезатор музыкальных
звуков и звуковых эффектов (16 каналов, 32 голоса, 128 инструментов), аналого–цифровой 16разрядный преобразователь для превращения аналогового сигнала с выхода микшера в цифровой
сигнал, систему сжатия цифровой информации с возможностью применения расширенного звукового
процессора ASP. Наконец, аудиоадаптер имеет цифро–аналоговый преобразователь (ЦАП) для
превращения цифровых сигналов, несущих информацию о звуке, в аналоговый сигнал, адаптивный
электронный фильтр на выходе ЦАП, снижающий помехи от квантования сигнала, двухканальный
усилитель мощности по 4 Вт на канал с ручным и программно–управляемым регулятором громкости
и MIDI–разъем для подключения музыкальных инструментов.
Как видно из этого перечня, аудиоадаптер — достаточно сложное техническое устройство,
построенное на основе использования последних достижений в аналоговой и цифровой аудиотехнике.
Download