Создание качественных электронных ресурсов

advertisement
Технология создания
качественных электронных
ресурсов библиотек
Г. Е. Евстигнеев,
Заместитель директора департамента по работе
с библиотеками и ВУЗами
Качественный электронный ресурс
Качественный электронный ресурс –
массив графических образов, полученный путем перевода в
электронный вид (оцифровки) исходных материалов Заказчика,
полностью удовлетворяющий предъявляемым Заказчиком
требованиям для дальнейшего целевого использования.
Основные требования, предъявляемые к электронным
ресурсам библиотек (при оцифровке книг)
 Строго упорядоченный выходной массив образов
 Аутентичность графических образов оригиналу
 Отсутствие дублей, пропусков, образов с частичной потерей
информации, геометрическими искажениями
 Пригодность электронного ресурса для использования в
программах просмотра в читальных залах, интернете и т.п.,
а также в качестве сохранных копий.
Создание качественных электронных ресурсов
2
Этапы создания электронного ресурса
Первичный осмотр и структурирование
исходных материалов
Сканирование (оцифровка)
Проверка полученных образов (сканов)
Дополнительная обработка
графических образов
Выходной контроль качества
массивов графических образов
Создание качественных электронных ресурсов
3
Создание строго упорядоченного
выходного массива графических образов
 Структурирование исходных материалов:
 Разделение исходных материалов на партии
и ящики, привязка каждой книги к ящику
 Исходный осмотр каждой книги
с описанием физических дефектов, присвоение
идентификационного номера — штрих-кода
 Сопровождение книги маршрутным листом
автоматическая идентификация по штрих-коду
 Использование специализированного программного
обеспечения слежения за движением исходных материалов:
базы данных реестра сканирования материалов
 Использование АСУ промышленного сканирования
 Сохранение подробной истории работы с массивом
 Создание выходного массива с заданными характеристиками
Создание качественных электронных ресурсов
4
Сканирование – создание
аутентичных графических образов
 В Техническом задании проекта формулируются
требования, предъявляемые к графическим образам:
 Равномерное освещение без бликов и тени от переплета
 Равные геометрические размеры образов страниц книги
(за исключением вклеек нестандартного размера)
 Ориентация по тексту (наклон текста не более 0,5 градуса)
 Отсутствие искажения текста
 Единообразная глубина и насыщенность цвета страниц
 Нумерация страниц не должна прерываться
(кроме случаев нарушения нумерации в оригинале)
 Четкая фокусировка изображения
 Отсутствие переплета
 Недопустима потеря информации
Создание качественных электронных ресурсов
5
При сканировании книг используется
профессиональное оборудование
 ЭЛАРобот, уникальный комплекс полностью
автоматического книжного сканирования –
высокопроизводительное сканирование
при минимальном участии оператора
 Планетарные сканеры
серии ЭЛАР ПланСкан – бесконтактное
сканирование, колыбели для размещения
книг большой толщины
 Комплексы высококачественного
сканирования ЭЛАР ПауэрСкан –
создание сохранных копий книг
высокого разрешения (до 800 dpi)
фотографического качества
Создание качественных электронных ресурсов
6
Бережное сканирование
 Бесконтактный способ сканирования
 Безопасное освещение без инфракрасного
и ультрафиолетового излучения
 Минимальное световое воздействие
на оригинал, только в момент сканирования
 Сканирование в естественном освещении
 Набор аксессуаров для деликатного обращения
 книжные колыбели для книг различной
толщины и веса
 уголковые держатели для книг
с неполным раскрытием
 сканирование без прижимного стекла
 автоматическое перелистывание страниц
воздушным потоком, а не манипулятором
Создание качественных электронных ресурсов
7
Проверка отсканированных образов
 Проверка на отсутствие пропусков и дублей
 По сравнению количества образов с количеством страниц
по результатам осмотра при внесении книги в базу реестра
 Визуальный контроль нарушения нумерации
 Визуальный контроль и удаление дублей
 Визуальная проверка качества сканов
 Равномерность цветовых оттенков страниц в книге
 Автоматизированная проверка качества сканов






Контроль расфокуса («размытого» изображения)
Отсутствие загибов страниц
Определение наклона текста
Контроль обрезки текста
Наличие полей по краям
Наличие посторонних объектов
Создание качественных электронных ресурсов
8
Дополнительная обработка
проверенных графических образов
 Точная ориентация по тексту (доворот)
 Удаление полей, тени от переплета, фрагментов других страниц
или части обложки (обрезка)
 Исправление геометрических искажений текста
 Выравнивание образов по размеру
 Удаление пятен, мусора,
посторонних предметов
 Разрезка разворотов
с удалением переплета
 Автоматическая замена
или выравнивание фона
 Прочие виды дополнительной
обработки, предусмотренные
в Техническом задании
Создание качественных электронных ресурсов
9
Система контроля качества образов –
четыре уровня контроля
 Первый уровень контроля –
оператор обработки обязан проверить качество
сканирования и отметить дефектные образы
 Второй уровень контроля –
руководитель группы выборочно проверяет
результаты работы подчиненных операторов
(минимум по 100 образов каждого сотрудника)
 Третий уровень – выборочная проверка массива
(минимум 10%) инспектором контроля качества
Производственного центра сканирования
 Четвертый уровень – выборочная проверка
выходных массивов графических образов
независимой Инспекцией контроля качества
Создание качественных электронных ресурсов
10
Система контроля качества образов –
действия по результатам проверок
Результаты работы
оператора поступают
на проверку (100 обр.)
Есть
дефекты?
нет
Массив образов (10%)
поступает на проверку
инспектору КК
Контроль
качества
успешно
пройден
нет
Более 2-х
дефектов на
1000 обр.?
Да
Да
Сотруднику
разъясняют его
ошибки, выборку
увеличивают еще
на 400 образов
Массив возвращается
на исправление
и доработку, выборка
контроля качества
увеличивается до 30%
Создание качественных электронных ресурсов
11
Дополнительные меры по обеспечению
качества и сохранности электронного
ресурса графических образов
 Возврат исходных материалов осуществляется согласно
Актам приемки теми же партиями
 Исходные сканы (до обработки) сохраняются до полного
прохождения контроля качества и сдачи электронного ресурса
Заказчику
 АСУ сканирования в процессе выгрузки полностью проверяет
соответствие формата выгружаемых файлов на соответствие ТЗ
по следующим параметрам: размер образа, формат файла,
разрешение, глубина цвета, степень сжатия (компрессии).
 Образы в текущем состоянии хранятся в двух экземплярах
(принцип резервного копирования) во избежание утраты
вследствие аппаратного сбоя и прочих технических проблем
Создание качественных электронных ресурсов
12
Сканирование карточных каталогов
 Применение высокопроизводительных сканеров
ЭЛАР СКАМАКС позволяет сканировать за один
проход лицевую и оборотную сторону карточки
 Автоматические самонаклад и выклад без
переворота обеспечивают сохранение
порядка следование карточек в массиве
 ГАК РГБ – 15 000 000 карточек
было оцифровано за 100 рабочих
дней на территории Заказчика
 Программа по автоматической
проверке/обработке карточек
(поворот, обрезка образов по краям)
позволила на 40% сэкономить
трудозатраты на проекте
Создание качественных электронных ресурсов
13
Ретроконверсия
Специальная промышленная технология перевода данных из
графического формата в электронный: текстовый или базу данных
 Распознавание текста
 По полям или полнотекстовое
 С или без коррекции результата
 С выгрузкой индексных данных в БД
и привязкой изображений к БД
 Печатный или рукописный текст
 На русском, европейских
или старорусском языках
 Создание базы данных алфавитного
каталога библиотеки
 Использование существующих
справочников
Создание качественных электронных ресурсов
14
Заимствование
Заимствование – технология оптимизации процесса ретроконверсии
библиотечных каталогов, основанная на базе уже имеющихся
машиночитаемых библиографических записей из наиболее полных
и качественно подготовленных электронных каталогов.
технология заимствования позволяет создавать
электронные каталоги библиотек быстрее, надежнее и дешевле
Создание качественных электронных ресурсов
15
Создание электронных книг PDF
 Книга без закладок
 Книга с закладками
по имеющемуся оглавлению
 Книга с закладками по тексту
(по заголовкам глав, разделов и т.п.)
 Книги с возможностью контекстного поиска
Слой с автоматически распознанным текстом
без верификации, возможность производить
контекстный поиск необходимой информации
и работать с текстом
 Электронные полнотекстовые книги
Полнотекстовый электронный вариант книги –
полнотекстовое распознавание, проверка
орфографии, верификация, макетирование
текста
Создание качественных электронных ресурсов
16
Спасибо за внимание!
127083, Москва
Петровско-Разумовская аллея, 12а
Тел.: +7 (495) 792-31-31,
факс: +7 (495) 251 3603
Интернет: www.elar.ru
E-mail: GEvstigneev@elar.ru
Download