Часть 2. Способы описания электронных ресурсов

advertisement
Министерство образования и науки Российской Федерации
Национальный фонд подготовки кадров
Барнаульский государственный педагогический университет
Создание электронной библиотеки
образовательного учреждения
учебно-методическое пособие
Барнаул-2004
УДК
Печатается по решению Ученого совета
ББК
Барнаульского государственного педагогического
университета
Создание электронной библиотеки образовательного учреждения Сост.:
Д.П. Тевс, В.А.Петров, М.В. Кузнецова, Н.И. Голубицких, Е.Р.Ярославцева,
А.А.Данькин, В.В.Печатнов, К.В.Головишников, Н.И.Юртаев, Т.Н. Иванова –
Барнаул: Изд-во БГПУ, 2004. – 129 с.
Редактор: С.Д. Каракозов, канд. физ.-мат. наук, профессор
Рецензенты: Н.И.Рыжова, докт. пед. наук, профессор, С.А.Жданов, канд. физ.мат. наук, профессор
Учебно-методическое пособие ориентировано на работников библиотек
образовательных учреждений Алтайского университетского округа в условиях
создаваемой распределенной библиотечной среды.
Учебно-методическое пособие рекомендуется использовать при подготовке
к лекционным, практическим и лабораторным занятиям, а также для
самостоятельного изучения работы по созданию электронной библиотеки
образовательного учреждения.
Издательство БГПУ, 2004
2
Содержание
ЧАСТЬ 1. ПОЛНОТЕКСТОВЫЕ БАЗЫ ДАННЫХ ................................................................................................ 4
ТЕМАТИЧЕСКАЯ НАВИГАЦИЯ В ПОЛНОТЕКСТОВЫХ БАЗАХ ДАННЫХ............................................................................. 9
РОССИЙСКИЕ И ЗАРУБЕЖНЫЕ ПОЛНОТЕКСТОВЫЕ БАЗЫ ДАННЫХ ............................................................................... 11
МУЛЬТИМЕДИА И ПОЛНОТЕКСТОВЫЕ БАЗЫ ДАННЫХ .................................................................................................. 22
ПОЛУЧЕНИЕ ПОЛНОТЕКСТОВЫХ БАЗ ДАННЫХ ............................................................................................................. 24
ЧАСТЬ 2. СПОСОБЫ ОПИСАНИЯ ЭЛЕКТРОННЫХ РЕСУРСОВ................................................................. 25
ОПИСАНИЕ МЕТА-ИНФОРМАЦИЯ ИНФОРМАЦИИ .......................................................................................................... 25
ОСНОВНЫЕ СИСТЕМЫ МЕТАДАННЫХ ........................................................................................................................... 27
ФОРМАТ ОПИСАНИЯ РЕСУРСОВ DUBLIN CORE METADATA ELEMENT SET .................................................................. 29
ОПИСАТЕЛЬНЫЕ МЕТАДАННЫЕ .................................................................................................................................... 32
СТРУКТУРНЫЕ МЕТАДАННЫЕ ....................................................................................................................................... 33
ЧАСТЬ 3. СРЕДСТВА ПОДГОТОВКИ ЭЛЕКТРОННЫХ ИЗДАНИЙ ............................................................. 35
ВВЕДЕНИЕ ..................................................................................................................................................................... 35
ОСНОВНЫЕ ФОРМАТЫ ХРАНЕНИЯ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ ................................................................................ 36
ОПИСАНИЕ СТРУКТУРЫ ХРАНЕНИЯ ПОЛНОТЕКСТОВЫХ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ............................................... 40
ТЕХНОЛОГИЯ ПОДГОТОВКИ И РАЗМЕЩЕНИЯ ПОЛНОТЕКСТОВЫХ ЭЛЕКТРОННЫХ ДОКУМЕНТОВ В СЕТИ INTERNET (НА
ОСНОВЕ ОПЫТА НБ БГПУ) .......................................................................................................................................... 41
ПРОГРАММНО–ТЕХНИЧЕСКИЕ СРЕДСТВА, НЕОБХОДИМЫЕ ДЛЯ ПОДГОТОВКИ ПОЛНОТЕКСТОВЫХ ЭЛЕКТРОННЫХ
ДОКУМЕНТОВ ................................................................................................................................................................ 41
ЧАСТЬ 4. СКАНИРОВАНИЕ И РАСПОЗНАВАНИЕ ОБРАЗОВ ....................................................................... 42
ОБРАБОТКА СКАНИРОВАННЫХ ИЗОБРАЖЕНИЙ ............................................................................................................ 52
РАБОТА С РЕДАКТОРОМ DJVU SOLO. ........................................................................................................................... 55
ПРОСМОТР ЭЛЕКТРОННЫХ ДОКУМЕНТОВ В ФОРМАТЕ DJVU....................................................................................... 61
ЧАСТЬ 5. ИНФОРМАЦИОННАЯ СТРУКТУРА СОВРЕМЕННОЙ БИБЛИОТЕКИ .................................... 61
ОБЩАЯ ИНФОРМАЦИОННАЯ СТРУКТУРА БИБЛИОТЕКИ ............................................................................................... 61
АНАЛИЗ ТРЕБОВАНИЙ И РАЗРАБОТКА СТРУКТУРЫ БАЗЫ ДАННЫХ ............................................................................... 68
МЕТОДЫ ОРГАНИЗАЦИИ ХРАНЕНИЯ И ПОИСКА ЭЛЕКТРОННЫХ ИЗДАНИЙ ................................................................... 69
ТЕХНОЛОГИЧЕСКИЕ АСПЕКТЫ СОЗДАНИЯ ЭЛЕКТРОННОГО КАТАЛОГА ....................................................................... 72
ЧАСТЬ 6. ВИРТУАЛЬНЫЙ МИР КНИГИ И ЕГО ОСОБЕННОСТИ............................................................... 81
НЕКОММЕРЧЕСКИЕ ЭЛЕКТРОННЫЕ БИБЛИОТЕКИ ......................................................................................................... 82
ПРЕДСТАВИТЕЛЬСТВО КРУПНЫХ БИБЛИОТЕК В ИНТЕРНЕТЕ........................................................................................ 83
ЧАСТЬ 7. ЭЛЕКТРОННЫЕ УЧЕБНЫЕ ПУБЛИКАЦИИ ................................................................................... 93
ЧАСТЬ 8. РЕГИОНАЛЬНАЯ БАЗА ДАННЫХ УЧЕБНЫХ МАТЕРИАЛОВ ................................................ 105
ЧАСТЬ 9. АВТОРСКИЕ ПРАВА ЭЛЕКТРОННЫХ ПУБЛИКАЦИЙ ............................................................. 117
СПИСОК РЕКОМЕНДУЕМОЙ ЛИТЕРАТУРЫ ................................................................................................. 124
ПРИЛОЖЕНИЕ 1 ....................................................................................................................................................... 126
3
Часть 1. Полнотекстовые базы данных
В конце 20-го века информация становится одним из главных ресурсов
человечества. Одно из определений 21-го века - век информации. Поэтому
создание, сохранение, эффективное использование, развитие информационных
ресурсов является одной из основных задач общества и государства.
Благодаря бурному развитию средств передачи данных, компьютерной
техники, программного обеспечения, Интернет уже сегодня существуют
множество баз данных (БД), в том числе полнотекстовых, на CD-ROM' ах и в
Интернет, в сети находятся также огромное число страниц книг, газет,
журналов, и их количество растет. Но уже сейчас имеются проблемы
рационального использования информации - нет унифицированного доступа к
ней, разнообразны способы ее хранения и распространения.
Виртуальная среда, обеспечивающая быстрый и надежный доступ к
ресурсам, позволила первыми оценить преимущества Интернет компании,
специализирующейся на производстве и продаже различного рода баз данных.
Созданием подобных баз с начала 80-х годов занималось множество
зарубежных корпораций, главным продуктом которых была информация.
Существовали фактографические базы данных, содержащие фактические
сведения (прежде всего статистику), библиографическую информацию
(сведения о документах) и полнотекстовые (полные тексты книг и статей из
газет, журналов и сборников). Среди наиболее известных производителей и
поставщиков баз данных в "доинтернетовский" период выделялись
LEXIS/NEXIS, Dialog, Silver Platter, EBSCO Information Services, STN
Internetional, H.W.Wilson, UMI (ныне ProQuest). Информационные продукты
доставлялись пользователям на магнитных лентах, посредством модемной
связи, а со второй половины 80-х годов - на CD-ROM.
Из всего перечня представленных в сети информационных продуктов
наибольший интерес представляют полнотекстовые базы данных текстовые базы первичных данных, содержащие полные тексты
документов (ГОСТ 7.73—96). В них содержатся тексты книг, статей из
журналов, газет и сборников, сообщения информационных агентств,
аналитические отчеты различных учреждений и другие документы.
Документом, в свою очередь, является единица хранения информации в
полнотекстовой базе данных, представляющая собой логически завершенную
часть данных о событиях и фактах имеющих информационный характер,
литературно-публицистические произведения или логически завершенные
части таких произведений, статьи, обзоры и проч. Документ имеет однородную
структуру и является текстовым файлом.
Число и отраслевой спектр полнотекстовых электронных собраний
постоянно расширяется. Если в 60-е годы их создание начиналось с правовой и
4
экономической областей, в 80-90-е года были освоены естественные, точные и
наиболее динамично развивающиеся гуманитарные дисциплины, то в
настоящее время очередь дошла до коллекций редких и старопечатных книг,
полных собраний сочинений античных и средневековых авторов, поэтических
антологий и подобных этому материалов.
Какие печатные издания переводятся в электронную форму? С одной
стороны, это редкие и старые издания, региональные издания. С другой
стороны, это книги наибольшего читательского спроса - энциклопедии,
словари, учебная литература, художественная литература. В Интернет и в базы
данных оперативно вводятся документы государственных органов - законы,
постановления, инструкции и т.д. Научных и технических изданий в Интернет
немного, но в Интернет и на CD-ROM'ах есть доступ к коллекциям научнотехнических и медицинских журналов.
Полнотекстовые тематические ресурсы на своих страницах размещают
многие институты, организации, а также частные лица, по различным отраслям
- экономике, политике, сельскому хозяйству, медицине, педагогике,
психологии,
философии,
религии,
лингвистике,
литературоведению,
культурологии, истории, мифологии и т.д.
Разнообразны ресурсы по культуре - сказки, мифы, художественные
альбомы, выставки.
Возможности электронных ресурсов позволяют по-новому представить
религиозную литературу - есть возможность поиска по любому слову из
Библии или Корана.
Среди учебных ресурсов - один из самых популярных сегодня - база
данных рефератов, курсовых, дипломов. Эта база данных существует и на CDROM'ах, и ежедневно пополняется через Интернет более чем на 100 адресах.
Для традиционных библиотек получение доступа к полнотекстовым
базам в значительной степени меняет подходы к информационной работе в
целом, так как позволяет пользователям обходиться без обращения к печатным
оригиналам изданий, и, следовательно, избавляет потенциальных клиентов от
необходимости физического посещения библиотек.
Каждую секунду в сети появляются новые материалы, какая-то их часть
по разным причинам удаляется с серверов, другая - меняет адресацию. Это
постоянное обновление с одновременным ростом объема информационного
массива делает крайне сложным учет всех или, по крайней мере, большинства
документов, существующих в Интернет. По оценкам, средний срок нахождения
информации по конкретному адресу - полгода. На сегодняшний день
насчитывается около 1 900 000 серверов в Интернет.
5
Таким образом, сведения, представляющие огромную ценность часто
остаются невостребованными пользователями по единственной причине
трудностей их разыскания. Ситуация в данном случае очень напоминает
известную задачу поиска иголки в стоге сена. Важность проблемы
информационного поиска в Интернет породила целую отрасль, задача которой
заключается именно в том, чтобы помочь пользователю в его навигации в
киберпространстве.
Средства поиска информации
Инструментов для поиска информации в Интернете, построенных на
разных принципах и преследующих разные цели, существует немало.
Реализация
компоненты:
поисковых
систем
всегда
подразумевает
следующие
 перемещение по сети (паук или кроулер), и сбор информации;
 база данных (индекс), содержащая информацию, собираемую
пауками;
 поисковый механизм (интерфейс) для взаимодействия с базой
данных;
 упорядочивание (ранжирование) результатов поиска.
По принципу организации и использования поисковые системы Интернет
подразделяются на:
 поисковые машины (автоматические индексы);
 каталоги (справочники, директории);
 метапоисковые Web-узлы (которые посылают запросы сразу на
несколько поисковых серверов).
Каждый из этих инструментов имеет определенные преимущества, а
основная разница между ними заключается в участии или неучастии человека.
И поисковые машины, и каталоги могут быть общими или
специализированными. Специализация в свою очередь может быть
региональная или тематическая.
Каталоги ресурсов – глобальные, локальные, специализированные.
Каталоги являются справочниками, содержащими списки адресов
Интернет, сгруппированные по определенным признакам. Как правило, они
объединяются по тематике (наука, искусство, новости и т. д.), где каждая тема
разветвляется на несколько подуровней, то есть имеют иерархическую
структуру, перемещаясь по которой, можно найти нужный объект. Для
6
пользователя получение информации о ресурсе из известного каталога всегда
является некоторой гарантией достоверности.
Но, так как каталоги создаются вручную, они охватывают намного
меньше ресурсов, чем поисковые машины.
Поисковые машины, или автоматические индексы – глобальные,
локальные, специализированные.
Все поисковые машины, предназначенные для сети Интернет, имеют
более или менее схожие принципы работы. Компактные копии документов,
известных серверам поисковых систем, хранятся на локальном диске. Задача
поисковых машин - вести поиск по ключевым словам из полных текстов webдокументов, то есть проводить детальное максимальное
разыскание
информации в электронной вселенной.
В отличие от справочников, все они функционируют полностью в
автоматизированном режиме, имеют одинаковый принцип деятельности и
состоят из двух основных блоков. Первый блок представляет собой программуробот, задача которого путешествовать с сервера на сервер, находить там новые
или изменившиеся документы и передавать их на свой базовый компьютер.
Чаще всего роботы просматривают серверы самостоятельно, находя
новые внешние ссылки, в уже обследованных документах, действуя, таким
образом, по известной методике "снежного кома". Выявленные документы
обрабатываются вторым блоком поисковых машин. При этом учитывается все
содержание страниц, зачастую даже не только полный текст, но и наличие
иллюстраций, аудио- и видео- файлов, Java-приложений.
Индексации подвергаются все слова в документе, что как раз и дает
возможность использовать поисковые системы для детального поиска по самой
узкой тематике. Выдача результатов осуществляется с помощью специальной
подсистемы, которая производит интеллектуальное ранжирование результатов,
опираясь в своих расчетах на местоположение термина, частоту его повторения
в тексте, процентное соотношение данного термина с остальным текстом на
данной странице. По этим параметрам среди внушительного числа поисковых
систем выделяются несколько наиболее признанных, позволяющих выявлять
информацию с высокой степенью полноты и надежности.
Из популярных средств русскоязычного поиска можно назвать серверы
Яndex, Апорт и Rambler, индексирующие десятки тысяч серверов и десятки
миллионов документов. Из зарубежных серверов популярны Altavista, Excite,
Hotbot, Lycos, WebCrawler, OpenText.
Яndex - Поисковая машина последнего поколения, являющаяся к
настоящему времени самой объемной: количество обследованных серверов
7
превышает 239 434, а число учтенных оригинальных документов 30 879 447.
Помимо серверов доменов "ru" и "su", Яndex индексирует содержание
зарубежных русскоязычных web-узлов, а также серверов СНГ. Яndex
безусловно располагает самой мощной и сложной системой составления
запросов: пользователю предлагается несколько вариантов поиска, в которых
легко запутаться. Более чем какие-либо другие системы, Яndex приспособлен
для задания запросов на естественном русском языке. В этом случае запрос
формируется путем простого ввода терминов или целой фразы в поисковую
строку. Поисковый механизм сам производит расширения (падежи, числа,
склонения), исключает "стоп-слова", анализирует расстояние терминов друг от
друга и пр. В списке результатов ссылки снабжаются сведениями о том, есть ли
в документе совпадение фразы или же все введенные термины.
Рамблер - единственный в российском Интернет портал, объединивший
поисковую систему, рейтинг-классификатор, а также ряд бесплатных сервисов
и информационных проектов. Ресурсы портала регистрируют ежесуточно более
3,5 млн. посещений, а ежемесячная аудитория Рамблера составляет 60-70% всех
пользователей Рунета. Только поисковая система содержит информацию о
более чем 12 миллионах документов, расположенных на серверах России и
стран СНГ. Рамблер обрабатывает ежесуточно не менее 500 тысяч поисковых
запросов (в среднем - 5 запросов в секунду), сканируя 48 тысяч web-серверов и
используя несколько одновременно работающих программ-роботов. Все
проекты Интернет-холдинга реализованы на базе собственных технологических
разработок.
На сегодняшний день Апорт (http://www.aport.ru/) является одним из
ведущих отечественных поисковых систем. Обновленная версия представляет
собой медиа-портал нового поколения, сочетающий в себе девять
информационно-развлекательных тематических разделов, каталог отобранных
интересных ресурсов Интернет и ряд полезных сервисов, в числе которых
поисковая машина Апорт, форумы, подписки и многое другое.
Создатели выработали четкую политику отражения материалов:
учитываются российские или содержательно относящиеся к России ресурсы, а
также сайты стран ближнего зарубежья, включая Прибалтику. К сервисным
функциям системы относится возможность сортировки ссылок в рубриках по
дате поступления в алфавите названий, по популярности, местоположению,
доступности, а также по лиге, к которой относятся сайты.
Существуют "любительская", "профессиональная", "высшая" и "элитная"
лиги, хотя во многом они представляют субъективный взгляд создателей
каталога. Специальная функция "Тропы" позволяет получить нечто вроде
обзора серверов конкретной тематики.
8
Другие поисковые системы и каталоги можно найти с помощью уже
известных каталогов в разделах "Интернет - поисковые системы (каталоги)".
Помимо универсальных поисковых серверов в Интернет уже существует
множество тематических указателей ресурсов. Их также можно найти в
соответствующих
разделах.
Например:
"Деловой
Интернет"
(http://www.delovoy.spb.ru).
Проект
создавался
как
бизнес-центр,
аккумулирующий в себе информацию о ресурсах Интернет по экономике,
финансам, менеджменту, маркетингу. Проект рассчитан на всех, кто в той или
иной мере интересуется вопросами экономики, менеджмента, маркетинга, ведет
поиск партнеров по бизнесу. В рамках проекта действует каталог ссылок.
Развивается и пополняется раздел, содержащий аналитическую информацию,
статьи по экономике, менеджменту, маркетингу. Действует ежемесячная
новостная рассылка (~600 подписчиков).
Полнотекстовые базы данных обеспечивают для клиентов высокий
уровень
сервиса.
Поисковый
механизм
позволяет
осуществлять
многоаспектный поиск с возможностью сочетания данных из разных полей.
Разыскание может осуществляться по отдельным словам, словосочетаниям и
точным фразам. Результаты поиска выдаются в виде списка библиографических
записей с указанием всех необходимых элементов. Существует возможность
формирования из общего перечня списка релевантных документов.
Тематическая навигация в полнотекстовых базах данных
Вследствие постоянного роста количества полнотекстовых документов,
представляемых в электронном виде, появляется все больше новых методов
навигации в информационных массивах. Сейчас текстовую информацию
обычно представляют в форме гипертекста, отличающегося возможностью
интерактивной работы с материалом и многомерностью его представления. При
этом конкретные реализации гипертекста различаются как способом
установления связей, так и формой визуального отображения, начиная с
простейших видов систем вроде Web-страниц, справочных или
программируемых, в которых используется переход по тексту посредством
жестко
задаваемых
разработчиками
приемов,
и,
заканчивая
«интеллектуальными»
электронными
книгами,
где
каждое
слово
сопровождается веером раскрывающихся гиперссылок, представляемых
понятиями, связанными по смыслу.
Создание поисковых машин в Интернет и увеличение объемов
публикуемой информации стимулировали развитие гипертекстовых средств
нового поколения, иначе называемых тематическими навигаторами. Системы с
подобными средствами позволяют передвигаться по связанным тематическим
категориям (рубрикам), а к каждой из них может быть отнесено множество
текстов, близких по содержанию. С помощью лучших из таких навигаторов
9
можно определить темы, объединяющие нужные тексты (например,
содержащие определенные слова), а затем передвигаться по этим темам.
Все известные тематические навигаторы подразделяются на две
категории. Навигаторы, относящиеся к первой категории, имеют жестко
заданную структуру с априори установленными темами и связями между ними.
В таких навигаторах используется заранее определенный рубрикатор с
иерархической структурой категорий, отражающий общепринятый набор
областей знаний. Нижние ветви рубрикатора обычно включают в себя классы
слов языка, относящиеся к определенным темам. Подобные навигаторы могут
автоматически распределять все входящие тексты по соответствующим
тематическим рубрикам и подсчитывать, на какие из ветвей приходится больше
слов из текста. Однако рубрикатор стандартной структуры отражает лишь
наиболее очевидные связи между темами, а они малоинтересны, поскольку не
открывают новой информации.
Для создания навигаторов второй категории требуется участие экспертов
для формирования структуры тем на основе анализа содержания собрания
текстов. Здесь гипертекстовая структура обычно представляет собой
семантическую сеть, связи которой показывают актуальное строение текстов с
семантической точки зрения. Такие навигаторы из-за высоких затрат на
разработку,
требующую
привлечения
«ручного»
труда,
обычно
предназначаются для небольших собраний текстов в узкой предметной области.
Технология тематического поиска предназначена для эксплицирования
скрытой в документах информации, относящейся к запросу пользователя, и ее
структурирования по темам. Основной отличительной особенностью
технологии является ориентация на поиск фактов различной природы,
имеющих в документах некую смысловую связь со словами запроса и
представляющих объекты возможного интереса пользователя. Функция
извлечения документов по факту является вторичной по отношению к функции
отбора фактов.
Тематический поиск позволяет найти темы, связанные по смыслу со
словами запроса или с заданной темой в коллекции документов, и получить
документы, раскрывающие выбранную тему или взаимосвязь нескольких тем.
Понятие “тема” в данном контексте обозначает ключевые объекты
произвольной природы, описываемые в документах, например: различные
наименования, события, понятия и т.п. Выявление тем основано на наших
технологиях автоматического анализа содержания текста.
Например, в ответ на запрос "нефть" можно получить следующий список
тем: "добыча нефти", "экспорт нефти", "государственная нефтяная компания
Азербайджана", "Азербайджан", "Ангарский НХК", "топливные компании",
"ЮКОС" и т.д.
10
Возможности тематического поиска могут оказать большую помощь в
случае, если пользователь затрудняется точно подобрать ключевые слова, или
же, если он хочет сузить область поиска, уточнив тематику новыми объектами,
по которым следует искать документы. Поиск по теме обладает более высокой
точностью и полнотой по сравнению с простым контекстным поиском. Так,
если контекстный поиск находит все документы, содержащие заданные слова,
то тематический поиск возвращает лишь те документы, в которых словам
запроса соответствует одна из ключевых тем. Кроме того, он позволяет найти
документы, вовсе не содержащие слов из названия заданной темы, однако
имеющие к ней отношение. Дополнительно тематический поиск позволяет
найти документы, близкие по содержанию к заданному, на основании
сравнения ключевых тем документов.
Российские и зарубежные полнотекстовые базы данных
По всем миру создано много независимых ЭБ. Они придерживаются
различной политики и базируются на различных компьютерных системах.
Рассмотрим конкретные примеры полнотекстовых электронных библиотек.
Рассмотрим
библиотек.
конкретные
примеры
полнотекстовых
электронных
Начнем с энциклопедий и словарей. Связь между Интернетом и
энциклопедией гораздо более глубока, чем это может показаться при
поверхностном взгляде. Интернет вырос из Энциклопедии, воспользовавшись
выработанными ею принципами структурирования больших объёмов
информации.
В Интернет и на CD-ROM' -ах размещены сегодня уже сотни ресурсов,
называющих себя энциклопедиями. Но на это название часто претендуют
полнотекстовые электронные издания, полно освещающие какой-то предмет.
Мы будем рассматривать энциклопедии в классическом понимании.
В Интернет энциклопедии также подразделяются по видам по тематике:
универсальные
(общемировые),
отраслевые,
региональные,
биографические, в т.ч. персональные (например, «Лермонтовская»),
проблемные или узко отраслевые, прочие (ориентированные на определенные
группы читателей).
В Интернет существуют порталы энциклопедий. Один из них - Рубрикон.
http://www.rubricon.ru
РУБРИКОН — информационно-энциклопедический проект компании «Русс
портал», в рамках которого пользователь впервые получает одновременно
11
удобный инструмент поиска лучших ресурсов сети Интернет и свободный
доступ к полным электронным версиям важнейших энциклопедий и словарей,
изданных за последние сто лет в России. Рубрикон — это информационносправочная система, объединяющая энциклопедии, каталог ссылок на страницы
Интернета и статьи из журнальной периодики, а также ряд дополнительных
информационных сервисов. Главными отличиями Рубрикона от аналогов
являются крупнейший в мире массив энциклопедических данных и
одновременный поиск по всем имеющимся информационным ресурсам.
http://www.rubricon.ru/bie_1.asp
Энциклопедический словарь Брокгауза и Ефрона.
Подборка из 5 334 статей «Энциклопедического словаря Брокгауза и Ефрона»,
подготовленная в современной орфографии и впервые опубликованная на CDROM компанией «Аутопан» в 1998 году (около 15% от общего количества
статей 86-томного издания, выходившего в 1890-1907 годах). В некоторых
случаях статьи брались из второго, незаконченного издания (1911-1916, из
запланированных 48 томов вышли 29, последнее слово - «Отто»).
Проект "Мир энциклопедий" находится на сайте
http://www.encyclopedia.ru/
Включает универсальные, отраслевые,
персональные он-лайн энциклопедии.
региональные,
специальные
и
Среди универсальных - энциклопедия Кирилла и Мефодия и ALL-IN-ONE.
ALL-IN-ONE - это справочник, носит энциклопедический характер и позволяет
быстро и легко получить числовую и фактическую информацию практически
по всем сферам человеческой деятельности. Помимо чисто научной
информации здесь можно найти немало просто интересных фактов и
сопоставлений. Разделы: Число и измерение. Вещество и поле. Вселенная
Земля. Живая природа. Человек. Культура.
При написании использованы материалы справочников "Альфа и Омега",
"Природопользование",
Химическая
энциклопедия,
Философский
энциклопедический словарь, Международная система единиц СИ,
Математический словарь, Малый атлас мира, Справочник необходимых
знаний.
http://students.informika.ru/enen/
12
Энциклопедия Энциклопедий - проект Сервера Российского Студенчества,
направленный на составление первой в мире наиболее полной Энциклопедии
всех энциклопедических ресурсов российского и мирового Интернет для
российских студентов и всех других категорий пользователей.
Из англоязычных энциклопедий - Энциклопедия Britannica.
Сетевой вариант самой авторитетной мировой энциклопедии. Содержит
более 72 тысяч статей по всем отраслям знания. Актуализируется ежегодно.
Результаты поиска включают не только тексты из энциклопедий, но и ссылки
на ресурсы Интернет, а также избранные журнальные публикации. Статьи
снабжены гиперссылками к другим разделам энциклопедии. Во многих случаях
представлены иллюстрации, таблицы, видеофайлы.
http://www.britannica.com
Научная электронная библиотека
Доступ к базам:
Academic Press (база по различным отраслям науки)
World Scientific (база по различным отраслям науки)
EBSCO(только около 1200 журналов)
MEDLINE (медицинская база)
CANCERLIT (медицинская база)
AIDSLINE (медицинская база)
EMBASE ALERT (медицинская база)
EMIS (база по математике)
Zentralblatt MATH (база по математике)
журналы издательства KLUWER, SPRINGER, BLACKWELL (по всем
направлениям фундаментальных наук)
журналы Royal Society of Chemistry (химия)
Institute of Physics (физика)
Журналы издательства ИНИОН РАН(на русском языке)
Журналы Российских издательств.
URL: http://www.elibrary.ru
Электронные библиотеки художественной литературы.
Электронных библиотек на русском язык уже существует немало. Они
создаются и в России, и в странах СНГ, и в дальнем зарубежье.
13
По меркам обычных библиотек, электронные библиотеки содержат не так уж и
много документов - до 50 тысяч. Однако создание и поддержание таких
библиотек требует значительных ресурсов.
Рассмотрим некоторые из них.
 Библиотека Максима Мошкова.
Самая известная в Рунете электронная www-библиотека, открыта в 1994.
Читатели ежедневно пополняют ее. Художественная литература,
фантастика и политика, техдокументация и юмор, история и поэзия, КСП
и русский рок, туризм и парашютизм, философия и эзотерика, и т.д. и т.п.
Библиотека Мошкова имеет 55 зеркал. В библиотеке есть проза,
переводы, поэзия, фантастика,
детективы,
история, старинная
литература, детская и приключения, научная, компьютерная литература,
учебники, и литература, специально для библиотекаря.
Тексты введены в большинстве случаев в простейшем ASCII формате.
Ряд литературных проектов создан автономной некоммерческой
организацией "Поддержка культурного наследия". На текущий момент к
этим проектам относятся:
Стихи.ru - национальный сервер современной поэзии.
Проза.ru - национальный сервер современной прозы.
Литер.ru - национальная литературная сеть.
Классика.ru - библиотека русскоязычной литературы.
ПИИТЕР - Лито города Санкт-Петербурга.
Русская культура XX века - антология литературных музеев. Полдень,
XXI век - журнал современной русской фантастики под редакцией Б.
Стругацкого. Выбор произведений возможен по автору, по хронологии, есть
рейтинги произведений по количеству читателей, есть случайные
произведения. Во всех проектах также есть рецензии, дискуссии, чат.
http://lib.ru
 Классика.Ru - электронная библиотека классической литературы.
Большая коллекция русской поэзии и прозы, а также биографии авторов.
На сайте представлено 2878 произведений 144 авторов.
Проза: Авторы и произведения. Авторы по хронологии. Рейтинг
произведений по количеству читателей. Случайное произведение.
Поэзия: Авторы и произведения. Авторы по хронологии. Рейтинги.
14
Случайное произведение. Энциклопедия поэзии.
Учебник стихосложения.
Об авторах: Биографии.
http://www.klassika.ru:8014/
 Проза.ru - национальный сервер современной прозы.
http://www.proza.ru/
 Стихи.ru - национальный сервер современной поэзии.
http://www.stihi.ru/
 Литер.ru: национальная литературная сеть.
http://www.liter.ru:8002/
 Русская виртуальная библиотека.
Целью Русской виртуальной библиотеки (РВБ) является электронная
публикация классических и современных произведений русской
литературы по авторитетным источникам с приложением необходимого
справочно-комментаторского аппарата.
Культурное и научно-образовательное значение проекта состоит, прежде
всего, в том, что пользователи получают доступ к научно выверенным
текстам
произведений
русской
литературы,
снабженным
профессионально подготовленным справочным аппаратом, который в
полной мере учитывает новейшие достижения филологической науки и
соответствует требованиям современного гуманитарного образования.
Деятельность РВБ нацелена на расширение и усиление академического
сектора русского Интернет.
Публикации, осуществленные в рамках РВБ, представляют вклад в
развитие современной филологии и должны учитываться при подготовке
будущих академических собраний сочинений русских авторов.
http://www.rvb.ru/
Образовательные проекты в Интернет.
На русском языке в сети в свободном доступе присутствует
незначительное количество полнотекстовых учебников. Но более чем на 100
15
серверах размещены коллекции рефератов, курсовых, дипломов, там есть и
учебники.
Специализированный
информационно-образовательный
портал
"Гуманитарные науки" создается в рамках Федеральной целевой программы
"Развитие единой образовательной информационной среды (2001-2005 годы)"
(ФЦП РЕОИС) как часть единой сети порталов российского образования.
Основой для создания данного портала является информационнообразовательный портал Auditorium.ru, работы над которым ведутся с конца
2001 года по инициативе и при финансовой поддержке Института "Открытое
общество" (Фонд Сороса) - Россия.
Цель проекта - способствовать развитию образования и научных
разработок в сфере общественных и гуманитарных наук в России путем
совершенствования информационного обеспечения учебного, учебнометодического и научного процессов на основе новых информационных
технологий.
Разделы библиотеки: История. Философия. Социология. Право.
Экономика.
Психология.
Филология
(Языкознание).
Филология
(Литературоведение).
Международные
отношения.
Политология.
Культурология. Педагогика и теория образования. Востоковедение и
африканистика. Гендерные исследования. Другие направления социальноэкономического и гуманитарного знания.
Журналы.
Типы публикаций
Авторефераты. Аннотации. Аудиоресурсы. Дипломы. Диссертации
докторские. Диссертации кандидатские. Доклады. Журналы. Исторические
документы. Коллективные монографии. Курсы лекций. Материалы
конференций. Методические пособия. Методические рекомендации. Научные
монографии. Обзоры научно-аналитические. Планы семинарских занятий.
Пособия для учащегося. Пособия для учителя. Проверочные задания.
Программы для высшей школы. Программы для средней школы. Реферативные
сборники. Рефераты. Сборники докладов. Сборники документов. Сборники
избранных работ. Сборники статей. Словари. Собрания сочинений.
Справочники. Статьи. Учебники для вузов. Учебники для средней школы.
Учебные пособия для вузов. Хрестоматии. Энциклопедии. Эссе, очерки.
Юридические документы.
Полные тексты доступны для зарегистрированных пользователей.
http://www.auditorium.ru/aud/about/index.php
16
 Федеральный общеобразовательный и специализированные порталы
Образовательный портал по экономике, менеджменту и социологии.
Образовательный портал по юридическим наукам
Портал «Социально-гуманитарное и политологическое образование»
Естественно-научный образовательный портал (физика, химия, биология)
Портал «Педагогика общеобразовательной школы»
Типы документов:
Учебные планы и программы. Учебные и учебно-методические
материалы. Научные и официальные материалы. Курсы лекций.
Практические задания, тестирование. Иллюстративный материал.
Учебная и научная литература. Специальная литература. Библиография.
Ссылки на библиотеки. Периодические электронные издания.
Студенческие рефераты. Курсовые и дипломные работы. Диссертации.
Биографии ученых. Ведущие преподаватели. Образовательные и научные
центры.
Государственные и муниципальные органы власти.
Статистические данные. Аналитические обзоры. Научные, научнопрактические конференции, семинары и симпозиумы. Ссылки на форумы,
- конференции, чаты.
http://www.edu.ru/db/portal/sites/portal_page.htm

Базы данных ИНИОН
Комплекс баз по гуманитарной тематике. Всего отражено более 1,2 млн.
записей, и массив регулярно пополняется. Дополнительной платной
услугой является электронная доставка полных текстов документов.
URL: http://www.inion.ru/product/db.htm

Университетская информационная система РОССИЯ
Университетская информационная система РОССИЯ (УИС РОССИЯ)
создана и поддерживается как база электронных ресурсов для
исследований и образования в области экономики, социологии,
политологии, международных отношений и других гуманитарных наук и
с 2000 года открыта для коллективного доступа университетов, вузов,
научных институтов РФ и специалистов.
17
Условия доступа: доступ по свободной регистрации через Интернет дает
возможность пользователю искать и просматривать аннотации по всем
коллекциям, но получать полные тексты документов только из
коллекций, разрешенных правообладателями для свободного доступа.
Доступ с ограниченными полномочиями открыт без регистрации. При
этом пользователь может производить поиск и просматривать аннотации
по коллекциям, разрешенным правообладателями для свободного
доступа. Просмотр документов возможен только для ограниченного круга
коллекций.
URL: http://www.cir.ru
Зарубежные базы данных

Global Books in Print
Global Books in Print - ведущая международная база данных, содержащая
более 9.2 млн. названий книг из всех стран мира, включая книги на аудиои видеокассетах (имеющихся в продаже, распроданных, доступных по
предварительному заказу). В состав базы данных Global Books in Print
интегрированы так же: Bowker's Publishers (более чем 300 000
издательств) Bowker's Autor Biography Bowker's Awards (литературные
премии) Bowker's Bestsellers. И что очень важно, база данных содержит
1.4 млн. полных текстов обзоров (ABSTRACTS), дающих представление
о том, что именно и по какой тематике вышло в свет за последнее время.
Данная база имеет четко отлаженную систему поиска по более чем 40
критериям, которые можно свободно комбинировать.
URL: http://www.globalbooksinprint.com

EJS(Electronic Journal Service)
Базы: MasterFILE Premier из EBSCO Publishing(полные тексты) В EJS
загружены 10 тысяч наименований журналов. В этой системе
пользователь получает возможность вести библиографический и
реферативный поиск по разным журналам, статьям, тематикам, а также
имеет возможность, прописав свой профиль, регулярно получать
информацию о вновь вышедших статьях по своей тематике.
URL: http://ejournals.ebsco.com

EBSCO Publishing
Доступ к базам:
Business Source Premier (по экономике, финансам, менеджменту)
18
MasterFILE Premier (база по основным наукам)
Newspaper Source (газетная база)
Regional Business News (полнотекстовые сводки новостей
информационных агентств)
Academic Search Premier (академическая база по социальным,
гуманитарным, компьютерным, естественным наукам, литературе и
искусству, лингвистике)
Health Source: Nursing/Academic Edition (медицинская база)
MEDLINE (медицинская база)
ERIC (база по образованию)
Health Source - Consumer Edition (медицинская база)
Clinical Pharmacology (медицинская база)
Russia Online (газеты, информация издательств, новостных агентств и
перепечатки ТВ редакций на русском языке)
Communication & Mass Media Complete(базы данных по массмедиа и
коммуникациям)
The American Humanities Index(базы по гуманитарным наукам)
URL: http://search.epnet.com

JSTOR
Доступ к базе «ARTS&SCIENCES I COLLECTION». Полнотекстовая
журнальная база (131 наименование) по антропологии, экономике,
образованию, финансам, истории, литературе, математике, философии,
политическим наукам, демографии, социологии, статистике на
английском языке.
URL: http://www.jstor.org

Cambridge University Press
Журнальная база издательства Cambridge University Press по физическим
наукам, психологии, компьютерным наукам, биологии, математике,
истории, философии на английском языке.
19
URL: http://www.journals.Cambridge.org
 New Journal of Physics (NJP)
Новый электронный полнотекстовый физический журнал, созданный
Inctitute of Physics и Deutsche Physikalische Gesellschaft, на английском
языке.
URL: http://www.njp.org

Gale и KG Zauer
Полнотекстовые периодические издания на английском языке.
Доступ к базам:
Biography Resource Center (биографии),
Literature Resource Center (биографии литературных авторов,
библиография),
Business and Company Resource Center (инвестиционные сообщения,
истории компании, хронологии и периодика),
IBZ - International Bibliography of Periodical
Literature (международная библиография периодической литературы в
социальных и общественных науках),
English Language Bibliography 1945 to the Present (английская
библиография с 1945 по настоящий год),
Yearbook of International Organizations Online (информация о
международных организациях с 1910 года),
Gale Virtual Reference Library (реферативные источники, включая
энциклопедии, альманахи).
URL: http://www.galeuk.com/saurtrials/eifl

База данных FINDARTICLES
База данных полных текстов статей на английском языке из 300
журналов, свободно доступная через Интернет. Возможности поиска во
всей базе данных, в определенной категории и в определенном названии.
Области знания - бизнес и финансы, образование, искусство и шоубизнес, автомобильное дело, компьютерные технологии, здоровье и
20
фитнес, общество, спорт, а также издания энциклопедического и
справочного характера.
URL: http://www.findarticles.com/cf_0/PI/subject.jhtml

Online Books Page
Содержит более 15 тыс. полнотекстовых книг и других изданий на
английском языке, хранящихся на сервере University of Pennsylvania.
Поиск по - автору, названию и ключевым словам. Коллекция снабжена
ссылками на другие книги, размещенные в Интернет.
URL: http://onlinebooks.library.upenn.edu/

Poets' Corner
Коллекция, содержащая более 6500 поэтических произведений на
английском языке. Поиск - по автору, названию, или предметной рубрике.
Большинство произведений написаны ранее, чем 75 лет назад, но рубрика
"Suggestions for Further Reading" включает списки произведений
современных авторов. Коллекция снабжена библиографическими
списками литературы, портретами авторов.
URL: http://www.geocities.com/%7Espanoudi/poems/index.html

Project Gutenberg
Представлены тексты из книг, публиковавшиеся до 1923 года. Это
классическая литература. Поиск по автору, заглавию, ключевому слову.
Тексты представлены в виде файлов .txt и .zip.
URL: http://www.gutenberg.net/

Bartleby Library: Great Books Online
Содержит тысячи поэтических произведений, романов, пьес, эссе и
свыше 100 тыс. цитат всемирно известных классиков. Прекрасные
поисковые возможности - поиск по отдельному произведению или по
всей коллекции, по текстам, по названию. Bartleby Verse включает
American & English Poetry (1250-1920), объединяющий в себе полные
тексты таких классических антологий как The Oxford Book of English
Verse, 1919; Yale Book of American Verse, 1919; Modern British Poetry,
1920; Modern American Poetry, 1919.
URL: http://www.bartleby.com
21

Bibliomania
Более 2000 классических произведений художественной (проза и поэзия)
и нехудожественной литературы, некоторые справочные издания и статьи
из периодических изданий. Включает полное собрание сочинений
Шекспира. Возможность поиска по полным текстам произведений,
определенным частям произведений, и по их названиям.
URL: http://www.bibliomania.com/

Athena
Более 10 000 книг по философии, классической литературе, экономике,
истории, минералогии, а также книги швейцарских и французских
авторов на языке оригинала. Поиск по автору, заглавию, ключевому
слову, языку.
URL: http://un2sg4.unige.ch/athena/html/athome.htm

Classics in the History of Psychology
Полнотекстовая коллекция исторически значимых произведений по
психологии и смежным дисциплинам. Поиск - по ключевым словам, по
авторам и по темам.
URL: http://psychclassics.yorku.ca/

Internet Public Library
Содержит более 18 тыс. названий классических произведений
художественной и нехудожественной литературы, журналы, газеты,
организованные в рубрики по классификации Дьюи. Поиск - по автору,
названию, и рубрике классификации. База поддерживается University of
Michigan School of Information.
URL: http://www.ipl.org/
Мультимедиа и полнотекстовые базы данных
Мультимедиа сейчас - это полноценное объединение компьютерных и
других информационных технологий: видео, аудио, фото, кино,
телекоммуникаций (телефон, телевидение, радиосвязь), не говоря уже о тексте
и графике, как статической, так и динамической (анимационной). С помощью
приложений мультимедиа текст, графика, аудио- и видеоинформация
объединяются в единое информационное поле, подобно тому, как в
кинофильме объединяются звук и движущееся изображение. Однако в отличие
от кинофильма мультимедиа представляет собой интерактивную среду, т. е.
22
пользователь может управлять процессом представления мультимедиа с
помощью различных средств ввода, таких как клавиатура и манипулятор мышь.
Успешное сращивание телекоммуникационных сетей с компьютерами,
стремительный рост их качества и количества преобразует вещательные сети в
интерактивные, создает единое мировое информационное мультимедиапространство. Важнейшей частью этого пространства является сеть Интернет и
особенно, ее гипермедиа-система World Wide Web. Распространение
мультимедиа-технологий (в сочетании с развитием электронной коммерции) в
дальнейшем наложит жесткие ограничения на конкурентоспособность
издательско-полиграфических фирм, ориентированных на широкий спрос.
Преимущества в продаже даже самой высококачественной продукции получат
те, кто быстрее и эффективней освоил электронные способы коммерции и
обслуживания.
Использование мультимедиа в учебных пособиях дополняет
аналитические (вычислительные и логические) и навигационные возможности
компьютеров способностью к образному, синтетическому описанию
изучаемого предмета или объекта. Многочисленные исследования показали,
что обучаемый с первого раза запоминает лишь четверть услышанного и треть
увиденного. При комбинированном воздействии на слух и зрение запоминается
приблизительно половина информации, а при вовлечении обучаемого еще и в
активные действия (например, при использовании интерактивных
мультимедиа-технологий) доля усвоенного достигает 75%. Мультимедиа,
особенно интерактивное, активизирует индивидуальные, личностные мотивы
усвоения материала обучаемым, в том числе:





целевой (для меня важно и необходимо знать этот материал и уметь
выполнять такую работу);
исследовательский (работая с учебным материалом, я не только узнаю
что-то новое, но и чувствую себя активным участником процесса
познания, сам участвую в творческом процессе);
эмоционально-эстетический (в процессе изучения материала я
испытываю удовольствие, как от получаемых результатов, так и от
самого процесса изучения этого материала);
игровой (эта форма обучения интересна, начав изучать материал, я не
могу остановиться, мне интересно и хочется довести до конца изучение
материала);
инициационный (предполагает органичное сочетание в мультимедийном
учебнике информационной и эстетически-эмоциональной глубины).
По уровню творческих мотивов и степени воздействия на человека
мультимедиа следует отнести к новому виду синтетического искусства,
отличительной особенностью которого является высокая информативность и
интерактивность. Поэтому в будущем следует ожидать создания теории
23
педагогики мультимедиа, учитывающей психофизиологические и эстетические
законы восприятия и усвоения большого объема информации. Не исключая
традиционной формы обучения, предполагающей творческое и воспитательное
общение с преподавателем, мультимедиа создает новые позитивные факторы, в
частности, значительный рост эффективности обучения за счет повышения
качества самостоятельной работы студента с электронными учебными
материалами.
Специалисты считают, что самую сложную систему автоматизированного
управления было бы гораздо легче освоить в том случае, если она реализована
на основе стандартного мультимедиа-интерфейса. В будущем, видимо, будут
созданы эвристические алгоритмы мультимедиа, которые позволят не только
человеку адаптироваться в компьютерной системе, но и компьютеру
адаптироваться к уровню восприятия человека, т. е. сделать процесс адаптации
двусторонним.
Получение полнотекстовых баз данных
Текстовые документы в электронную библиотеку могут поступать из
разных источников - некоторые могли быть созданы для онлайнового
использования, некоторые получены конверсией печатных материалов,
некоторые могут быть оцифрованными звуковыми дорожками к фильмам и
телепрограммам.
Наполнение полнотекстовых баз данных производится двумя способами.
Первый заключается в сканировании печатных оригиналов и получении
электронных копий документов, выполненных в большинстве случаев в
формате PDF. Эти документы воспроизводятся (читаются) с использованием
бесплатно распространяемой программы Adobe Acrobat. Сканирование
печатных оригиналов применяется при оцифровывании существующих
тематически и логически законченных собраний, хранящихся, как правило, в
фондах библиотек или архивов. При этом масштабы и темпы оцифровки
документальных массивов в рамках коммерческих проектов в разных странах
дают все основания полагать, что уже в ближайшие годы будет оцифровано
большинство значимых для человечества материалов. Для пользователей станет
принципиально возможным получить доступ к любым источникам - от
германских старопечатных книг XVI века до заметки в завтрашнем номере
японской газеты.
Второй метод - покупка электронных копий книг, газет или журналов
непосредственно в издательствах. По предварительному договору издательства
передают электронную версию документа (чаще всего готовый оригинал-макет)
поставщику и получают определенный процент от средств, полученных за
обращение к поставленным файлам. Загрузка документов в систему
осуществляется, как правило, в момент опубликования печатного оригинала
или даже ранее. После физической загрузки в базу информационный массив
24
индексируется, после чего электронные документы становятся доступными для
поиска и выгрузки. Подобный способ "комплектования" применяется при
работе с современными периодическими изданиями и сообщениями агентств
новостей.
В профессиональных базах данных полные тексты предстают перед
пользователем в виде HTML-документов или PDF-файлов. Особенностью
последних является способность представлять документ именно в том виде, как
он существует в печатной копии, с сохранением колонок, таблиц, иллюстраций
и т.д. В тоже время все содержание такого документа может быть доступно для
поиска (проиндексировано). Источники в PDF можно не только просматривать
(читать) в онлайновом режиме, но и сохранять на собственном компьютере для
дальнейшей работы.
Модель доступа к информации становится основной характеристикой
электронной библиотеки. Только доступ к электронным ресурсам через
специально организованные электронные библиотеки может обеспечить
необходимую полноту информирования. Только проблемно-ориентированные
электронные библиотеки, в которых ресурсы систематизированы на основе
детальных иерархических классификаций, могут обеспечить оперативный и
качественный поиск необходимого ресурса.
Несмотря на то, что бумажные издания были и остаются для большинства
людей основным источником информации, полнотекстовые базы данных
являются перспективным видом хранения библиографических материалов.
Часть 2. Способы описания электронных ресурсов
Описание мета-информация информации
Логическим компонентом любой электронной библиотеки является
система метаданных. Подобно тому, как библиотечный каталог организует все
множество единиц хранения в систему библиотечных фондов, вокруг которой
строятся все библиотечные технологии, система метаданных организует
совокупность электронных информационных ресурсов (или цифровых
объектов) электронной библиотеки.
Соответственно вокруг системы метаданных и на ее основе строятся
основные технологические процессы электронной библиотеки, а именно:



навигация в информационном пространстве;
поиск отдельных цифровых объектов (информационных ресурсов) или их
совокупностей;
ввод, обработка и организация хранения цифровых объектов, а также их
исключение (изъятие);
25

управление правами доступа к цифровым объектам, включая защиту
авторских прав, организация платы за доступ и пр.
Метаданные находятся рядом с нами с тех пор, как первый библиотекарь
сделал список хранящихся на полке рукописных свитков. Термин "мета (meta)"
появился из греческого слова, которое означает "рядом, с, после, следующий".
Более позднее латинское и английское употребление использует термин "мета"
для определения чего-то абстрактного или сверхъестественного. Метаданные,
кроме того, могут быть интерпретированы как данные о других данных. Это
термин века Интернет, определяющий информацию, которую библиотекари
традиционно организовывали в виде каталогов и которая чаще всего
используется для описания Web-ресурсов. Запись метаданных состоит из
набора атрибутов или элементов, необходимых для описания данного ресурса.
Например, наиболее часто встречающаяся в библиотеках система метаданных библиотечный каталог - содержит набор записей метаданных с элементами,
которые описывают книгу либо другую библиотечную единицу: автор,
заглавие, дата создания или публикации, предметный охват и шифр,
определяющий местонахождение единицы на полке.
В сущности, понятие метаданные, придуманное информационными
специалистами компьютерных технологий, не является новым по значению для
библиотечного, музейного или архивного специалиста. Библиографическая
карточка есть не что иное, как набор метаданных на книгу или статью из
журнала, построенная по правилам библиографического описания.
Изначально метаданные возникли как вспомогательная структура для
автоматической индексации цифровых ресурсов. Иными словами, в код htmlстраницы, в области заголовков (между тегами html <HEAD> и </HEAD>)
вносятся в определенном порядке данные, описывающие определенные
параметры. Любая информация, внесенная в эту область html-документа не
отображается браузером (компьютерной программой, предназначенной для
показа html-файлов) на экране компьютера и пользователь может даже не
подозревать, что просматриваемый им документ несет в себе еще какую-то
дополнительную информацию, однако программные роботы, да и сам браузер
извлекают эти данные, полезные для решения определенных задач.
Дальнейшее развитие сети привело к созданию других наборов
метаданных, предназначенных не только для оперирования ими роботами, но и
для решения более широкого круга задач.
Сейчас таких наборов метаданных существуют десятки. Это могут быть
узкоспецифические наборы, предназначенные для описания ресурсов какой-то
определенной отрасли или тематики, имеются также и метаданные более
общего, универсального характера: набор метаданных VRA4, Ассоциации
Визуальных ресурсов, предназначенный для описания цифровых ресурсов,
26
содержащих графические изображения; набор метаданных GILS - Глобальный
Информационный Указатель-Сервис, предназначенный для упрощения поиска
и доступа к ресурсам, издаваемым в США государственными и
индустриальными компаниями в сети Интернет; инициатива университета
Беркли EAD, Кодирование архивных описаний, призванная обеспечить методы
описания, сохранения и доступа к цифровым ресурсам библиотек, музеев и
архивов на основе языка SGML и многие другие. Исчерпывающую
информацию по которым можно получить (на английском языке) на сайте
ИФЛА по адресу: http://www.ifla.org/II/metadata.htm
Распространенные категории метаданных включают "описательные
(descriptive) метаданные" (например, библиографическая информация),
"структурные (structural) метаданные" (информация о форматах и структурах),
и "административные (administrative) метаданные" (которые включают права,
разрешения и другую информацию, используемую для управления доступом).
Еще одна разновидность метаданных - идентификатор (identifier), который
однозначно представляет объект для внешнего мира.
Вопрос о соотношении типов метаданных в рамках конкретной системы
метаданных является принципиальным для выбора системы.
Основные системы метаданных
Приведем перечень некоторых наиболее известных систем метаданных:


SDGM — стандарт для цифровых геопространственных данных
Документ
направлен
на
выработку
общей
терминологии
геопространственных метаданных. Одобрен в 1994 г. на заседании
Федерального комитета по географическим данным США и затем
утвержден Правительственным распоряжением 12096, которое обязывает
американские федеральные организации использовать этот стандарт,
начиная с 1995 г. Федеральный комитет развивал этот стандарт, чтобы
помогать идентифицировать источники пространственных данных и
обеспечивать доступ к данным через Национальную информационную
инфраструктуру. Стандарт метаданных GSDGM содержит 334 элемента
данных, более 100 из которых служат для описания связей между
элементами.
DIF — формат обмена для справочников геопространственных данных .
Структура данных для каталога метаданных, создаваемая NASA и
поддерживаемая в США межведомственной рабочей группой по
управлению данными для глобального обмена. Формат был разработан в
конце 1980-х гг. для обмена спутниковой и другой телеметрической
информацией.
Позже
стал
использоваться
для
любых
геопространственных данных и стал стандартом де-факто в
международных глобальных информационных системах. Стандарт
вводит элементы метаданных, определяет их содержание и структуру для
27






передачи метаданных в информационных системах. Стандарт позволяет
пользователю определить, содержит ли набор данных релевантную
информацию.
GILS — Глобальная (правительственная) служба поиска информации.
Являясь частью Национальной информационной инфраструктуры, GILS
обеспечивает доступ частным лицам и организациям к федеральным
информационным ресурсам, через общедоступный каталог этих ресурсов.
GILS базируется на международных стандартах информационного поиска
с использованием протокола доступа Z39.50 и использует систему
метаданных в рамках этого протокола. Развитие системы GILS
предполагает создание системы взаимосвязанных каталогов для поиска
метаданных, возможно, различных типов.
MARC — машиночитаемый каталог. Один из старейших и самых
известных и распространенных в России и в мире стандартов
метаданных. Отличается детальным составом элементов данных,
универсальностью, развитой структурой. Ориентирован на библиотечную
практику, имеет конкурирующие версии и высокую стоимость
эксплуатации.
ЕАД. — кодировка архивных описаний. Набор изначально текстовых
метаданных на базе языка разметки SGML , разработанных для нужд
архивов и используемых для стандартизации и классификации
уникальных архивных материалов, прежде всего рукописей. Версия 1.0.
1998 г. совместима с форматом XML. Поддерживается Американским
архивным обществом и Библиотекой Конгресса США.
TEI - инициатива по кодированию текстов http://www-tei.uic.edu/orgs/tei/):
разработана в Центре электронных текстов Вирджинии в 1989 г. как
инструмент при процессе оцифровке, который идентифицирует
электронный ресурс и его печатный источник посредством метаданных,
размещаемых внутри самого электронного ресурса.
IAFA/WHOIS++
(http://www.ifla.org/documents/libraries/cataloging/metadata/iafa.txt):
шаблонно ориентированные метаданные для описания сетевых ресурсов,
первоначально использовавшиеся для описания списков электронной
почтовой рассылки, других ftp-архивов, а позднее распространенные на
другие ресурсы. Наиболее широкое применение наблюдалось в рамках
ранних проектов британской программы по электронным библиотекам
eLib (ROADS и т. д.), но даже сейчас эта схема метаданных считается
одной из самых употребительных.
Интероперабельность данных в системах электронной коммерции INDECS (.http://www.indecs.org). Набор метаданных, который развился из
потребностей электронной коммерции в сфере шоу-бизнеса (музыка,
зрелища и др.). Представляет собой наиболее сложный набор
метаданных, ориентированных на управление правами на цифровой
объект (вид интеллектуальной собственности, лицензионные сборы,
перечисление средств правообладателям и проч.). Создается в связке с
28



одной из наиболее известных систем идентификации цифровых объектов
DOI (Digital Object Identification).
EDIFACT- одна из старейших международных систем метаданных,
содержащих правила и структуру описания торгово-транспортных и
других коммерческих документов. С 1998 г. поддерживается языком
XML.
MATER — система метаданных, описывающая словари, классификаторы
и другие лексикографические данные. Поддерживается стандартами
ИСО. Имеется российская версия под названием ФОЛИЯ (Формат
обмена лексикой информационных языков).
Формат Государственного регистра баз и банков данных. Российский
стандарт, действующий с конца 1980-х гг. и содержащий систему
метаданных для баз данных и других электронных наборов данных.
Утвержден Правительством РФ, поддерживается НТЦ “Информрегистр”,
применяется в ряде отраслей и регионов, а также в странах СНГ для
ведения баз метаданных.
 Dublin Core Metadata Set (DC) - Дублинское ядро метаданных консорциум W3
Формат описания ресурсов Dublin Core Metadata Element Set
В качестве базового средства формирования метаданных для описания
широкого класса цифровых объектов обычно упоминается Дублинское ядро
метаданных.
Стандарт метаданных Dublin Core, (произносится "даблин кор") или DC
("диси") является форматом описания практически любых ресурсов Интернет.
Преимуществом использования Dublin Core является возможность создания
такого механизма, который при минимальных затратах на описание позволяет
искать и находить данные вне зависимости от языковой принадлежности,
тематики и места их нахождения.
В сентябре 2001г. набор метаданных Dublin Core был утвержден в США,
Американским Институтом Национальных Стандартов как стандарт Z39.85. В
Австралии, Канаде, Дании, Финляндии, Ирландии и Великобритании в этом же
году формат Dublin Core рекомендован и принят как государственный стандарт
для онлайн ресурсов и е-коммерции.
Формат Dublin Core версии 1.1 включает в себя 15 элементов для
описания цифрового ресурса:
Заголовок (Title) Название, присвоенное ресурсу создателем или
издателем.
29
Автор (создатель, Creator) Человек или организация, изначально
ответственная за интеллектуальное содержание ресурса (в случае рукописного
документа это авторы; исполнители, фотографы или иллюстраторы в случае
визуальных ресурсов).
Подполя:
DC.Creator - автор (подполе по умолчанию)
DC.Creator.PersonalName - имя индивидуального автора
DC.Creator.CorporateName - имя коллективного автора
(включая наименования конференции)
DC.Creator.PersonalName.Address - адрес индивидуального
автора (включая любой тип адреса, электронной почты и т.п.)
DC.Creator.CorporateName.Address - адрес коллективного
автора (включая любой тип адреса, электронной почты и т.п.)
Необходимо заметить, что иногда встречаются дополнительные
уточняющие подполя (номер факса, телефона и т.п.) В настоящем документе
включен только адрес потому что он наиболее часто встречается в текущих
проектах связанных с метаданными. При необходимости применения
дополнительных подполей они могут использоваться как локальное
расширение.
Предмет (Subject) Тема ресурса. Обычно предмет выражается в
ключевых словах или фразе, описывающей предмет или содержание ресурса.
Приветствуется использование контролируемых словарей и формальных схем
классификации.
Описание (Description) Текстовое описание содержания ресурса, включая
реферат в случае документов или описание содержания в случае визуального
ресурса.
Издатель (Publisher) Организация, ответственная за создание ресурса в
его нынешней форме - например, издательский дом, университетский
департамент или корпорация.
Подполя:
DC.Publisher - издатель (подполе по умолчанию)
DC. Publisher.PersonalName - имя издателя (лица)
DC. Publisher.CorporateName - наименование издающей
организации
DC. Publisher.PersonalName.Address - адрес издателя (лица)
(включая любой тип адреса, электронной почты и т.п.)
DC. Publisher.CorporateName.Address - адрес издающей
организации (включая любой тип адреса, электронной почты и т.п.)
30
Участник создания материала (Contributor) - человек или организация,
которые не являются авторами (не обозначены в элементе "автор"), но внесли
значительный интеллектуальный вклад в ресурс, но чей вклад вторичен по
отношению к любому человеку или организации, указанной в числе авторов например, редактор, переводчик, иллюстратор.
Дата (Date) Дата, указывающая на создание или появление (в доступном
виде) ресурса.
Тип (Type) Категория ресурса - например, домашняя страничка, роман,
поэма, статья, препринт, технический отчет, эссе, словарь.
Существует список возможных типов ресурса.
Формат (Format) Формат представления данных ресурса (обычно
указывается тип программного обеспечения и - возможно - тип компьютера,
которые могут быть необходимы для отображения и работы с ресурсом).
Он может использоваться для определения программного и технического
обеспечения, необходимого для использования содержимого ресурса.
Идентификатор (Identifier) Набор букв или цифр, который обычно
используется для уникальной идентификации ресурса. В случае сетевых
ресурсов примерами являются URL и URN.
Источник (Source) Информация о вторичном источнике, из которого был
получен настоящий ресурс.
Язык (Language)
содержание ресурса.
Язык,
на
котором
изложено
интеллектуальное
Связь (Relation) Идентификатор вторичного ресурса и его связь с
настоящим ресурсом. Этот элемента позволяет связывать между собой близкие
ресурсы, а также описания ресурса, которые необходимо показать. Примеры издание книги и глава книги.
Охват (Coverage) Характеристики местонахождения и временной
продолжительности ресурса.
Права (Rights) Утверждение об авторских правах и управление ими;
идентификатор, связанный с таким утверждением; идентификатор, связанный с
сервисом, представляющим информацию об управлении правами на данный
ресурс.
Каждый из 15 элементов Dublin Core не является обязательным и может
повторяться.
31
Для более детального описания некоторых элементов применяются
подэлементы, называемые квалификаторами. К квалификаторам относятся
дополнительные подтипы основного элемента и схемы.
Например, можно уточнить тип автора (коллективный или
индивидуальный) с помощью квалификатора:
<meta name="DC.Creator.PersonalName" content="Маркс, Карл">
С помощью квалификатора СХЕМА (Scheme) можно пояснить из какого
контролируемого словаря взято значение элемента:
<meta name="DC.Subject" scheme="ББК" content="Другие разделы
спектроскопии"><meta name="DC.Subject" scheme="ББК" content="В344.9">
Применение квалификаторов желательно, но не обязательно. Все зависит
от того, насколько детально составляется описание цифрового ресурса.
Порядок следования элементов не имеет значения.
Особенность предлагаемого подхода к каталогизации ресурса состоит в
том, что описание его, размеченное по правилам HTML, будет находиться в
самом ресурсе.
Описательные метаданные
Большинство методов поиска информации не ищут реальные объекты в
коллекциях, обычно они работают с описательными метаданными об этих
объектах. Метаданные об объекте могут представлять собой каталожную
запись, запись в индексе или реферат. Описательные метаданные обычно
хранятся отдельно от описываемых объектов, но иногда они являются их
частью.
Описательные метаданные обычно текстовые; однако можно
использовать метаданные в иных форматах, например, изображения,
звукозаписи, карты и компьютерные программы. Единый каталог может
объединять записи обо всех видах материалов, носителей и форматов. Это
позволяет пользователям электронной библиотеки находить материалы на
любых носителях в ходе поиска по текстовым записям.
Описательные метаданные обычно создаются профессионалами.
Библиотечные каталоги и научные индексы аккумулируют усилия
подготовленных сотрудников, но можно найти более быстрый способ
генерации
метаданных,
либо
с
использованием
автоматического
индексирования, либо с использованием компьютерных возможностей.
32
То, что пользователь видит как одно слово, может быть представлено в
компьютере как комбинация файлов и структурных данных в разных форматах.
Связи между этими компонентами и пользовательским восприятием объекта
иногда называют "моделью объекта".
С точки зрения пользователя, журнальная статья, хранящаяся на вебсервере, может быть представлена как связный текст с графикой; однако
храниться она может как несколько текстовых файлов, несколько графических
файлов и, возможно, некоторых программ. Одно изображение может
сохраняться в разных видах: как высококачественный архивный образ, как
изображение для повседневного использования среднего разрешения и еще раз
как маленькая "иконка", которая дает общее представление об изображении, но
утрачивает детали. Этот образ может обозначаться единым библиотечным
идентификатором - но для компьютера это группа определенных файлов.
Могут существовать множество версий одного и того же объекта. А
электронные библиотеки часто имеют "приватные" версии тех материалов,
которые готовятся для публичного доступа. После того, как они будут
выставлены, могут потребоваться новые версии для исправления ошибок, или
материалы могут быть реорганизованы или перенесены на другие компьютеры,
или в результате технического прогресса появятся дополнительные форматы.
Структурные метаданные
Для представления различных компонентов и связей между ними
используются структурные метаданные. Типы данных - это структурные
метаданные, используемые для описания различных возможных объектов в
электронной библиотеке.
Выбор структурных метаданных для конкретной категории материалов
создает модель объекта.
Различные категории объектов требуют различных моделей объектов например, текст в разметке SGML, объекты веб, компьютерные программы,
оцифрованный звук. Для каждой категории правила и соглашения описывают
способы организации такой информации в набор цифровых объектов.
Для каждой категории правила описывают представление материала в
библиотеке, группировку компонентов как группы цифровых объектов,
внутреннюю структуру каждого компонента, ассоциированные метаданные,
соглашения по наименованиям цифровых объектов. Такие категории
различаются по структурному типу.
Структурные типы могут различаться по жанрам (genres). В поисковых
задачах метаописание по жанрам является вполне обычным. (Например,
некоторые жанры популярной музыки - джаз, блюз, реп, рок.) Жанры - это
естественный и полезный способ описания материалов для поиска и других
33
библиотечных целей, но для управления распределенными электронными
библиотеками требуется другая категоризация.
Хотя художественный фильм, документальная лента и учебное видео
явно представляют различные жанры, их цифровые эквиваленты могут
кодироваться и обрабатываться абсолютно одинаково; они имеют один и тот же
структурный тип. И наоборот, два текста могут быть одного жанра, но если
один представлен в разметке SGML, а другой - в формате PDF, то они имеют
различные структурные типы и модели объектов. Например, карта, афиша,
техническая диаграмма представляют различное содержание, но с точки зрения
хранения и обработки в компьютере они представляют собой одну структуру. В
настоящее время можно полагать, что даже сложные коллекции электронной
библиотеки могут быть представлены небольшим числом структурных типов.
Менее десяти структурных типов оказалось достаточно для адекватного
описания всех категорий материалов, которые конвертировались в Библиотеке
Конгресса. Среди них оцифрованные изображения, наборы изображений
страниц, наборы изображений страниц со связанным SGML текстом,
оцифрованные звукозаписи, оцифрованные видеозаписи.
Набор элементов метаданных нужен для тех, кто публикует
электронные материалы с описанием своих результатов и для тех, кому
структурные дополнительные элементы позволяют добиться большей точности
в метаданных. Например, если поле "предмет" (subject) заполнялось с
использованием Девеевского десятичного классификатора, было бы полезно
отразить этот факт в метаданных. Для дальнейшего повышения эффективности
метаданных при обработке информации, предлагается присваивать некоторым
элементам некоторые "значения" (values). Это может быть определенный набор,
список типов, которым могут руководствоваться составители индексов.
Языки разметки являются одним из таких методов структурирования
текстов. К примеру, на HTML-странице тэг <img> является структурным
метаданным, который указывает на расположение изображения.
Одно из потенциальных применений языков разметки, вроде SGML
или XML, в том, что структурные тэги могут использоваться программами
автоматического индексирования для построения записей, для поиска
информации. В тексте документа фраза "Marie Celeste" может быть именем
человека, названием книги, песни, корабля, издательства, пьесы или вообще не
являться именем. При наличии структурной разметки фраза может быть
идентифицирована и помечена. Таким образом, информация, содержащаяся в
разметке, может быть использована для различения различных категорий
информации, таких как автор, название или дата.
Присоединение метаданных к содержанию
34
Описательные метаданные должны быть присоединены к материалу,
который они описывают. В прошлом метаданные обычно хранились отдельно,
как внешний каталог или индекс. В этом способе много достоинств, но
требуются связи между метаданными и описываемыми объектами. Некоторые
электронные библиотеки двигаются в ином направлении, сохраняя метаданные
и данные вместе (либо встраивая метаданные с объект или в виде двух
отдельных связанных объектов). Этот подход удобен для распределенных
систем и для долговременного архивирования, поскольку гарантируется, что
компьютерные программы будут иметь доступ к данным и метаданным в одно
и тоже время.
Механизм ассоциирования метаданных с веб-страницами был предметом
серьезного обсуждения. Для HTML-страниц простейший подход состоит в
использовании специального HTML-тэга <meta>, который появился из
описания элементов Dublin Core для HTML. Выбор тэгов <meta> - это
системообразующее решение. В рамках проекта Dublin Core специально не
определяется, каким именно образом метаданные связываются с материалом.
Предложенная технология предлагает в качестве базового стандарта для
взаимодействия с сетью Интернет использовать формат метаданных Dublin
Core, для изучения которого потребуется определенные усилия со стороны
библиотек, но в остальном же, эта технология и разработанное программное
обеспечение вписывается в рамки традиционной библиотечной работы.
Часть 3. Средства подготовки электронных изданий
Введение
В наше время новых информационных технологий все большую
популярность приобретают полнотекстовые электронные документы. В
отличие от обычных документов на бумажных носителях они обладают рядом
неоспоримых преимуществ, например:
1)
2)
3)
общедоступность – электронный документ представленный в сети Internet
не нуждается в каком-либо специальном тиражировании, он доступен
всем пользователям, где бы они ни находились (единственное
требование – наличие доступа у пользователя к сети Internet);
мобильность – подготовленный электронный документ становится
общедоступным сразу после его публикации в сети Internet, и в случае
необходимости внесения изменений в документ эти изменения, после их
внесения, становятся доступными всем читателям этого документа;
дешевизна – распространение электронных документов обходится
дешевле распространения документов на бумажных носителях.
35
Основные форматы хранения электронных документов
На данный момент наиболее популярны следующие
представления полнотекстовых электронных документов:
форматы
Plain-Text
«Просто текст» – документ этого формата представляет собой просто
файл с текстом, с минимальными возможностями для управления отображения
содержимого документа (практически, все управление по отображению
сводится к расстановке в документе пробельных символов и переводов строк).
Для его просмотра и редактирования не требуется особых программ – в составе
любой операционной системы найдутся программы, позволяющие
редактировать и просматривать документы данного формата. К достоинствам
таких документов относится их очень малый объем – это самый экономичный
формат хранения электронных документов.
HTML
Hyper Text Mark-up Language («Язык гипертекстовой разметки
документов») – на сегодняшний день основной формат представления
электронных документов в сети Internet. Документ этого формата представляет
собой файл с текстом, в котором есть особые метки («тэги»), управляющие его
отображением в специальных программах – браузерах. Хотя на сегодняшний
36
день существует масса программных продуктов, нацеленных на автоматизацию
создания электронных документов в этом формате, все же основная масса
документов на сегодняшний момент подготавливается вручную. Причиной
этого является то, что для электронных документов, публикуемых в Internet,
основным свойством (критерием?) является размер, а программы,
генерирующие HTML-документы практически всегда «перегружают» документ
излишними тэгами. Еще одним недостатком является то, что один и тот же
документ в браузерах разных производителей выглядит по-разному.
RTF
Reach Text Format («богатый текстовый формат») – на сегодняшний день
основной формат первичной подготовки и обработки текстов, предназначенных
для транспортировки между различными текстовыми процессорами
(редакторами). Является, как и HTML, гипертекстовым языком разметки
текста. Отличается от HTML тем, что позволяет встраивать непосредственно в
документ различные объекты (например, картинки – в HTML они хранятся как
внешние файлы). Достоинства формата – поддержка его ведущими текстовыми
процессорами (MS Word, Adobe PageMaker и т.д.), общеизвестность, а так же
реализация принципа «один документ – один файл». Недостаток – подчас
гигантские размеры файлов.
DOC
DOC – «родной» формат текстового процессора (редактора) Microsoft
Word. В силу сверхпопулярности последнего является практически основным
форматом подготовки электронных документов. По своим возможностям
соответствует RTF, однако документы этого формата имеют гораздо меньший
объем в силу того, что информация хранится в запакованном виде.
37
PDF
Portable Document Format («формат переносимых документов») – формат,
разработанный фирмой Adobe. Предназначен для однообразного отображения
документа на различных системах и при печати его на различных устройствах
(все предыдущие форматы этим не отличаются, документы в этих форматах
видоизменяются в зависимости от массы причин – от используемого
программного обеспечения, от разрешающей способности системы, при
помощи которой отображается документ,
и т.д., даже от принтера,
установленного в системе). Основной недостаток – его коммерческая
направленность. Практически все программное обеспечение, предназначенное
для подготовки документов в этом формате, является коммерческим.
DjVU
Сравнительно новый формат представления электронных документов,
поддерживаемый компанией LizardTech. Отличается от всех предыдущих
форматов тем, что не является форматом хранения текста – документ в этом
формате представлен в виде изображения. Предназначен в первую очередь для
представления электронных документов, полученных путем сканирования с
38
бумажных оригиналов. Данный формат приобретает в последнее время все
большую популярность по следующим причинам:
1. Простота и высокая скорость изготовления документов.
2. Наличие свободно распространяемого (freeware) программного обеспечения
для создания и просмотра электронных документов данного формата.
3. Малый объем создаваемых электронных документов (достигается за счет
уникальной технологии хранения документа)
4. Явная направленность формата на публикацию документов в Internet.
Обычно при выборе основного формата представления полнотекстовых
электронных документов оцениваются следующие факторы:
1. Скорость изготовления электронного документа
2. Размер получаемого электронного документа
3. Качество получаемого электронного документа
В силу третьего фактора, исключим из рассмотрения формат Plain-Text
как самый «маловыразительный» (в смысле внешнего оформления
документов).
Стоит так же отметить специфику подготавливаемых документов – в
основном это книги, хранящиеся в фондах библиотеки учебного заведения
(книги довольно таки популярные среди читателей библиотеки, но имеющиеся
в недостаточном количестве).
Проведя исследования среди указанных выше форматов, библиотека
БГПУ остановила свой выбор на формате DjVU, как наиболее
удовлетворяющий выбранным критериям.
В качестве примера исследования приведем сравнение между форматами
в скорости изготовления и объеме результирующего файла при подготовке
электронной копии документа состоящего из 25 страниц:
39
Таблица 1. Сравнение скорости создания электронного документа в различных
форматах
Формат
HTML RTF
DOC PDF DjVU
Время
2,5 ч
1,25 ч. 1,25 ч. 1,25 10 мин.
изготовления
ч.
Таблица 2. Сравнение размеров итоговых электронных документов
Формат
HTML RTF
DOC
PDF
DjVU
Объем конечного
250 Кб 630 Кб 620 Кб 760 Кб 500 Кб
документа
Из приведенного примера видно явное преимущество формата DjVU
перед другими форматами. Можно добавить так же, что у остальных форматов
столь высокие результаты обеспечены за счет использования современной
системы распознавания текстов FineReader, которая является коммерческим
продуктом. В случае невозможности использовать данной системы разрыв
между DjVU и остальными форматами значительно увеличился бы. Так же
стоит отметить, что в качестве тестового выбирался документ, не содержащий
сложных типов форматирования и картинок, что так же повлияло на
сравнительную малые объем и скорость подготовки итоговых электронных
документов форматов HTML, RTF, DOC и PDF – иначе значения обоих
параметров значительно увеличились бы для этих форматов, увеличение же
сложности текста практические не влияет на значение этих параметров для
формата DjVU.
Описание структуры хранения полнотекстовых электронных документов
DjVU предлагает два способа хранения электронного документа:
1 Bundle («связка»), когда все страницы документа представлены в
одном файле – подходит для небольших документов и документов, не
предназначенных для публикации в Internet;
2 Indirect («косвенный»), когда страницы документа хранятся каждая в
отдельном файле, доступ к ним осуществляется через единую точку
документа, а сам документ представляет собой каталог (папку) на
электронном носителе – подходит для большинства документов, а так
же для документов, предназначенных для публикации в Internet.
Что касается Научной библиотеки БГПУ, то исходя из потребности
размещения полнотекстовых электронных документов в корпоративной сети
вуза (а затем и публикации их в Internet), было принято решение в качестве
способа хранения электронных документов принять способ Indirect.
Таким образом, физически структура хранения электронных документов
являет собой каталог (тематический), в качестве подкаталогов которого
40
выступают каталоги с электронными документами, относящимися по тематике
к данному каталогу.
Технология подготовки и размещения полнотекстовых электронных
документов в сети Internet (на основе опыта НБ БГПУ)
Технология подготовки и размещения
документов состоит в следующем:
полнотекстовых
электронных
1. Сканирование электронного документа. Желательно, чтобы программное
обеспечение сканера поддерживало пакетное сканирование изображений
(чтобы не отвлекаться на присвоение имен изображением, а это делалось бы
автоматически). Если программное обеспечение, поставляемое фирмойпроизводителем сканера, не поддерживает пакетное сканирование
изображений, в качестве данного ПО можно использовать программу
FineReader компании ABBYY, так как она позволяет осуществлять даже в
демонстрационном режиме пакетное сканирование изображений на
подавляющем большинстве сканеров (т.е. ее можно и не покупать).
2. После того как изображения страниц документа отсканированы, эти
изображения попадают на обработку в какой-либо пакетный графический
редактор1 для обработки (удаление пустых полей, поворот изображения,
приведение к нужному графическому формату и т.д.). В БГПУ в качестве
такого графического редактора в данное время (в опрабационный период)
используется пакетный графический редактор ImageMagick компании
ImageMagick, который является бесплатным (свободно-распространяемым,
freeware) продуктом.
3. Из обработанных изображений при помощи свободно-распространяемой
программы DjVU Solo (разработка компании LizardTech) изготавливается
документ в формате DjVU (Indirect), который выглядит как обычный каталог
на локальном диске.
4. Подготовленный документ помещается в хранилище полнотекстовых
электронных документов.
Программно–технические средства, необходимые для подготовки
полнотекстовых электронных документов
Для подготовки полнотекстовых электронных документов нужно
следующее программное обеспечение:
1 Сканер (желательно с автоподачей листов)
2 Программное обеспечение для сканирования
изображений (обычно
поставляется фирмой-производителем вместе со сканером, но можно
1
В связи с тем, что изображения сканировались все сразу в одно время с одного бумажного носителя,
то правильно бы было предположить, что практически все изображения требуют одной и той же
предварительной обработки. Поэтому гораздо удобнее на этом этапе использовать пакетные графические
редакторы.
41
использовать так же и ПО сторонних фирм, например демо-версию
программы ABBYY FineReader, которую можно получить на WWW-сайте
производителя ABBYY Software: http://www.abbyy.ru/). Минимальные
требования к системе см. в руководстве пользователя соответствующего
программного обеспечения.
3 Графический редактор, желательно поддерживающий пакетную обработку
графических
изображений
(можно
использовать
свободнораспространяемый редактор ImageMagick, который можно получить на
WWW-сайте компании ImageMagick: http://www.imagemagick.org/).
4 DjVU Solo – программа подготовки электронных документов в формате DjVU
(можно
получить
на
WWW-сайте
компании
LizardTech:
http://www.lizardtech.com). Минимальные требования к системе: Intel Pentium
II 350 MHz, HDD 1 Gb, RAM 32 Mb, операционная система Windows
95/98/NT/2000/XP.
Для просмотра документа в формате DjVU используется браузер Internet с
установленным «plug-in» от компании LizardTech, который является свободнораспространяемым
продуктом
и
доступен
на
сайте
фирмы
(http://www.lizardtech.com).
Часть 4. Сканирование и распознавание образов
Какой бы формат мы не выбирали в качестве предпочтительного при
публикации электронных документов, если нужно получить электронную
копию документа, существующего только на бумажном носителе (копию
книги, журнала, газеты и т.д.), то прежде всего нам нужно отсканировать
данный документ. Для этого нужны (кроме компьютера) сканер и программа
сканирования.
Так
как
сканируемые
документы
почти
всегда
являются
многостраничными, необходимо чтобы программа сканирования поддерживала
режим пакетного сканирования изображений (когда программа сама пытается
отсканировать указанное количество страниц документа), а у сканера имелся
автоподатчик страниц (ADF- устройство, «automatic document feeder»).
Автоподатчик страниц у сканера существенно облегчает сканирование
документа, ведь при его наличии сканер может сам сканировать нужное
количество страниц– нужно просто в него вставить пачку страниц, требующих
сканирования, и сказать программе сканирования сканировать страницы с
автоподатчика, и дальше сканирование будет происходить без участия
человека.
42
Однако сканеры с автоподатчиками страниц гораздо более дорогие, чем
обычные сканеры, и вследствие этого менее распространены. Однако и на
обычном сканере без автоподатчика можно производить пакетное
сканирование страниц документа – лишь бы используемое программное
обеспечение позволяла выполнять сканирование такого типа (роль ADFустройства в этом случае придется играть сканировщику).
Кроме таких особенностей, как наличие или отсутствие автоподатчика, у
сканеров различают следующие основные характеристики:
 Интерфейс (способ подключения к компьютеру) (в порядке возрастания
производительности): LPT, USB, FireWare, SCSI;
 Максимальное разрешение отсканированного изображения и глубина
цветов;
 Среднее время сканирования одной страницы (очень часто зависит от
предыдущих характеристик).
Однако, если рассматривать сканер как средство «оцифровки» документов, все
эти параметры не играют столь уж большой роли: даже при помощи самого
«слабого» (т.е. дешевого) сканера можно изготовить практически такие же по
качеству электронные копии документа, как и на более мощном (а значит и
дорогом) – единственным отличием будет только время, затраченное на
подготовку документа.
Пакет сканирования и распознавания текста FineReader.
Итак, как уже отмечалось, неважно какой сканер у нас имеется – главное чтобы
он был, так как основная тяжесть работы ляжет на плечи программы
сканирования. По этому желательно, чтобы программа сканирования умела:
1. производить пакетное сканирование изображений
2. автоматически производить первичную обработку изображений
3. производить распознавание отсканированного текста электронного
документа с последующим сохранением его
43
В качестве такой программы рассмотрим программу сканирования и
распознавания текста FineReader компании ABBYY Software (демо-версию
программы можно взять с сайта компании: http://www.abbyy.ru), которая
является одной из лидирующих на рынке программных продуктов для
сканирования и распознавания документов.
Рассмотрим основные шаги при сканировании и распознавании документа.
Создание нового пакета изображений
Перед сканированием нового документа для него рекомендуется создать
так называемый «пакет», в котором будут храниться как отсканированные
изображения документа, так и все настройки относящиеся к этому документу.
Для этого необходимо после запуска программы FineReader выбрать в меню
команду [Файл→Новый пакет…] и в появившемся окне указать в каком
каталоге будет располагаться новый пакет.
Настройка параметров сканирования
Теперь необходимо настроить параметры сканирования изображений.
Для этого необходимо выполнить команду меню [Сервис→Опции…] и в
появившемся окне выбрать закладку [Сканирование/открытие]:
Если в поле [TWAIN-драйвер сканера] еще не указан сканер, с которым
будет работать программа, то его нужно указать при помощи кнопки [Выбрать
драйвер]. После этого нужно указать [Использовать интерфейс FineReader],
чтобы была возможность включения режима пакетного сканирования.
В секции [Обработка изображений] доступны следующие опции сканирования:
 Инвертировать – преобразование изображение в свой негатив;
44
 Очистить от мусора – изображение будет «почищено» от дефектов
сканирования (рекомендуется включить);
 Делить разворот книги – рекомендуется при сканировании книг, брошюр,
журналов, т.к. при сканировании книг обычно сканируется «разворот
книги» (сразу две страницы раскрытой книги), и при этом логичнее
разделить такие изображения на два (левую и правую страницы);
 Уменьшать разрешение цветного/серого изображения до 100 dpi – если
сканер настроен сканировать изображения как цветные/серые, то для
уменьшения их объема и экономии места на жестком диске можно
воспользоваться данной опцией;
 Приводить цветное/серое изображение к черно-белому – если текст
простой и не сдержит значимых картинок (например репродукций с
картин художников), то для для уменьшения объема изображений и
экономии места на жестком диске можно воспользоваться данной
опцией.
Следующую опцию стоит указывать если предполагается не только
сканирование страниц, но и распознавание текста (например, если наша цель
подготовить электронный документ не в формате DjVU, а, например, в RTF или
PDF)
 Определить ориентацию страницы – во время распознавания программой
будет произведена попытка определить, как нужно развернуть
изображение текста, чтобы он принял удобочитаемый (а значит и удобораспознаваемый) вид.
Теперь нужно настроить сам сканер, для этого нужно нажать на кнопку
[Настройки сканера] в секции [Сканер] текущего окна, и в появившемся
диалоговом окне указать следующие параметры:
 Ориентация изображения – книжная или альбомная;
 Единицы измерения – сантиметры или дюймы (рекомендуется указать
сантиметры);
 Размер бумаги – размер сканируемой области документа. Можно указать
либо стандартный размер (например, A4), либо определить свой
собственный;
 Отступы, размер – манипулируя данными параметрами можно избавиться
от ненужных полей в отсканированном изображении документа, что в
свою очередь экономит пространство на жестком диске;
 Подбор яркости – позволяет указать яркость сканируемых страниц:
 Автоматический
–
яркость
подбирает
FineReader
(использовать при неоднородном распределении яркости на
странице – например при больших перегибах страниц возле
корешка);
45





 Средствами сканера – яркость подбирает сканер
(использовать при неоднородном распределении яркости на
странице – например при больших перегибах страниц возле
корешка);
 Ручной – яркость указывает пользователь (убыстряет процесс
сканирования, использовать при однородном распределении
яркости на странице).
Режим сканирования – указывает, как будут сканироваться изображения
страниц документов – как цветные, серые или черно-белые;
Разрешение – с каким разрешением сканировать изображения страниц
(обычно хватает 300 dpi)
Загружать страницы из автоподатчика бумаги (ADF) – данная опция
доступна если есть возможность воспользоваться автоподатчиком бумаги
у сканера;
Пауза между страницами – позволяет указать паузу в секундах (обычно
около 5 секунд), которую будет делать программа, прежде чем
автоматически начать сканирование следующей страницы в режиме
«Сканировать несколько страниц» (см. ниже).
Останавливаться между страницами – если нужно производить контроль
качества отсканированных изображений, то следует выбрать этот
параметр (тогда по окончанию сканирования страницы будет появляться
диалог с вопросом о продолжении сканирования).
Таким образом, мы произвели настройку параметров сканирования и
можно приступать непосредственно к сканированию документа.
Сканирование документа
Для начала необходимо проверить, насколько соответствуют наши
настройки сканирования документу, который мы собираемся сканировать. Для
этого можно сделать пробное сканирование при помощи команды меню
[Файл→Сканировать изображение]:
46
и спустя некоторое время в нашем пакете появится со сканера изображение
страницы документа. Произведя оценку качества изображения и если оно
удовлетворяет нашим требованиям можно запустить пакетное сканирование
при помощи команды меню [Файл→Сканировать несколько страниц], после
чего сканер либо начнет сканировать страницы документа либо с
автоподатчика (если есть), либо со стекла делая паузы между страницами (см.
выше описание параметра «Пауза между страницами»). Если же качество по
каким-нибудь причинам не удовлетворяет, необходимо удалить пробное
изображение из пакета, зайти в настройки сканера и поправить параметры
отвечающие за обнаруженные дефекты изображения, после чего опять
произвести пробное сканирование документа.
После того, как документ будет полностью отсканирован, мы получим
набор изображений страниц документа в формате TIF, из которых можно после
некоторой предварительной обработки построить документ в формате DjVU.
Распознавание документа.
Если мы решили создавать электронный документ в формате,
подразумевающем хранение текста как набора букв и цифр (т.е. не в формате
DjVU), то после сканирования необходимо произвести распознавание текста,
хранящегося в изображениях документа.
Настройку параметров распознавания текста можно произвести при
помощи команды меню [Сервис→Опции…] (закладка [Распознавание]):
где указать основные характеристики распознаваемого текста.
Запуска процесса распознавания можно воспользоваться командой меню
[Процесс→Распознать] (распознается только текущее изображение) или
47
[Процесс→Распознать все] (распознаются все нераспознанные изображения
пакета):
после чего программа проанализирует изображения пакета, разметит в каждом
изображении блоки различных типов (текст, таблица, изображение) и
произведет распознавание документа в соответствии с размеченными блоками.
Рабочая область FineReader приобретет следующий вид:
На рисунке видно, какие блоки на странице разметил FineReader (верхняя
левая и нижняя часть рабочей области программы) и как он эти блоки
распознал (правая верхняя часть рабочей области программы).
Если мы не согласны с расстановкой, типами или порядком следования
блоков на странице, мы можем отредактировать их, задать другой тип или
48
порядковый номер (при помощи контекстного меню, выпадающем при правом
щелчке мыши на блоке):
после чего необходимо произвести распознавание повторно.
Исправление ошибок распознавания
При всем качестве распознавания, FineReader не дает 100% точного
распознавания документа (участки, в точности распознавания которых
программа не уверена, выделяются цветом в окне, где показывается результат
распознавания – см. рис. выше). Поэтому после сканирования и распознавания
документа необходимо производить проверку документа. Проверку и
исправление ошибок распознавания можно производить как непосредственно в
FineReader-е перед сохранением электронного документа, так и после его
сохранения в редакторе, соответствующем формату хранения электронного
документа (например, при помощи Word для форматов RTF и DOC).
В FineReader-е «работа над ошибками» начинается с команды меню
[Сервис→Проверка]:
49
после чего в интерактивном режиме обработать неуверенно распознанные
участки документа:
Сохранение документа
После того, как мы исправили ошибки распознавания в документе
необходимо его сохранить.
Для этого сначала нужно определить при помощи команды меню
[Сервис→Опции…] (закладка [Форматирование]) как мы желаем сохранить
текст – либо сохранить полное оформление документа, либо сохранить только
начертание и размер шрифта, либо не сохранять оформление документа, а так
же сохранять или нет картинки:
50
После того, как мы определились с этими параметрами, можно либо
сохранить документ (или его часть) в файле нужного формата при помощи
команды меню [Файл→сохранить текст как]:
либо при помощи команды [Файл→Передать все страницы] (или
[Файл→Передать выбранные страницы]) передать распознанный документ (или
его часть) в соответствующую программу:
51
после чего будет запущена выбранная программа с нашим документом в
качестве редактируемой (рабочей) информации.
Обработка сканированных изображений
Очень часто после сканирования документов возникает необходимость
обработки отсканированных изображений перед формированием из них
электронного документа.
Как уже отмечалось, в качестве графического редактора для обработки
отсканированных изображений предлагается использовать пакетный
графический редактор “ImageMagick”, дистрибутив которого можно получить
на сайте компании ImageMagick (http://www.imagemagick.com/).
После установки дистрибутива мы получаем целый пакет программ
обработки графических изображений, из которых особый интерес представляет
две: “Mogrify” и “Convert”.
Утилита “Mogrify” предназначена для однотипного преобразования
нескольких изображений – для нее указываются преобразования и список
изображений, над которыми нужно произвести эти преобразования.
Преобразованные изображения будут сохранены в файлах, в которых были
исходные изображения (т.е. старые изображения будут заменены новыми).
Утилита “Convert” предназначена для разнотипного преобразования
нескольких изображений – для нее указываются список файлов и к каждому
файлу указывается преобразования, которые нужно провезти над изображением
в файле. Так же указывается файл, в который будет сохранено преобразованное
изображение.
Обычно над отсканированными изображениями необходимо произвести
следующие действия:
52
1. поворот некоторых отсканированных изображений – это иногда
требуется в силу неверного позиционирования сканируемого документа на
стекле сканера;
2. удаление пустых полей у отсканированных изображений.
Обычно перед редактированием изображений производят их резервное
копирование, чтобы в случае ошибочного редактирования была возможность
вернуться к исходному изображению из копии.
Поворот отсканированных изображений
При ручном сканировании документов (когда сканирование ведется без
автоподатчика) нередки случаи, когда отсканированное изображение
получается как бы повернуто. Иногда пересканирование является не совсем
желательным – например, нарушается последовательность изображений
отсканированных страниц или книга-оригинал находится уже на руках у
читателя.
Поворот изображения можно сделать при помощи утилиты “Convert”, для
этого необходимо:
1. в каталоге с отсканированными изображениями выявить те
изображения, что требуют поворота;
2. запустить какой-нибудь файловый менеджер, поддерживающий
запуск приложений при помощи командной строки (например, “Far” – для
пользователей из стран бывшего СССР, в число которых входит и Россия,
эта программа является бесплатной и последнюю ее версию можно получить
с сайта http://www.rarsoft.com, но можно воспользоваться и командным
интерпретатором, который входит в состав любой ОС Windows);
3. перейти в каталог с отсканированными изображениями;
4. Если требуется повернуть каждое изображение, помеченное для
этого в п.1, на разный угол, то это можно сделать при помощи утилиты
“Convert”
используя следующий формат командной строки:
convert
<что_поворачивать>
-rotate
<градусы>
<куда_записать>
где:

что_поворачивать – файл с изображением, которое нужно
повернуть

градусы – на сколько градусов повернуть изображение
(положительное значение – поворот будет произведен по часовой
стрелке, отрицательное – против);

куда_записать – куда записать обработанное изображение
(можно указать имя исходного файла, тогда новое изображение заменит
старое).
53
degree < 0
degree > 0
Начальное
изображение
5. Если требуется повернуть каждое изображение, помеченное для этого в п.1,
на один и тот же угол, то это можно сделать при помощи утилиты “Mogrify”
используя
следующий
формат
командной
строки:
mogrify - rotate <градусы> <что_поворачивать> где:
 что_поворачивать – файл с изображением, которое нужно повернуть
 градусы – на сколько градусов повернуть изображение (положительное
значение – поворот будет произведен по часовой стрелке,
отрицательное – против).
Удаление пустых полей у изображений
После того, как все изображения будут выровнены, необходимо удалить
пустые поля.
В отличие от поворота, который нужно делать не так часто, удаление
пустых полей нужно делать практически всегда, причем для всех изображений
нужно удалять примерно одни и те же поля, т.е. удобней всего пользоваться
утилитой “Mogrify” чем “Convert”.
Формат командной строки утилиты “Mogrify”:
mogrify –crop <X>x<Y>+<dX>+<dY> <список файлов>
где:
 X – ширина будущей картинки по X
 Y – высота будущей картинки по Y
 dX – ширина удаляемого левого поля
 dY – высота удаляемого верхнего поля
54
dY
dX
Y
Об
из раб
об от
ра ан
ж е но
ни е
е
Начальное
изображение
X
Работа с редактором DjVU Solo.
После того, все отсканированные изображения будут обработаны при
помощи графического редактора, можно приступить непосредственно
изготовлению электронного документа в формате DjVU.
Для этого необходимо установить редактор DjVU Solo, дистрибутив
которого
можно
взять
с
WWW-сайта
компании
LizardTech
(http://www.lizardtech.com/).
Процесс создания электронного документа при помощи DjVU
состоит в следующем:
Solo
1. После запуска DjVU Solo выбрать изображение которое будет первой
страницей электронного документа при помощи команды меню
[File→Open]:
2. Добавить остальные отсканированные изображения страниц в документ при
помощи команды меню [Edit→Append pages]:
55
3. У всех редакторов DjVU-файлов компании LizardTech есть одна ошибка –
при вставке документ нескольких страниц за один раз (как в предыдущем
пункте) первая и последняя страница из вставляемых изображений
меняются местами. Поэтому нужно поменять их местами при помощи
команд контекстного меню “Cut” (“Вырезать”) и “Paste” (“Вставить”):
3.1. Щелкнуть правой кнопкой мыши на первой из вставленных в п. 2
страниц и в появившемся контекстном меню выбрать команду “Cut”
(“Вырезать”) – отмеченная страница будет перемещена в буфер:
3.2. Выбрать последнюю из вставленных страниц, щелкнуть правой кнопкой
мыши на ней и в появившемся контекстном меню выбрать команду
“Paste after” (“Вставить после”) или “Paste before” (“Вставить до”) –
страница перемещенная в буфер на предыдущем этапе будет вставлена
после (до) выбранной страницы:
56
3.3. Точно так же переместить в буфер последнюю из страниц, вставленных в
п. 2, и вставить ее на место того изображения, c которым мы работали в
пп. 3.1.
4. После того как в документ будут включены все отсканированные
изображения, можно сохранить электронный документ в формате DjVU. Для
этого нужно выполнить команду меню [File→Save]. Появится окно,
предлагающее сохранить электронный документ в режиме “Bundled” или
“Indirect” (см. §2):
После выбора режима хранения документа, программа предложит выбрать
место хранения и имя документа:
После этого нужно указать разрешение (в dpi – точек/дюйм) и качество
(Scanned – Сканирования, Photo – Фотографии, Clean – Очищенное, Bitonal –
Черно-белое),
с
каким
сохранять
страницы
документа:
После всех этих действий документ готов и может быть размещен в хранилище
электронных документов.
57
Дополнительные возможности редактора DjVU Solo
Электронный документ, созданный нами ранее, не имеет такого важного
атрибута электронных документов размещаемых в Internet, как гиперссылки,
значительно облегчающих работу с этим документом – например помогают
осуществлять перемещение на нужную страницу в документе.
Однако в DjVU есть возможность использовать и гиперссылки в документах.
Для определения гиперссылки в DjVU Solo необходимо перейти в режим
редактирования документа путем нажатия указателем мыши на кнопку
в
панели инструментов. После этого на панели инструментов становятся
доступными кнопки, отвечающие за построение гиперссылок в документе:




– оформление гиперссылки
– оформление гиперссылки
– оформление гиперссылки
– оформление гиперссылки
многоугольника
в виде закрашенного прямоугольника
в виде контура прямоугольника
в виде контура овала
в виде контура произвольного
Рассмотрим механизм оформления гиперссылки в виде контура
прямоугольника – в остальных оформлениях используется этот же механизм
(возможно с небольшими изменениями).
В качестве примера рассмотрим, как размещать гиперссылки на странице
«Содержание» нашего документа, а именно как сделать так, чтобы при выборе
любого пункта из «Содержания» мы попадали на указываемую в «Содержании»
страницу.
Размещение гиперссылки на странице состоит в следующем:
1. Щелкнуть указателем мышки по кнопке
, находящейся на панели
инструментов.
2. Выделить мышью на странице участок, который будет считаться
гиперссылкой:
58
3. В появившемся
гиперссылки:
окне
настроить
основные
параметры
поведения
где:
 Style – стиль появления рамки вокруг гиперссылки при наведении на нее
мышки. Основные исполыьзуемые стили:
 XOR – рамка будет «обычной» (простой но всегда различимой за счет
использования
при
прорисовывании
побитовой
операции
«Исключающее или»);
 Plain Border – рамка будет цветной (цвет рамки указывается
дополнительно в пункте Color, который появляется при выборе данного
стиля).
 Always Visible – рамка будет присутствовать всегда (а не только при
наведении мышки на данную область изображения);
 Highlight Area – «подсветить область», данная область будет выделена
цветом, указанном в пункте Color;
 Description – обычно сюда вводят текст подсказки, который должен
всплывать при наведении указателя мышки на данную гиперссылку;
 Link to – куда будет указывать гиперссылка. Принимает три значения:
 URL – данная гиперссылка указывает на другой документ, адрес в
Internet которого необходимо указать в пункте “URL”;
 Page Number – гиперссылка указывает на страницу документа с
номером, указанным в пункте Page Number;
 Page Name – в режима хранения Indirect (когда каждая страница
документа хранится в отдельном файле, см. §2) гиперссылка указывает
59
на страницу, которая сохранена на диске с именем, указанным в пункте
Page Name.
 Target – как будет работать Internet-браузер при щелчке мышью на
данной гиперссылке:
 Same Frame – объект, на который указывает данная гиперссылка
появится в том же фрейме, что и страница, содержащая эту
гиперссылку;
 Same Window – объект, на который указывает данная гиперссылка
появится в том же окне, что и страница, содержащая эту гиперссылку;
 New Window – объект, на который указывает данная гиперссылка
появится в новом окне;
 Other – здесь можно указать еще какой либо способ работы Internetбраузера
Для наших целей достаточно ввести следующие значения в пункты этого окна:
 Style – XOR
 Link to – Page Number
 Page Number – 5 (если нет пятой страницы, можно ввести любую
доступную)
 Target – Same Frame
и гиперссылка готова. Теперь можно переключиться в режим предварительного
просмотра (кнопка
на панели инструментов) и проверить, как ведет себя
гиперссылка при наведении на нее указателя мыши (обратите внимание на
рамку вокруг фразы «Шифрование сценариев» – она появляется когда курсор
указателя мыши оказывается над участком, помеченным как гиперссылка):
60
Просмотр электронных документов в формате DjVU
Как уже отмечалось выше (см. §4), для просмотра документов в формате
DjVU используется Internet-браузер Internet Explorer с установленным «plug-in»
от компании LizardTech (этот plug-in можно взять с WWW-сайта компании
http://www.lizardtech.com). После установки указанного plug-in можно
просматривать документы в формате DjVU при помощи любого файлового
менеджера – например из Explorer (Проводника), встроенного во все ОС
Windows. Для просмотра нужно просто в Проводнике произвести двойной
щелчок указателем мыши на документе в формате DjVU или выбрать команду
“Открыть” контекстного меню, выпадающем при правом щелчке указателя
мыши на этом документе – запустится Internet Explorer, который и покажет
содержимое этого документа.
Часть 5. Информационная структура современной библиотеки
Общая информационная структура библиотеки
Современная университетская библиотека сегодня – это не только
хранилище знаний, источник идей и мыслей, но и информационный центр,
предоставляющий услуги своим пользователям как в локальных, так и в
удаленных режимах. Основной тенденцией в последние несколько лет, наряду с
привычными подходами к автоматизации традиционных библиотечных
процессов, стало расширение сервиса для читателей на основе компьютерных
технологий и обеспечение широкого доступа к различным областям и видам
информации. Важнейшим условием учебной и научной деятельности является
налаженная
система
информационного
обеспечения
потребностей
пользователей библиотеки. Пользователям необходимо уметь ориентироваться
в потоке документов, оперативно находить, выбирать, и оценивать
информацию, получать их своевременно и в удобной для пользования форме.
Информационные продукты распространяются через следующие каналы:
электронные каталоги библиотек, традиционные каталоги и картотеки,
библиографические указатели текущего и ретроспективного характера,
реферативные журналы и сборники, каталоги баз данных, информационные
ресурсы Интернет. В настоящее время эффективное информационнобиблиотечное обслуживание достигается путем создания электронных
библиотек – систем, реализующих унифицированный подход к производству,
хранению и организации разнообразной информации с целью поиска, анализа и
доступа к ней с использованием глобальных компьютерных сетей. Можно с
уверенностью говорить о том, что сегодня процесс создания полнотекстовых
коллекций в библиотеках приобретает устойчивый характер.
Научная библиотека БГПУ не первый год занимается внедрением и
использованием новых информационных технологий. Краткая характеристика
библиотеки. Научная библиотека БГПУ – старейшая вузовская библиотека
61
Алтайского края. В 2003 году она отметила 70 летний юбилей. В фондах НБ
сосредоточена уникальная коллекция естественно-научной литературы,
социально-экономической, правовой и психолого-педагогической тематики (в
соответствии с профилем университета). Библиотека университета
осуществляет информационное обеспечение учебного процесса (8610
студентов, 600 преподавателей), фундаментальных и прикладных исследований
научно-технических программ ВУЗа (53 кафедр, 13 научных лабораторий и
т.д.), а также методическое руководство библиотеками учебных заведений,
входящих в университетский комплекс.
Общий объем фонда составляет 637 единиц хранения, в том числе
научной литературы- 276445 экз., учебно-методической 311540 экз.,
художественной литературы- 47746 экз., литературы на иностранных языках
31437 экз.
В составе фонда – фонд редких книг, особую ценность представляет
коллекция краеведения, фонд диссертаций и авторефератов, защищенных в
диссертационном совете БГПУ, редкие и ценные издания последних лет.
Наличие достаточного количества литературы по различным отраслям
знания, таким как (например: биология, география, экономика, экология и
другим естественнонаучным и гуманитарным дисциплинам) позволяет
удовлетворять широкий спектр запросов всех заинтересованных пользователей.
По такому показателю, как обеспеченность учебного процесса учебной
литературой, университет занимает 13 место среди педагогических высших
учебных заведений (2003 год).
Текущий репертуар подписки включает более 300 наименований
отечественных периодических изданий.
Библиотекой сформирован уникальный по полноте фонд изданий
(научные труды, научно-методические рекомендации, монографии и др.)
ученых ВУЗа.
Обеспечение информационно-библиотечной поддержки образовательной
деятельности в рамках распределенной модели образовательной деятельности
университета включает в себя:
 обеспечение информационно-библиотечной поддержки к получению
образования на месте в районах края, включая доступ к электронным
каталогам, межбиблиотечный абонемент, доступ к информационным
ресурсам университета сотрудников, преподавателей и учащихся
образовательных учреждений, входящих в Алтайский университетский
комплекс,
62
 обеспечение доступа к электронным учебно-методическим комплексам
по реализуемым университетом учебным программам и полнотекстовым
базам данных.
Работа в условиях распределенной модели обучения в университете включает в
себя:
 использование
автоматизированных
информационно-библиотечных
систем;
 открытый доступ к библиотечным фондам;
 доступ к информационным ресурсам университета для всех
образовательных учреждений университетского комплекса.
Библиотекой закуплено программное обеспечение «Руслан», которое
имеет модульную архитектуру, в которой каждый модуль, или
автоматизированное
рабочее
место,
обеспечивает
автоматизацию
определенного процесса (ряда процессов) библиотечной деятельности. Модули
связаны между собой в единую интегрированную автоматизированную
библиотечную систему.
Базы данных спроектированы с возможностью хранения и обработки данных в
виде:
 линейной текстовой информации неопределенной длины – для
полнотекстовых документов;
 структурированной - библиографической информации фиксированной и
неопределенной длины;
 мультимедийной (статическая и динамическая, анимированная графика,
аудио - и видеофайлы) и гипермедийной (мультимедийной, многомерные
объекты с гипертекстовыми связями) информации различных видов
представления и форматов. «Руслан» обеспечивает взаимодействие с
другими системами, стандартами и протоколами в различных сетевых
средах - от локальной до глобальной через корпоративную сеть, работу
со стандартом Z39.50 (ISO 23950), обеспечивающим информационный
поиск и обмен данными в вычислительных сетях.
Автоматизированная информационная библиотечная система обладает
дружественным графическим интерфейсом, поддерживает многоязычность
работы,
обладает
Web-интерфейсом,
позволяет
реализовывать
функциональные возможности АИБС в глобальных сетях и обеспечивать
поддержку основных коммуникативных библиографических форматов
семейства MARC - USMARC, UNIMARC, RUSMARC.
Выбранная
информационная
функциональными возможностями.
система
63
обладает
следующими
Модуль системы
Функции модуля (АРМа)
(АРМ)
Контроль заказа (формирование заказа, оплата,
Модуль
получение); регистрация поступающих изданий;
комплектования
книжного
фонда/ ведение различных форм отчетности и статистики.
каталогизации

Каталогизация изданий разного вида и на
(АРМ Комплектатор/ различных
носителях;
классификация;
Каталогизатор)
предметизация; аналитическая обработка книжных
и периодических изданий - роспись оглавления,
аннотирование, реферирование.
Модуль абонемента
(АРМ Книговыдача)
Модуль
межбиблиотечного
абонемента
Регистрация читателей; транзакции изданий
(выдача,
продление,
прием);
заказ
и
резервирование/бронирование
изданий;
учет
просроченных изданий и генерация санкций
(предупреждение по просроченным изданиям,
начисление штрафов); статистика использования
материалов фондов.
Регистрация читателей; регистрация заказов по
МБА; учет реализации заказов; транзакции изданий
по МБА.
(АРМ МБА)
поиск;
представление
Модуль читательского Информационный
каталога
открытого результатов поиска в различных форматах
библиографического описания; экспорт данных
доступа
(вывод на экран, печать и магнитные носители).
(АРМ Читатель)
Управление и поддержка функционирования
Модуль
системы; архивация статистических данных;
администрирования
ведение отчетности; организация и ведение
(АРМ Администратор) профилей ИРИ; генерация отчетов различного
формата на экран, печать и магнитные носители;
поддержка экспорта/импорта данных.
В рамках информационной модели деятельности библиотеки выделяются
следующие основные задачи подразделений библиотеки.
64
Основным направлением работы в отделе комплектования является
пополнение фонда библиотеки БГПУ научной, учебной, учебно-методической
литературой, электронными изданиями с целью наиболее полного обеспечения
информацией образовательных, научных, исследовательских процессов.
В отделе каталогизации ведется автоматизированная научная обработка
новых поступлений: систематизация, составление библиографической записи в
электронном каталоге, проводится ретроконверсия документов, а так же
продолжается создание и редактирование традиционных карточных каталогов.
В Отделе обслуживания пользователи непосредственно получают
издания на дом или для работы в читальном зале. Для удобства пользователей
организована работа читального зала открытого доступа к информации.
Научно-библиографический отдел традиционно занимается справочноинформационным обслуживанием пользователей библиотеки, воспитанием
информационной культуры пользователей. Наряду с библиографическими
базами данных отделом создается и полнотекстовая база «Персоналии».
Отдел краеведения и редких книг
осуществляет работу по
использованию современных технологий в расширении баз данных библиотеки,
прежде всего, отборе редких и ценных книг, в том числе создание фонда
авторефератов и диссертаций, создание условий для хранения фонда.
Для внедрении информационно-коммуникационных технологий в работу
библиотеки,
в соответствие с техническим заданием проекта «Научнопедагогическая
библиотека
Алтайского
университетского
округа
педагогического профиля»,
принято решение о
создании отдела
электронных и информационных ресурсов.
Его открытие стало следствием новых требований, которые стали
предъявлять к получению высококачественной информации пользователи
образовательных учреждений. Задачи отдела:
 создание электронной библиотеки университета:
o электронные издания учебников и учебно-методических пособий;
o полнотекстовые БД авторефератов и диссертаций, защищенных в
диссертационном совете БГПУ;
o электронные журналы БГПУ и АУШПО;
o электронный каталог;
 электронная доставка документов из других библиотек.
 предоставление доступа читателям к глобальной сети Интернет.
65
В распоряжение пользователей предоставлен фонд медиатеки с
энциклопедической, справочной, библиографической информацией на компакт
дисках.
В секторе маркетинга организован репрографический центр, который
выполняет задачи оперативного копирования без ограничений:
 Любого материала заказчика;
 Научных, учебных и периодических изданий библиотеки БГПУ;
 Печать электронных изданий.
Отдел автоматизации является ведущим подразделением библиотеки по
разработке и внедрению автоматизированных технологий для выполнения
библиотечных процессов.
Научно- методический отдел научной библиотеки БГПУ организует
работу по созданию нормативно-методической документации и работу по
организации взаимодействия с библиотеками образовательных учреждений
университетского комплекса.
Одним из важнейших направлений работы – методическое обеспечение
библиотек образовательных учреждений, включая проведение конференций и
семинаров. Интеграция усилий образовательных учреждений приведет к
созданию современной университетской научно-педагогической библиотеки.
Создание
такой
библиотеки
позволит
обеспечить
своевременное
удовлетворение информационных потребностей не только профессорскопреподавательского и научного состава БГПУ, но и всего преподавательского
состава образовательных учреждений университетского комплекса.
Администрация библиотеки вырабатывает стратегию развития научной
библиотеки, осуществляет планирование, анализ работы библиотеки в целом и
ее структурных подразделений, контроль за выполнением плана работы, а
также ведет работу с персоналом по повышению квалификации.
66
67
Анализ требований и разработка структуры базы данных
База данных – это совокупность блоков информационных элементов,
представленных на машиночитаемых носителях, предназначенных и пригодных
для оперативного решения пользовательских, служебных и других задач с
использованием средств вычислительной техники.
База данных (БД) отвечает следующим признакам:
 БД содержит некоторое множество данных, необходимых для решения
конкретных задач многих пользователей;
 Информационные
элементы
в
БД
определенным
образом
структурированы;
 Данные представлены на машиночитаемых носителях в форме,
пригодной для оперативного их использования с применением
вычислительной техники.
Совокупность информационных элементов, не отвечающих любому из
трех перечисленных выше признаков, не может называться базой данных.
Требования к БД формируются в зависимости от ее назначения, но есть и
такие требования, которым должна отвечать любая база.
Итак, правильно спроектированная база данных:
Удовлетворяет всем требованиям пользователей к содержимому базы
данных;
 Гарантирует непротиворечивость и целостность данных;
 Обеспечивает естественное, легкое для восприятия структурирование
информации;
 Удовлетворяет требованиям пользователей к производительности базы
данных.

Использование баз данных характеризуются следующими свойствами:
оперативностью (оперативный доступ к информации), полной доступностью
(вся информация доступна для использования), гибкостью (возможность
изменять состав и форму выдачи данных), целостностью данных
(минимизирование дублирования данных), а также работ по их обновлению.
Структура БД – это принцип или порядок организации записей в базе
данных и связей между ними. Большинство баз данных имеют табличную
структуру, в которой адрес данных определяется пересечением строк и
столбцов. В БД столбцы называются полями, а строки записями. Поля образуют
структуру БД, а записи составляют информацию, которая в ней содержится.
68
Простейшие БД можно создавать, не прибегая к специальным
программным средствам. Чтобы файл считался базой данных, информация в
нем должна иметь структуру (поля), и быть форматирована так, чтобы
содержимое соседних полей легко различалось.
Основные шаги проектирования базы данных:
1.
Определить информационные потребности базы данных.
2.
Проанализировать объекты, которые необходимо смоделировать в
базе данных.
3.
Поставить в соответствие сущностям и характеристикам - таблицы
и столбцы (поля) в выбранной Вами СУБД (системе управления базами
данных).
4.
Определить
атрибуты,
которые
уникальным
образом
идентифицируют каждый объект.
5.
Выработать правила, которые будут устанавливать и поддерживать
целостность данных.
6.
Установить связи между объектами (таблицами и столбцами),
провести нормализацию таблиц.
7.
Спланировать вопросы надежности данных и, при необходимости,
сохранения секретности информации.
Методы организации хранения и поиска электронных изданий
Для хранения электронных копий изданий и их фрагментов используются
различные базы данных. Это относится к базам данных, которые используются
в сети Интернет и связаны с поисковыми серверами, которые, отыскав ссылку
на нужное издание в своем поисковом индексе, обращаются к соответствующей
сетевой базе данных.
Существует два разных метода организации хранения электронных
изданий:
в виде иерархической файловой системы, в которой файлы отдельных
изданий объединены в каталоги по тематическому или другим признакам;
 в виде текстовой базы данных, в которой размещены файлы изданий.

Первый метод проще с точки зрения организации структур данных, но
требует создания и использования дополнительных средств для поиска
нужного электронного издания, в особенности если количество таких изданий
достаточно велико. При его использовании, в общем случае, гораздо труднее
обеспечить защиту информации от несанкционированного доступа, которая
несомненно нужна, так как издания представляют собой определенную
информационную и материальную ценность, являясь интеллектуальной
собственностью конкретного издательства.
69
Во втором варианте обычно проще осуществить защиту информации.
Методы и средства для этого достаточно разработаны и проверены практикой.
Однако при работе с изданием, связанной с его изменением, используется
большое количество операций записи и чтения информации. Это связано с тем
обстоятельством, что приложение не может напрямую работать с базой данных.
В результате, для больших текстовых баз данных существенно снижается
скорость обработки информации. Кроме того, возникают определенные
проблемы при использовании различных видов информационных носителей,
например жестких магнитных дисков и оптических компакт- или DVD-дисков.
Хранение изданий требует обязательной организации системы поиска.
Существуют два варианта поиска изданий пользователем.
В первом случае производится поиск электронного издания, о котором
точно известно, что оно существует и известен хотя бы один его поисковый
атрибут. Такие системы называют фактографическими, так как в них каждому
изданию однозначно соответствуют поисковые атрибуты.
Во втором случае ставится задача отыскания всей совокупности
электронных изданий по определенному тематическому направлению. В этом
случае заранее неизвестно не только количество изданий, но даже сам факт их
существования. Такие системы называют документальными. Большинство
аналитических и исследовательских задач на начальной стадии реализации
связано с применением второго варианта поиска.
Методы организации поиска также могут быть разделены на две группы.
К первой из них относится так называемый атрибутивный поиск. Он
основан на том, что каждый документ (издание представляет собой частный
случай документа) характеризуется определенным набором атрибутов (полей).
Эти поля заполнены конкретной информацией, которая изменяется для
различных изданий. При поиске проверяется совпадение значений,
содержащихся в запросе, со значениями в соответствующих полях каждого из
изданий. Такой метод организации поиска характерен для фактографической
модели.
К атрибутам изданий относят: название, автора (авторов), время
создания, ISBN (индивидуальный номер издания по универсальной книжной
классификации) и т. д. В последнее время набор атрибутов все чаще называют
метаинформацией. Делаются попытки стандартизации электронного описания
для любого издания. В частности, имеются библиотечные стандарты, в том
числе и отечественные, а также и стандарты описания в книжной торговле.
Ко второй группе средств относится полнотекстовый поиск и выборка
изданий. Для организации полнотекстового поиска необходимо вначале
произвести индексацию изданий, составить для них так называемый
70
полнотекстовый индекс. В простейшем случае он представляет собой список
всех значащих слов в текстовой базе данных с указанием, в каких изданиях
встречаются эти слова. Встречаются многоуровневые индексы, в которых на
верхнем уровне расположен словарь или поисковый индекс слова. В нем
каждому значащему слову соответствует указатель на расположенный на
следующем уровне список местонахождений или индекс ссылок, в котором
содержатся адрес издания и, иногда, позиция слова внутри документа.
Можно сформулировать четыре основных отличия полнотекстовой
выборки от атрибутивной:
полнотекстовая выборка отвечает на запросы с меньшей точностью;
 выборка вероятностная, а недетерминированная;
 критерием правильности выборки является не точное совпадение, а лишь
пригодность извлеченного из базы издания;
 время поиска и извлечения издания больше зависит не от технических
средств, а от качества формулирования запроса и скорости анализа
пользователем пригодности извлеченных из базы изданий.

Атрибутивный поиск проще и быстрее, а также позволяет получить
точный, а не вероятностный, результат. Для его реализации не требуется
создавать полнотекстовый индекс, занимающий значительное дисковое
пространство, а также сложные поисковые механизмы. Но атрибутивный поиск
не всегда применим, так как пользователь может не знать ни одного атрибута.
Существует несколько методов поиска в текстовых базах данных. Первой
и наиболее простой моделью поиска является просмотр, т. е. процесс сходный с
обычной работой с книгой. В этом случае из базы данных извлекается
определенное электронное издание и пользователь знакомится с его
содержанием. Используя современные средства навигации, можно
перемещаться по каталогу изданий, раскрывать нужные книги и просматривать
их оглавления и аннотации. Для больших баз данных такой способ
неэффективен и может использоваться только в сочетании с другими моделями.
Следующая модель
использует в качестве основы логические
конструкции, т. е. слова или фразы (последние заключаются обычно в круглые
скобки), объединенные знаками логических операций И, ИЛИ и НЕ .
Специальное
программное
обеспечение
может
обеспечить
автоматическую оценку степени полезности каждого из извлеченных изданий.
Результаты обычно сортируются по степени релевантности. Такая модель
поиска используется, в частности, на поисковом сервере Rambler.
Во многих случаях следует остановится на промежуточном варианте,
когда наряду с атрибутами в поисковой среде хранится набор ключевых слов и
терминов, каждый из которых связан с определенным кругом изданий. При
71
включении нового издания в поисковую структуру из набора ключевых слов
отбирается несколько, в наибольшей степени отвечающих тематике и
содержанию издания. При поиске информации пользователь также
просматривает список ключевых слов и отбирает те из них, которые, по его
мнению, в наибольшей степени соответствуют его требованиям.
Технологические аспекты создания электронного каталога
Современное общество характеризуется быстрым развитием электронных
средств и систем распространения информации. Остро встает вопрос о
способах и методиках обработки информации, в том числе вопрос об
эффективном поиске и отборе информации. Рост информационного потока
требует адекватных методов обработки информации. Отметим изменения,
характеризующие деятельность современной библиотеки:
 все более широкое использование компьютеров не только при создании
электронных каталогов, но и при оформлении заказов, взаимодействии
между отделами, филиалами и т.д.;
 использование сетевых технологий для организации совместной работы и
взаимодействия сотрудников библиотеки и ее филиалов;
 повсеместное внедрение электронной формы представления изданий в базе
данных (БД);
 распространение в электронном виде (по согласованию с автором и
издательством) точной копии печатного издания с возможностью ее
последующей распечатки
в случае необходимости в произвольном
количестве экземпляров;
 появление в принципиально новых типов изданий с использованием чисто
компьютерных технологий,
таких как гипертекст, мультимедиа,
электронное аналоговое моделирование, анимационные эффекты;
 подключение практически всех средних и крупных издательств к Всеминой
сети Интернет, что открывает совершенно новые возможности для
взаимодействия библиотек и издательств.
Современной библиотеке все в большей и большей степени приходится
работать с цифровой информацией. В функции современной библиотеки входит
оцифровка, индексация, длительное хранение, извлечение и защита от
несанкционированного доступа цифровой информации в распределенной
сетевой среде. В связи с этим встает вопрос о создании модели
информационной структуры библиотечной деятельности. Как уже отмечалось
выше, такой моделью может быть модель, описанная в [1] для современного
издательства (рис. 1). Рассмотрим основные компоненты модели.
 централизованное
форматов;
хранилище
цифровой
72
информации
всех
типов
и
 совокупность цифровых технологий для загрузки изданий в хранилище и их
каталогизации;
 система поиска и просмотра первичной информации;
 доставка единиц хранения информации пользователю (читателю) для
просмотра или работнику библиотеки для исправления ошибок.
Все основные компоненты располагаются на одном или нескольких
серверах.
Такая система обязана обладать определенным набором свойств. Она
должна обеспечить:




хранение всех типов данных в едином информационном пространстве;
минимизацию ручного труда по каталогизации и индексации информации;
доступность информации с любого клиентского компьютера;
возможность
нахождения
издания
по
его
информационным
характеристикам;
 доступность издания только для лиц с соответствующими правами доступа.
Рис. 1. Модель информационной структуры современной библиотеки.
Остановимся более подробно на элементах представленной модели.
73
Ядром любой информационной системы является хранилище изданий,
предназначенное для хранения электронных изданий. Для организации
эффективного поиска изданий, наряду с содержанием самих изданий
необходимо хранить атрибутивную информацию (метаинформацию или
метаданные). В состав метаинформации обычно включают: имя автора или
авторов, название издания, время первой публикации издания, название
издательства, принадлежность авторских прав, характер представления данных
(тип файла, его размещение) и пр.
Можно выделить два подхода создания хранилищ документов.
Создание
фактографических
хранилищ.
При
использовании
фактографической схемы хранения документов в БД записывается
определенный набор атрибутов каждого издания и ссылки на место хранения
изданий. Поиск документов в таких хранилищах организуется только по
атрибутам изданий, хранимым в БД.
Другой подход – это создание документальных хранилищ. В данной
системе организуется полнотекстовый поиск, т.е. поиск по содержанию
документа. Документальные хранилища ориентированы на хранение изданий в
электронном виде.
В настоящее используется интегрированный подход к организации
хранения изданий: документы в электронном виде размещаются в файловой
системе сервера, а метаинформацию об изданиях сохраняют в БД. Такой
подход позволяет каталогизировать не только электронные издания, но и
печатные, т.е. внести метаинформацию о печатном издании в БД, что упрощает
поиск этого издания.
Загрузчик является той частью системы, которая должна сделать ввод
изданий и документов настолько эффективным, насколько это возможно.
Поскольку количество вводимой информации велико, становится понятно
требование минимизации ручного труда в этом процессе. При вводе
электронных изданий одновременно должны генерироваться метаданные для
каталогизации и индексирования, на основе которых документы могут затем
извлекаться пользователями. Известно несколько способов автоматизации,
соответствующих разным методам доступа к данным. Наиболее известен и
хорошо отработан метод автоматической индексации полного текста.
Самые прогрессивные средства индексации текста базируются на
технологии семантических сетей, в которой значения слов определяются по
контексту, а не просто подбором унифицированных терминов для отдельных
слов. При этом, чем более структурирован язык описания страниц, тем легче
выделять информацию, однако пока работу программных средств нельзя
назвать безупречной. Представляется оправданным включение в метаданные
ключевых слов, отобранных автором и редактором, так как лучше них никто не
74
сможет подобрать набор ключевых слов, оптимально характеризующих как
тематическую область издания, так и его отличия от близких по тематике.
Передача данных пользователю так же является одним из основных
компонентов описываемой структуры. Можно выделить два основных типа
передачи данных: передача файлов (используется для передачи текстовой и
графической информации по электронным сетям) и передача потоков данных
(используется для передачи аудио и видео информации в цифровом виде по
электронным сетям). Для обработки аудио и видео информации (в том числе
хранение
и
передача
по
электронным
сетям)
необходимы
высокопроизводительные ЭВМ с большими объемами оперативной и внешней
памяти, а так же надежные каналы передачи данных с высокой пропускной
способностью.
Браузер должен обеспечить интерфейс пользователя. Перечислим
основные функции, доступ к которым должен обеспечить браузер:
 доступ к тематическим каталогам и файлам;
 поиск информации;
 просмотр статических, мультемедийных и динамических (например,
ответов, формируемых системой поиска информации) документов;
 навигацию между связанными документами.
В качестве браузера может выступать либо специализированная
клиентская программа, либо, что более предпочтительно, стандартный
Интернет-браузер (например, Internet Explorer, Netscape Navigator, Opera и др.).
Использование стандартного Интернет-браузера позволяет снять проблему
разработки и распространения клиентского программного обеспечения,
проблему взаимодействия различный операционных систем, но в то же время
усложняется вопрос разработки серверной части системы.
Хранение изданий требует обязательной организации системы поиска,
которая является основной сервисной функцией предоставляемой клиенту.
Можно выделить два вида поиска изданий пользователем:
1. Атрибутивный поиск – поиск существующего издания по одному или
нескольким известным атрибутам, которые сопоставляются каждому из
документов. Эта система поиска используется в фактографической системе
хранения документов. К атрибутам изданий относят: название, автора
(авторов), время создания, ISBN (индивидуальный номер издания по
универсальной книжной классификации) и так далее.
2. Полнотекстовый поиск - поиск всей совокупности изданий по
определенному тематическому направлению. В этом случае заранее
неизвестно не только количество изданий, но даже сам факт их
существования. Такие системы поиска используются в документальных
75
хранилищах. Большинство аналитических и исследовательских задач на
начальной стадии реализации связано с применением второго варианта
поиска. В частности, на этапе постановки задачи всегда проводится обзор
литературы
по
рассматриваемому
вопросу.
Для
организации
полнотекстового поиска необходимо вначале произвести индексацию
изданий, составить для них так называемый полнотекстовый индекс. В
простейшем случае он представляет собой список всех значащих слов в
текстовой базе данных с указанием, в каких изданиях встречаются эти слова.
Встречаются многоуровневые индексы, в которых на верхнем уровне
расположен словарь или поисковый индекс слова. В нем каждому
значащему слову соответствует указатель на расположенный на следующем
уровне список местонахождений или индекс ссылок, в котором содержатся
адрес издания и, иногда, позиция слова внутри документа. Полнотекстовый
поиск широко применяется на поисковых серверах Интернет.
Выделим отличия полнотекстового поиска от атрибутивного:
 полнотекстовый поиск выполняется с меньшей точностью;
 полнотекстовый поиск вероятностный, а не детерминированный;
 критерием правильности выборки является не точное совпадение, а лишь
пригодность извлеченного из базы издания;
 время поиска и извлечения издания зависит от формулировки запроса и
скорости анализа пользователем пригодности извлеченных из базы изданий.
Следует отметить, что исторически первыми использовались базы
данных для хранения структурированной информации с жестким набором
атрибутов. Затем возникла необходимость хранения документов, включая
журналы и книги, которые представляют собой набор неструктурированной
или почти неструктурированной информации.
Атрибутивный поиск проще организовать, он выполняется гораздо
быстрее и позволяет получить точный, а не вероятностный, результат. Для его
реализации не требуется создавать полнотекстовый индекс, занимающий
значительное дисковое пространство, а также сложные поисковые механизмы.
В последние годы в сети Интернет взят курс на поисковые системы,
основанные на частичном; использовании метаинформации, по крайней мере, в
тех случаях, когда эта информация известна пользователю. Вводится и
соответствующий стандарт на содержание атрибутов на каждой Web-странице
для реализации такого поиска. Тем не менее, полнотекстовые базы и поиск пока
еще достаточна широко используется в издательских информационных
системах.
В.А.Вуаль выделяет несколько методов поиска в текстовых базах данных.
76
Просмотр или связное чтение, т. е. процесс сходный с обычной работой с
книгой. Из базы данных извлекается определенное электронное издание, и
пользователь знакомится с его содержанием. Используя средства навигации,
можно перемещаться по каталогу изданий, просматривать их оглавления и
аннотации. Для больших баз данных такой способ неэффективен и может
использоваться только в сочетании с другими моделями.
Булевы модели поиска, использующие в качестве основы логические
конструкции, т. е. слова или фразы, объединенные знаками логических
операций И (AND, &), ИЛИ (OR) и НЕ (NO). Входящие в конструкцию слова и
фразы, если последние рассматриваются как единое целое, обычно называют
термами. Если в результате запроса поисковая система выдала чрезмерно
большой список документов, запрос можно попытаться усложнить, включив в
него большее количество термов и логических операторов. Наоборот, если
найдено небольшое количество пригодных (peлевантных) документов, запрос
можно упростить, исключив из него отдельные конструкции или заменив
логические операторы. Современные системы поиска обычно производят
оценку степени полезности найденного документа на основе частоты, с которой
искомые термины встречаются в найденном документе.
Векторная модель поиска основана на представлении каждого
отдельного издания некоторым вектором в N-мерном пространстве. Запрос
также представляется в виде вектора. Степень полезности документа,
определяется как его близость в указанном N-мерном пространстве к вектору
запроса. Количественная оценка близости найденного документа к запросу
выражается косинусом угла между этими векторами и изменяется в пределах от
0 до 1. Векторная модель поиска обязательно подразумевает последовательные
итерации. В начале поиска пользователь из всего множества выбранных
изданий определяет некоторые как нужные, полезные для него. На основании
этого выбора вырабатывается уточненное положение вектора запроса
Основной характеристикой применимости методов поиска является
эффективность. Эффективность описывается точностью и охватом. Точность
– это отношение релевантных документов (R) в полученной в результате поиска
выборки к общему числу документов в выборке (N):  
R
. Охват – это
N
отношение числа релевантных документов в выборке (R) к общему числу
релевантных документов в базе данных (T):


R
.
T
Говоря о поисках документов необходимо остановиться на законах Зипфа
и их применении.
Для организации эффективного поиска необходимо уметь выделять набор
ключевых (значимых терминов) терминов. Известный математик Дж. Зипф
(G.K. Zipf) показал, что все созданные человеком тексты подчиняются
77
некоторым общим закономерностям. Он сформулировал в 1946—1949 годах
три таких закона.
Если взять любой текст, то можно подсчитать, какие слова применяются
в нем и сколько раз они встречаются. Количество повторов слова в тексте
можно назвать частотой этого слова. Чаще всего встречающемуся слову
можно приписать ранг 1, следующему по частоте — ранг 2 и т. д. Если
несколько разных слов имеют одинаковые частоты, то учитывается только одно
из них. Если разделить частоту повторения слова f на общее количество
значащих слов в тексте S, то получим относительную частоту или вероятность
встречи этого слова в тексте.
Первый закон Зипфа гласит, что произведение частоты или вероятности
встречи слова в тексте на его ранг приблизительно постоянно для любых
текстов определенного языка. На рис. 2 представлена кривая зависимости
частоты слова от его ранга:
f 
Const
,
R
где Const – некоторая константа, различная для разных языков (для русского
примерно 960).
Рис. 2. Кривая зависимости частоты, с которой слово встречается в тексте, от
его ранга
На основании первого закона Зипфа можно сказать, если самое
распространенное слово встречается в тексте 100 раз, то следующее по частоте
слово будет встречаться примерно 50 раз.
Дж. Зипф так же установил, что частота и количество слов, входящих в
текст с этой частотой, также связаны между собой определенной зависимостью.
78
Если построить график, отложив по оси абсцисс частоту вхождения слова, а оси
ординат — количество слов, характеризуемых данной частотой, то
получившаяся кривая будет сохранять свои параметры для всех без исключения
созданных человеком текстов в пределах одного языка. Однако и
межъязыковые различия невелики. На каком бы языке текст ни был написан,
форма этой кривой Зипфа останется неизменной. Могут незначительно
отличаться лишь коэффициенты, отвечающие за наклон кривой (рис. 3). Если
график построен в полулогарифмическом масштабе, то он состоит из двух
отрезков прямых линий с небольшим криволинейным участком между ними.
Рис. 3. Кривые для французского (кривая 1), английского (кривая 2) и русского
(кривая 3) языков.
Полученные Дж. Зипфом результаты могут успешно использоваться на
практике для выделения значащих слов в тексте. Все значащие слова для
любого текста размещаются в области средних значений ранга и частоты
(выделенная область, см. рис. 2). Действительно, самые часто встречающиеся
слова, ранг которых изменяется от 1 до 4—5, обычно относятся к разряду
вспомогательных, а самые редкие — обычно также не имеют решающего
смыслового значения для данного текста. От того, как будет задан диапазон
значимых слов, зависит многое. Если сделать его слишком широким — нужные
термины потонут в море вспомогательных слов. Установив же чрезмерно узкий
диапазон, мы рискуем потерять некоторые смысловые термины.
До сих пор рассматривались отдельно взятые документы. Однако каждый
такой документ является частью совокупности изданий. Эта совокупность, в
частности, может быть реализована в виде базы изданий или документов. Всю
эту базу, или ее часть, включающую документы одной и той же тематики или
направления, можно представить в виде одного, очень большого документа. К
этому составному документу также применимы законы Зипфа. Использование
понятия "составной документ" позволяет повысить качество выборки значащих
слов (или их рейтинг) путем введения нового понятия инверсная частота
79
термина, которая характеризует вес или значимость этого термина. Этот
параметр позволяет снизить опасность попадания малозначащих терминов в
состав выборки. Инверсная частота i определяется как логарифм отношения
общего количества рассматриваемых документов n к числу документов,
содержащих данный термин m (под термином может пониматься не только
отдельное слово, но и единое по смыслу словосочетание). Т.е.
i  log 2
n
.
m
С учетом инверсной частоты вес или значимость термина в каждом
документе определится выражением:
z f
i
,
S
где z — вес или значимость термина в издании; f— частота повторения термина
в этом издании; i— инверсная частота этого термина в группе изданий; S—
количество значащих слов в определенном издании. Следует заметить, что
значимость одного и того же термина в различных изданиях обычно
существенно отличается друг от друга.
Роль инверсной частоты в приведенной формуле состоит в том, чтобы
уменьшить вес слов и устойчивых словосочетаний, которые выполняют
вспомогательные функции в документе, обеспечивая стиль и определена
характер повествования. Для случайных слов и сочетаний мала частота
повторения терминов f, а для стоп-слов и вспомогательных понятий стремит к
нулю инверсная частота i. Таким образом, вес или значимость термина;
позволяет выделить именно ключевые слова и сочетания. Этот же параметр
позволяет ранжировать значащие слова, т. е. построить их последовательность
в порядке значимости.
Законы Зипфа используются при пополнении ссылочной базы данных
поисковых серверах, причем весовые коэффициенты основаны не только на
весе каждого термина, но могут учитывать и то, какой частью речи является
термин, а также его местоположение внутри документа, морфологические
особенности и пр. Они же применяются для оценки релевантности найденного
в процессе поиска документа, величина которой изменяется от 0 до 1.
Релевантность оценивается на основе того, какое количество слов из
представленных в поисковом выражении содержится в найденном документе, а
также веса каждого из таких слов, представленных в документе.
Дж. Зипф представил свои законы в 1949 году. Позднее они были
уточнены на основе ряда практических исследований известным математиком
Бенуа Мандельбротом (Benoit Mandlebrot). В настоящее время именно эти
80
законы легли в основу алгоритмов автоматического распознавания текста и
различных автоматических поисковых стратегий.
Часть 6. Виртуальный мир книги и его особенности.
Термин “виртуальность” приобрел в последние два десятилетия
необычайную популярность, сфера его применения практически необозрима – в
философских, культурологических, психологических, политологических
кругах. Однако в речевой практике под виртуальностью подразумеваются
артефакты, создаваемые компьютерной техникой.
В толковом словаре мы находим следующее определение для понятия
“виртуальный” [<ср.-лат.virtualis] 1) возможный; такой который может или
должен проявиться при определенных условиях, но в реальности не
существующий; 2) созданный на экране компьютера; воспроизводимый
компьютерными средствами.
Мы и ставим перед собой задачу описать возможность знакомства с
различными электронными книгами в тех случаях, когда у нас нет в руках
самих этих книг. К понятиям – “электронная книга”, “электронное издание”
проявляют интерес не только специалисты, но и читатели. В вузах в процессе
обучения активно используются электронные учебники и учебные пособия, в
Интернете существует огромное количество электронных библиотек, и все
чаще можно встретить людей, читающих произведения на транспорте с
помощью карманных компьютеров.
Кроме того, привычным для нашей страны становятся виртуальные
книжные магазины и прилавки, которые распространяют книги через сеть, не
имея никакого торгового объекта в реальном мире, даже простого киоска или
стола на книжном развале. Познакомиться с электронными изданиями можно и
обратившись в электронную библиотеку. Такие библиотеки могут быть двух
видов:
 представительства в сети реальных библиотек, обычно крупных,
имеющих свои собственный Web-сервер или сайт;
типично виртуальные библиотеки, не имеющие реального
представительства, а предоставляющие читателям только электронные книги;
такие библиотеки организуются энтузиастами и пополняются не только
организаторами, но и читателями.

Таким образом, средствами распространения электронной книги в сети
являются: виртуальные магазины, которые могут существовать и на сайтах
издательств, представительства в сети крупных государственных библиотек,
виртуальные библиотеки, т.е. созданные на некоммерческих началах сетевые
хранилища электронных изданий. Все перечисленные средства, позволяющие
81
сделать электронную книгу доступной читателю, будут рассмотрены ниже.
Вначале рассмотрим виртуальные библиотеки.
Некоммерческие электронные библиотеки
Возможность познакомиться с интересными книгами предоставляется на
некоторых серверах и сайтах. Обычно они так и называются “Электронная
библиотека” или “Виртуальная библиотека”.
Самая известная из них в Русском Интернете - библиотека Максима
Мошкова (http://www.lib.ru) (рис.1), информационный объем которой
превышает 1,7 Гб. Она была открыта в 1994г. Читатели ежедневно пополняют
ее новыми файлами. Здесь есть современная и античная художественная
литература, фантастика и политика, техдокументация и юмор, история и
поэзия, туризм и парашютизм, философия и эзотерика, КСП и русский рок и
многое другое.
Рис.1
Главное достоинство этой и ей подобных библиотек состоит в том, что
посетитель может выбрать любую понравившуюся ему книгу и бесплатно
«скачать» ее на свой компьютер. После этого он может читать или изучать ее
электронную версию или распечатать книгу и работать или отдыхать с
распечаткой без компьютера. На сервере предусмотрена возможность поиска
нужной книги, разнообразные переходы на конкретные виды литературы,
включая новинки (то, что недавно переведено в электронную форму и
включено в состав библиотеки) и самиздат, т.е. произведения
непрофессиональных писателей, представленные пока только в электронном
виде. Следует отметить, что сайт имеет множество зеркал, т.е. его копии
воспроизводятся на самых различных серверах.
Интересное начинание, названное “Избой-читальней” представлено на
сервере “Русский Сиэтл” (www.russianseattle.com). Это тем более интересно,
что территориально сайт находится не в одном из крупных городов, а в так
называемой “глубинке”, в черноземной зоне. Не останавливаясь на
82
особенностях самого сайта, отметим, что на нем представлен большой список
электронных библиотек, связи с которыми и переходы к ним организованы на
этом сайте.
Большая виртуальная библиотека расположена на сайте www.library.ru .
Это информационно-справочный портал, созданный при поддержке
Министерства культуры Российской Федерации. Содержит наиболее полный
каталог сайтов российских (и частично - зарубежных) библиотек с указанием
наличия на них электронных каталогов. Аннотированный каталог Интернетресурсов,
содержащих
собрания
литературных
произведений
и
литературоведческих текстов. Здесь же расположен виртуальный читальный
зал, а при обращении в “виртуальную справку” можно получить
исчерпывающий ответ.
Сайт гуманитарного некоммерческого проекта “Электронное чтиво”
(www.ebooks.da.ru), продукцией которого являются так называемые
“электронные книги” (удобно запакованные микро-сайты, работающие на
любом компьютере и распространяемые через загрузку с сайта “Электронное
чтиво”, на магнитных носителях, через локальные сети, по электронной почте).
Основная цель проекта – сокращение дистанции между литературным
произведением и его читателем при минимальных затратах на провайдерские
услуги. Предлагается каталог “электронных книг” и возможность подписки на
них.
Представительство крупных библиотек в Интернете
Виртуальными
электронными
библиотеками
называют
также
представительство реальных крупных библиотек в Интернете. Их перечень
можно найти в каталоге “Мир библиотек, БиблиоNet” на сайте www.library.ru.
Это сайты российских библиотек различных типов и ведомственной
принадлежности. Особую ценность представляет наличие в каталоге ссылок на
сайты муниципальных библиотек. Ближнее зарубежье представлено 106
сайтами библиотек различных типов, а дальнее зарубежье – 117
национальными и 47 публичными библиотеками. В перспективе эти разделы
каталога будут значительно обогащены информацией о сайтах, прежде всего,
публичных библиотек. Существенную часть каталога составляют официальные
и профильные сервера, сайты корпоративных библиотечных систем и центров,
библиотечных ассоциаций, а также организаций – партнеров библиотек.
Наибольший интерес представляет сводный каталог научно-технической
литературы, представленный на сайте Государственной публичной научнотехнической библиотеки (ГПНТБ), адрес которого www.gpntb.ru (рис.2).
83
Рис.2
Каталог самой библиотеки содержит более 180.000 документов, в числе
которых отечественные и зарубежные книги последних лет издания,
авторефераты диссертаций, неопубликованные переводы и отчеты. Имеет
развитый поисковый интерфейс. По умолчанию он рассчитан на тематический
поиск по ключевым словам, с возможностью использования метаинформации
(заглавие, автор, предметные рубрики). Множество дополнительных установок.
В частности, можно менять количество ссылок в группе результатов поиска.
Сводный каталог научно-технической литературы содержит более 400.000
записей и отражает содержимое всех крупных Российских библиотек. Его
интерфейс абсолютно идентичен электронному каталогу ГПНТБ.
Каталог Научной Библиотеки МГУ (www.lib.msu.su) - крупнейший
российский каталог литературы универсального содержания, доступный через
Интернет. В нем отражено более 190 тысяч описаний отечественных и
зарубежных книг последних лет издания. Скромный поисковый механизм
допускает разыскание лишь по автору, заглавию (первое слово) и ключевому
слову. Найденные результаты выдаются группами по пять записей. Поисковый
механизм не всегда работает надежно.
Из других каталогов отметим каталог Российской Национальной
Библиотеки (www.nlr.ru). В нем отражено более 40 тыс. книг, поступивших в
библиотеку с 1998 г. Обеспечивается поиск по всем традиционным параметрам:
индивидуальный и коллективный автор, место и год издания, предметные
рубрики. На сервере РНБ также расположены каталоги авторефератов
диссертаций, специальных видов литературы и карт.
Каталог
Фундаментальной
библиотеки
Санкт-Петербургского
государственного технического университета (www.unilib.neva.ru) содержит
более 18 тысяч книг последних лет издания. Возможен поиск по автору (в том
числе и коллективному), заглавию, индексам УДК и ББК, предметной рубрике,
издательству, году издания.
84
Какие же услуги оказывают эти виртуальные представительства крупных
библиотек и каталогов своим клиентам. Отметим, прежде всего, что все эти
услуги платные. Помимо рассылки электронных копий изданий или их частей
возможна также рассылка копий на вещественном носителе: ксерокопии,
фотокопии,
включая
микрофотографии.
Предоставляются
также
библиографические услуги в форме поиска литературы по определенной
тематике с последующей рассылкой аннотированного списка литературы или
самих этих изданий. Возможны различные варианты оплаты услуг, в том числе:
банковский перевод, наличными, с помощью кредитной карты и депозитного
счета.
Надо сказать, что такие информационные услуги во всем мире относятся
к категории услуг, с удовольствием оплачиваемых пользователями, так как
предварительная обработка информации экономит впоследствии значительную
часть их рабочего времени. Естественно при условии, что эти
библиографические услуги выполнены на высоком профессиональном уровне.
Пока коммерческие электронные библиотеки, рассылающие в
электронной
форме
литературу
и
оказывающие
дистанционно
библиографические услуги, в высокой степени используют преимущества
сетевых технологий для повышения качества и скорости оказания услуг.
Тормозящим фактором здесь, как и для электронных магазинов и электронных
прилавков
при
издательствах,
является
отсутствие
гарантий
конфиденциальности в виртуальном пространстве, в связи с чем опасно
оплачивать услуги путем дистанционного перечисления своих средств с
кредитной карты.
Тогда как некоммерческие электронные библиотеки обеспечивают
массовое распространение книги и сопутствующих услуг.
Электронные книжные магазины
Широкое распространение получили российские и зарубежные
электронные магазины, предлагающие печатные и периодические издания
(книги, карты, атласы и т.п.), электронные издания (CD-ROM и дискеты, DVD,
программное обеспечение), аудиоиздания на компакт-дисках и кассетах, а
также видеоиздания.
Сайты электронных магазинов включают тематику предлагаемых
изданий, поисковые возможности, предоставляемые на сайте того или иного
магазина, описание информации, выводимой в результате поиска
интересующих изданий, способы оплаты и доставки заказанных изданий.
Один из самых известных и крупных Интернет-магазинов
“Amazon”(www.amazon.com)
американской
фирмы
Amazon.com,
специализирующийся на продаже зарубежных книг и др. изданий. Не имея ни
85
одного традиционного книжного магазина, первым создал “виртуальный
прилавок” и быстро преуспел в продаже книг через Internet, выручив в 1996 г.
около 16 млн. дол, а в 1997 г.- уже более 121 млн. дол. Предлагаемая тематика
изданий охватывается рубрикатором, в который включены практически все
традиционные рубрики. Рубрикатор многоуровневый. Возможен простой поиск
по ключевому слову с ограничением формата книги и возраста читателя.
Многоуровневый рубрикатор позволяет производить более сложные поиски, в
результате которых осуществляется вывод найденных по запросу книг
группами по 25 записей. Описание включает в себя: выходные данные книги,
изображение обложки, краткую и расширенную аннотацию. Поиск по разделу
CD-ROM позволяет получить информацию о наименовании дисков по заданной
тематике, возрастных ограничениях, дате выпуска, издательстве, платформе для
воспроизведения диска (mac/win), ISBN, размерах коробки, цене, доступности
диска в настоящее время, краткое описание и изображение обложки. Кроме
того, магазин предлагает музыкальные CD, видеоигры, DVD видеодиски,
программное обеспечение. В России представлено еще несколько фирм,
обеспечивающих рублевую оплату продукции, предлагаемой Amazon (Ozon,
Interactive Information Agency, Problem Net). Доступ к изданиям, предлагаемым
Amazon.com за рубли возможен с сайта http://www.ottu-da.ru. Доставка: почтой.
Далее рассмотрим еще несколько примеров электронных книжных
магазинов.
Интернет-магазин “24х7” (www.24x7.ru) предлагает более 50 тыс.
наименований книг, музыкальных компакт-дисков, видеокассет, DVD,
VideoCD. Описание книг сопровождается изображением обложки, аннотацией
и выходными данными книги, описание видео - изображением обложки,
аннотацией и сведениями о студии, режиссере и актерах. Быстрый поиск по
ключевому слову. Доставка почтой по России и другие страны, курьерская
доставка в 50 крупных городов России.
Интернет-магазин “RusHall.ru” (www.rushall.ru) предлагает большое
разнообразие книг, видео и DVD. Результатом поиска книг является
изображение обложки, аннотация и выходные данные книги. Есть возможность
получить информацию о наличии и ценах на интересующее издание в
различных Интернет-магазинах (через систему FindBook (www.findbook.ru).
Расширенный поиск с применением логических операторов позволяет вести
поиск книг по названию, автору, серии, издательству, году издания; поиск
видео и DVD по названию фильма, дистрибьютеру, режиссеру, актерам, серии,
году выпуска. Оплата производится наличными курьеру при курьерской
доставке (Москва и Санкт-Петербург), наложенным платежом, банковским
переводом на счет Интернет-магазина через Сбербанк РФ - кредитной картой
через сервер ASSIST. По Москве и Санкт-Петербургу курьерская доставка, для
России обычной (наземной) почтой. В страны СНГ заказы доставляются
бандеролями с объявленной стоимостью либо наземной, либо авиапочтой. Для
86
всех зарубежных заказчиков российской почтой за рубеж (либо наземной, либо
авиапочтой) и экспресс-доставка с помощью службы "EMS Гарантпост" - это
курьерская доставка "от двери до двери".
Магазин “Бизнес-книга” (www.bizbook.ru) распространяет деловую и
компьютерную литературу и справочники в пределах Москвы. Общее
количество наименований книг около 2,5 тысяч, изображения обложек
отсутствует, поиск производится по автору, названию и году издания,
каталогизация одноуровневая, цена изданий розничная, для получения книги
можно заехать в офис фирмы. Таким образом, у этой фирмы наряду с
виртуальным существует представительство реальное.
Одним из первых в России открыла виртуальный книжный прилавок
фирма “Озон” в 1999 г., создав свой собственный сервер www.ozon.ru (рис.3).
Сервер реализует функции виртуального магазина, в котором можно заказать
все основные виды продукции медиа-индустрии: книги, видео- и аудио
продукцию, компакт-диски с компьютерными программными пакетами. На
сервере организована современная схема отбора заказов путем пометки
соответствующего товара и последующего нажатия кнопки «добавить в
корзину». Когда потенциальный покупатель отобрал все необходимое, он имеет
возможность “раскрыть свою корзину” и просмотреть отобранные издания,
удалив те, от которых он решил отказаться. После этого он оформляет заказ с
помощью специальной страницы с развитым интерфейсом.
Рис.3
Сайт характеризуется, пожалуй, чрезмерно разветвленной структурой с
большим количеством страниц и ссылок и значительным числом уровней
вложения. Так, главная страница (Home page) содержит 84 гиперссылки.
Интерфейс сайта содержит также множество закладок, пиктограмм,
выпадающих окон и окон прокрутки. Информационная часть сайта несколько
перегружена рубриками, ссылками, цитатами, рекламой, разнообразными
приложениями. С другой стороны, удобно, что на каждой странице сайта есть
87
окна поиска по ключевым словам, что облегчает поиск пользователю нужного
ему издания. Полезным достоинством сайта является наличие архивированных
списков изданий различного типа с указанием объема соответствующих
файлов. Это позволяет перенести нужный файл на свой компьютер и, не
расходуя лишних средств на оплату работы в глобальной сети, не спеша
разобраться в том, что из имеющихся товаров тебе требуется.
Из интерактивных пользовательских средств на сайте имеются страницы
со вставками элементов JavaScript, позволяющих отправить отзыв о
прочитанной книге, а также принять участие в книжном, музыкальном и
киноведческом конкурсах. Предусмотрены и вспомогательные страницы, такие
как «Часто задаваемые вопросы», «Как сделать заказ», «Впервые на Озоне?» и
пр. Подраздел «Услуги» также содержит несколько интересных рубрик:
«Книжный клуб», «Подписка на новости», «Предложение сотрудничества»,
«Как заработать деньги» и т. д. Оплата наличными, наложенным платежом,
кредитными картами, через сберкассу, почтовым и телеграфным переводом.
Доставка в любую точку мира.
Адрес www.top-kniga.ru (рис.4) представляет сервер книготорговой
фирмы “Ton-книга”, крупнейшего за Уралом оптового распространителя
изданий (помимо Сибири и Дальнего Востока в сферу интересов фирмы входит
также Казахстан, точнее его русскоязычная часть населения) и одновременно
электронного розничного магазина. В частности, интернет-магазин - книгапочтой является основным виртуальным распространителем книги в Зауралье,
Сибири и на Дальнем Востоке.
Рис.4
Виртуальные книжные магазины стали неотъемлемой частью ряда
издательств, преимущественно связанных с выпуском компьютерной
литературы. В частности, появился специальный сервер “Книги России”
(www.books.ru), который принадлежит издательскому дому “Символ-плюс” и
претендует на освещение книгоиздания и обеспечение возможности покупки
любых Российских изданий. На сервере отдельно организовано взаимодействие
88
с оптовиками, библиотеками, и розничными покупателями. Достаточно просто
и содержательно оформлена лицевая страница. Наряду с изданными уже
книгами анонсируются подготавливаемые к изданию (рубрики “Сданы в
типографию” и “Готовятся к печати”), причем можно заранее оформить заказ
на них.
Помимо книжных изданий представлена также периодика (журналы и
газеты), компакт-диски, видеокассеты и программное обеспечение. На сервере
реализована многоуровневая каталогизация и наряду с простым (автор и
название) сложный поиск (по ключевым словам текста и аннотации). Он
выгодно отличается наличием не только предоплаты заказов, но и наложенного
платежа, и указанием точных цен доставки книг в любой конкретный регион
России и мира. На сервере содержатся также книжные обзоры, рейтинги книг,
мнения читателей о книгах и самом сервере. В целом можно оценить его как
один из лучших и наиболее современных книжных серверов России.
Еще хотелось бы упомянуть сервер Издательского Дома “Питер”, адрес
которого www.piter-press.ru. Там предусмотрен встроенный книжный магазин,
реализующий продукцию только этого издательства. Оформление главной
страницы достаточно лаконично и содержательно. Наряду с шестью основными
разделами, ссылки на которые можно найти в верхней части любой страницы
(издательство, книги, журналы, продажа, клуб, обратная связь), предусмотрены
три кнопки: “корзина” (просмотр и редактирование заказа для
зарегистрированных посетителей интернет-магазина), “письмо” (его получит
Web-мастер) и “главная страница”.
На главной странице можно прочесть свежие новости, подписаться на
рассылку новостей по электронной почте, просмотреть рейтинги книг по
результатам продаж, принять участие в опросах и увидеть их результаты. В
разделе “Книги” можно просмотреть тематический каталог книг, выпущенных
и намеченных к выпуску издательством, ознакомится с оглавлением и
отрывками из книг, познакомиться с отзывами читателей и оставить свой
отзыв. После оформления заказа на Ваш электронный адрес отправляется
сообщение, в котором перечисляются отобранные Вами книги и диски и их
общая стоимость. В течение 24 часов с момента посылки этого сообщения вы
можете отказаться от заказа, направив соответствующее электронное письмо в
службу книги-почтой. Магазин обслуживает всю территорию России.
Электронное издательство “Коминфо” зарегистрированно на сайте
www.cominf.ru предлагает 25 мультимедийных изданий собственной
разработки на компакт-дисках, обучающие программы, CDROM для детей,
энциклопедии по искуству и истории, астрономии, интерактивные альбомы и
путеводители. Для всех изданий имеется аннотация, изображение обложки,
приведена цена в у.е. Для заказа необходимо зарегистрироваться на сайте
Русских
виртуальных
магазинов
89
https://www.russianstory.com/accounts/Xnewuser_r.htm. Для всех изданий имеется
аннотация. Оплата кредитной карточкой или банковским переводом. Доставка
по всему миру.
Основные причины, сдерживающие развитие электронной торговли, отсутствие у компаний развитой электронной инфраструктуры сервисной
поддержки покупателей, а также недостаточная осведомленность и инерция
последних. На решение этих проблем необходимо время.
Главными причинами отказа от покупки книг и сопутствующих товаров в
виртуальных магазинах следует считать:
1. Желание предварительно ознакомиться с оформлением и качеством
изготовления приобретаемых книг.
2. Сложностью возврата товара и получения обратно затраченных на его
покупку денег.
3. Необходимостью ввода большого количества информации на Webстраницу для приобретения товара.
4. Нежеланием дополнительно оплачивать доставку книг.
5. Запутанной структурой и трудностями управления страницами сайта.
Как видим, владельцам сайтов необходимо внести изменения. Для этого
требуется представить фотографию обложки или переплета книги и
исчерпывающие сведения по тематике книги и ее дизайну, а также качественно
оформить сайт виртуального магазина или прилавка и предельно упростить ту
его страничку, которая используется при оформлении заказа на книги.
Но электронное издательство представляет собой один из путей решения
основной проблемы любого издательства - определения тиража выпускаемой
книги. Эта задача не имеет точного алгоритмического решения. В большинстве
случаев издатель полагается на свой опыт, интуицию и возможность
проведения целенаправленной рекламной компании для продвижения
выпускаемой книги к читателю. Один из путей решения этой задачи - это
печать по заказу (Print-on-Demand), реализуемый с помощью одной из страниц
сайта. Метод печати по заказу полезен для молодых авторов, предлагая им
следующее:


сам факт опубликования книги;
возможность провести самостоятельно маркетинг и оценить уровень
спроса;


низкий уровень расходов на электронную публикацию;
полную свободу самовыражения автора, включая верстку и дизайн
книги.
Компьютерная сеть Интернет представляет средство маркетинга и
рекламы электронной книги. Метод печати по запросу позволяет сделать
90
издание книг безубыточным, так как купить книгу при печатном тираже в 200
экземпляров могут лишь те, кому она безусловно нужна. А для того, чтобы эти
люди узнали о ее издании, необходимо сделать ее известной предельно
широкому кругу лиц. Интернет предоставляет для этого все возможности, а
также позволяет сделать на книгу заказ по электронной почте.
Таким образом, электронный, или виртуальный, книжный магазин
возникает в результате создания сайта, объединяющего определенные ресурсы
(чаще русскоязычные), связанные с литературой, компакт- и DVD-дискам и
видео- и аудио-кассетами. Используя систему «встроенных» в издательский
сайт магазинов, можно обеспечить удаленный доступ и возможность заказа
различного рода товаров, а также возможность получения доступа к редкой и
специальной литературе.
Развитие электронного книгораспространения
Современный уровень развития и распространения компьютерной
техники определяет целесообразность перевода информации с носителей на
бумажной основе в электронную форму. Новые разработки в области
электронных изданий показывают, что этот процесс неудержим и имеет
практически неограниченные возможности для своего дальнейшего развития.
Развитие информационных компьютерных технологий обратило на себя
внимание ученых, журналистов, издателей и других специалистов, так или
иначе занятых в области создания и распространения информации. Дошла
очередь и до книг. Появились электронные, или как их называют - eBook.
Хотелось бы остановится на технологии E-book, которая определяет
дальнейшее совершенствование и развитие электронного книгоиздания и
книгораспространения. Сам термин E-book переводится как “электронная
книга”, хотя правильней было бы говорить о переносной электронной
библиотеке. Существует два различных понятия, обозначающихся одинаковым
термином
E-book.
E-book
называют
как
аппаратное
средство
(специализированный микрокомпьютер) для хранения и чтения электронных
книг, так и сами такие книги. Многие сетевые магазины, продавая электронные
издания, называют их электронными книгами. Нам кажется правильнее
называть E-book (рис.5) только как аппаратное средство для хранения и чтения
электронных изданий.
91
Рис.5
Мы непременно читаем с экрана компьютера то, без чего невозможно
обойтись: электронную почту, Web-страницы, подготавливаемые нами тексты и
программы, потому что нет альтернативы. Однако символы с экрана читать
труднее, чем печатную книгу, из-за худшего разрешения и бликов на экране. К
тому же мы не можем работать вдали от своего рабочего стола. Даже пользуясь
портативным компьютером, мы далеки от той удобной позы, которую человек
принимает за чтением книги.
Новая аппаратура E-book и новые технологии чтения с экрана этого
устройства ставят целью обеспечение максимального удобства при чтении
электронных изданий, а также достижение того же самого качества восприятия
информации, как при работе с напечатанной на хорошей бумаге книгой. При
этом аппаратные средства E-book должны позволить носить с собой, если и не
всю свою библиотеку, то хотя бы значительную ее часть.
Современное аппаратное средство E-book появилось в США в 1998 г.
Разработчики его поставили перед собой задачу создать для читателей
электронной книги условия, практически неотличимые от условий чтения
обычной книги. Известно, что текст обычной книги в абсолютном большинстве
случаев печатается на белой бумаге черной краской. Разрешение для символов
печатной книги составляет не менее 300 точек на дюйм, в то время как
разрешение мониторов немного превышает 100 точек на дюйм. Поэтому перед
разработчиками стояла сложная задача, состоящая в устранении или
ослаблении влияния этих очевидных недостатков электронной книги по
сравнению с печатной.
Разработчикам удалось создать новую шрифтовую технологию ClearType
и сопутствующее ей программное обеспечение, что сделало возможным чтение
с экрана компьютера, не напрягая глаза,- почти так же, как если бы это был
текст, напечатанный на хорошей бумаге четким крупным шрифтом. Программа
же Microsoft Reader обеспечивает качественное воспроизведение ClearType
шрифтов и все необходимые операции со шрифтами и текстом, включая
масштабирование и поворот.
92
Выделяют две разновидности таких устройств: с одним экраном и
двухэкранные. Последние более точно моделируют книгу, так как позволяют
выводить на монитор не одну единственную страницу книги, а две или
разворот, как принято говорить у издателей и полиграфистов. Сейчас
производятся три основные модели E-book. Аппараты Rocket eBook и SoftBook
Reader относятся к книгам планшетного типа (с одним экраном-дисплеем), а
EveryBook - к книгам двухэкранного типа (у них два экрана). Все эти
устройства разработаны компаниями в США, но не меньшая активность в этом
направлении наблюдается и на другом континенте. Известно устройство
Bookman, которое производилось Корпорацией Sony с 1992 года и
использовало информацию, хранящуюся на специальных картриджах. Также
Sony принадлежит патент на электронную книгу типа Twoscreen eBook (книги
с двумя экранами).
Помимо самого текста справа на экране отображается индикатор
прочитанной части книги в виде полоски, верхняя темная часть которой
указывает положение текущей страницы и долю прочитанной части книги от ее
полного объема. Сенсорный монохромный ЖК экран Rocket eBook имеет
разрешение 106 точек на дюйм и снабжен четырьмя пиктограммами.
Пиктограмма в виде раскрытой книги позволяет выделять фрагменты текста,
производить поиск нужного фрагмента, а также поиск значений слов во
встроенном словаре Random House Dictionary. Возможно также добавление
закладок и заметок.
Аппараты E-book, программное обеспечение для них, а также
электронные издания для своей электронной библиотеки доступны уже сейчас.
Соответствующая информация представлена на сайтах www.ebookshop.ru/rocket
и www.e-book.ru. Там же можно прочесть мнения читателей о E-book и
различную сопутствующую информацию.
В заключении хотелось бы отметить и традиционная, и электронная книга
имеют каждая свои достоинства, способствующие развитию книжного дела и
культуры человечества.
Часть 7. Электронные учебные публикации
В настоящее время создание информационных сетей (Internet/Intranet)
привело к возникновению дистанционного обучения - новой формы обучения,
которая органично дополняет очную, заочную и вечернюю формы обучения.
Посредством системы дистанционного обучения (СДО) слушатели имеют
возможность в удобное для них время с помощью своего домашнего
компьютера осваивать обучающие курсы и другие учебно-методические
материалы, консультироваться у преподавателей, выполнять контрольные и
курсовые работы. Теперь студенты со своего компьютера могут прослушать
лекцию выдающегося ученого, который находится в тысячах километрах от
них,
осуществить
виртуальные
экскурсии
по
музеям,
научно93
исследовательским лабораториям, подискутировать с товарищами на Форуме
идей и т.д. С другой стороны СДО значительно облегчает работу деканата,
автоматизируя многие операции, позволяя оперативно получать информацию о
прохождении учебного процесса (срез успеваемости как по группам, так и по
отдельным слушателям), об оплате слушателями обучения. СДО позволяет
накапливать разнообразные статистические данные, которые могут быть
использованы для формирования отчетных документов.
С помощью СДО можно осуществить массовое обучение слушателей при
малом штате преподавателей. Развертывание Дистанционного обучающего
центра в ВУЗе позволяет экономить аудиторный фонд института, позволяет
привлечь к преподавательской работе специалистов, которые в силу ряда
причин не могут покидать свои рабочие места на основной работе. Широкое
использование дистанционного обучения в ВУЗе может привести к коренной
перестройке всего учебного процесса. Так, в 80-ти % колледжей США лекции
по многим курсам записываются на CD- и DVD-дисках, изучаются студентами
на своих домашних компьютерах. Далее посредством Дистанционных
обучающих центров осуществляется консультирование студентов и их
тестирование. В аудиториях же студенты в основном проводят семинары и
лабораторные работы.
Для работников библиотек можно на базе Дистанционного обучающего
центра можно создать курсы, позволяющие не только оценивать
существующий уровень знаний, но и создать курсы позволяющие повышать
квалификацию в сфере информационных и коммуникационных технологий.
Кроме того, можно создать курсы, которые позволят специалистам,
работающим на периферии, повышать квалификацию и в области
библиотечного дела. В дальнейшем при помощи контрольных заданий и тестов
можно адекватно и объективно проверить уровень профессиональной
пригодности работников.
В созданном Дистанционном обучающем центре основными
действующими лицами учебного центра являются: администратор, куратор,
преподаватель и обучаемые (слушатели).

Администратор организует работу учебного центра.

Куратор организует учебный процесс. Он формирует учебные
группы на основе заявок на обучение, полученных по Интернет или любым
иным способом.

Преподаватель готовит учебно-методические материалы, проводит
групповые и индивидуальные консультации со слушателями. Совместно с
куратором группы принимает решение об аттестации слушателей на основании
результатов очного или заочного, автоматизированного или автоматического
контроля и тестирования.
94

Слушатели объединяются в учебные группы. Все слушатели
учебной группы изучают одни и те же учебные курсы. Количество слушателей
в учебной группе не ограничивается. К группе прикрепляется куратор,
отвечающий за организацию учебного процесса в группе, и преподаватели,
ведущие учебные курсы. Один учебный курс в группе могут вести несколько
преподавателей.
Программные средства Дистанционного обучающего центра имеют
структуру, показанную на рис 1:
Рис. 1.
Административная подсистема включает в себя автоматизированные
рабочие места (АРМ) “Администратор”, АРМ “Куратор”, АРМ
“Преподаватель”.
АРМ “Администратор” обеспечивает информационную поддержку
администратора учебного центра, ведение централизованной базы данных,
получение информации об учебных группах и персонале виртуального
учебного центра, управление доступом участников учебного процесса.
АРМ “Куратор” имеет средства для организации учебного процесса,
формирования учебных групп и получения сведений о текущем учебном
процессе.
АРМ “Преподаватель” имеет средства подготовки учебно-методических
материалов, предназначенных для проведения учебного процесса и/или
95
тестирования, дистанционного ведения консультаций по курсу, проверки и
оценки тестовых заданий и курсовых работ.
Слушатели учебного курса объединяются в учебные группы на период
проведения подготовки, переподготовки или тестирования. После зачисления
на курс они получают доступ к учебно-методическим материалам курса.
Процесс обучения, в основном, строится на изучении материалов электронных
учебников, консультации с преподавателями центра, выполнении курсовых
работ и тестовых заданий. Слушатели могут самостоятельно изучать учебные
материалы, рекомендованные преподавателем, и/или искать в каталоге
дополнительные материалы. Слушатели имеют возможность записаться на
индивидуальную консультацию к преподавателю. Преподаватель также имеет
возможность разослать приглашения на консультацию слушателям своей
группы. В режиме on-line консультации проводятся с использованием
стандартных процедур Chat (разговор) или Whiteboard (классная доска), либо
в виде телеконференций.
В системе Дистанционного обучающего центра функционирует
дискуссионный клуб “Форум”, где слушатели группы могут обмениваться
мнениями в режиме off-line.
После изучения материала и консультаций слушатели в соответствии с
учебным планом выполняют специально подготовленные тестовые задания и
курсовые работы. В системе Дистанционного обучающего центра имеются
средства автоматического контроля выполнения тестов. Курсовые работы
слушатели пересылают преподавателям файлами, либо демонстрируют их в
режиме совместного использования приложений.
Схема организации дистанционного обучения представлена на рис. 2:
Рис. 2.
96
Схема функционирования виртуального учебного центра представлена на
рис. 3:
Рис. 3.
Процесс обучения в центре
Учебный курс состоит из отдельных разделов. Слушатели
самостоятельно изучают как учебно-методические материалы, подготовленные
преподавателями виртуального учебного центра, так и дополнительную
литературу по данному разделу курса.
Схема изучения учебного курса слушателями Дистанционного учебного
центра представлена на рис. 4.
97
Рис. 4.
В виртуальном учебном центре используются обучающие программы
следующего типа:
 компьютерные обучающие программы (КОП), изучаемые слушателями
по сети Интернет или Интранет в режиме on-line;
 КОП, которые поставляются слушателям на магнитном носителе и
изучаются на автономном компьютере в режиме off-line;
 КОП, изучаемые слушателями в режиме гибридного Интернета.
На следующем рисунке приведено главное окно обучающего курса
“Редактор тестов: WORD 2000”, подготовленного с помощью дизайнера курсов
“Униар Продюсер 2002”. Эта КОП может изучаться как в системе Windows в
режиме off-line, так и в сети Интранет.
Этот обучающий мультимедийный курс разработан на основе CBTтехнологии (Computer Base Training - Тренировка практических навыков на
базе компьютера). Суть этой технологии заключается в следующем:
Рассказ – информационный экран заменяет преподавателя и дает полное
представление об изучаемом предмете.
Показ – позволяет продемонстрировать практические приемы работы.
98
Упражнение – дает возможность пользователю самостоятельно получить
навыки решения практических задач с помощью тренажеров и в среде
изучаемого продукта.
Конспект – позволяет закрепить полученные знания.
Контроль – позволяет пользователю осуществить самоконтроль; тесты
состоят из практических заданий и позволяют проверять не только формальные
знания, но умения и навыки обучаемого.
Таким образом, курс, реализованный в виде компьютерной обучающей
программы, ориентирован на выработку у обучаемого устойчивых
практических навыков самостоятельной работы. Работая с курсом,
пользователь находится в режиме «непрерывного тренинга», выполняя на
каждом шаге по два - три практических упражнения. В результате у слушателя
формируется умение применения на практике накопленных знаний.
Рис. 5.
В виртуальном учебном центре слушатели также могут
изучать
компьютерные обучающие программы в режиме гибридного Интернета. В этом
случае конфиденциальная часть информации хранится на сервере ДОЦ и
доступна по сети Интернет только при введении пользователем пароля, а
99
большая часть информации (в основном графический и звуковой материал)
содержится на CD – диске.
В Дистанционном обучающем центре предусмотрено проведение
групповых или индивидуальных консультаций. Естественно, прежде чем
проводить консультацию, преподаватель должен назначить дату и время
консультации и послать по электронной почте сообщение об этом слушателям.
Консультации проводятся либо средствами стандартной программы Microsoft
NetMeeting, либо с помощью собственных управляемых средств АС
“ДОЦЕНТ”.
Преподаватель может проводить консультацию в различных режимах
функционирования программы MS NetMeeting. Режим Chat (Разговор)
позволяет собеседникам обмениваться печатными сообщениями в режиме
реального времени. Когда один из участников консультации (прежде всего преподаватель) запускает программу Chat, окно разговора появляется на экране
каждого пользователя.
В виртуальном учебном центре слушатели также могут
изучать
компьютерные обучающие программы в режиме гибридного Интернета. В этом
случае конфиденциальная часть информации хранится на сервере ДОЦ и
доступна по сети Интернет только при введении пользователем пароля, а
большая часть информации (в основном графический и звуковой материал)
содержится на CD – диске.
В Дистанционном обучающем центре предусмотрено проведение
групповых или индивидуальных консультаций. Естественно, прежде чем
проводить консультацию, преподаватель должен назначить дату и время
консультации и послать по электронной почте сообщение об этом слушателям.
Консультации проводятся либо средствами стандартной программы Microsoft
NetMeeting, либо с помощью собственных управляемых средств АС
“ДОЦЕНТ”.
Преподаватель может проводить консультацию в различных режимах
функционирования программы MS NetMeeting. Режим Chat (Разговор)
позволяет собеседникам обмениваться печатными сообщениями в режиме
реального времени. Когда один из участников консультации (прежде всего преподаватель) запускает программу Chat, окно разговора появляется на экране
каждого пользователя.
В режиме Консультаций слушатели задают вопросы преподавателю и
получают его ответы. Преподаватель в этом режиме может вывести вопрос
слушателя на всеобщее обозрение и публично ответить, либо может ответить
слушателю лично.
100
Фронтальный контроль, который также функционирует в режиме on-line,
преподаватель может использовать для проведения контрольного занятия. В
этом режиме слушателям задаются вопросы различной сложности, на которые
они могут ответить “Да”, “Нет” или “Не знаю”. При правильном ответе
слушатель получает n баллов (n – вес вопроса, задаваемый преподавателем),
при неправильном ответе – из суммарного результата слушателя вычитается n
баллов; если слушатель щелкнет мышью на кнопке “Не знаю” – его суммарный
результат не изменится. Суммарная оценка фронтального контроля заносится в
централизованную базу данных.
Проведение контрольного занятия в режиме Фронтальный опрос
позволяет преподавателю формулировать вопросы, на которые слушатель
должен дать ответ в виде строки. Здесь также формируется суммарная оценка
на основании веса вопроса и правильности ответа. Если до появления на экране
следующего вопроса слушатель не отправит ответ, его суммарная оценка не
изменяется (данный “отклик” соответствует ответу “Не знаю” в режиме
Фронтальный контроль).
В режиме Фронтальное тестирование преподаватель задает на
выполнение слушателям группы предварительно подготовленные тесты. В этом
случае оценки слушателей формируются на основании протоколов
тестирования и также сохраняются в централизованной базе данных.
После изучения материала данного раздела и консультаций слушатели
получают специально подготовленные тесты. Индивидуальные тесты заданной
сложности, позволяющие проверять не только уровень знаний, но и навыки
слушателей, создаются преподавателем посредством графической оболочки,
входящей в состав автоматизированной системы. В системе Дистанционного
обучающего центра имеются средства автоматического контроля выполнения
тестов. Оценки за выполненные тесты проставляются по пятибальной системе
либо по системе «зачет – незачет».
Преподаватель может создать для учебной группы групповой вариант
теста, если слушатели группы удалены друг от друга, или создать
индивидуальные варианты тестов для каждого обучаемого, если тестирование
осуществляется одновременно для всех слушателей в одном помещении. После
этого преподаватель должен разослать для удаленных слушателей приглашения
по электронной почте и/или назначить тесты группе. В приглашении
преподаватель указывает название назначенного теста по данному разделу
курса и контрольную дату выполнения теста. Удаленные слушатели, используя
АРМ "Слушатель", выполняют тесты в удобное для них время, но к
определенной преподавателем дате. Результаты тестирования слушателя
сводятся в протокол выполнения теста и пересылаются в централизованную
базу данных.
101
Преподаватель может задать ведение полного протокола тестирования,
либо его сокращенного варианта. Полный протокол содержит информацию о
слушателе, название и общие характеристики всего теста, название и номер
каждого теста, результаты выполнения теста, окончательные характеристики
прохождения теста: суммарный балл, процент набранных баллов, фактическое
время прохождения теста. Сокращенный протокол не содержит результатов
отдельных тестов, а только окончательные характеристики прохождения теста.
Преподаватель на своем автоматизированном рабочем месте получает
протоколы выполнения теста и, просматривая их, принимает решение о
проставлении зачета, изменении оценки автоматизированного контроля,
назначении дополнительного теста или проведении консультации со
слушателями.
В функциональной подсистеме АРМ "Преподаватель" имеются средства
оформления зачетных и экзаменационных ведомостей. После изучения всех
разделов курса и выполнения всех назначенных тестов слушатель получает
диплом Дистанционного обучающего центра об окончании курса.
При
создании
учебных
материалов
можно
использовать
инструментальные пакеты “Униар Билдер 2002” и “Униар Продюсер 2002”.
Они позволяют разрабатывать обучающие курсы пользователям, которые не
являются профессиональными программистами. Для того чтобы научиться
создавать обучающие курсы достаточно прочитать инструкцию и, возможно,
просмотреть примеры, устанавливаемые при инсталляции в директорию
EXAMPLE. Курсы и тесты могут работать автономно в режиме Windowsприложений или в виде Java-аплетов, в том числе в составе
Автоматизированной Системы дистанционного обучения «Доцент». При работе
в составе системы «Доцент» протокол работы тестов записывается в базу
данных системы и становится доступным преподавателю.
Обучающий курс, созданный с помощью данных инструментальных
пакетов, состоит из разделов. Курс в целом имеет название, оглавление и общие
параметры курса. Оглавление состоит из названий разделов. Раздел
представляет собой последовательность связанных между собой экранов.
Каждый экран связан с двумя другими экранами – следующим за данным и
предыдущим.
Экран раздела курса может быть информационным или содержать
тестовый вопрос, предполагающий ответ обучаемого. Тестовые вопросы (и
соответствующие им типовые экраны - шаблоны) формируются на основании
следующего перечня:

выбор одного варианта ответа из нескольких возможных (Один из
нескольких, порядок следования вариантов генерируется случайным образом)
102

выбор правильных ответов из предложенного списка (Много из
нескольких)

ввод эталонной строки текста (Эталонная строка)

ввод модели строки текста (Модель строки)

ввод формулы из латинских, греческих и векторный символов
(Формула)

выбор одной из заданных областей (Ожидание щелчка)

ожидание ввода числа (Ответ – число)

сборка объекта из составляющих (Сборка чертежа)

указание последовательности объектов (Указание порядка)

указание соответствия объектов (Указание соответствия)

коррекция ошибок в многострочном тексте (Коррекция ошибок в
тексте)

векторная графика (Вектор)

рисование заданного графика (График)

перемещение объекта по экрану (Перетаскивание)

выбор прямоугольных областей (Выбор областей)

выделение фрагмента текста манипулятором мышь (Выделение
текста)
Все экраны группируются в файлы сценария c расширением «.atv». При
работе с учебный курс последовательно или с помощью случайной выборки
заполняет экраны разделов файлов сценария и выводит результаты в виде
графических образов на экран с подключением звуковых файлов. При
выполнении в тестов в сети Интернет файл сценария, для сокращения времени
подкачки по сети Интернет, запаковывается в «ZIP» архив, а графический
материал переводится в «GIF» формат или «JPEG» формат.. По окончанию
времени тестирования или по инициативе обучаемого формируется протокол
тестирования и пересылается в базу данных АС “”Доцент”.
Курс строится на основе набора стандартных экранов. При этом
разработчику курса нет необходимости заниматься созданием дизайна для этих
экранов.
Конструкторы курсов позволяют создавать обучающих программ и
наборов тестов. Он позволяет проводить эту работу преподавателю, который не
обладает навыками программирования. Курсы и тесты, подготовленные
посредством конструктора, могут работать автономно в режиме Windows–
приложений или в виде Java–аплетов.
Возможно строить тесты с использованием широкого перечня типовых
тестов.
103
Конструктор курсов и тестов позволяет создавать разнообразные
обучающие компьютерные курсы и тесты как в гуманитарных, так и в
естественнонаучных областях знаний, позволяет разрабатывать наборы тестов
на основе созданных ранее учебных курсов и подключать их к этим курсам.
Таким образом можно сделать следующие выводы:
1. Дистанционное обучение через компьютерную сеть является новой,
перспективной формой обучения студентов, переподготовки и повышения
квалификации работников различных организаций.
2. Автоматизированная система Дистанционного обучающего центра
представляет
собой
комплекс
программно-методических
средств
дистанционного обучения, переподготовки и тестирования слушателей.
Данный комплекс основан на современных Интернет-технологиях и методиках
образования на базе компьютерных обучающих программ и тестирующих
систем. Автоматизированная система имеет защиту от возможных сбоев
телекоммуникационной сети. В системе проводится идентификация
пользователей,
разделение
прав
доступа,
защита
данных
от
несанкционированного доступа.
3. Учебный процесс в виртуальном обучающем центре строится на базе
автоматизированных рабочих мест администратора, куратора, преподавателя и
слушателя. Работа на автоматизированном рабочем месте реализуется при
вводе, поиске и коррекции данных в наборе специальных окон, которые
последовательно выводятся на экран монитора. Работа с окнами отличается
простотой и эффективностью.
4. В Дистанционном обучающем центре средствами стандартной
программы Microsoft NetMeeting проводятся групповые и индивидуальные
консультации. Консультации могут проводиться в режиме Chat (Разговор),
когда собеседники обмениваются печатными сообщениями в режиме реального
времени, в режиме Whiteboard (Доска), который позволяет создавать
совместные наброски и рисунки, демонстрировать заранее подготовленные
чертежи, в режиме совместного редактирования документов. При проведении
индивидуальных консультаций можно
использовать режим звукового
общения.
5. АС “ДОЦЕНТ” содержит собственные управляемые средства
проведения занятий и консультаций (управляемый преподавателем Chat).
Преподаватель может выбрать один из следующих режимов работы: свободный
разговор,
телеконференция,
консультация,
фронтальный
контроль,
фронтальный опрос и фронтальное тестирование.
6. Преподаватели центра посредством специальной графической
оболочки могут создавать индивидуальные тесты заданной сложности,
104
позволяющие проверять не только уровень знаний, но и навыки слушателей. В
системе
Дистанционного
обучающего
центра
имеются
средства
автоматического контроля выполнения тестов.
7. На базе Дистанционного обучающего центра имеется возможность
проводить сертификацию (допуск к работе) специалистов организации,
разработать контрольные задания и тесты, позволяющие адекватно и
объективно проверять уровень профессиональной пригодности работников.
8. На базе Дистанционного обучающего центра имеется возможность
предоставления консультационных и учебных услуг на коммерческой основе.
Часть 8. Региональная база данных учебных материалов
В Алтайском крае создан и успешно развивается учебно-научный
комплекс «Алтайский университетский школьно-педагогический округ»,
ведущими организациями которого являются Комитет администрации
Алтайского края по образованию и Барнаульский государственный
педагогический университет. В рамках округа реализуются различные
инновационные программы, в том числе связанные с развитием
информационной инфраструктуры региона.
На базе Барнаульского государственного педагогического университета
действуют
Институт
информатизации педагогического образования,
Региональный информационный центр (РИЦ) учебного книгоиздания,
Региональный центр обработки информации (РЦОИ) единого государственного
экзамена, учебные центры, классы доступа к информации работников системы
образования и студентов.
При непосредственном участии университета в крае создана
действующая информационная система на основе региональных баз данных и
телекоммуникационного
обмена.
Система
создавалась
как
телекоммуникационная-информационная система учебного книгоиздания, но
теперь значительно расширила свой функционал и стала основой развития
дальнейших новаций в области информатизации системы управления
образованием.
Университетом создан и поддерживается ряд сайтов (http://bspu.secna.ru/ ,
http://ege.uni-altai.ru/ , http://ric.uni-altai.ru/) которые стали базовыми
информационными площадками в области образования региона. БГПУ
разработал и внедрил систему электронного обмена информацией между
муниципальными и краевым органами управления образованием. На сервере,
администрируемом сотрудниками университета, расположены электронные
почтовые ящики всех муниципальных органов управления образованием.
105
Организация связи между муниципальными органами управления
образованием и региональным информационным центром
г.Барнаул
Районный центр
РИЦ
UNIVERSITY
IDC
TALK / DATA
TALK
Районный
комитет(отдел)
по образованию
RS CS TR RD TD CD
телефонная
линия
Региональный
представитель
АлтайТелеком
Туннель через сети
АлтайТелеком и
Элиен Нетворк
Проблемами информационного обмена, выявлением информационных
потребностей системы, обучением и консультированием пользователей
занимаются
высококвалифицированные
специалисты
университета,
программисты, методисты, преподаватели.
Проводится сбор и обработка значительных объемов различной
информации для формирования региональных баз данных проведения единого
государственного
экзамена,
по
учебному
книгоизданию,
системе
трудоустройства, образовательной статистике, мониторингу качества
образования.
Специалистами университета в области информатизации образования и
учебного книгообеспечения:
 разработана система сбора информации и анализа состояния
региональной системы образования и рынка учебного книгоиздания и
книгообеспечения;
 анализируется и пополняется региональная база данных учебных
изданий информацией о существующей и выходящей учебной
литературе;
 осуществляется анализ обеспеченности образовательных учреждений
учебной литературой и потребности в ней; анализ состояния
библиотечных фондов школ, потребности в пополнении для
106




предоставления информации комитету администрации Алтайского края
по образованию;
проводится анализ обеспеченности школ края учителями;
производится сбор информации и анализ состояния регионального
рынка учебного книгоиздания;
организуются и проводятся мероприятия для специалистов
муниципальных органов управления образованием по вопросам
эффективной эксплуатации ТИС;
оказывается
информационная
и
консультационная
помощь
заинтересованным лицам и организациям по вопросам нормативного
обеспечения.
Специалистами университета проведены неоднократные образовательные
курсы для методистов, инспекторов и иных работников муниципальных
органов управления образованием, занимающихся эксплуатацией полученного
МОУО компьютерного и телекоммуникационного оборудования, обработкой
информации на районном уровне. Если на первых занятиях осваивались азы
компьютерных технологий, то в последующем, преимущественно по
инициативе слушателей, вводились дополнительные темы, имеющие как
прикладное, так и теоретическое значение.
В результате были подготовлены кадры, которые, в основном, в
состоянии решать задачи по созданию и сопровождению региональной
информационной системы по различным направлениям.
При формировании системы сбора данных учитывается необходимость
автоматизации ежегодных процедур по сбору и анализу больших объемов
информации по системе образования региона.
Автоматизация
несколько задач:
процедуры
сбора
информации
позволяет
решить
 ускорит получение исходных данных от нижестоящих организаций;
 ускорит обработку обобщенных данных;
 выведет качество ее обработки на новый уровень за счет использования
методов математической статистики, картографических методов
обработки информации и пр.;
 введет унификацию получаемой информации;
 повысит точность собираемых сведений за счет осуществления
перекрестных проверок при вводе информации;
 снизит
зависимость
формирования
отчетов
от
личностей
«незаменимых» специалистов;
 повысит дисциплину подготовки официальных сведений в отношении
сроков и полноты предоставления информации.
107
Принимаемые меры способствуют удовлетворению информационных
потребностей органов управления образованием различного уровня и
образовательных учреждений.
Региональным информационным центром проведена работа по
выявлению содержания и объемов необходимой органам управления
образованием информации. На основании согласованных с Комитетом
администрации Алтайского края по образованию форм и таблиц создана
программная оболочка базы данных для автоматизированного сбора и
обработки информации. Работы по согласованию перечня и объемов
необходимой для сбора информации постоянно продолжаются.
При обсуждении концепции создания программ сбора данных в
отношении
требовательности
к
производительности
компьютерного
оборудования обсуждались варианты ориентации на вычислительный парк
современных персональных компьютеров или ориентации на маломощные,
устаревшие машины, которые в большом количестве эксплуатировались в
системе образования Алтайского края. Учитывая, что по программам
информатизации образования в каждую школу поступила современная техника
принято решение не ставить ограничений по ресурсоемкости создаваемых
программ.
Базовой идеей при разработке программ сбора данных стала их
модульность и наличие нескольких пользовательских уровней. Модульность
предполагает собой возможность работы программной оболочки с
ограниченным,
либо
расширенным
содержанием
без
ущерба
производительности и функционалу в зависимости от потребностей
пользователя. Так же модульность предполагает возможность добавления
нового функционала (полей ввода данных либо целых таблиц) в программную
оболочку, добавления справочников, облегчающих ввод данных и т.п.
Разработаны программы трех пользовательских уровней. На первом,
который назовем «школьным», производится ввод данных уровня школы.
После ввода сведений генерируются выходные файлы, которые на дискете, а в
последующем, при развитии внутрирайонных телекоммуникаций, по
электронной почте передаются в муниципальные органы управления
образованием. В МОУО производится слияние полученных данных.
Формируется статистическая картина района с легким и простым получением
детальных сведений по каждой школе, либо обобщенных сведений по какимлибо тематическим разрезам на уровне района. Далее вводятся необходимые
данные районного уровня и, после генерации выходных файлов они
направляются в региональный информационный центр. На уровне края
производится слияние данных, технологически реализуемое так же как на
районном уровне. Здесь производится проверка собранных сведений на
108
корректность, полноту, сверка с иными источниками статистической
информации. При необходимости вводятся данные краевого уровня.
В настоящее время, при непосредственном участии РИЦ, проводится
масштабная работа по формированию региональных баз данных системы
образования Алтайского края. Ее главная идея в консолидации разрозненных
сведений на основе единых справочников и предоставление органам
управления образованием различного уровня единого интерфейса для доступа к
информации.
Интегрированная база данных состоит из следующих компонентов:






база данных органов управления образованием;
база данных административно-территориальных единиц;
база данных образовательных учреждений;
база данных педагогического состава образовательных учреждений;
база данных учащихся (выпускных классов);
база данных учебного книгообеспечения (техническое и кадровое
обеспечение библиотек ОУ), включая базу данных учебной литературы.
При
формировании
региональных
справочников
использованы
рекомендации федеральных органов и столичных организаций: Министерства
образования РФ, Московского института электроники и математики
(технический университет), Центра тестирования Министерства образования
РФ, Головного информационного центра учебного книгоиздания и др. Это
позволяет в дальнейшем производить подготовку разнообразных отчетов для
предоставления в вышестоящие органы без запросов первичной информации
путем их компиляции из имеющихся сведений, и, лишь при расхождении
формата данных, производить дополнительный сбор сведений.
Актуализация прежде накопленной информации производится ежегодно.
Все базы данных объединяются единым интерфейсом по вводу сведений и
по выводу информации, что снижает издержки при обучении пользователей и
повышает качество работы операторов. Происходит постепенное слияние
программ по формированию баз данных в единую программную среду. Так,
уже объединены одной оболочкой базы данных учащихся, учителей,
образовательных учреждений.
109
Пример интерфейса программы сбора данных по учебной литературе
Имеющийся фонд учебной литературы по классам и годам
Интеграция баз данных на программном уровне позволяет в перспективе
проведение многофакторного анализа данных, выявление сложных
зависимостей, например между уровнем подготовки учащихся, используемыми
учебниками и педагогическим стажем учителя; предпочтениями тех или иных
учебных материалов учителями в зависимости от их образования и давности
проведения курсов повышения квалификации.
В анализе используются различные средства визуализации данных:
построение графиков, диаграмм, анализ с использованием ГИС-технологий.
В качестве примера приводим анализ данных кадрового состава обще
образовательных учреждений Алтайского края (количества учителей по
возрасту и преподаваемым предметам и по образовательным учреждениям,
которые окончили учителя Алтайского края) и по использованию учебников по
предметам в выпускных классах школ региона.
110
Возраст учителей Алтайского края
по некоторым предметам
30
Процент от общего числа
25
Директорат
20
Нач. классы
Русский язык
Математика
Физика
15
Химия
Биология
История
10
География
5
0
до 20
21-25
26-30
31-35
36-40
41-45
46-50
51-55
Возраст
111
56-60
61-65
66-70
71-75
Соотношение числа учебников по математике,
используемых для обучения выпускников 2004 г.
20823
10674
169
191
Другие
Виленикин
Н.Я. и др.
Мордкович
А.Г.
1015
Башмаков
М.И.
1500
Алимов
Ш.А. и др.
Атанасян
Л.С. и др.
Колмогоров
А.Н. и др.
2428
Соотношение числа учебников по истории,
используемых для обучения выпускников 2004 г.
11508
Дмитренко
В.П. и др.
550
322
411
Другие
1186
Ионов И.Н.
1507
Хачатурян
В.М.
Левандовский
А.А., Щетинов
Ю.А.
Сороко-Цюпа
О.С. и др.
Островский
В.П., Уткин
А.И.
2126
Волобуев
О.В., Клоков
В.А. и др.
5855
Обеспечен on-line доступ к большинству сформированным и
формируемым базам данных. Просмотр информации через Интернет
используется не только для просмотра баз данных, но и для мониторинга
112
поступления информации. В перспективе возможно составление сложных
запросов с изменяемыми параметрами в диалоговом режиме.
Пример страницы мониторинга поступления информации в региональную
базу данных
Для авторизации на сайте используются парольный доступ и определение
пользователей по статическим IP адресам. Парольный доступ предоставлен
органам управления образованием (краевому, городскому, некоторым
районным).
Благодаря тому, что РИЦ является региональным центром обработки
информации ЕГЭ достигается синергетический эффект при концентрации
разнообразных баз. Так же это способствует соблюдения сроков, полноте и
качеству предоставления информации в РИЦ от муниципальных органов
управления образованием и образовательных учреждений.
В Алтайском крае созданы и эффективно функционирую межрайонные
информационные центры, руководство которыми возложено на РИЦ. Место
организации центров определялось как географическими особенностями
(наличие рек, дорог, расстояние), так и имеющимся возможностями наладить
эффективную работу организациями, на базе которых созданы центры. В
113
каждую зону вошло от 3 до 5 районов (исключение Бийский центр, в зоне
ответственности которого 11 МОУО).
№ п/п
Межрайонный
Перечень районов
информационный
центр
1
Алейский
Алейский, Калманский, Топчихинский,
Усть-Пристанский, г. Алейск
2
Барнаульский
г. Барнаул
3
Бийский
Алтайский, Бийский, Быстроистокский,
Красногорский, Смоленский, Советский,
Солтонский, Солонешский,
Петропавловский, г. Бийск, г. Белокуриха
4
Благовещенский
Благовещенский, Суетский, Кулундинский
5
Волчинский
Волчихинский, Ключевский,
Михайловский, Родинский
6
Заринский
Залесовский, Заринский, Кытмановский,
Тогульский, г. Заринск
7
Змеиногорский
Змеиногорский, Курьинский, Локтевский,
Третьяковский, г. Змеиногорск
8
Каменский
Баевский, Каменский, Крутихинский,
Панкрушихинский, г. Камень-на-Оби
9
Мамонтовский
Завьяловский, Мамонтовский, Романовский
10
Павловский
Павловский, Ребрихинский, Тюменцевский,
Шелаболихинский
11
Первомайский
Косихинский, Первомайский, Тальменский,
ЗАТО Сибирский, г. Новоалтайск
12
Рубцовский
Егорьевский, Рубцовский, Угловский,
г. Рубцовск
13
Славгородский
Бурлинский, Немецкий национальный,
Славгородский, Табунский, Хабарский,
г. Славгород, г. Яровое
14
Троицкий
Ельцовский, Зональный, Троицкий,
Целинный
15
Усть-Калманский
Краснощековский, Усть-Калманский,
Чарышский
16
Шипуновкий
Новичихинский, Поспелихинский,
Шипуновский
В Алтайском крае внедрена, учитывая особенности региона, как весьма
крупного по территории и по величине системы образования, следующая схема
сбора информации:
114
 образовательные
учреждения
предоставляют
данные
в
муниципальные органы управления образованием (МОУО) — пока
преимущественно на дискетах;
 МОУО предоставляют совокупные данные в межрайонные центры
обработки информации по электронной почте.
 информация из межрайонных центров передается в РИЦ по
электронной почте.
Межрайонные центры выполняют консультационные функции для МОУО,
осуществляют предварительный контроль полноты и качества получаемых из
МОУО сведений.
Разработаны и опробуются технологии заполнения форм в on-line, но в
полном объеме в условиях Алтайского края это пока не реализуемо из-за
невысокого развития средств электронной связи в отношении ее постоянства и
пропускной способности.
Приводим образец интерфейса программы сбора информации по
книгообеспеченности школ края (аналогичные программы подготовлены по
всем направлениям сбора данных).
Проводится
работа
по
анализу
накопленной
информации.
Постановщиками задач в этом являются методисты РИЦ и специалисты
комитета Администрации Алтайского края по образованию. Результаты
анализа передаются в комитет Администрации Алтайского края по
образованию, МОУО, вузы, используются при подготовке научных публикаций
по проблемам образования.
Пример анализа выполнения заданий ЕГЭ 2004 г. по русскому языку (избранные
задания)
МОУ _____________ средняя общеобразовательная школа
Процент верно
выполненных заданий
Разделы и темы кодификатора
Задание
по
по
по
школе району
краю
Текст. Последовательность предложений в
тексте. Умение строить связное
A1
100,00
91,19
85,68
высказывание.
Характеристика простого предложения
Умение применять лингвистические
A2
50,00
45,91
47,03
знания в работе с языковым материалом.
Характеристика сложного предложения.
Умение применять лингвистические
A3
30,00
39,62
39,01
знания в работе с языковым материалом.
115
Морфологический разбор. Умение
применять лингвистические знания в
работе с языковым материалом.
Алфавит. Умение применять
лингвистические знания в работе с
языковым материалом.
Согласные глухие и звонкие. Гласные
ударные и безударные. Фонетический
разбор. Умение применять
лингвистические знания в работе с
лингвистическим материалом.
Падежные и родовые окончания. Умение
решать орфографические задачи.
Односоставное предложение. Умение
применять лингвистические знания в
работе с языковым материалом.
Осложненное предложение. Умение
применять лингвистические знания в
работе с языковым материалом.
Сложное предложение. Умение
применять лингвистические знания в
работе с языковым материалом.
Понимание содержания исходного
текста.
Правильность фактического материала.
Языковой анализ исходного текста.
Отражение позиции экзаменуемого.
Смысловая цельность и композиционная
стройность.
Точноcть, богатство и выразительность
речи.
Орфографические ошибки.
Пунктуационные ошибки.
Грамматические ошибки.
Лексические ошибки, речевые недочеты.
A4
30,00
35,85
41,94
A5
70,00
80,50
76,71
A6
90,00
90,57
89,15
A7
90,00
91,19
86,70
B5
60,00
48,43
46,83
B6
40,00
37,74
40,99
B7
10,00
8,81
5,08
C1
43,33
37,32
42,76
C2
C3
C4
60,00
30,00
55,00
57,86
28,72
44,03
62,21
26,96
51,81
C5
40,00
41,51
44,48
C6
45,00
38,99
43,49
C7
C8
C9
C10
70,00
50,00
55,00
50,00
49,37
39,62
55,97
50,94
57,22
45,70
66,51
59,75
Учитывая сложившуюся ситуацию можно сказать, что в Алтайском крае
созданы предпосылки для качественного прорыва в области информатизации
процессов управления системой образования. Видится определенное
количество перспектив, в направлении которых необходимо организовывать
активное продвижение в ближайшее время. Это подготовка управленческих и
педагогических кадров в области информатизации, продвижение методик
116
преподавания школьных дисциплин с использованием информационных
технологий, развитие материальной базы и пр. Главное, что в обществе и в
среде управленцев существует понимание данной проблематики и
предпринимаются попытки решения имеющихся проблем.
Часть 9. Авторские права электронных публикаций
Электронные издания пока еще многим библиотекарям и пользователям
непривычны, однако, за последние два года наметилась четкая тенденция роста
их популярности. Сегодня нет необходимости доказывать преимущества
электронных изданий над
бумажными. Это и сохранение площадей в
библиотеке, это и экономичность в издании, когда небольшое количество
людей способно создать электронное издание, используя только компьютер и
сканер. Это экономия в бумаге. Электронные издания легче сохранить от
хищения и порчи.
Производство,
распространение
и использование электронных
документов привело к появлению новых правоотношений в библиотеках.
Развитие автоматизированных информационных центров, электронных
библиотек, служб электронной доставки документов, доступных через
электронную почту, использование Интернет происходит в условиях, когда
правовое обеспечение не соответствует потребностям общества.
Библиотеки стремительно накапливают электронные ресурсы, хотя
потребность в бумажных изданиях не убывает, данный формат пользуется
большой популярностью у всех категорий потребителей услуг библиотек. И в
этом состоянии повышенной информационной нагрузки необходимо
согласовывать информационное и библиотечное законодательство с
гражданским,
уголовно-процессуальным
и
интеллектуальным
законодательством России и международными правовыми актами, прежде
всего с Всемирной (Женевской) конвенцией об авторском праве и Бернской
конвенцией об охране литературных и художественных произведений, 1866 г. с
изменениями и дополнениями 1948, 1967 и 1971 г. Многие положения законов
являются общими для бумажных и электронных публикаций.
Авторское право предполагает охрану прав на результаты
интеллектуального творчества и труда, предполагает защиту имущественных и
неимущественных прав.
Статья 9 "Закона об авторском праве и смежных правах", 1993 г.
устанавливает презумпцию авторства: "Авторское право на произведение
науки, литературы и искусства возникает в силу факта его создания. Для
возникновения и осуществления авторского права не требуется регистрации
произведения, иного специального оформления произведения или соблюдения
каких-либо формальностей. Автор для оповещения о своих правах использует
при желании знак охраны авторского права, который помещается на каждом
117
экземпляре произведения и состоит из трех элементов: латинской буквы "С" в
окружности: (С), имени обладателя исключительных авторских прав, года
первого опубликования произведения. "
Издатель произведения обычно берет на себя оформление и компоновку
рукописей (вставка графических изображений и т.п.), а также оказывает
авторам помощь в переводе на иностранный язык аннотаций и т.п. Поэтому
издатель частично обладает правами на препринт. Например, согласно статье 7
"Закона об авторском праве…" аннотация и перевод являются объектами
авторского права.
Любое произведение, как результат творческой деятельности автора
становится объектом авторского права лишь при условии, что оно выражено в
форме: письменной (рукопись, машинопись и т.д.), устной (публичное
озвучивание) или в другой форме, т.е. произведение должно существовать в
форме, которая отделена от личности автора и стало существовать
самостоятельно. Правовой охраной в равной степени пользуются все
произведения не зависимо проставлен ли на них знак охраны авторского права.
В соответствии со статьей 16 закона РФ "Об авторском праве и смежных
правах" автор имеет личные имущественные и неимущественные права.
Личными имущественными правами автора являются его права на
использование произведения в любой форме и любым способом, которые
включают право на воспроизведение, право на распространение, право на
перевод и т.п.
К личным неимущественным правам в соответствии со статьей 15 закона
относится право на авторство, право на имя, право на обнародование
произведения, включающее право на его отзыв, а также право на защиту
репутации автора.
Таким образом, воспроизведение какого-либо авторского документа в
электронной библиотеке возможно только с согласия автора. В противном
случае нарушаются его личные имущественные и неимущественные права.
Существует мнение, что в Интернет невозможно обеспечить правовую
защиту авторских прав из-за отсутствия ограничений на свободное
копирование и сложности ведения контроля за копированием и использованием
произведений. В законе "Об авторском праве и смежных правах" имеются
ограничения и противоречия, которые не учитывают тенденции развития
Интернет, сдерживают его развитие. Использование Интернет изменил
отношения в балансе треугольника автор-издатель-читатель, необходимость
иметь посредника между автором и пользователем отпадает, а
законодательство по авторскому праву осталось прежним. Права пользователя
по действующему авторскому праву в современных условиях неоправданно
ущемляются, автор в современном обществе конечно же должен иметь доход от
118
продуктов творческой деятельности, но только с первой публикации авторской
работы, а не жить на ренту с однажды созданных произведений. 21 апреля
2004 г. Государственная Дума РФ приняла во втором чтении изменения к
Федеральному Закону "Об авторском праве и смежных правах". Предлагаемые
изменения касаются продления сроков действия авторских прав (с пятидесяти
до семидесяти лет со дня смерти автора), определения авторских прав в сети
Интернет. В целом, принятие поправок должно привести российское
законодательство в этой области в соответствие с международными нормами.
Развитие Интернет, несомненно, должно привести к изменению
концепции авторского права. Интернет - это следствие развития технологий.
Сегодня в цивилизованных странах существуют законодательно
гарантированные права на образование и медицинскую помощь для всех,
включая неимущих. Та же участь ждет и информацию, нынешние объекты
авторского права. Будучи предметом насущной жизненной необходимости, они
станут общедоступными. Тот кто не может себе позволить за информацию
платить, будет получать её бесплатно. В этой ситуации библиотеки, с одной
стороны, обязаны соблюдать права авторов произведений, с другой, обеспечить
широкое использование их произведений, в том числе библиографической
продукции, в целях образования, просвещения и научной деятельности
пользователей. Эти вопросы постоянно возникают в повседневной
деятельности библиотек и имеют юридический и практический характер. Они
еще только изучаются как в отдельных странах, так и на международном
уровне в рамках Европейского Совета, Всемирной организации
интеллектуальной собственности (ВОИС), ИФЛА и др., в той или иной степени
затрагиваются на конференциях и совещаниях, в профессиональной печати.
В рамках ИФЛА разработаны и приняты документы, имеющие
принципиальное значение для функционирования электронных библиотек. Так
на 62-й Генеральной конференции ИФЛА (Пекин, 1996) было одобрено
Заявление ИФЛА по вопросам авторского права в электронной среде, в котором
выражена официальная позиция этой влиятельной международной
библиотечной организации от имени библиотечных и информационных
работников мира. Основные положения этого документа следующие:
Библиотекам принадлежит главная роль в обеспечении доступа к
электронной информации;
На основе Бернской конвенции и других соглашений об авторском праве
необходимо внести в национальное законодательство положения,
обеспечивающие равные возможности использования электронной и печатной
информации, а также закрепить за библиотеками и архивами возможность
перевода в машиночитаемую форму охраняемых авторским правом текстов и
изображений в целях обеспечения их сохранности и консервации.
119
Электронная информация должна быть доступна бесплатно и
беспрепятственно в форме копирования охраняемых авторским правом
документов для личного пользования или культурных и образовательных
целях.
Вопросы свободного доступа к электронной информации отражены также
в новом документе Манифеста ИФЛА об Интернет, принятом 27 марта 2002 г.
На 25 конгрессе Международной ассоциации издателей (Барселона,
Испания, 1996 г.) были утверждены "Рекомендации, содержащие предложения
к издателям и библиотекарям, осуществляющим совместные проекты по
использованию сетевых возможностей для доставки документов и оказания
услуг пользователям", способствующие объединению усилий ученых,
исследователей и общественности в предоставлении информации, охраняемой
авторским правом, не нанося ущерба обладателям авторских прав.
Эти документы являются основополагающими при формировании
библиотечной политики в условиях развития информационного общества в
России.
Правовые аспекты защиты электронных публикаций, предоставляемых в
компьютерных сетях постоянно являются объектом пристального внимания
библиотечных работников на международных конференциях - "Управление
электронными ресурсами библиотек" (Москва, 2000г.), "Электронные
конвергенции: новые информационные технологии в музеях, галереях,
библиотеках и архивах" ЕVA.- 2000 (Москва, 2001) и др.
Производство,
распространение
и использование
публикаций установило иные правоотношения в библиотеках.
электронных
При
формировании
электронных
библиотек,
создании
автоматизированных электронных центров, служб электронной доставки
документов библиотеки устанавливают ответственность и обязанности,
связанные с комплектованием и использованием электронных документов как
специализированных фондов. Возникают вопросы организации и обработки
электронных документов, их учет, система хранения и межбиблиотечного
обмена и др. Возникают вопросы, связанные с использованием и сохранностью
фондов электронных документов. Эти отношения требуют решения правовых,
экономических, технических, технологических вопросов.
При осуществлении библиотечно-информационного обслуживания
пользователей библиографической информацией в электронной среде
устанавливаются обязанности сотрудников библиотеки и пользователей,
направленные на обеспечение конституционного права каждого гражданина на
поиск и получение информации, свободного доступа и использования фондов,
каталогов, картотек, баз и банков данных. Устанавливаются обязанности и
120
ответственность библиотеки за своевременность предоставления потребителю
необходимой библиографической информации и публикаций.
В библиотеке возникают отношения между создателями (авторами)
библиографической
информации
и
пользователями,
библиотекойобладательницей прав на использование этой информации и пользователем.
Библиотека всегда ответственна за создание недоброкачественной, ложной
информации, дезинформации пользователя.
При решении этих вопросов необходимы усилия государства
и
установлении правового режима регулирования отношений, которые
удовлетворяли бы интересы авторов, издателей, библиотекарей и
пользователей.
Эти
правоотношения
регулируются
действующими
федеральными нормативными актами по библиотечному делу и информации,
авторскому праву, хотя и не в полной мере.
В законе РФ "О библиотечном деле", 1994г. среди основных обязанностей
библиотек названы создание автоматизированных баз данных в рамках
федеральных программ сохранения и развития культуры.
Закон РФ "Об участии в международном информационном обмене",
1996г. законодательно признает полноправное участие в нем муниципальных
информационных служб, к которым можно отнести библиотечноинформационные учреждения.
Закон предусматривает договорные отношения между собственниками
(владельцами) библиографической продукции в электронном виде и
пользователями. При этом указано, что сам факт оказания информационной
услуги не создает для последнего право авторства на полученную
документированную информацию. Этим законом также предусмотрен
механизм правового регулирования-лицензирование деятельности библиотек
по международному информационному обмену
Закон РФ "Об информации, информатизации и защите информации",
1995г. в IV главе касается деятельности библиотек, связанной с созданием и
использованием БД и электронных каталогов и картотек. В этом законе
определено, что права авторства и право на информационные системы,
технологии и средства их обеспечения могут принадлежать разным лицам,
являющимся разработчиками средств обеспечения автоматизированных
информационных систем, баз и банков данных, их сетей, иных
информационных технологий. Библиотека-собственник информационной
системы, технологии и средств их обеспечения обязана защищать права их
авторов в соответствии с законами РФ" Об авторском праве и смежных
правах" и "О правовой охране программ для электронных вычислительных
машин и баз данных",
1992г. Электронные публикации подпадают под
действие сразу двух законов.
121
Впервые правовая охрана программного обеспечения ЭВМ в Российской
Федерации была введена Основами гражданского законодательства в 1991 г.,
когда программы для ЭВМ и базы данных стали объектом авторского права и
были приравнены к произведениям литературы и им присущи традиционные
принципы авторского права.
Закон РФ "О правовой охране программ …" регулирует специфику
использования и взаимоотношений собственника и пользователей. "Если
программа для ЭВМ или база данных созданы совместной творческой
деятельностью двух и более физических лиц, то независимо от того, состоит ли
программа для ЭВМ или база данных из частей, каждая из которых имеет
самостоятельное значение, или является неделимой, каждое из этих лиц
признается
автором
такой
программы
для
ЭВМ
или
базы
данных…Имущественные права на программу для ЭВМ или базу данных,
созданные в порядке выполнения служебных обязанностей или по заданию
работодателя, принадлежит работодателю, если в договоре между ним и
автором не предусмотрено иное. " При этом письменная форма договора
является обязательным условием. Этот закон определяет механизм правового
регулирования отношений, возникающих между обладателем прав на
программы и базы данных и пользователями на основе государственного учета
и регистрации, стандартизации и сертификации. Специальное законодательство
регламентирующее текстовую информацию, предоставляемую в электронных
сетях, в России до настоящего времени отсутствует.
Процесс разработки и совершенствования законодательства значительно
отстает от бурного развития и внедрения новых информационных технологий и
не позволяет оперативно решать возникающие вопросы. Поэтому российские
библиотеки стараются самостоятельно регулировать правоотношения,
касающиеся авторских прав и предоставления пользователям электронной
библиотеки текстовых документов на основе договоров или лицензионных
соглашений с авторами и правообладателями.
Однако отсутствие стандартов, устанавливающих единые требования к
средствам воспроизведения информации на электронных носителях, обработке,
хранению, доступу и предоставлению электронных документов в сетях,
значительно затрудняет развитие этих отношений. Разработку таких стандартов
только планируется начать в рамках Системы стандартов по информации,
библиотечному и издательскому делу (СИБИД).
Урегулирование правоотношений, касающихся авторских прав и
предоставления пользователям ЭБ текстовых документов, библиотеки решают
на основе договоров или лицензионных соглашений с авторами и
правообладателями.
122
Особенно остро в последнее время встают вопросы авторского права при
создании электронных библиотек диссертаций. Библиотеки самостоятельно
разрабатывают механизм регулирования этих правоотношений, анкетируя
авторов и заключая с ними договоры, в которых определяются права авторов
диссертаций и права библиотеки на их использование и предоставление в
электронную библиотеку.
Российская государственная библиотека (РГБ) имеет богатый опыт
работы с авторами при создании электронной библиотеки диссертаций (См. в
прил. образец Авторского договора).
Библиография:
1.ГОСТ 7.73-96
Поиск и распространение информации. Термины и определения. — Утв.
1996. — Взамен ГОСТ 7.27—80. — (Система стандартов по информации,
библиотечному и издательскому делу).
http://www.bibliography.ru/method/gosts/7-73/7_73.htm
2.Армс. Вильям И. Цифровые библиотеки.
http://www.rsuh.ru/dl/zaglavlnaya.htm
3.Ермаков А.Е. Проблемы полнотекстового поиска и их решение // Мир
ПК. – 2001. – N 5.
4.Липинский Г.В. Russian Context Optimizer: путь к возможностям Oracle
interMedia в русскоязычных базах данных: Доклад на XII конференции
АПО/ROUG, 1 сентября 2000 г.
5.Материалы международных конференций «Крым-2000», «Крым-2001»,
«Крым-2002».
http://www.gpntb.ru/win/inter-events/
6.Материалы научного электронного журнала «Электронные библиотеки”
за 2000-2002 годы.
http://www.iis.ru/el-bib/
7.Степанов В. Интернет в профессиональной
деятельности. Интерактивный учебник.
http://www.libs.ru/materials/textbook/index.html
123
информационной
Список рекомендуемой литературы
1.Российский коммуникативный формат. В помощь разработчикам
программного обеспечения/ http://www.rba.ru:8101/rusmarc/
2.Антопольский А. Б. Системы метаданных в электронных библиотеках
http://www.gpntb.ru/win/inter-events/crimea2001/tom/sec4/Doc5.HTML
3.Волохин О. М. Технологическая модель построения информационного
портала библиотеки с использованием метаданных Dublin Core // НТБ. – 2004. № 3. – С. 22-35.
4.Руш-Фейа Д. Международные инициативы в области метаданных —
последние
достижения.
http://www.rsl.ru/tacis/2000/200004/rusch-feja/ruschfeja.ru.html
5. Шварцман М.Е., Ильин А.С. Dublin Core в коробке. http://www.iis.ru/elbib/2000/200002/SI/si.ru.html
6. Шварцман
М.Е.
Метаданные
http://www.iis.ru/events/19990616/shvar.ru.html
и
Интернет.
7.The Organization of Information./Arlene G. Taylor -Englewood, Colorado:
Libraries Unlimited, Inc., 1999.6. Information Architecture for the World Wide
Web./Louis Rosenfeld and Peter Morville, Cambridge: O'Reilly, 1998.
8. ISO 2709 - 1981: Документация - Формат
библиографической информацией на магнитной ленте.
для
обмена
9. Michael Day, 6.2 Mapping Dublin Core to UNIMARC. In: Format
conversion feasibility, ed. Rachel Heery. BIBLINK Project Deliverable D4.1, 15
September 1997./http://hosted.ukoln.ac.uk/biblink/wp4/d4.1/doc0006-1.html9. IFLA
Universal Bibliographic Control and International MARC Core Programme,
UNIMARC: an introduction./ http://www.ifla.org/VI/3/p1996-1/unimarc.htm10.
IFLA Universal Bibliographic Control and International MARC Core Programme.
UNIMARC manual: bibliographic format. 2nd ed., with update 1. UBCIM
publications,
n.s.,
vol.
14.
Munchen:
K.G.
Saur,
1996./
http://www.ifla.org/VI/3/p1996-1/concise.htm
10.Arms W.Y. Digital Libraries (перевод Арнаутова С.А.)
11.Dublin Core Metadata for Resource Discovery
http://www.faqs.org/rfcs/rfc2413.html;
текстовая
http://www.faqs.org/rfc/rfc2413.txt
124
—
RFC 2413.
версия
12.Dublin Core Qualifiers (DCMI recommendation,
http://purl.org/dc/documents/rec/dcmes-qualifiers-20000711.htm
125
2000-07-11).
Приложение 1
АВТОРСКИЙ ДОГОВОР
г. Москва
"
"
200 г.
(Ф.И.О.)
именуемый в дальнейшем "Автор", с одной стороны, и Российская государственная
библиотека,
именуемая
в
дальнейшем
"Библиотека",
в
лице
___________________________ ________ _______ . действующего на основании Устава, с
другой стороны, заключили настоящий договор о нижеследующем;
1.
Предмет договора
Автор предоставляет Библиотеке права на включение в электронную библиотеку
диссертаций и авторефератов РГБ как полнотекстовую базу данных (ненужное зачеркнуть):
своей кандидатской/докторской диссертации,
автореферата своей диссертации,
на тему (вписать): ____________________ _ ____ _____„„ _____ ___ ___ _____
именуемого(ш, ых) в дальнейшем "Диссертация/Автореферат", и использование
воспроизведенного
в
электронной
форме
материала
в
обусловленных
настоящим
договором
пределах
и
на
неопределенный
срок,
начиная
с
___________ ____ (дата).
2.
2.1.
Права и обязанности сторон
По настоящему договору Автор предоставляет Библиотеке следующие права:
2.1 I. Изготовление электронных копий Диссертации/Автореферата или
их частей;
2 1.2 Предоставление электронной копии Диссертации/Автореферата (ненужное
зачеркнуть):
в открытом доступе на сайте Библиотеки в сети Интернет как части
полнотекстовой базы данных электронной библиотеки диссертаций! в
режиме «только чтение»; для доступа только читателям Библиотеки в
рамках полно-текстовой базы данных электронной библиотеки
диссертаций в режиме «только чтение»:
для доступа только персоналу Библиотеки и специалистам ВАК в электронном
депозитарном хранилище Библиотеки.
2.1.3 Предоставление электронных копий Диссертации/Автореферата или
отдельных частей Диссертации/Автореферата ио заказам на платной основе,
126
2.1.4
Копирование частей Диссертации/Автореферата на бумажный носитель и
предоставление копий отдельных частей на бумажном носителе по заказам на
платной основе;
2.1.5. Дополнительные права.
2.2.Автор сохраняет за собой право использовать самостоятельно
или предоставлять аналогичные права на использование
Диссертации/Автореферата третьим лицам.
2.3.{Заполняется в случае передачи Автором в Библиотеку
электронной версии Диссертации/Автореферата)
Автор передает Библиотеке файл(ы), содержащий(е) (ненужное
зачеркнуть):


полную электронную версию Диссертации/Автореферата,
неполную электронную версию Диссертации/Автореферата
в формате(ах) (указываются форматы) на дискете, по электронной
почте (ненужное зачеркнуть, электронный адрес отправителя
указать) и гарантирует идентичность переданного полного текста
Диссертации/Автореферата или всех переданных ее (его, их)
частей печатной(ым) версии(ям) Диссертации/Автореферата,
поступившей(ему, им) на хранение в Библиотеку.
2.4. Библиотека обязуется отчислять Автору 10% от суммы,
вырученной от продажи электронных копий по безналичному
расчету.
3. Ответственность сторон
3.1. Ответственность Сторон определяется а соответствии с
действующим законодательством РФ.
4. Конфиденциальность
4.1. Условия настоящего договора конфиденциальны и не
подлежат разглашению.
5. Разрешение споров
5.1.Все споры и разногласия, которые могут возникнуть между
сторонами по вопросам, не нашедшим своего разрешения в тексте
данного договора, будут разрешаться путем переговоров на основе
действующего законодательства и обычаев делового оборота.
5.2.При неурегулировании в процессе переговоров спорных
вопросов споры разрешаются в судебном порядке.
6. Срок действия договора
127
6.1. Настоящий договор вступает в силу с момента подписания и
действует бессрочно.
7. Расторжение договора
7.1.Стороны вправе расторгнуть договор по взаимному
письменному соглашению.
7.2.Библиотека вправе расторгнуть договор в случае, если на
момент его заключения Автор не обладает вышеперечисленными
правами на предмет договора или переданная в Библиотеку электронная версия Диссертации/Автореферата не соответствует
печатной версии, поступившей в Библиотеку на хранение.
8. Заключительные положения
8.1.8о всем остальном, что не предусмотрено настоящим
договором,
стороны
руководству
ются действующим законодательством.
8.2.Любые изменения и дополнения к настоящему договору
действительны при условии, если они совершены в письменной
форме и подписаны сторонами или надлежаще уполномоченными
на то представителями сторон.
8.3.Все уведомления и сообщения должны направляться в
письменной форме.
8.4.Договор составлен в двух экземплярах, из которых один
находится у Автора, второй - у Библиотеки.
8.5.Адреса и реквизиты сторон:
Подписи сторон:
Автор:
Библиотека
В случае пересылки автором договора по почте подпись автора
заверяется отделом кадров по его месту работы.)
128
Учебно-методическое пособие
Создание электронной библиотеки образовательного учреждения
Отв. за выпуск –
Редактор
Корректор
Компьютерная верстка – Д.П.Тевс
Подписано в печать
Объем
Тираж
Отпечатано
129
Download