Лингвистическое обеспечение АБИС

advertisement
Основные виды библиотечных каталогов
Отражающие
формальные
признаки:
- алфавитный
- хронологический
- нумерационный
- географический
- топографический
Отражающие
содержательные
признаки:
- систематический
- предметный
- региональный
(страноведческие,
краеведческие)
Отражающие различные
виды документов:
- книг
- нотных изданий
- диссертаций
- картографических
произведений
- редких изданий
- изоизданий
- патентов
- стандартов и др.
ЯБО, ББК, УДК, МПК, КГС, АПК, рубрикаторы, классификаторы и др.
Период
Термин
1960-1970 гг.
ИПЯ
1970-1980 гг.
Лингвистические средства
1980 - наст. время
Лингвистическое обеспечение
Воройский Ф.С, 2001
Захаров В.П., 2002
Состав ЛО АС
Состав ЛО
документальной ИПС
1. Языковые средства:
1.1. Алфавит и
микросинтаксис
1.2. Язык
библиографических
данных
1.3. классификационные
языки
1.4.Дескрипторные и
другие
посткоординатные
языки
1.5. Объектнопризнаковые языки
1.6. Языки запросов и
манипулирования
данными
2. Средства поддержки
ЛО:
2.1. Лингвистические
процессоры
2.2. Лингвистический
банк данных
2.3. Нормативная,
конструкторская и
технологическая
документация,
2.4. Служба ведения
языковых средств
1.
ИПЯ
1.1. Предкоординатные
1.2. Посткоординатные
1.3. Составные части
ИПЯ
2. Методы
индексирования
3. Языки запросов
4. Языки описания
данных
4.1. Языки
библиографического
описания
4.2. Машинные
библиографические
форматы
4.3. Нормирование в
языках
библиографического
описания (авторитетный
контроль)
5. Языки представления
электронных
документов
6. Языки метаданных.
Дублинское ядро (Dublin
Core)
7. Модели поиска
Антопольский А.Б.,
Зайцева Е.М., , 2004
2003
Состав ЛО электронных Лингвистическое
библиотек
обеспечение АБИС
1. ИПЯ
2. Системы метаданных
3. Классификационные
языки
4. Вербальные языки
5. Фактографические
(объектнопризнаковые)языки
6. Лингвистические
процессоры
6.1. Системы
автоматической
обработки текста
6.2. Лингвистические
банки данных
1. Информационные
языки
2. Лингвистические
процессоры
3. Словари
4. Авторитетные
файлы
Лавренова О.А., 2008
Состав ЛО электронных
каталогов и электронных
библиотек
1. Форматы представления
электронных данных:
библиографических,
авторитетных/ нормативных,
классификационных,
фондовых, «официальных»
2. Языки разметки текстовых
данных
3. Авторитетные/нормативные
данные (файлы)
4. Средства тематического
поиска
4.1.Свободные ключевые
слова
4.2. Перечни ключевых слов
4.3. Тезаурусы
4.4. Предметные рубрики
(предметные классификации)
4.5. Иерархические
классификации
4.6. Рубрикаторы
4.7. Имитация тематического
поиска
4.8. Полнотекстовый поиск с
лингвистическими
процессорами и без них
5. Правила и алгоритмы
применения указанных
средств для обработки данных
 Упование на возможности компьютеров в области
семантической обработки и поиска информации.
 Отказ от создания и ведения дорогостоящих ИПЯ,
располагающих средствами нормализации и контроля
лексики.
 Сомнение в необходимости развития систем классификации
и совершенствовании методик индексирования.
 Забвение базового постулата теории ИПЯ – необходимости
формализации процедуры поиска информации из-за
воздействия избыточности, синонимии и многозначности
естественного языка.
 Переход к поиску информации по ключевым словам
естественного языка.
 Отсутствие четких рекомендаций относительно оптимального
(необходимого и достаточного) состава лингвистических средств, в
частности, относительно выбора состава однотипных ИПЯ.
 Отсутствие единого подхода к комплексному использованию ИПЯ
в
ЭК
на
принципах
целостности,
взаимодополнения,
функциональной дифференциации используемых лингвистических
средств, особенно
в условиях
ведения ЭК
в условиях
корпоративной каталогизации.
 Слабое осознание специфики электронной среды и взаимосвязи
средств лингвистического и программного обеспечения АБИС.
 Не разработанность методик индексирования
меняющейся информационной среды.
в
условиях
 Неоправданное разнообразие лингвистических средств, усложняющих
доступность и комфортность использования электронных каталогов,
увеличивающих временные и интеллектуальные затраты на овладение
ими разных правил работы с ними в разных библиотеках.
 Отсутствие средств помощи конечным пользователям электронного
каталога в использовании лингвистических средств.
 Неоправданное
забвение
возможностей
иерархических
классификационных ИПЯ при организации электронного каталога:
отсутствие обозримости перечня основных классов вниз по
иерархической цепочке, от широких, обобщающих делений – к узким;
отсутствие АПУ.
 Превращение
иерархических
классификаций
в
атрибут
внутрибиблиотечной технологии, «тайный» инструмент библиотекаря,
скрытый от глаз читателя.
 Отказ от иерархических классификаций как средств навигации в
предметной области.
Лингвистические средства – это собирательное
понятие, не имеющее пока четких границ.
Под лингвистическими средствами понимается
совокупность ИПЯ, методов индексирования,
методов формализованного представления
данных, языков взаимодействия с системой.
Лингвистическое обеспечение АБИС – это
обеспечивающая подсистема, представляющая
собой совокупность лингвистических средств,
средства и методы их создания, ведения,
использования и контроля, предназначенная для
эффективной реализации важнейших функций
АБИС: комплектования, обработки документов,
запросов и фактов, ведения электронного
каталога, обслуживания пользователей, учета,
статистики и управления.
Компонентная часть
1.Лингвистические средства
1.1. ИПЯ
1.2. Методы индексирования
1.3. Методы формализованного
представления данных: аспектный
(матричный, формулярный, анкетный)
способ, метод стандартных фраз и т.п.
1.4. Языки взаимодействия с системой
Функциональная часть
1. ЛО подсистемы комплектования
2. ЛО подсистемы обработки
документов
3. ЛО подсистемы ведения
электронного каталога
4. ЛО подсистемы обслуживания
пользователей
5. ЛО подсистемы учета, статистики и
управления
2. Средства и методы создания,
ведения, использования и контроля 6. ЛО подсистемы взаимодействия
конкретной АИС с другими
лингвистических средств
(внешними) информационными
2.1. Форматы представления данных в
системами
машиночитаемой форме
2.2. Нормативно-справочная база
2.3. Лингвистические процессоры
2.4. Рабочие средства
Лингвистическое
обеспечение
информационных систем
Лингвистические средства
Информационнопоисковые языки и/или
элементы ИПЯ
Методы и методики
индексирования
Методы
формализованного
представления данных
Языки взаимодействия с
системой
Средства и методы, определяющие
правила их создания, ведения,
использования и контроля.
Форматы представления
данных
Лингвистические процессоры
Нормативно-справочная база
Рабочие средства,
необходимые для обработки,
систематизации, поиска и
хранения информации.
Тип ИПЯ
Методы и методики индексирования
ИПЯ предкоординатного типа, включая
иерархические классификации (ДКД,
УДК, ББК, МПК, ГРНТИ,
классификаторы, рубрикаторы и др.)
Метод и методики систематизации
ИПЯ предкоординатного типа, включая
алфавитно-предметную
классификацию или язык предметных
рубрик
Метод и методики предметизации
Фасетная классификация
Категорийный анализ, фасетный
анализ
ИПЯ координатного типа, включая язык Метод и методики координатного
ключевых слов, дескрипторный ИПЯ
индексирования
Объектно-признаковый ИПЯ (ОПЯ)
Метод и методики фактографического
индексирования
Метод и методики составления
Язык библиографического описания как
библиографического описания
разновидность ОПЯ
документов
1. Языки разметки текста (HTML, XML, WML,SGML и др.)
2. Языки сценариев (JavaScript, BScript; ASP, Perl, PHP и др.)
3. Язык манипулирования данными или язык управления
данными, (от анг. Data manipulation language, DML)
например SQL
4. Языки поисковых запросов
5. Языки диалога (разговорные языки, диалоговые языки,
языки пользовательского интерфейса, языки интерфейса)
№
Информационная задача (Причина)
Используемый
специализированный
искусственный язык
(Следствие)
1. Создание
баз
данных,
в
частности,
необходимость получения, вставки, удаления
или изменения данных
SQL
2. Развитие технологии гипертекста и гипермедиа,
необходимость верстки или разметки структуры
сайта Разработка Web-страниц или документов
HTML. можно добавлять и форматировать
элементы документа.
Разработка электронных ресурсов (электронных
документов, электронных коллекций, сайтов)
HTML, XML
3. Обеспечение интерактивности веб-страниц.
4. Поиск в Интернете
JavaScript
Perl, PHP и др.
Язык поисковых
запросов
Тип специализированного
искусственного языка
Язык манипулирования данными
Язык баз данных
Информационно-логический язык
Язык программирования.
Язык разметки
Семантический язык разметки
текста
Компьютерный язык
Высокоуровневый язык
программирования
Язык сценариев
Сценарный (скриптовый) язык
Язык веб-программирования
Язык программирования общего
назначения
Язык регулярных выражений
5. Создание комфортной среды для работы Язык пользовательских Язык
диалога
пользователя,
развитие
пользовательских
интерфейсов
компьютер»
интерфейсов
«человек-
№
Средства и методы создания, ведения, использования и контроля лингвистических
средств
1
Форматы представления данных в машиночитаемой форме (MARC, UNIMARC, RUSMARC)
Системы метаданных (Дублинское ядро - Dublin Соге)
2
Нормативно-справочная база:
- справочные издания (нормативные терминологические словари, специализированные
справочники)
- нормативные документы (ГОСТы, Положения и др.)
- инструктивные документы (инструкции и правила)
3
Лингвистические процессоры:
- Словарные БД (БД ГРНТИ, УДК, ДКД, ББК, тезаурусов, БД авторитетных записей, БД
грамматических словарей и т.п);
- процессоры транслитерации, трансляции ПОДов с одних языков индексирования на другие,
автоматического перевода элементов записей документов, индексирования запросов
пользователей;
- грамматические процессоры типа процедур отсечения окончании или идентификации
словоформ одного слова;
- словарные процессоры, т.е. средства автоматизированного ведения словарей (например,
процессор словарно-грамматической фильтрации слов, процессор тезаурусной фильтрации
терминов).
4
Рабочие средства:
- правила транслитерации знаков языка
- таблицы соответствия
Заболеева-Зотова А.В.,
Камаев В. А.
Лингвистическое обеспечение
автоматизированных систем :
учебное пособие для студентов
вузов .- М, 2008. - 245 с.
Рассмотрены вопросы теории
формальных языков и методов
синтаксически-ориентированной
трансляции автоматных и
контекстно-свободных языков.
Тенишев, Д. Ш.
Лингвистическое и
программное обеспечение
автоматизированных систем :
учеб. Пособие .- СанктПетербург, 2010. – 408 с.
Описаны современные технологии
разработки программных систем и
трансляции языков высокого уровня,
характеризуются основные концепции
объектно-ориентированного
программирования с использованием
языка С++, базовые и специфичные
для автоматизированных систем
(САПР, АСУ) структуры данных и
алгоритмы.
Технологический процесс
Используемые ИПЯ и/или их элементы
Комплектование библиотечного фонда
ЯБО, ББК, ГРНТИ, ДКД, УДК, КПА, ОКС, МПК, МКС,
языки идентификаторы, элементы ОПЯ,
Прием и учет поступивших документов
ЯБО, элементы ОПЯ, языки идентификаторы
Библиотечная
обработка
документов. ЯБО, ББК, УДК, КПА, ОКС, МПК, МКС, АПК, языки
Организация и ведение каталогов;
идентификаторы, элементы ОПЯ
Работа с фондом
ББК, УДК, КПА, ОКС, МПК, МКС,
Обслуживание читателей
ЯБО, ББК, ГРНТИ, УДК, КПА, ОКС, МПК, МКС, АПК, язык
ключевых слов, ДИПЯ, элементы ОПЯ
Обслуживание
по
абонементу (МБА)
межбиблиотечному ЯБО, ББК, УДК, ГРНТИ, КПА,ОКС, МПК, МКС, АПК, языки
идентификаторы, язык ключевых слов, элементы ОПЯ
Массовая работа
ББК, УДК, ГРНТИ, АПК, КПА, язык ключевых слов
Справочная и информационная работа
ЯБО, ББК, ДКД, УДК, ГРНТИ, КПА, ОКС, МПК, МКС, АПК,
языки идентификаторы, элементы ОПЯ, язык ключевых
слов, дескрипторный ИПЯ
Исследовательская работа
ББК, УДК, ГРНТИ, КПА, АПК, ОКС, МКС, ОПЯ, ЯБО, язык
ключевых слов
Методическая работа
ББК, УДК, ГРНТИ, КПА, АПК, ОПЯ, ЯБО, язык ключевых
слов
Работы научно-организационного характера
ОПЯ, язык ключевых слов
Работа по организации труда и управлению
ОПЯ, языки идентификаторы
Тип информационного
запроса
Адресно-библиографический
Используемые ИПЯ
преимущественно
Язык библиографического
описания
дополнительно
Объектно-признаковый
язык, языки
идентификаторы, языки
международных
стандартных номеров
На уточнение
Язык библиографического
библиографического описания описания
Комплекс ИПЯ
Тематический
Классификационные ИПЯ
Дескрипторные ИПЯ
Фактографический
Объектно-признаковый язык
Дескрипторный ИПЯ,
классификаторы, языки
идентификаторы, языки
международных
стандартных номеров
Аналитический
Комплекс ИПЯ
Номер
нормы
Наименование процесса, операции.
Состав работы
Комментарий
3.8. Справочная и информационная работа
3.8.2. Библиографическое информирование. Подготовка бюллетеня новых поступлений
41-45
Уточнить
(определить)
тематические
границы поиска и отбора документов.
Создать рубрикатор бюллетеня. Выявить и
отобрать документы в массиве текущих
поступлений
источников
информации.
Подобрать
аннотации,
рефераты,
засистематизировать их.
Требуется
один
или
несколько
классификационных
ИПЯ,
из
числа
рекомендованных ГОСТ 7.59-2003 (ББК, ГРНТИ,
ДКД, УДК, КПА, ОКС, МПК, МКС) и используемых
в данной библиотеке. Необходимо знание
технологии
создания
лексико-семантической
основы ИПЯ для разработки рубрикатора, а
также владение методикой систематизации.
3.8.3. Информационная работа
Подготовка ретроспективных научно-вспомогательных библиографических указателей
7.
Составить
аннотированный
библиографический
указатель
многоотраслевого
содержания
с
хронологическим охватом до 100 лет и
более,
...
требующий
сложных
библиографический разысканий, учета всех
переизданий
публикаций
и
их
характеристики путем сличения текстов.
Требуется использование всего комплекса ИПЯ,
включая
универсальные и политематические
иерархические классификационные ИПЯ, языкиидентификаторы, ЯБО, и др.
 Системности: представлены все основные виды лингвистических
средств, используемых как в традиционной, так и в
автоматизированной библиотечно-информационной технологии,
учтены специфические особенности реализации лингвистического
обеспечения в условиях электронной среды;
 Технологичности: анализ и характеристика лингвистических
средств осуществляется в неразрывной связи с технологическими
процессами, реализуемыми в современных библиотеках и
информационных службах;
 Интегративности: содержание учебника строится на интеграции
знаний библиотечно-библиографических дисциплин, информатики,
логики, семиотики, языкознания, прикладной лингвистики;
 Унификации структуры представления учебного материала в
целях облегчения его восприятия: характеристика всех
рассматриваемых ИПЯ осуществляется по единой логической
схеме.
Цель: дать целостное, системное представление о составе, структуре
и назначении лингвистических средств библиотечно-информационной
технологии и лингвистического обеспечения АБИС.
Задачи:
 изложение теоретических и технологических основ создания и
ведения лингвистических средств библиотечно-информационной
технологии и лингвистического обеспечения АБИС;
 формирование профессиональных компетенций обоснования и
выбора адекватных лингвистических средств для реализации
библиотечно-информационной технологии и лингвистического
обеспечения АБИС;
 выявление специфики лингвистического обеспечения библиотек в
условиях электронной среды;
 представление
широкого
спектра
областей
применения
лингвистических
средств
в
библиотечно-информационной
деятельности.
Предисловие
Введение
Раздел 1. Информационно-поисковые языки (ИПЯ): назначение,
структура и принципы построения
Глава 1. Представление о знаковой природе и типологии языков
1.1. Язык как знаковая система
1.2. Естественные и искусственные языки
1.3. Причины создания ИПЯ. Требования, предъявляемые к ИПЯ
Глава 2. ИПЯ как разновидность искусственных языков:
структура и технология создания
2.1. Алфавит и лексика ИПЯ
2.2. Термины – основа лексики ИПЯ
2.3.Парадигматические отношения в ИПЯ
2.4.Синтагматические отношения в ИПЯ
2.5. Технология создания лексико-семантической основы ИПЯ
Раздел 2. Основные типы ИПЯ
Глава 3. Иерархические классификационные ИПЯ , применяемые
в библиотеках
3.1. Представление о классификации и типологии ИПЯ
3.2. Иерархические классификации: принципы построения и
отличительные особенности
3.3. Структура иерархических классификаций как ИПЯ
3.4. Десятичная (децимальная) классификация Дьюи (ДКД)
3.5. Универсальная десятичная (децимальная) классификация (УДК)
3.6. Библиотечно-библиографическая классификация (ББК)
Глава 4. Иерархические классификационные ИПЯ, применяемые в
органах информации, издательствах, книготорговых
организациях, архивах и музеях.
4.1. Патентные классификации. Международная патентная
классификация (МПК)
4.2. Рубрикаторы. Государственный рубрикатор научно-технической
информации (ГРНТИ)
4.3. Классификатор правовых актов
4.4. Классификаторы стандартов. Межгосударственный классификатор
стандартов (МКС)
4.5. Иерархические классификационные ИПЯ в книготорговой и
книгоиздательской сфере
4.6. Иерархические классификационные ИПЯ в архивном и музейном
деле
Глава 5. Неиерархические классификационные ИПЯ
5.1. Иерархические и неиерархические классификации:
сопоставительный анализ структуры, преимущества и ограничения
5.2. Алфавитно-предметная классификация
5.3. Фасетная классификация
5.4. Классификаторы технико-экономической и социальной
информации как фасетизированные иерархические
классификационные ИПЯ
5.5. Общероссийские классификаторы в единой системе
классификации и кодирования
Глава 6. Дескрипторные ИПЯ
6.1. Общая характеристика дескрипторных ИПЯ. Язык системы
«Унитерм» как прообраз дескрипторного ИПЯ.
6.2. Структура и принципы построения дескрипторных ИПЯ
6.3. Тезаурус как способ систематизированного представления знаний
и разновидность идеографического словаря
6.4. Информационно-поисковые тезаурусы: назначение, структура и
порядок разработки
6.5. Виды и функции информационно-поисковых тезаурусов
6.6. Эволюция взглядов на информационно-поисковые тезаурусы в
эпоху Интернет
Глава 7. Объектно-признаковые языки
7.1. Объектно-признаковые ИПЯ как средство поиска
фактографической информации
7.2. Язык библиографического описания как ИПЯ объектнопризнакового типа
7.3. Системы и стандарты метаданных: Dublin Core, MARC, ONIX
7.4. Языки идентификаторы. Языки международных стандартных
номеров (ISBN, ISSN, ISRN, ISMN, ISRC)
Глава 8. Причины многообразия ИПЯ и тенденции их развития
8.1. Многоаспектная классификация ИПЯ. Функции ИПЯ
8.2. Факторы, обусловившие многообразие ИПЯ
8.3. Проблемы взаимодействия и совместимости ИПЯ
Раздел 3. Использование лингвистических средств при
реализации библиотечно-информационной технологии
Глава 9. Индексирование как способ реализации ИПЯ
9.1.Индексирование: сущность и назначение, требования и факторы
9.2. Виды индексирования
9.3.Технология индексирования
9.4. Качество индексирования и ресурсные возможности библиотеки
Глава 10. Лингвистические средства в структуре основных
технологических процессов, выполняемых в библиотеках
10.1. Анализ лингвистических средств библиотечно-информационных
технологий
10.2. Лингвистические средства электронного каталога
10.3. Использование лингвистических средств при производстве
информационных продуктов и услуг
Заключение
Список литературы
Список принятых сокращений
Предметный указатель
Электронные презентации
 Стихийность и отсутствие координации в разработке и
применении лингвистических средств.
 Эмпирический характер разработки
средств и разрыв научных традиций.
лингвистических
 Закрытый характер лингвистических средств
исследователя: невозможность их анализа и оценки.
для
Глава 1. Лингвистические средства и лингвистическое обеспечение
информационных систем с позиций исторического и структурнофункционального подходов
Глава 2. Лингвистические средства современных информационных систем
Глава 3. Причины многообразия ИПЯ и тенденции их развития
Глава 4. Лингвистические средства, применяемые в библиотеках
Глава. 5. Лингвистические средства, применяемые в архивах
Глава. 6. Лингвистические средства, применяемые в музеях
Глава. 7. Лингвистические средства, применяемые в издательствах и
книготорговых организациях
Глава. 8. Лингвистические средства, применяемые в автоматизированных
информационных системах федеральных и отраслевых информационных
центров
Почтовый адрес:
Россия, 650029, Кемерово,
ул. Ворошилова, 17
Тел., факс: (384-2) 35-96-15
http://nii.kemguki.ru
E-mail: nii@kemguki.ru
Download