Библиометрический анализ информации в базах данных и

advertisement
БИБЛИОМЕТРИЧЕСКИЙ АНАЛИЗ ИНФОРМАЦИИ В БАЗАХ ДАННЫХ
И ЭЛЕКТРОННЫХ КАТАЛОГАХ БИБЛИОТЕК С ИСПОЛЬЗОВАНИЕМ
УДК И ГРНТИ
Ефременкова В.М., Крючкова Е.А., Старцева О.Б. (ВИНИТИ РАН)
1. Введение
Для библиотечной и информационной науки особую актуальность в настоящее время
приобретает возможность анализа содержания и структуры классификационных систем,
которая зависит от состояния технических и технологических возможностей. Одним из
важнейших качественных признаков классификационной системы является стабильность
на протяжении длительного времени без существенных изменений структуры и
содержания. Это позволяет организовать процесс ее изучения на уровне общих принципов
и
устойчивых
базовых
характеристик,
применяя
библиометрические
методы
исследования. До сих пор библиометрические методы тематического анализа публикаций
использовались лишь информационными системами разных стран, каждая из которых
имеет в различной степени развитую систему классификации.
УДК
–
единственный
международный
инфомационно-поисковый
язык,
используемый различными субъектами информационного рынка. По УДК работают
крупнейшие библиотеки, его широко используют издатели, менеджеры при определении
объемов и ассортимента книжного рынка. УДК может служить универсальным
навигатором для поиска нужной литературы в книжных магазинах и книжных ярмарках в
силу простоты построения основной классификационной таблицы УДК по отраслям
знания.
Все ведущие информационные центры мира имеют свои системы классификации
не связанные друг с другом. Сопоставление различных классификационных систем
представляет огромные трудности. Здесь УДК может помочь пониманию особенностей
тематического
содержания
различных
БД,
используя
таблицы
соответствия
классификаторов БД и УДК.
2. Практика индексирования документов с помощью таблиц УДК
в международных БД
Практика использования УДК информационными центрами принята лишь
Японским информационным центром – Japanese Information Center of Science and
Technology (JICST) и Российским информационным центром – ВИНИТИ.
По УДК индексируются все публикации, отражаемые в 5 фрагментах БД ВИНИТИ:

Информатика,

Математика

Издательское дело и полиграфия,

География,

Геология.
В Государственном рубрикаторе научно-технической информации (ГРНТИ) для
всех рубрик 1-3 уровней приводятся индексы УДК, которые могут использоваться как
справочные при индексировании документов.
С 1969 г. при формировании РЖ/БД «Математика» стала использоваться
классификация УДК, при всех последующих изменениях классификатора РЖ/БД
ВИНИТИ «Математика» разрабатывались таблицы соответствия между УДК и
Рубрикатором информационных изданий ВИНИТИ.
3. Индексирование документов с помощью таблиц УДК в ВИНИТИ
3.1 Поиск документов в БД ВИНИТИ по рубрикам ГРНТИ и кодам УДК
Для индексирования содержания документа по рубрикатору ГРНТИ используется
одна
рубрика,
если
публикация
посвящена
одной
проблеме;
для
отражения
многоаспектности указывается несколько кодов, каждый из которых соответствует
различным узко-тематическим направлениям данной работы.
Поиск по кодам УДК значительно сложнее из-за присутствия в многопрофильных
кодах различных определителей и знаков, уточняющих содержание документа. В
поисковой системе ВИНИТИ, к сожалению, не предусмотрен поиск по сложным
индексам, типа определителей места, формы и др.
Приведем
пример
поиска
документов
по
кодам
УДК
в
БД
ВИНИТИ
«Информатика» 2009 гг.
Была поставлена задача найти документы, в которых присутствовала бы
информация по следующим тематическим направлениям:
- Центры документации (код УДК 002)
- Системы управления БД (код УДК 004)
- Теоретические проблемы информатики (код УДК 007).
Для построения поискового предписания уточним содержание кодов и свяжем эти
три кода с помощью : (знака отношения)
‘002.6:004.65:007.51’
После проведения поиска по этому поисковому предписанию находим документы,
один их которых соответствует потребности пользователя:
‘002.6:004.65:007.51’
Аникин М. А., Брейман А. Д.
Гибридная модель интеграции информации для корпоративных информационных
систем с сервисно-ориентированной архитектурой
Кл. слова: Информационные системы, сервисно-ориентированная архитектура,
интеграция информации, гибридные модели, распределенная кэш-память
Рубрики ГРНТИ, ВИНИТИ:20.23.21; 201.23.21.03 - «Разработка систем и банков
данных»
УДК 002.6:004.658:007.51
Центры
документации
Системы
управления
БД
Общая
теория связи
и
управления
3.2 Анализ документов в БД ВИНИТИ по рубрикам ГРНТИ и кодам УДК
В режиме «анализа» поисковой системы ВИНИТИ можно выявить весь репертуар
кодов УДК и их сочетаний, отражающих содержание публикаций в БД «Информатика».
Ранжирование кодов и последующее суммирование количеств каждого из наиболее
информативных кодов, отвечающих определенной тематике позволило построить
диаграмму качественного и количественного распределения массива публикаций по всем
рассматриваемым тематикам, охватываемым информатикой (рис.1).
Как видно из рис.1 основная доля публикаций относится к библиотечному делу,
системам НТИ и видам документов, представляющих библиотечное дело (около 86%). Из
наиболее важных направлений, относящихся к работе библиотек с древнейших времен и
до наших дней, связано с каталогами и составлением библиографий.
Большое внимание в информатике всегда уделялось систематизации знания и
различных отраслей техники и технологии, при этом не забывая о развитии образования, в
частности информационного.
В век информационных технологий получили развитие не только системы поиска,
анализа; изменилась техника размножения документов на бумажных носителях; новые
системы сканирования позволили обеспечить доступ широкому кругу читателей к редким
старинным изданиям; системы интернета дали возможность «увидеть» работы,
представленные авторами только в электронном виде. Именно поэтому мы видим рост
публикаций по информационным технологиям (рис. 1)
Библиотечное
дело
43,94%
Юридические
науки
1,36%
Образование
0,45%
Библиография.
Каталоги
2,13%
Документация.
НТИ
42,89%
Информационные
технологии
2,20%
Наука и знание
7,03%
Рис. 1. Распределение потока публикаций, проиндексированных по УДК, в БД
«Информатика» по различным тематическим направлениям 1982–2009 гг.
Библиометрический анализ, проведенный в БД «Информатика» 1982–2009 гг. по
кодам УДК, отражает состояние и перспективы развития отдельных направлений. В
рассматриваемый период времени поток публикаций достаточно стабилен по основным
направлениям, рост отмечается только по тематическому направлению «информационные
технологии» (Рис.2).
3.3. Сопоставление массивов публикаций, выделенных с помощью кодов УДК и
рубрик ГРНТИ
Объемы потоков публикаций отвечающих одному тематическому направлению
близки по величине независимо от систематизации их по разным классификаторам.
Сопоставление динамики распределения потоков публикаций, проиндексированных по
классификаторам УДК и ГРНТИ, было проведено для одной из важных тем информатики:
«Документация. Научно-техническая информация».
2500
Количество публикаций
2000
1500
1000
500
2007
2008
2009
2005
2006
2002
2003
2004
2000
2001
1997
1998
1999
1995
1996
1992
1993
1994
1990
1991
1987
1988
1989
1985
1986
1982
1983
1984
0
Год генерации БД
Библиография. Каталоги
Наука и знание
Документация. НТИ
Информационные технологии
Юридические науки
Библиотечное дело
Образование
Рис. 2. Динамика потока публикаций по основным направлениям, отражаемым в БД
«Информатика» 1982–2009 гг.
2400
УДК
2200
Количество публикаций
2000
1800
1600
1400
ГРНТИ
1200
1000
2009
2006
2003
2000
1997
1994
1991
1988
1985
1982
800
Год генерации БД
Рис. 3. Динамика распределения потоков публикаций, проиндексированных
по ГРНТИ и УДК
На рис. 3 видно, что динамика потоков публикаций проиндексированных по
ГРНТИ и УДК подобны. Это говорит о том, что в равной степени можно пользоваться и
УДК и ГРНТИ для поиска и анализа документов.
Выводы
1. Объем публикаций в РЖ/БД позволяет выявить основные направления исследований,
отражающиеся в РЖ/БД.
2. Приведенные примеры иллюстрируют проблемы, которые необходимо решать,
используя УДК и ГРНТИ в современных поисковых системах.
Download