МНОГОФУНКЦИОНАЛЬНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА T–LIBRA С МУЛЬТИМОДАЛЬНЫМ РАСШИРЕНИЕМ ДЛЯ ГУМАНИТАРНОГО

advertisement
МНОГОФУНКЦИОНАЛЬНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА T–LIBRA
С МУЛЬТИМОДАЛЬНЫМ РАСШИРЕНИЕМ ДЛЯ ГУМАНИТАРНОГО
ОБРАЗОВАНИЯ И ГУМАНИТАРНЫХ ИССЛЕДОВАНИЙ
С.Х. Ляпин, А.В. Куковякин
Некоммерческое партнерство «Центроконцепт»
г. Архангельск
ВВЕДЕНИЕ: О МЕСТЕ И РОЛИ ЭЛЕКТРОННОЙ БИБЛИОТЕКИ
Электронная библиотека может стать эффективным инструментом по информационной поддержке
гуманитарного образования и гуманитарного исследования, основой которых является многоплановая
работа с различными «текстами»: первоисточниками, монографиями, учебниками, статьями, справочниками
и т.д. Для этого она должна быть ориентирована на автоматизированные интеллектуальные сервисы по
гибкой тематической обработке полнотекстовой и связанной с ней нетекстовой информации, на различные
формы репрезентации результатов поиска, приспособленные к функциональному назначению ее подсистем
(обучение, исследование, создание тематической экспозиции и т.д.). Именно наличием такого рода
интеллектуальных сервисов (а не электронной формой первичных ресурсов) электронная библиотека
принципиально отличается от традиционной «бумажной».
Два момента важны для реализации этого подхода. Во-первых, для осуществления гибкой
многофункциональной тематизации запроса поисковая система библиотеки должна «доставать» до
отдельного предложения или авторского абзаца первичного ресурса (книги, статьи и т.п.), а также
предоставлять пользователю возможность произвольной компоновки результатов запроса. Во-вторых,
архитектура электронной библиотека должна обладать возможностями ее мультимодального расширения —
то есть включения в ее ресурсную базу нетекстовых модальностей информации (графика, звук, видео и
т.д.), а в ее функционал — унифицированного поиска по гетерогенным базам данных.
Такая библиотека de facto берет на себя существенную часть образовательных, исследовательских и
презентационных функций, которые находятся за пределами традиционной библиотеки. Она становится
многофункциональной информационной средой, архитектура и функционал которой позволяет
использовать ее как в рамках традиционной («аудиторной»), так и дистанционной технологии обучения, как
в качестве простого поставщика первичных ресурсов для гуманитарных исследований, проводимых
традиционными методами, так и в качестве нового эффективного инструмента таких исследований [1].
ЭБ T–LIBRA: АРХИТЕКТУРА И ФУНКЦИОНАЛ
Вышеназванным требованиям отвечает электронная библиотека T-Libra (разработка ООО «Константа»
и НП «Центроконцепт», Архангельск, Россия), созданная в архитектуре «клиент-сервер» (Web-browser /
Web-server / SQL-server) и работающая под управлением СУБД Sybase ASA v.7.0. [2]. Выбранная
архитектура позволяет достичь оптимального сочетания, с одной стороны, универсальности и
эффективности обработки информации (за счет мощной реляционной СУБД, а также специально
разработанной объектно-ориентированной среды Х-Taurus) и, с другой стороны, удобства для конечного
пользователя — за счет использования на стороне клиента стандартного Web-браузера.
Версии ЭБ T-Libra 5.0. и 5.1. с 2003 года используются в ННОУ «Институт управления» (г. Архангельск) и
в его филиалах в рамках как аудиторной, так и дистанционной технологий обучения. В настоящее время на
платформе T-Libra ведется разработка нескольких специализированных библиотек (для медицины, экологии,
культуры). При этом их архитектура проектируется с использованием различных СУБД (Sybase ASA, MS SQL
Server, Oracle SQL Server, MySQL) и двух вариантов бизнес-логики приложений (внутренней логики,
использующей особенности этих СУБД и реализуемой на языке SQL, и внешней логики, встроенной в СGIрасширение Веб-сервера и реализуемой на объектно-ориентированном языке C++).
В варианте ЭБ T-Libra v.5.2. имеются следующие основные функциональные разделы и подразделы.
Административный раздел включает в себя пять функциональных рабочих мест: 1) администратора
системы; 2) оператора каталога; 3) оператора электронного словаря; 4) оператора депозитария; 5) оператора
полнотекстовой базы данных.
Опубликовано:
Ляпин С.Х., Куковякин А.В. Многофункциональная электронная библиотека T-LIBRA с
мультимодальным расширением для гуманитарного образования и гуманитарных исследований //
Технологии информационного общества — Интернет и современное общество: труды VII
Всероссийской объединенной конференции. Санкт-Петербург, 10 – 12 ноября 2004 г. — СПб.: Изд-во
Филологического ф-та СПбГУ, 2004. С. 132 – 134.
ISBN 5-8465-0294-6
Пользовательский раздел включает в себя три функциональные подсистемы, предназначенные для
эффективного поиска и презентации информации: БД Каталог, БД Депозитарий, БД Полнотекстовый поиск.
Каталог. Подсистема предназначена для поиска по библиографической информации, организованной в
виде SQL-базы данных, и последующей презентации в среде Веб-браузера всех ресурсов, имеющихся в
электронной библиотеке (как в файловых, так и в реляционных базах данных). Поиск осуществляется с
учетом морфологии по 8-ми полям: «Автор», «Заглавие», «Ключевые слова», «Аннотация», «Год издания»,
«Предметная область», «Библиотечные фонды», «Носитель информации». Булева алгебра включена в
функционал соответствующих полей и структуру формы поиска. Поле «Предметная область» фактически
представляет собой настраиваемый мультирубрикатор, включающий набор стандартных классификаторов
(ББК, УДК, ВАК, ГРНТИ).
Депозитарий. Подсистема содержит файловые ресурсы различного формата и информационной
модальности (символьный текст, текст в виде графических файлов, собственно графика, аудио, видео и т.д.),
соотнесенные с теми или иными предметными областями: учебными дисциплинами, научными
направлениями, тематикой выставок и т.д.). Она имеет собственный рубрикатор ресурсов, настраиваемый
пользовательский интерфейс, и является принципиально важной для мультимодального расширения ЭБ
T-Libra с целью создания на ее основе специализированных оболочек для образования, исследований,
виртуального музея и архива.
Полнотекстовый поиск. Подсистема организована как совокупность гибких параметризируемых
запросов к полнотекстовой SQL-базе данных. Именно она ориентирована на компьютерную поддержку тех
видов деятельности пользователя, в основе которой лежит многоплановая работа с текстом первоисточника.
В архитектуре подсистемы предусмотрены: а) блок электронных словарей с программой
автоматической генерации словоформ естественного языка (в версии 5.2. имеется около 1 млн. словоформ
русского языка); б) блок гибких параметризируемых поисковых запросов (в версии 5.2. представлены 2 типа
и 6 видов таких запросов); в) блок функциональных моделей смыслового (концепт-ориентированного)
поиска (в версии 5.2. не представлен).
Методологически и технически в системе запросов выделяются: а) единицы поиска (в зависимости от
вида запроса это могут быть термины, цепочки терминов, многослойные терминологические структуры
и т.д.), б) единицы результатов поиска (произвольное предложение или авторский абзац, частотноранжированная совокупность терминов и т.д.), в) единицы представления результатов поиска (авторский
абзац, таблица частотно-ранжированных терминов и т.д.).
В версии 5.2. реализованы 2 типа запросов: «Абзацно-ориентированный поиск» и «Частотноориентированный поиск», каждый из которых представлен тремя видами. Первый тип запросов
ориентирован на экспликацию терминологических полей в пределах естественной смысловой единицы
текста — авторского абзаца. Второй тип — на частотный анализ текста и построение частотноранжированных таблиц терминов, «терминограмм» произведения или совокупности произведений.
ОТ T–LIBRA К T–EDUCATION: ЭКСПЛИКАЦИЯ УЧЕБНОЙ «ТЕМЫ»
НА ОСНОВЕ ГИБКОГО ПАРАМЕТРИЗИРУЕМОГО ПОЛНОТЕКСТОВОГО ПОИСКА
Экспликация учебной «темы» (проблемы, аспекта) может быть произведена с помощью одного из
запросов или их сочетания (каскадный запрос).
Пример одного из абзацно-ориентированных запросов: многослойный терминологический поиск.
Производится по нескольким терминам, которые одновременно: а) принадлежат разным условным
тематическим «слоям» терминов, при этом количество слоев в форме запроса варьируется (от 2 до 9) и б)
находятся на определенном «расстоянии» между собой (которое также варьируется пользователем).
Запрос позволяет на некотором терминологическом поле, определяемом всеми терминами запроса,
фиксировать смысловую связь между терминами, относящимися к разным слоям. Результатом запроса
является совокупность авторских абзацев из выбранного произведения (или произведений), содержащих
указанную многослойную терминологическую структуру, а тем самым опосредованно, через содержание
множества абзацев — экспликацию темы (проблемы), определяемую структурой пользовательского запроса.
Изменяя пять параметров запроса: 1) содержание списков терминов в каждом из слоев, 2) количество
терминов, включаемых в каждый из слоев, 3) количество слоев, включаемых в запрос, 4) количество слоев,
реально учитываемых при поиске, 5) расстояние между терминами, принадлежащими разным слоям, можно
производить своеобразную смысловую фокусировку поиска, — варьировать смысловую плотность и
тематическое содержание эксплицированного материала.
Опубликовано:
Ляпин С.Х., Куковякин А.В. Многофункциональная электронная библиотека T-LIBRA с
мультимодальным расширением для гуманитарного образования и гуманитарных исследований //
Технологии информационного общества — Интернет и современное общество: труды VII
Всероссийской объединенной конференции. Санкт-Петербург, 10 – 12 ноября 2004 г. — СПб.: Изд-во
Филологического ф-та СПбГУ, 2004. С. 132 – 134.
ISBN 5-8465-0294-6
Образовательный функционал T-Libra существенно расширяется за счет специализированной оболочки
Educator, включающей в себя инструментарий для более тонкой настройки тематического поиска и
презентации его результатов.
ОТ T–LIBRA К T–RESEARCH: ВИРТУАЛЬНАЯ ЛАБОРАТОРИЯ
ДЛЯ ГУМАНИТАРНЫХ ИССЛЕДОВАНИЙ НА ОСНОВЕ ГИБКОГО
ПАРАМЕТРИЗИРУЕМОГО ПОЛНОТЕКСТОВОГО ПОИСКА
Для широкого спектра гуманитарных исследований (лингвистика, история, философия, культурология,
юриспруденция, экономика и т.д.), в том числе междисциплинарных, принципиально важной является
возможность компьютерной обработки «текста», — различных по содержанию полнотекстовых ресурсов,
существующих в виде SQL-базы данных. Эта возможность реализуется как в собственной поисковой
системе T-Libra, так и в ее расширении с помощью программной оболочки Researcher. Это расширение (над
ресурсной и поисковой базой T-Libra) позволяет создать совокупность виртуальных экспериментальных
установок (ВЭУ), представляющих собой программные комплексы, каждый из которых предназначен для
решения исследовательских задач определенного типа [3].
В действующей версии библиотеки с вышеназванным расширением имеются четыре ВЭУ, каждая из
которых снабжена собственным интерфейсом для организации поиска и презентации результатов: «Анализ
и моделирование словообразования»; «Анализ и моделирование микроконтекста»; «Анализ и
моделирование макроконтекста»; «Экспликация культурных концептов».
ЛИТЕРАТУРА
1. Ляпин С.Х., Куковякин А.В. Многофункциональная информационная среда T-System в архитектуре
Web-browser / Web-server / SQL-server для гуманитарных исследований и гуманитарного
образования //Материалы межд. конф. «Гуманитарные исследования и гуманитарное образование на
Европейском Севере». — Архангельск: Изд. Поморского ун-та, 2002. С. 424–433.
2. Ляпин С.Х., Куковякин А.В. Многофункциональная электронная библиотека T-Libra: WWSархитектура,
интегрированный
каталог,
настраиваемый
мультирубрикатор,
гибкий
параметризируемый полнотекстовый поиск //Труды 5-й Всеросс. науч. конф. «Электронные
библиотеки: перспективные методы и технологии, электронные коллекции», RCDL’03, СанктПетербург, 29–31 октября 2003 г. — СПб, Изд-во СпбГУ, 2003. С. 292–299
[http://rcdl2003.spbu.ru/proceedings/J4.pdf].
3. Ляпин С.Х., Куковякин А.В. Виртуальная лаборатория для гуманитарных исследований на основе
электронной библиотеки с гибким полнотекстовым поиском //Труды 6-й Всеросс. конф. «Научный
сервис в сети ИНТЕРНЕТ», г. Новороссийск (п. Дюрсо), 20–25 сент. 2004 года. — М.: Изд-во
Московского государственного университета, 2004 (в печати).
Опубликовано:
Ляпин С.Х., Куковякин А.В. Многофункциональная электронная библиотека T-LIBRA с
мультимодальным расширением для гуманитарного образования и гуманитарных исследований //
Технологии информационного общества — Интернет и современное общество: труды VII
Всероссийской объединенной конференции. Санкт-Петербург, 10 – 12 ноября 2004 г. — СПб.: Изд-во
Филологического ф-та СПбГУ, 2004. С. 132 – 134.
ISBN 5-8465-0294-6
Download