Фактографический поиск и сеть internet

advertisement
УДК 004(06) Информатика и процессы управления
С.Д. КУЛИК, Д.С. ГУДЗЬ, А.Б. МИРОНОВ, Д.А. НЕСТЕРОВ,
М.А. ЯЦКОВ
Московский инженерно-физический институт (государственный университет)
ФАКТОГРАФИЧЕСКИЙ ПОИСК И СЕТЬ INTERNET
Представлены результаты исследования поисковых машин (ПМ), поисковых
роботов (ПР) и фактографического поиска (ФП) в сети Internet.
Развитие современных средств коммуникации и, в частности, сеть
Internet требуют от разработчиков информационно-поисковых систем
(ИПС) находить новые решения для построения эффективных ИПС.
Исследователи различают среди ИПС класс фактографических ИПС
(ФИПС) [2-9]. Среди ФИПС выделяют класс автоматизированных ФИПС
(АФИПС) [2,3,4]. Отметим что, АФИПС позволяет получать ответы на
фактографические запросы (ФЗ) и выполнять фактографический поиск.
Существенное отличие рассматриваемых АФИПС от других систем
состоит в том, что при документальном поиске (ДП) система выдает
пользователям те же документы, что и поступали когда-то на ее вход.
Важно отметить, что при фактографическом поиске, когда
обрабатывается фактографический запрос, система может выдать
фактографические данные (ФД), созданные в результате аналитикосинтетической переработки входных документов внутри системы.
Для синтеза ФД такая система как АФИПС должна иметь специальный
инструмент, проверяющий достоверность вновь поступающих ФД,
сопоставление их с уже известными, корректировку и пополнение ФД.
Так, например, на такой ФЗ "Какие акции фирмы X были проданы фирме
Y?" ДП выдаст рекомендательный список, справочников, энциклопедий,
каталогов, возможно содержащих ФД о требуемых акциях, а ФП выдаст
перечень акций фирмы X, которое были проданы фирме Y.
Проект, связанный с исследованием ФП в сети Internet ведется по трем
направлениям. Первое — исследование наиболее общих вопросов
проектирования, разработки и эксплуатации АФИПС различного
назначения [2-4], в том числе, и в сети Internet [5-9]. Второе —
исследование поисковых машин и поисковых роботов сети Internet.
Третье — исследование и анализ результатов документального поиска [1,
10 и др.] с целью их применения для реализации ФП.
Основное внимание на первых этапах исследования было уделено
изучению существующих ПМ, ПР и, в частности, поисковой системы
ISBN 5-7262-0555-3. НАУЧНАЯ СЕССИЯ МИФИ-2005. Том 12
86
УДК 004(06) Информатика и процессы управления
Яndex. На последующих этапах исследовался ДП и те средства, с
помощью которых разработчики на практике достигали заданной
эффективности своих систем (особенно те средства, что могут быть
полностью или частично применены для реализации ФП в сети Internet).
Результаты экспериментальных исследований поисковой системы
Яndex показали [9], что с ее помощью может быть построена АФИПС с
заданной эффективностью.
Результаты анализа и исследования существующих ПМ, ПР показали,
что их число огромно (более 200 поисковых роботов [1, с.113] и более
2000 поисковых систем [1, с.117]).
В целом проведенные исследования позволили предложить подход к
построению АФИПС для сети Internet. Для разработчика АФИПС
выработаны некоторые предварительные рекомендации, помогающие ему
строить системы с требуемой эффективностью.
Список литературы
1. Захаров В.П. Информационные системы (документальный поиск): Учебное пособие.–
СПб., 2002. 188с.
2. Кулик С.Д. Исследование эффективности фактографического поиска в
информационных системах /Изд. “Радиотехника”.–М., 2004.–251с.–Деп. в ВИНИТИ
29.07.2004, №1326-В2004; Библ. указат. №9(204), 2004.
3. Кулик С.Д. Фактографические системы (методы построения, модели, стратегии поиска
и программное обеспечение) /Изд. “Радиотехника”.—М., 2003.—325с.—Деп. в ВИНИТИ
23.06.2003, №1205-В2003; Библ. Указат. № 8(378), 2003.
4. Кулик С.Д. Объекты интеллектуальной собственности России (обзор программного
обеспечения).-М.: “Компания Спутник+”, 2001.-159с.
5. Кулик С.Д. Аналитическая модель глобальной сети Internet //Вуз-XXI и культура
(сборник статей). —Казань: Изд-во КГТУ, 2000. - С.32-36.
6. Кулик
С.Д.
Аналитическая модель
поискового робота,
выполняющего
фактографический поиск в глобальной сети Internet для обоснования управленческих
решений //Актуальные проблемы управления-2000: Материалы международной научнопрактической конференции: Вып.5 — М.: ГУУ, 2000. — С.126-129.
7. Кулик С.Д. Свидетельство на программу №2000610134 Российская Федерация (RU).
"Представление фактографических данных издательства в сети Internet" (WEB$ITE)/С.Д.
Кулик (Россия).-№ 991021; Заяв. 23.12.1999; Зарегистр. 21.02.2000.
8. Разработка программного обеспечения для поиска фактографических данных в сети
Internet. Исследование и разработка модели фактографического поиска данных: Отчет о
НИР/МИФИ. Руководитель: Кулик С.Д. Испол.: Кулик С.Д., Козлов В. М. — Отчет по теме
№80-3-029-511, №ГР01200102159, Инв.№02.2.00101863.-М.: МИФИ, 2000.-78с.
9. Кулик С.Д., Платонова И.В., Симагин П.В. Фактографическая информационносправочная система в сети Internet //Научная сессия МИФИ-2004. Сб. науч. тр. В 15т. М.:
МИФИ, 2004. Т.12. Информатика и процессы управления.
10.
Конференция TREC (Text Retrieval Conferences) http://trec.nist.gov/.
ISBN 5-7262-0555-3. НАУЧНАЯ СЕССИЯ МИФИ-2005. Том 12
87
Download