– ТЕХНОЛОГИЯ ДЛЯ TEXTANALYST ПРЕДСТАВЛЕНИЯ ТЕКСТА ПОЛЬЗОВАТЕЛЮ

advertisement
TEXTANALYST – ТЕХНОЛОГИЯ ДЛЯ
ПРЕДСТАВЛЕНИЯ ТЕКСТА
ПОЛЬЗОВАТЕЛЮ
Харламов А.А.
Крюкова О.П.
Сведения о докладчиках


Харламов Александр
Александрович
Крюкова Ольга Павловна
ООО НПИЦ «Микросистемы»,
г. Москва
Федеральный институт
развития образования
Наши проекты и основные
направления деятельности


Цифровые библиотеки в
образовании
Развитие речевой,
коммуникативной и
интеллектуальной
деятельности учащегося
Какова основная тема и проблема
выступления?
Инновационная технология работы с
текстовой информацией на базе
компьютерной технологии
(далее «технология ТА»)
С помощью системы
ТекстАналист
( www.Analyst.ru)
в автоматизации обмена
данными в книжной отрасли
Что это за технология?
Нейросетевая технология обработки
текстовой информации TextAnalyst
позволяет
 анализировать текст независимо от
языка и предметной области
 автоматически извлекать
-ключевые понятия из текста (с их
смысловыми весами в рамках данного
текста),
-устанавливать их взаимосвязи в
данном тексте
(также с их весовыми характеристиками).
Что это дает издателю/
редактору?

1. В результате
автоматической обработки
пользователь мгновенно
получает смысловой портрет
текста
– семантическую сетьсовокупность ключевых
понятий в их взаимосвязях ,
как они даны в данном тексте;
Что это дает издателю/
редактору?

2.Технология ТА оказывается
удобным средством навигации
по тексту . См. комм
Что это дает издателю/
редактору?

3. ТА может автоматически
создавать реферат , который ,
в составе наиболее значимых
предложений текста,
позволяет осуществить
первичное и быстрое
знакомство с текстом.
Что дает технология ТА?

На основе семантической сети
строится гипертекстовое
представление, которое
позволяет легко (методом
«клика») навигировать по
тексту с использованием
ассоциативных связей и
быстро просматривать
контекст конкретных
ключевых слов.
Что дает технология ТА?
(это особенно важно при
работе с корпусами текстов )
 Вычисление степени
пересечения семантической
сети запроса с
семантическими сетями
найденных по запросу текстов
дает возможность
отранжировать найденные
тексты по степени
близости к запросу.
Что дает технология ТА?

Вычисление степени
пересечения семантической
сети текста с семантическими
сетями рубрик позволяет
автоматически отнести
входной текст к одной или
нескольким рубрикам, то есть
– отклассифицировать его.
Какой опыт использования
технологии ТА?

С 1996 года технология
представлена на российском
рынке в виде двух продуктов:
персонального продукта для
автоматического анализа
текстов TextAnalyst и
библиотеки COM-модулей для
встраивания ее в продукты
пользователя – TextAnalyst
SDK.
Какой опыт использования
технологии ТА?

С 1998 года те же продукты
представлены на рынке США
под названием Megaputer’s
TextAnalyst (Megaputer
Intelligence, Inc., Bloomington –
является дистрибутором
продуктов ООО НПИЦ
«Микросистемы» в США)
Рейтинг популярности ТА
какой?









Which text-mining tools you have used
[111 votes total]dt
Search (6)5%IMiner for Text (19)17%
INTEXT (1)1%
TextAnalyst (30)27%
TextSmart (6)5%
Text-o-Scope (2)2%
Wordstat (3)3%
Other (10)9%None (34)31%
Copyright © 2002 KDnuggets. Subscribe to
KDnuggets News!
Еще о рейтинге
популярности?

В 2000 году вышла книга Дэна
Салливэна [1], вторая часть
которой посвящена сравнению
технологии TextAnalyst с
аналогичными технологиями
фирм IBM и ORACLE.
Что нового и полезного
появляется в работе издателя/
редактора с помощью ТА ?

Таким образом, гипертекстовое
представление текстовой
информации в составе исходного
текста, семантической сети и
множества предложений,
содержащих понятия сети вполне
может использоваться как новый и
более точный стандарт в
представлении текстовой
информации пользователю.
Предложения о дальнейшей
совместной научно –
исследовательской деятельности
 Становится возможной
совместная разработка
интеллектуальных инструментов
анализа специальных текстовых и
терминологических баз и самих
текстовых баз данных для
широких целей автоматизации в
использовании цифрового
издательского текстового фонда в
образовании, самообразовании,
интеллектуальном труде
учащегося и, шире, пользователя.
Какие новые горизонты издательской
деятельности открывает использование
интеллектуальных технологий (технологии
ТА) ?

Расширение сферы
коммерческой деятельности
издателей при использовании
цифровых библиотек
собственных архивов
Контактная информация
kharlamov@analyst.ru
krukova-op@narod.ru
Download