Соглашение 14.579.21.0090

advertisement
14.579.21.0090
1
Федеральная целевая программа
«Исследования и разработки по приоритетным направлениям развития научно-технологического
комплекса России на 2014—2020 годы»
Информационно-телекоммуникационные системы
Тема: Создание и программная реализация методов комплексной вычислительной объективной оценки качества
неструктурированных научно-технических документов на естественных языках на основе совместного анализа моделей
семантики текстовых документов и их коллекций и библиометрических и наукометрических данных и показателей
Соглашение 14.579.21.0090
Руководитель проекта: Генеральный директор, Крейнес М.Г.
на период 2014 - 2016 гг.
Получатель субсидии: ООО «БАЗИСНЫЕ ТЕХНОЛОГИИ»
Цели и задачи проекта
Целью проекта является разработка новых методов комплексной вычислительной объективной оценки качества неструктурированных научно-технических документов (далее – НТД). Задачами проекта являются создание и реализация в
форме экспериментального образца программного обеспечения нового подхода к вычислительной оценке качества НТД, сочетающего анализ традиционных библиометрических и наукометрических данных и
показателей с анализом моделей семантики и расчетными оценками показателей качества НТД, основанными на моделях и методах семантического поиска и анализа текстовых документов и их коллекций, не
зависящими от взглядов и пристрастий экспертов; создание для научно-исследовательских организаций, промышленности и лиц, принимающих решения в различных сферах научно-технической деятельности,
научно-технических основ для сервиса по оценке качества НТД, превосходящего существующие методы по объективности и, одновременно, минимизирующего необходимые трудозатраты квалифицированных
специалистов, а также для вывода на рынок информационно-аналитических систем, ориентированных на получение оценок результатов научно-технической деятельности, нового типа услуг.
Актуальность выполняемых исследований обусловлена тем, что оценка качества научных текстов лежит в основе успешного конкурентоспособного развития всех отраслей науки и техники. Научная новизна
выполняемой работы обеспечивается использованием принципиально новых методов вычислительного анализа текстовой информации, разработанных и разрабатываемых ООО «БАЗИСНЫЕ ТЕХНОЛОГИИ».
Актуальность и научная новизна выполняемой работы также подтверждаются в ходе проводимых патентных исследований и аналитических обзоров имеющейся литературы по данной тематике.
Ожидаемые результаты проекта
Создание научно-технических основ комплексного сервиса по объективной оценке качества неструктурированных НТД на естественных языках в составе следующих конкретных результатов. Создание принципов и методов
совместного использования библиометрических и наукометрических данных и показателей, моделей семантики НТД и вычислительных оценок качества (показатели значимости, информативности и содержательной независимости)
НТД, формирование которых основано на методах семантического поиска и анализа неструктурированной текстовой информации на естественных языках для комплексной вычислительной объективной оценки качества НТД.
Разработка алгоритмического обеспечения и экспериментального образца программного обеспечения комплексной вычислительной объективной оценки качества неструктурированных НТД на естественных языках на основе
совместного анализа моделей семантики текстовых документов и их коллекций и библиометрических и наукометрических данных и показателей. Создание экспериментального информационно-технологического стенда поиска НТД,
способных оказать влияние на оценку анализируемого текста; использование его информационного и технологического обеспечения для организации семантического поиска в научной электронной библиотеке. Создание принципов,
моделей, методов и алгоритмов формирования и анализа коллекций НТД, применяемых для построения вычислительных оценок качества и для определения референтных значений библиометрических и наукометрических показателей
анализируемого текста. Результаты экспериментальных исследований по программе и методикам экспериментальных исследований разработанного ЭО ПО должны подтвердить эффективность предложенных решений. Результаты
комплексной оценки качества НТД из тестовой выборки НТД будут представлены в НЭБ. Методическое обеспечение использования результатов комплексного вычислительного оценивания качества НТД в реальном секторе экономики с
учетом технологических возможностей Индустриального партнера ориентируется на информационно-аналитическое обеспечение экспертизы НТД, а также на дальнейшие исследования и разработки. Результаты проекта отвечают
поставленным в мировой литературе запросам и не имеют аналогов. Разрабатываемый ЭО ПО будет превосходить по точности, объективности и оперативности все существующие средства вычислительной оценки качества научнотехнических документов.
Перспективы практического использования
Полученные результаты могут использоваться для совершенствования экспертных процедур на всех этапах жизненного цикла научно-технических разработок (от оценки качества научных статей и планирования тематики НИР/ОКР до передачи
результатов работ на производство). В случае выполнения ОКР с целью создания промышленного сервиса по оценке качества НТД на базе разработанных экспериментальных образцов, практическое использование сервиса сделает процедуры оценки
значительно более эффективными и быстрыми при снижении их стоимости.
Использование полученных результатов может значительно увеличить эффективность процедур экспертной оценки научно-технических документов и, тем самым, существенно положительно повлиять на развитие всего научно-технологического
комплекса.
Внедрение полученных результатов приведет к существенному улучшению экспертных процедур, чем обусловлен возможный значительный социально-экономический эффект в различных областях деятельности. Проводимые исследования, совместно с
развитием работ на уровне ОКР, позволят создать принципиально новые сервисы и оказывать принципиально новые услуги в области анализа неструктурированных данных с целью оценки научных и научно-технических документов. Это способно привести к
усилению конкурентных позиций отечественной науки и бизнеса.
Результаты исследовательской работы, полученные в 2015 г.
Разработан метод вычислительной объективной оценки качества неструктурированных научно-технических документов на естественных языках.
Разработаны модель и метод формирования коллекций НТД, адекватных для построения вычислительных оценок качества.
Разработано алгоритмическое обеспечение комплексной вычислительной объективной оценки качества неструктурированных НТД.
Разработано алгоритмическое обеспечение формирования коллекций НТД, адекватных для построения вычислительных оценок качества.
Разработаны методы формирования и предоставления РИНЦ библиометрических и наукометрических данных и показателей.
Разработаны методы получения РИНЦ коллекций НТД, адекватных для вычислительной объективной оценки качества неструктурированных документов.
Проведены патентные исследования по ГОСТ 15.011-96.
Осуществлена программная реализация экспериментального образца программного обеспечения (ЭО ПО) совместного использования библиометрических и наукометрических показателей, моделей семантики НТД и
вычислительных оценок качества НТД для вычислительной объективной оценки качества неструктурированных НТД на естественных языках.
В частности, разработаны следующие программные компоненты:
1) формирования и анализа коллекций НТД, применяемых для построения вычислительных оценок качества (значимости, информативности и содержательной независимости) и для определения референтных
(сопоставимых) значений библиометрических и наукометрических показателей анализируемого текста,
2) построения вычислительных оценок качества (значимости, информативности и содержательной независимости),
3) определения референтных (сопоставимых) значений библиометрических и наукометрических показателей анализируемого текста,
4) оценки согласованности вычислительных оценок качества и библиометрических и наукометрических показателей.
Осуществлена программная реализация сервиса по семантическому поиску в научной электронной библиотеке на основе экспериментального информационно-технологического стенда поиска НТД.
Разработано алгоритмическое и программное обеспечение взаимодействия РИНЦ и ЭО ПО: формирования и предоставления РИНЦ библиометрических и наукометрических данных и показателей, а также получения РИНЦ
сформированных адекватных для построения вычислительных оценок качества коллекций НТД.
Разработаны программа и методики экспериментальных исследований ЭО ПО, предусматривающие проверку следующих характеристик:
1) содержательная правильность – качественный параметр (да/нет), определяемый соответствием результатов комплексной вычислительной оценки качества документа высококвалифицированной экспертной оценке
качества документа, комплексные оценки качества НТД должны быть правильными не менее чем для 95 % проанализированных документов,
2) интерпретируемость – качественный параметр (да/нет), характеризующий возможность и простоту содержательной интерпретации пользователем полученных результатов комплексной оценки качества документа,
комплексные оценки качества НТД должны быть интерпретируемы не менее чем для 95 % проанализированных документов,
3) воспроизводимость – количественный параметр (измеряемый в процентах), характеризующий совпадение результатов при повторном решении задачи, комплексные оценки качества НТД должны быть 100 %
воспроизводимы,
4) оперативность – количественный параметр, характеризующий время, необходимое для вычислительного формирования оценок качества 10 (Десяти) НТД на естественном языке, вычислительное формирование
комплексных оценок качества 10 (Десяти) НТД должно выполняться не более чем в течение пяти часов.
Как показывают проведенные патентные и аналитические исследования, полученные результаты не имеют аналогов в мире и превосходят в правильности, интерпретируемости, объективности, воспроизводимости и
оперативности все имеющиеся на данный момент в мире методы, алгоритмы и способы решения задачи оценки качества неструктурированных научно-технических документов на естественных языках.
Партнеры проекта
Индустриальным партнером проекта является Общество с ограниченной ответственностью «НАУЧНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА» (интернет-портал elibrary.ru) – крупнейший в России информационно-аналитический
портал в области науки, технологии, медицины и образования. Электронная библиотека содержит рефераты и полные тексты более 19 миллионов научных статей и публикаций, в том числе, электронные версии более
3900 научных журналов, из которых более 2800 журналов представлены в открытом доступе. Библиотека обладает богатыми возможностями поиска и получения информации, интегрирована с Российским индексом
научного цитирования (РИНЦ). Индустриальный партнер осуществляет внебюджетное финансирование проекта и проводит работы по интеграции РИНЦ с экспериментальным образцом программного обеспечения
совместного использования библиометрических и наукометрических показателей, моделей семантики НТД и вычислительных оценок качества НТД для вычислительной объективной оценки качества
неструктурированных НТД на естественных языках.
Соисполнители работ по проекту отсутствуют.
14.579.21.0090
1
Download