СТРУКТУРА СИСТЕМЫ АНАЛИЗА НАУЧНОЙ ДЕЯТЕЛЬНОСТИ

advertisement
СТРУКТУРА СИСТЕМЫ АНАЛИЗА НАУЧНОЙ ДЕЯТЕЛЬНОСТИ
Коробко А.А., Коробко А.В.
Институт вычислительного моделирования СО РАН,
г. Красноясрк
Оценка деятельности институтов Сибирского отделения РАН в настоящее
время осуществляется на основе показателей результативности научной
деятельности. Институты сравниваются по количеству публикаций в журналах из
различных баз и списков, например, в журналах из базы РИНЦ, в журналах из базы
Web of Science, в журналах из списка ВАК, в рецензируемых журналах; по
количеству докладов сотрудников института на международных, всероссийских и
региональных конференциях; по количеству интеграционных проектов в которых
участвует институт и т.д. На основании этих количественных показателей
происходит оценка различных аспектов научной деятельности института, например,
публикационная активность, грантовая активность, патентная деятельность,
интеграционная деятельность, образовательная деятельность, участие и организация
научных мероприятий, и т.п.
Состав и структура собираемой информации часто изменяются, вводятся новые
критерии оценки, возникает необходимость учитывать новые параметры, кроме этого
появляются новые виды научной активности [1]. Процесс сбора, выверки, проверки
научных данных отнимает много времени и, в конечном счете, не позволяет получить
удовлетворительных результатов. Собранная информация не достаточно полна и
достоверна. Люди, заинтересованные в полноте и достоверности информации, не
имеют прямого доступа к данным о своей же научной деятельности [2-4].
Существующие библиографические системы аккумулируют данные о публикациях
сотрудников института, но не позволяют рассчитывать аналитические показатели на
основе хранимой информации. Кроме того, подобные системы не охватывают другие
аспекты научной деятельности [5].
Актуальной является задача создания информационной системы сбора и
анализа первичных данных о деятельности сотрудников научной организации.
Требования к информационной системе о деятельности сотрудников
научной организации
Ввиду необходимости анализа информации о научной деятельности
сотрудников целесообразным является консолидация первичной информации обо
всех видах научной деятельности в одной базе.
Поскольку требуемые оценки научной деятельности организации часто
изменяются, также меняется и состав собираемой первичной информации, в связи с
этим разрабатываемая информационная система должна обладать возможностью
развития, исходя из новых требований. Под развитием системы понимается
оперативное изменение интерфейса системы, позволяющее собирать новую
информацию, а также адаптация базы данных к новому составу информации.
Научной деятельностью в институте занимаются сотрудники, они же являются
основными лицами, заинтересованными в полноте и достоверности собираемой
информации. В связи с этим необходимо предоставить возможность контролировать
информацию, пополнять её и актуализировать.
Развитие системы должно происходить без привлечения специалистов в
области информационных технологий, то есть интерфейс администрирования должен
быть понятен специалистам предметной области.
131
В связи с необходимостью формирования ежегодных отчётов о научной
деятельности института должна быть предусмотрена выгрузка первичной
информации в распространённые форматы обмена данными. На основе собранных
первичных данных должен проводиться расчёт показателей эффективностирезультативности научной деятельности учреждения.
Создание единой базы данных
Для решения вышеизложенных задач предлагается создать единую базу
данных, содержащую информацию о научной деятельности всех сотрудников
(рисунок 1).
Рисунок 1 – Структура базы
132
Предлагаемая структура предполагает следующее разбиение научной
деятельности.
Самый верхний уровень содержит типы научной работы, это публикации,
патентная деятельность, гранты и т.д., следующий уровень – виды научной работы –
более детальный, например, для публикаций он содержит разделы: монографии,
статьи, авторефераты. И уже каждый вид содержит в себе множество конкретных
научных работ.
Таблица «Научная работа» занимает центральное место в предлагаемой
структуре, эта таблица связана с таблицей «Сотрудники института» и «Соавторы»,
что позволяет аккумулировать информацию о научной работе по каждому
сотруднику и, соответственно, оценивать эффективность научной деятельности
каждого сотрудника. Поскольку сотрудники и соавторы могут иметь несколько
псевдонимов или вариантов написания своих фамилии, имени, отчества в научных
работах, в соответствующих таблицах заведены поля «Основная запись сотрудника»,
которые позволяют привязать при анализе несколько записей к одному сотруднику.
Научная работа каждого типа имеет определенный постоянно расширяемый
набор характерных признаков, для сохранения значений этих признаков
предназначена таблица «Значения признаков научной работы». Данная таблица
имеет поля даты начала и окончания, что позволяет хранить изменяющиеся во
времени атрибуты. Например, значение импакт-фактора журналов меняется каждый
год, но для расчета цитируемости статей в этом журнале нужны значения импактфакторов за все прошедшие года. Сами научные работы за счёт поля «Зависимость»
можно группировать, например, присоединять статьи к журналам. Эта зависимость
позволяет избежать дублирования информации, эффективно хранить данные и свести
к минимуму количество ошибок возникающих при вводе, а также упростить
процедуру внесения изменений. Так, если в названии журнала была допущена
опечатка, то ее достаточно исправить в одном месте для того, чтобы изменения
отразились во всех статьях данного журнала. Кроме того, привязка статей к
журналам, как к самостоятельному объекту научной деятельности, позволяет
осуществлять анализ публикационной активности сотрудников в разрезе журналов и
их характерных признаков.
Таблицы «Типы научной работы», «Виды научной работы», «Признаки», а
также таблица связи «Признаки научной работы» содержат метаданные, которые
описывают модель предметной области. Модель предметной области определяет вид
интерфейса системы, состав и тип собираемой информации, зависимости и т.д.
Принципы реализации системы
В системе реализован оригинальный подход к редактированию метаданных,
непосредственно через интерфейс системы сбора данный о научной деятельности,
что максимально облегчает и упрощает процесс адаптации системы к новым
требованиям предметной области [6].
Для решения проблемы с доступом сотрудников к собираемой информации о
научной деятельности предлагается использовать web-интерфейс, тогда на стороне
сотрудника клиентом выступает браузер, в качестве web-сервера предлагается
использовать apache с php.
Разрабатываемое web-приложение предусматривает интерфейс авторизации
(рисунок 2). Авторизация позволяет идентифицировать пользователя и построить
интерфейс в соответствии с его ролью.
133
Рисунок 2 – Авторизация
В настоящее время реализовано три типа пользователей, это администратор,
оператор и гость. В зависимости от выбранного пользователя накладываются
ограничения на выполняемые операции в системе. Гость может только
просматривать информацию о научной деятельности, оператор может заносить
информацию о научных работах, а администратор кроме всего прочего занимается
настройкой системы, он может редактировать или заводить новые виды деятельности
и связанные с ними атрибуты.
Для ввода данных по научным работам разработан интерфейс, оперативно
изменяющийся в зависимости от вида научной деятельности (рисунок 3).
Рисунок 3 – Интерфейс ввода
134
Как видно на рисунке, на панели инструментов расположены кнопки,
позволяющие выбрать вид научной деятельности, после выбора на форме
отображается список с конкретными научными работами в данной области, а также
атрибуты, которые можно заполнить для данной работы. На форме есть инструмент,
позволяющий выгружать данные о научных работах сотрудников в MS Excel для
дальнейшей их обработки или передачи в виде отчёта. Реализован инструмент,
позволяющий фильтровать научные работы по любому признаку, имеющемуся у
данного вида научной деятельности.
Все описанные решения частично или полностью реализованы и позволяют
автоматизировать сбор и консолидацию в одной базе информации о научных работах
сотрудников института. Система позволяет решать часть задач по сбору информации
силами самих сотрудников, что ускоряет процесс сбора и повышает достоверность
собираемой информации. При этом, за счёт того, что работа системы регулируется
моделью, хранящейся в метаданных, её развитие может осуществляться без
привлечения специалистов в области информационных технологий.
Литература
1. Лядова
Л.Н.
Технология
создания
динамически
адаптируемых
информационных систем // Труды междунар. науч.-тех. конф. «Интеллектуальные
системы» (AIS’07). Т. 2. – М.: Физматлит, 2007. – С. 350-357
2. Коробко А.В. Концептуальная модель горизонтальной интеграции данных о
деятельности научной организации // Материалы конференции XII Санктпетербургской международной конференции «Региональная информатика – 2010» –
Санкт-Петербург. 2010. – С. 50.
3. Коробко А.В., Ноженков А.И. Проблемы автоматизации сбора и обработки
данных о научной деятельности // Материалы Всероссийской конференции «VI
Всесибирский конгресс женщин-математиков» – Красноярск. 2010. – С. 214-219.
4.
Коробко А.В. Проблемы доступности оперативной аналитичсекой
обработки в задачах организационного управления // Материалы десятой
Всероссийской научно-практической конференции ПИР-2009. – Красноярск: СФУ,
2009. – С. 134-136.
5. Гребнев А.Н. Научные информационные системы // Вестник УдГУ:
Математика. – Ижевск: Изд-во УдГУ, 2003. – С. 99-106.
6. Gruber T. R., 1995. Toward Principles for the Design of Ontologies Used for
Knowledge Shring // International Jornal of Human and Computer Studies. – № 43 (5/6). –
P. 907–28.
135
Download