Коспект лекций

advertisement
Информационное обеспечение
научных исследовании и разработок
(4Л+20ПЗ)
Информационное обеспечение – информация, необходимая для управления экономическими процессами, содержащаяся в базах данных информационных систем.
Согласно ГОСТ 7.0–99 СИБИД «Информационно-библиотечная деятельность, библиография. Термины иопределения»,
– совокупность информационных ресурсов и услуг, предоставляемых для
решения управленческих и научно-технических задач в соответствии с этапами
их выполнения.
1) обеспечение фактическими данными управленческих структур;
2) использование информационных данных для автоматизированных систем управления;
3) использование информации для обеспечения деятельности различных
потребителей (организаций, ученых, художников, писателей, журналистов и т.
д.).
Обеспечение информацией управленческих структур (государства, корпораций, организаций) производится, прежде всего, за счет организаций, специально занимающихся сбором данных (государственные органы статистики,
научные центры различного типа), большую роль в информационном обеспечении управленческих структур играют средства массовой информации, которые
не только представляют большой массив информации, но и формируют на ее
основе общественное мнение, воздействующее на управленческие решения.
Вторым важным направлением информационного обеспечения является
формирование информационных данных для автоматической системы управления (АСУ), вводимая в систему асу информация является необходимым элементом всей системы, без которой невозможно математическое, техническое, организационно-правовое ее функционирование, информация, вводимая в систему,
ее пред машинная обработка - основа современных автоматизированных информационных систем.
Третье направление информационного обеспечения связано с удовлетворением информационных запросов потребителей самого разнообразного типа:
как организаций, учреждений, так и отдельных лиц, в этом случае в качестве
информационного обеспечения выступают не только статистические данные,
данные социологических опросов, данные архивов и пр. официальных учреждений, но и такие типы информации, как книжные и журнальные публикации,
научные отчеты, диссертации и пр.
Наиболее распространенной формой этого типа информационного обеспечения являются библиотеки, а в современных условиях все большее значение
приобретают службы и центры анализа информации (например, в России -
2
всероссийский институт научной и технической информации, всероссийский
научно-технический информационный центр и др. информационные службы).
Ретроспектива (история вопроса)
Разработке теоретических, методических и практических проблем информационного обеспечения научных исследований уделялось внимание на всех
этапах развития отечественного библиотечного дела ХХ века. Интенсивное развитие науки в середине ХХ столетия, обусловившее бурный рост количества
научно-технических публикаций, появление баз (БД) и банков данных (БнД),
повлияло на библиотечную деятельность: начали закладываться основы форм и
методов информационного обеспечения науки.
С появлением в конце 1970-х – начале 1980-х гг. таких организационных
форм проведения научных исследований, как НИР в рамках научно-производственных объединений (НПО), целевые комплексные программы (ЦКП),
НИР в рамках международных научно-технических комплексов (МНТК), стали
изучаться вопросы адаптации разработанных форм и методов информационного
обеспечения к новым условиям. В результате стали развиваться и новые подходы к информационному обеспечению НИР в рамках указанных форм организации. При этом вопросы их информационного обеспечения стали рассматриваться в следующих аспектах.
1) НИР в рамках НПО – указывается видовая структура и тематический
состав информации с учетом их изменения относительно информационной базы, необходимой при проведении НИР и ОКР. Кроме того,
рассматривается также оптимальные формы и методы предоставления
информации в процессе выполнения комплекса задач НПО.
2) НИР в рамках МНТК - обосновывается важность отдельных видов источников информации, и рассматривались проблемы создания комплексной информационной базы, актуальные формы и методы работы
библиотек.
Данные подходы к построению информационного обеспечения рассматриваемых организационных форм научных исследований, были ориентированы
на стабильную социально-экономическую среду и постепенное развитие информационных технологий. В условиях интенсивной автоматизации библиотечной деятельности результаты проведённых работ можно рассматривать как основу для определения подходов к информационному обеспечению исследований учёных и специалистов, занятых разработками в рамках современных организационных форм НИР.
С внедрением компьютерных технологий первостепенный статус получило изучение направлений автоматизации информационных и библиотечных
процессов с использованием электронных ресурсов на основе внедрения информационных технологий.
Возникновение в 1970-х гг. отделов научно-технической информации
(ОНТИ) и параллельное развитие информационной функции традиционных
библиотек НИИ вызвало обсуждение темы взаимодействия информационных
служб и библиотек. Поскольку в академических учреждениях не всегда имелась
3
возможность создать ОНТИ, научная библиотека (НБ) должна была полностью
выполнять его функции.
Изменения, произошедшие в формах и средствах представления и распространения научно-технической информации, новые информационнотехнологические условия определили роль библиотеки НИИ как посредника
между владельцами электронных ресурсов и их потребителями или как неотъемлемого звена в системе научных коммуникаций. Данную точку зрения разделяли и зарубежные специалисты. В их публикациях актуализировалась тема
обеспечения свободной циркуляции научной информации путём создания консорциумов библиотек для приобретения электронных ресурсов.
В современной отечественной и зарубежной литературе по информационному обеспечению научных исследований рассматриваются проблемы использования телекоммуникационных процессов и вопросы создания ресурсов собственной генерации, при этом особое внимание уделяется электронным каталогам; обсуждается роль электронных ресурсов в информационном обеспечении и
проводится анализ их использования.
Как известно, со времени возникновения Академии наук главной задачей
академических библиотек было содействие научно-исследовательской деятельности. Поэтому информационное обеспечение НИР и ОКР является основным
направлением исследований специалистов централизованных библиотечных систем (ЦБС) РАН.
Так, разработки специалистов ЦБС БЕН РАН направлены на создание БД,
каталогов и порталов, интегрирующих в одном месте доступ к максимально
возможному числу естественнонаучных ресурсов, способов хранения и представления электронной информации, её взаимодействия с традиционными формами. Также в публикациях сотрудников ЦБС БЕН РАН обсуждаются вопросы
автоматизация комплектования, процессов межбиблиотечного абонемента
(МБА), систематизации данных и оптимизации поисковых возможностей систем. Одна из задач дальнейшего развития информационного обеспечения
науки определена как интеграция информационных систем. Активность в
разработках проявляется на всех уровнях ЦБС. Отраслевые библиотеки НИИ
ведут разработки по созданию отечественных БД, а их сайтам отводится роль
наиболее важного звена в отраслевой системе электронных коммуникаций.
Перспективы развития информационного обеспечения научных сотрудников в БЕН РАН, по свидетельству Н. Е. Калёнова, связаны с созданием собственной электронной библиотеки, организацией интерактивного взаимодействия с книготорговыми организациями, включением ресурсов библиотек своей
ЦБС в единую информационную систему РАН.
Так, в Пущинской ЦБС (г. Пущино), входящей в состав ЦБС БЕН РАН,
осуществляется внедрение новых инструментов, обеспечивающих комплексное
использование информации на электронных носителях и создание интернетпортала в области физико-химической биологии. Специалисты ЦБС обсуждают
вопросы развития, использования электронных информационных ресурсов в НБ
и создания собственных ресурсов для информационного обеспечения НИР Пущинского НЦ, в том числе электронных каталогов и БД диссертаций по физико-химической биологии.
4
Специфика информационного обеспечения современных форм организации научных исследований
Шабурова Н.Н. (Научная библиотека Института физики полупроводников СО РАН) ШАБУРОВА НАТАЛЬЯ НИКОЛАЕВНА
Очевидно, что рассмотрение информационного обеспечения (ИО) науки
(как и любой предметной области или процесса) должно быть основано на логике научного познания и проводиться в соответствии с этапами исследований
различных категорий – фундаментальных и прикладных исследований и опытно-конструкторских разработок (ОКР).
Для проведения же фундаментальных и прикладных исследований (НИР)
требуются, в первую очередь, системные знания. По определению Д.И. Блюменау “системные знания – это совокупность (система) суждений науки, фиксирующих устойчивые, необходимые связи и свойства предметов и явлений
объективного мира. Системные знания составляют структуру науки и являются
неотъемлемой основой и конечной целью научно-технической деятельности” [1,
с. 8]. Такие знания научно-техническая литература. ОКР, в отличие от НИР,
включают этапы создания опытно-промышленного образца, его испытания и
внедрения, и доработки технической документации на выпуск серии образцов в
промышленных условиях [4].
НИР: исследование предметной
области и получение о ней новых сведений
ОКР: создания образца, его
испытание и внедрение, доработки техдокументации
системные знания -
ситуативные знания -
устойчивые, необходимые связи и свойства
временные, конъюнктурные
связи и отношения
ИО: научно-техническая литература;
конъюнктурная, методологическая, нормативнотехническая, производственная, правовая, патентнолицензионная, экономическая и социально-политическая
литературе
Рис. 1. Структура ИО НИР и ОКР
В процессе проведения НИР и ОКР, по мере перехода исследований от
этапа к этапу, то есть по мере решения конкретных задач, системные знания
начинают требоваться все менее, а возникает необходимость в знаниях другого
характера [2]. Появляется потребность в информации для выбора и определе-
5
ния, какие технологические разработки предпочтительнее, как рациональнее их
проводить и где лучшая сфера их применения. Такая информация представляет
собой основу для формирования «ситуативных знаний – предложений науки и
техники, которые отражают не устойчивые и необходимые, а временные, конъюнктурные, соотнесенные с определенной ситуацией связи и отношения, и которые не являются элементами науки как системы» [1, с. 8]. На основе такой
информации чаще всего и принимаются творческие и управленческие решения.
Очевидно, что для естественнонаучного направления информация для ситуативных знаний содержится не в научно-технической, а в конъюнктурной, методологической, нормативно-технической, производственной, правовой, патентно-лицензионной, экономической и социально-политической литературе.
Так, например, в табл. 1 показана степень изменения потребностей ученых в системных и ситуативных знаниях на различных этапах научных исследований (табл. 1).
Таблица 1
Изменение потребности в системных и ситуативных знаниях на различных
этапах научных исследований различных категорий
Этапы НИР
Организационный
(подготовительный)
Творческий процесс
(основной)
Обработка результатов - создание новых сведений (заключительный)
Планирование практической реализации
полученных результатов
Разработка опытного
образца
Экспериментальное
испытание
Доработка и корректировка
Обобщение результатов, определение
возможности внедрения в производство (заключительный)
Категории научных исследований
Фундаментальные
Прикладные
ОКР
системные знания
системные знания
системные знания
системные знания
ситуативные
знания
ситуативные
знания
ситуативные
знания
ситуативные
знания
ситуативные
знания
6
В настоящее время, когда десятки лет существовавшее пятилетнее планирование НИР, устойчиво финансируемое государством, заменено, в основном,
краткосрочными проектами с многообразными источниками финансирования,
предоставляемыми на основе конкурсов, сами научные исследования организационно также преобразовались. Появились исследования в рамках индивидуальных и коллективных грантов, интеграционных проектов и программ, а также
международных грантов и договоров с научными организациями и фирмами зарубежных стран (табл. 2).
Таблица 2
Организационные формы научных исследований, источники их финансирования и участие в них научных сотрудников ИФП СО РАН
Т.к. работа библиотеки нацелена на построение адекватной системы ИО
всех форм организации науки, то необходимо, прежде всего, хорошо понимать
их специфику, а затем и выработать подходы к их ИО.
Один из современных подходов к ИО фундаментальных научных исследований предлагает В.А. Маркусова [5] - ИО надо начинать с этапа поиска ассигнований и включить отделам информации и библиотекам в свою повседневную деятельность работу по оповещению ученых об отечественных и зарубежных фондах, сроках предоставления заявок, о тематике деятельности фондов и
7
некоторых стандартных (для зарубежных фондов) критериях отбора проектов.
Более того, другие авторы призывают отделы информации и библиотеки принимать участие в поиске потенциальных спонсоров, фондов и партнеров [3, 6].
Другими словами, они подчеркивают необходимость предоставлять ситуативные знания еще до начала проведения самих исследований и разработок.
С целью выработки своих подходов к ИО библиотекой Института физики
полупроводников (ИФП) СО РАН проведен ряд исследований. Анализ отчетов и
экспертное анкетирование помогли выявить характер приоритетной информации для основных организационных форм науки. Поскольку библиотека ИФП
специализируется на тематике исследований и разработок конкретного контингента ученых своего НИИ, то ее фонд укомплектован научно-технической литературой, практически не несущей ситуативных знаний. Однако, результаты исследований, приведенные в табл. 3, показали расширение потребности в ситуативных знаниях и явились подтверждением того, что настало время перестраивать систему ИО. Прежде всего, для ИО современных форм организации науки
требуется изменение баланса системных и ситуативных знаний.
Таблица 3
Зависимость структуры информационной базы ИО от специфики современных организационных форм научных исследований
Контракты с хозяй-
+
Рекламная
+
Производственная
Интеграционные
проекты СО РАН
Патентно-лицензионная
+
Нормативно-техническая
Программы фундаментальных исследований РАН и СО
РАН
Социально-политическая
+
Экономическая
+
Конъюнктурная
Методологическая
Гранты РФФИ
Организационные.
форма научных
исследований
Правовая
Научно-техническая
Характер информации
+
+
+
+
+
+
+
+
8
ствующими организациями
Международные
гранты
+
+
+
+
+
Договоры с зарубежными фирмами
+
+
+
+
+
Для более детального изучения потребности в литературе, отсутствующей
в фонде библиотеки ИФП, был проанализирован документопоток, полученный
по МБА из других библиотек, за 1993 и 2003 гг. В качестве основного исследуемого признака принят содержательный.
Проведенный анализ показал, что в 1993 г. из 1128 полученных печатных
единиц 1030 (91,31 %) составляли монографии, сборники, справочники и периодическая научно-техническая литература, предоставлявшая системные знания.
Доля же литературы, несущей ситуативные знания, составляла 8,69 % (98
наименований): монографий и статей из периодических изданий по общественным наукам – 29 (2,57 %), нормативно-технической литературы – 23 (2,04 %), в
т.ч. стандартов – 11 (0,98 %), производственной – 16 (1,42 %), патентнолицензионной – 13 (1,15 %), экономической – 12 (1,06 %), методологической по
организации производства и управления – 5 (0,45 %).
В 2003 г. из общего количества полученных 1083 документов 72,2 % (782
экземпляра) составляла научно-техническая литература. Доля литературы, несущей ситуативные знания, увеличилась до 27,8 % (301 документ): общественно-политической литературы – 138 (12,75 %), экономической – 46 (4,25 %),
нормативно-технической – 57 (5,26 %), в т.ч. стандартов – 34 (3,14 %), производственной – 6 (0,55 %), патентно-лицензионной – 17 (1,57 %), экономической
– 46 (4,25 %), методологической – 13 (1,2 %) и конъюнктурной – 24 (2,22 %).
Сравнительно-статистический анализ демонстрирует, что при сохранении
общего количества полученных документов произошло изменение структуры
информации. Полученные данные свидетельствуют, что у сотрудников ИФП
СО РАН возросла потребность в литературе, обеспечивающей получение ситуативных знаний, более, чем в 3 раза (рис. 1). Это сопоставление можно считать
еще одним подтверждением того, что для современных форм организации науки
нужно перестраивать систему ИО, для чего необходимо перестраивать информационную базу.
Далее метод интервьюирования позволил понять, какие формы ИО, на
взгляд опрошенных, могут в условиях работы академической библиотеки гипотетически предоставлять информацию для формирования ситуативных знаний.
Опрошено 10 % научных сотрудников ИФП СО РАН: представитель администрации, руководители всех форм организации научных исследований фундаментального и прикладного направлений, а также разработчики, исполнители и
индивидуальные обладатели грантов в рамках Президентской программы поддержки талантливой научной молодежи и Лаврентьевского конкурса молодежных проектов. Результаты интервьюирования продемонстрировали, что все ис-
9
пользуемые библиотекой формы ИО (индивидуальное и массовое СИ, групповое ИРИ, ретроспективный поиск в режиме “запрос-ответ” и комплексные методы) нацелены в настоящее время на удовлетворение потребности ученых в
системных знаниях. Предоставление же ситуативных данных не охвачено формами систематической подачи информации, например СИ, ИРИ.
Рис.2. График изменения потребности в литературе, полученной по МБА библиотекой ИФП СО РАН.
Таким образом, проведенные исследования позволяют сделать следующие
выводы.
 Современные формы развития значительной части научных исследований
ориентированы на конъюнктуру и конкуренцию, и поэтому, независимо от
категории, им требуются ситуативные знания уже на самой первой стадии
исследования, на стадии их планирования. Однако, используя самые современные средства для реализации существующих форм и методов ИО, генерируя собственные базы данных, академическая библиотека по-прежнему
нацелена, главным образом, на предоставление системных знаний. В связи с
этим очевидна необходимость перестройки системы ИО современных организационных форм научных исследований и развития ее с целью предоставления требуемых знаний и характера информации.
 Основным подходом к ИО современных форм научных исследований является организация и соблюдение необходимого баланса предоставления информации для формирования системных и ситуативных знаний. Расширившиеся потребности ученых в ситуативных знаниях ставят перед академической библиотекой задачу определить, при помощи каких форм ИО их подавать.
 В зависимости от возможностей каждого конкретного НИИ могут быть выбраны разные пути развития регулярного информирования ученых в области
ситуативных знаний. Например, вопрос может решаться путем корректировки тематико-типологического плана комплектования; более интенсивного
использования возможностей ЦБС, в том числе, заключения договоров с Ин-
10
ститутом экономики и организации промышленного производства (ИЭиОПП) СО РАН или ГПНТБ СО РАН на оказание с их стороны информационных услуг в виде подготовки концептографических обзоров, предоставляющих ситуативные знания, по имеющимся в их фондах материалам; развития электронной доставки документов (ЭДД) и др.
Рисунок 2 – Структура информационных потоков, используемых
для информационного обеспечения НИР в ИФП СО РАН
Исследование также даёт представление об исходных предпосылках
создания системы информационного обеспечения научных исследований с
учётом их новых организационных форм в академическом НИИ и при этом
показывает предпочитаемые учёными каналы получения информации.
Прежде всего, анализ сложившейся системы современного информационного обеспечения позволяет утверждать, что используемые формы и методы работы удовлетворяют требованиям учёных и специалистов, предъявляемым к доведению системных знаний.
Поскольку электронные ресурсы – библиографические, полнотекстовые БД, интернет-ресурсы – составляют всё большую часть в структуре системы фондов, проведён анализ использования электронных изданий в академическом НИИ. Он необходим для определения принципов формирования
системы фондов. В результате исследований выявляется стабильный рост
11
использования электронных ресурсов учёными (рис. 3). Результаты анкетирования сотрудников библиотек подтверждают, что в целом спрос на электронные ресурсы постепенно растёт, а традиционная выдача литературы
снижается во всех исследуемых НИИ.
Рисунок 3 – Динамика использования электронных журналов НЭБ и БД
«ScienceDirect» научными сотрудниками ИФП СО РАН за 2002–2005 гг.
Тем не менее, изучение форматных предпочтений иностранных журналов в работе учёных показывает, что сотрудники, активно пользующиеся
услугами библиотеки, при двух равных возможностях предпочитают работу с
традиционными изданиями. На первый взгляд этот вывод противоречит приведённым ранее данным о постоянном росте спроса на электронные издания. Если исключить вариант, что растёт использование электронных версий
«ядерных» журналов, на печатные версии которых по финансовым причинам
подписка в НИИ прекращена, то важно понять причины всё возрастающего
спроса на электронные журналы и определить основные принципы комплектования зарубежными периодическими изданиями академической библиотеки и установить критерии формирования информационной базы.
Для объяснения данного противоречия выдвинута гипотеза, что этот
феномен связан с рассеянием информации по журналам согласно Закону
Брэдфорда. Ведь именно большие коллекции обеспечивают удовлетворение
потребности в информации, рассеянной по очень большому числу источников. Этим, на наш взгляд, и объясняется высокий спрос на электронные ресурсы, тем более, если есть возможность оперативного и комфортного доступа к журналам ядерной и средней зон.
Таким образом, исходя из вывода о том, что, с одной стороны, электронные ресурсы предоставляют рассеянную по большому количеству источников информацию и снижают трудоемкость её поиска, а с другой – что
учёные закономерно предпочитают не утратить печатную версию журналов
ядерной зоны, следует, что основной подход к формированию информационной базы должен быть сформулирован следующим образом. Информационная база должна представлять собой совокупность различных форматов
12
научной информации, приоритеты и соотношения которых должны быть
следующими: обязательное сохранение традиционной подписки на все журналы ядерной зоны и обеспечение доступа к их электронным версиям. Выделенные в соответствии с Законом Брэдфорда журналы средней зоны, если
позволяют финансовые возможности, также необходимо иметь в традиционном и электронном форматах, а для работы с журналами третьей зоны очень
важным является формирование электронной подписки на качественные тематические пакеты.
Учитывая, что требуются новые подходы к формированию информационной базы, и что ситуативные знания представлены сопутствующей тематикой, предлагается 4-уровневая архитектура информационной базы. Это
позволяет не «перегружать» фонд ресурсами, несущими ситуативные знания,
а предоставлять их от других фондодержателей – из других традиционных и
электронных библиотек, используя различные формы и методы предоставления информации.
Последний блок задач диссертационной работы направлен на определение оптимальных форм и методов предоставления ситуативных знаний.
Для этого использованы интервью и эксперимент, по завершении которого
проведен опрос участников. Результаты показывают, что наиболее приоритетными формами предоставления ситуативных знаний являются библиографические обзоры, подборки и дайджесты.
Заключительным этапом является построение модели информационного обеспечения современных форм научных исследований. Она включает основные требования к параметрам системы их информационного обеспечения.
Особенность предлагаемой модели отдельно для каждой организационной
формы современных НИР состоит в том, что она соединяет тематиковидовой аспект необходимой информации с оптимальными для учёных и
специалистов формами и методами её предоставления. В ней также учитывается расширение тематико-видовой структуры информационной базы.
Информационное обеспечение современных научных исследований в
соответствии с разработанной моделью предполагает при этом включение
данных о периодичности предоставления ситуативных знаний.
УДК 025:65.011
ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ НАУЧНЫХ ИССЛЕДОВАНИЙ, ОБРАЗОВАТЕЛЬНЫХ ПРОГРАММ И ИННОВАЦИОННЫХ
РАЗРАБОТОК СРЕДСТВАМИ ДАТА-ЦЕНТРА
Ю.С. Вишняков, д.т.н., гл. научный сотрудник;
А.Б. Жижченко, д.ф.-м.н., профессор, академик РАН; М.А.
Жижченко, к.ф.-м.н., с.н.с.;
С.А. Поликарпов, к.ф.-м.н., с.н.с.
13
(Вычислительный центр им. А.А. Дородницына РАН, ул.
Вавилова, 40, г. Москва, 119333, Россия);
А.Н. Сотников, д.ф.-м.н., профессор, зам. директора
(Межведомственный суперкомпьютерный центр РАН,
Ленинский просп., 32а, г. Москва, 119991, Россия,
asotnikov@jscc.ru)
Программные продукты и системы НАУЧНОПРАКТИЧЕСКОЕ ИЗДАНИЕ 2, 2013 г.
Научно-исследовательский институт
«Це нт р п р ог р аммс и с т ем» Тверь
В статье обосновывается необходимость формирования
единого информационного пространства науки, образования и
инноваций. В качестве базовых компонент информационного
пространства выступают суперкомпьютерные вычислительные системы, сетевые среды и информационные ресурсы.
Интегрирующим элементом данного пространства является
комплекс технических, технологических и организационных
решений, объединенных понятием «Дата-центр».
Определены основные цели и задачи проекта по созданию Дата-центра, обсуждаются общие принципы его построения. Сформулирован ключевой принцип архитектуры Датацентра – независимое развитие электронных информационных ресурсов организаций-участников с одновременной их
интеграцией в единое информационное пространство. Представлены результаты формирования пилотной зоны Датацентра как инструмента для отработки его основных технических, технологических и организационных решений.
Ключевые слова: интегрированное информационное пространство, Дата-центр, суперкомпьютерные системы,
сетевые средства, информационные ресурсы.
Информационное обеспечение научных исследований,
образовательных программ и инновационных разработок
средствами дата-центра
http://www.swsys.ru/index.php?id=3481&page=articleВерсия для печати
Выпуск в формате PDF (7.68Мб)
Скачать обложку в формате PDF (1.35Мб)Статья опубликована в выпуске журнала № 2 за 2013 год. [ на стр. 142-148
]
14
Информационное обеспечение научных исследований, образовательных программ как основы создания и развития новых технологий и инновационных производств является важнейшим средством выполнения программы модернизации страны.
Интеграция существующих и создаваемых научно-образовательных
информационных ресурсов в рамках единого информационного пространства
- основа для построения инфраструктуры информационного общества.
Базовыми элементами этой инфраструктуры являются суперкомпьютерные системы, телекоммуникационные сети, информационные ресурсы.
Сегодня инфраструктура - это совокупность суперкомпьютерных центров, ведомственных и корпоративных сетей, разрозненных наборов научных
данных и материалов, созданных в рамках самостоятельных и невзаимосвязанных проектов.
Значительные усилия предпринимаются в направлении формирования
единой вычислительной среды за счет создания и развития суперкомпьютерных центров в научно-исследовательских и образовательных учреждениях,
которые совместно создают и используют масштабируемые суперкомпьютерные мощности на основе глубокой интеграции средствами GRIDтехнологий.
Важным шагом на пути интеграции вычислительных средств является
вхождение РАН в европейский консорциум суперкомпьютерных центров
DEISA.
Проект направлен на коллективное использование вычислительных ресурсов европейских стран, проведение совместных исследований и разработок в области архитектур суперкомпьютеров и организации суперкомпьютерных вычислений, создания и совместного использования распределенных
информационных ресурсов. В проекте участвуют пятнадцать крупнейших
европейских суперкомпьютерных центров, включая и Межведомственный
суперкомпьютерный центр (МСЦ) РАН.
В России насчитывается более двадцати научно-исследовательских и
образовательных сетей, являющихся компонентами общероссийской телекоммуникационной сети науки и образования. Среди них следует выделить
RASNet (сеть, представляющую РАН и МГУ), RBNet (Курчатовский научный центр), RUNNet (Минобрнауки РФ).
Общими усилиями были заложены основы инфраструктуры научнообразовательной телекоммуникационной сети России с опорными узлами в
ведущих научных и образовательных центрах.
Важным шагом в формировании единой интегрированной высокоскоростной телекоммуникационной сетевой инфраструктуры в научнообразовательной и исследовательской сферах явилось создание Национальной ассоциации исследовательских и научно-образовательных электронных
инфраструктур е-АРЕНА, объединяющей крупнейшие научнообразовательные сети страны и обеспечивающей их интеграцию с европейской научно-образовательной сетью GEANT.
15
В настоящее время под управлением ассоциации е-АРЕНА функционирует базовый узел межсетевого обмена научно-образовательных сетей
«GigaNAP/Москва». Научно-образовательные сети подключены к данному
базовому узлу каналами связи 1-10 Гбит/с.
Европейская научно-образовательная сеть GEANT имеет в своей основе 50 тысяч километров сетевой инфраструктуры, объединяет более 8 тысяч
исследовательских институтов, обеспечивает доступ к вычислительным, сетевым и информационным ресурсам около 40 миллионов ученых, специалистов и студентов, включая и российских.
Развитие сетевых и компьютерных технологий привело к тому, что в
настоящее время в мире стало возможным объединение распределенных разнородных вычислительных ресурсов, хранилищ данных, соответствующего
ПО в единую инфраструктуру, на базе которой можно обеспечивать доступ к
ресурсам, в том числе к различным имитационным моделям, как к webсервису в рамках так называемой концепции облачных вычислений.
Российское научно-образовательное сообщество, и в первую очередь
РАН, является обладателем и генератором огромного научного информационного фонда, сконцентрированного в научных институтах и центрах РАН, а
также в библиотеках, архивах и музеях. Эффективное использование этих
уникальных информационных фондов в интересах науки, образования и инноваций требует кардинально новых подходов к их организации, формированию и сопровождению, обеспечивающих широкий доступ.
Вместе с тем сложившаяся система информационной поддержки научных исследований, образовательных программ и инновационных производств является разрозненной и неоднородной, носит преимущественно узконаправленный и внутриотраслевой характер, ограничивает доступ к накопленным массивам знаний и информации, ведет к потере данных. Это не позволяет в полной мере обеспечить решение задач по формированию и актуализации БД и БЗ, повышению эффективности взаимодействия научных коллективов.
Современное развитие исследовательской и научно-образовательной
сфер, разработку новых технологий, особенно в таких областях, как нанотехнологии, альтернативная энергетика, биоинженерия и других, невозможно
представить без соответствующих информационных технологий. Необходимы определенные имитационные и математические модели различных процессов и явлений, что, в свою очередь, требует решения задач, связанных с
обработкой больших массивов данных, и выполнения значительных объемов
вычислений, затруднительных даже для суперкомпьютеров.
С другой стороны, работы носят принципиально междисциплинарный
характер и зачастую требуют сотрудничества коллективов, находящихся в
различных регионах. Дорогостоящие, а иногда и уникальные элементы материально-технической базы, формируемые и необходимые для научных исследований информационные ресурсы также часто оказываются географически разнесенными.
16
Таким образом, в интересах научно-образовательного сообщества возникла необходимость реализовать проект формирования единой среды распределенных информационных ресурсов, как уже существующих, так и
вновь создаваемых, с унифицированной системой доступа и с подключением
к этой среде широкого круга активных пользователей [1].
Признанной мировой практикой решения проблем накопления, сохранения, интеграции научных данных и знаний, обеспечения унифицированного доступа к ним является комплекс технических, технологических и организационных решений, объединенных понятием «Дата-центр».
Состояние проблемы в России
Во многих научных организациях и исследовательских центрах, и в
первую очередь в РАН, накоплены колоссальные объемы данных, представляющих собой результаты экспериментальных исследований и наблюдений,
математические модели, на основе которых можно решать самые разнообразные исследовательские, аналитические, образовательные задачи.
Российские электронные информационные ресурсы в научной сфере,
включая область научного наследия, достаточно многочисленны, однако они
чрезвычайно разрозненны, несистемны, несовместимы между собой, различны по качеству и методологии создания, целям и возможностям для дальнейшего развития.
Множество проектов в этой сфере, созданных по грантам научных
фондов, перестают поддерживаться и исчезают после прекращения финансирования. Крайне слабо осуществляется связь научной и образовательной
сфер в этой области.
В то же время некоторые информационные ресурсы научнообразовательно-го профиля являются качественными, вполне жизнеспособными и востребованными научным сообществом. Примером могут служить
репозитории экспериментальных и теоретических данных по структурной
протеомике (Институт биоорганической химии им. академиков М.М. Шемякина и Ю.А. Овчинникова РАН, г. Москва), востребованные для создания
высокоэффективных подходов к рациональному компьютерному конструированию новых молекул (в том числе лекарств, вакцин и пр.) и наноконструкций с заданным спектром биологической активности.
Создание фондов численных данных по свойствам веществ и материалов, атомно-молекулярных и наноструктур является одним из ключевых результатов исследований, выполняемых в институтах РАН естественнонаучного и технического профилей. Широкую известность приобрели БД
ИВТАНТЕРМО, ТЕРМАЛЬ, ЭПИДИФ, включающие обширные массивы
информации по теплофизическим и термодинамическим свойствам (Объединенный институт высоких температур РАН, г. Москва) [2]. Начаты работы по
организации компьютерных систем хранения и обработки слабоструктурированных данных, характерных для наноструктур и наноматериалов.
Следующий проект нацелен на инвентаризацию основных, прежде всего сетевых, информационных ресурсов РАН в части пространственных дан-
17
ных и знаний, накопленных в институтах и других учреждениях РАН географического, геоэкологического, геохимического и геофизического профилей,
включая наборы базовых цифровых тематических данных, охватывающих
предметные области наук о Земле. Среди них геология, рельеф (геоморфология), почвы, флора, фауна, биологическое разнообразие и биогеографическое
районирование, климат, водные объекты суши, мировой океан, особо охраняемые природные территории, объекты культурного наследия, воздействие на
окружающую среду, зоны природных рисков, объекты народного хозяйства,
население и его демографические характеристики, здравоохранение
и безопасность среды обитания (медико-географические характеристики), земельные, водные, биологические, энергетические и минеральносырьевые ресурсы. Для описания этих данных используется академический
профиль метаданных «ГеоМЕТА» [3].
Существенно продвинулась разработка решений, ориентированных на
работу с большими объемами информации и интеграции разнородных информационных ресурсов. Здесь следует в первую очередь отметить создание
общероссийского математического портала Math-Net.Ru - современной информационной системы, обеспечивающей представителям российского и
международного математических сообществ различные возможности в поиске необходимой в научной работе информации [4].
К числу успешных проектов формирования интегрированных информационных ресурсов следует отнести и создание электронной библиотеки
«Научное наследие России», объединяющей информационные фонды библиотек, архивов, музеев и научных учреждений РАН и предоставляющей в
открытый доступ информацию о российских достижениях в области фундаментальных естественных и гуманитарных наук с возможностью ознакомления с полными текстами научных работ ученых [5].
Все большую популярность в мире приобретает концепция проблемноориентированных web-площадок (hub - сетевой концентратор), поддерживающих сотрудничество в конкретных областях науки и образования (например в экономике, биологии и др.). Инновационность подхода состоит в объединении современных концепций web 2.0 с возможностью доступа к прикладным моделям. В этой связи уникальным для России является опыт Института системного программирования РАН (ИСП РАН, г. Москва) по реализации программы «Университетский кластер» [6], организованной ИСП
РАН (центр компетенции) совместно с МСЦ РАН, компанией HewlettPackard и национальным оператором связи Синтерра. Цель проекта - создание единой инфраструктуры (экосистемы) исследований, разработок и образования в области параллельных и распределенных вычислений, а также создание сообщества пользователей и разработчиков соответствующих технологий.
Другим примером является участие РАН в международном проекте
OpenCirras, организованном компаниями Hewlett-Packard, Intel и Yahoo! при
участии Национального научного фонда США (NSF), Университета Илли-
18
нойса в Урбане-Шам-пэйн, Министерства развития компьютерных коммуникаций Сингапура, Технологического института в Карлсруэ. Целью проекта
Open Cirrus является создание стенда на базе распределенных центров обработки данных для поддержки разработчиков как прикладных, так и системных программных средств в области облачных вычислений. РАН стала первой восточно-европейской организацией, присоединившейся к проекту Open
Cirrus, и одним из семи центров компетенции в составе ИСП РАН, МСЦ РАН
и РНЦ «Курчатовский институт».
Понимание проблемы и необходимый научный и технический задел
имеются и в регионах России. Так, в Институте математики и механики
Уральского отделения РАН (ИММ УрО РАН, г. Ижевск) разработано уже не
одно поколение программных средств для создания электронных каталогов
библиотек. В рамках этой работы созданы четыре специализированных библиотечных сервера - в Екатеринбурге, Перми, Ижевске и Сыктывкаре. На них
установлено ПО, позволяющее создавать и редактировать электронные каталоги и осуществлять доступ пользователей к ним через Интернет. Разработанное ПО имеет статус FreeWare и распространяется свободно.
В рамках проектов формирования и использования информационных
ресурсов в РАН на базе Вычислительного центра им. А.А. Дородницина РАН
(г. Москва) проведены исследования и разработки, создан задел, который
позволяет перейти к масштабному интеграционному проекту - созданию Дата-центра науки, образования и инноваций, который смог бы объединить
усилия в данной области учреждений РАН, высшей школы, других организаций научно-информационной сферы России. Именно совместная работа в
этом направлении представителей всех заинтересованных ведомств - РАН,
вузов страны, исследовательских организаций создаст предпосылки для
успешной реализации проекта в кратчайшие сроки.
Задача интеграции средствами Дата-центра научно-образовательной
информации в единое информационное пространство, создание условий его
эффективного освоения, несомненно, должна рассматриваться как составная
часть стратегии развития отечественной науки и образования и, таким образом, становления и развития информационного общества в России.
При реализации проекта необходимо учитывать лучший зарубежный
опыт. С одной стороны, целесообразно использовать технологические достижения, современные международные стандарты, технологию открытых
систем, семантического Web и др. С другой - важно учесть практический
опыт реализации крупных интеграционных проектов в области формирования распределенных научных ресурсов: Еврокомиссии DRIVER, создания
Дата-центров, электронных библиотек и др. Наконец, необходимо ориентироваться на тесное взаимодействие с аналогичными проектами в США, Европе, Японии, Китае и в других странах для обеспечения возможности обмена с ними как ресурсами, так и технологиями.
Общие принципы создания Дата-центра науки, образования и инноваций
19
Главной целью проекта создания такого Дата-центра является организация качественно новой, современной инфраструктуры для проведения
научных исследований, обработки и хранения результатов научных исследований.
В ходе выполнения работ по проекту должны быть решены следующие
задачи:
- обеспечение процедур сбора, хранения, обработки распределенных
данных и управления информационными потоками данных и знаний; объединение различных информационных фондов с помощью интегрированного
каталога метаданных и механизмов логической адресации единиц хранения;
- реализация механизмов и логики управления жизненным циклом
данных, включая создание материалов, передачу, хранение, доступ к ним;
- предоставление механизмов поиска и доступа пользователей к информационным ресурсам.
Пользователи должны получить масштабируемое прозрачное хранилище гетерогенных данных с гарантированным качеством сервиса (защита,
сохранность, скорость доступа, точность поиска) и унифицированными механизмами обмена данными разного типа (файлы, таблицы, массивы), совместимое с вычислительными и сетевыми сервисами GRID-инфраструктуры.
Хранилище должно поддерживать долговременное хранение, поиск и
удобный доступ к параметрам экспериментов, к необработанным экспериментальным данным и результатам их обработки, описаниям математических
моделей и данным имитационного моделирования, методикам проведения
экспериментов, научным отчетам и комментариям к ним, другим материалам. Объектами хранения в распределенной системе данных должны быть
файлы, коллекции файлов, многомерные массивы, базы и банки данных.
Участники программы. В ближайшие 2-3 года основными участниками программы должны стать исследовательские центры и институты РАН. В
качестве исполнителей в программу могут быть приглашены другие государственные академии, научные библиотеки, архивы, музеи и издательства, а
также организации-генераторы и держатели научных информационных фондов, профессионально занимающиеся научно-образовательной деятельностью.
Предполагается, что проект принципиально должен быть открыт и для
других учреждений, а также для зарубежных организаций.
Все участники предоставляют в общее пользование имеющиеся у них
информационные ресурсы в электронной форме по профильной для участника тематике и в виде, определяемом соглашениями. Каждый участник самостоятельно осуществляет поиск и отбор материалов, удовлетворяющих согласованным требованиям, перевод в электронную форму, создание метаданных, решение правовых и экономических вопросов, связанных с размещением информационных ресурсов в Интернете и предоставлением их пользователю.
20
Централизованно осуществляются контроль качества, управление метаданными и словарями, общая навигация и организация поиска.
Вопросы централизации или распределения ресурсов на технических
средствах участников, архивирования ресурсов, мониторинга Дата-центра и
реализации некоторых других функций определяются отдельными соглашениями.
Информационное наполнение Дата-центра. Информационное пространство Дата-центра предлагается организовать на основных сущностях,
образующих множество научных данных, таких как файлы, репозитории
данных, базы и банки данных, хранилища данных.
В информационном пространстве Дата-центра будут представлены результаты экспериментальных исследований, физических наблюдений и экспериментов, математического моделирования, алгоритмы, модели и программы, а также информационные объекты, являющиеся электронными копиями объектов библиотечного, архивного и музейного хранения, - печатных
изданий, архивных документов, аудио- и видеоматериалов, музейных экспонатов.
Архитектура Дата-центра. Дата-центр строится как распределенная
информационная система с выделенным центральным узлом и узлами, объединяющими ресурсы участников. Узлы системы, с одной стороны, являются
точками входа в электронные информационные ресурсы организацийучастников проекта, с другой - поставщиками информации для всей распределенной системы.
Таким образом, ключевой принцип архитектуры - независимое развитие электронных ресурсов организаций-участников с одновременной интеграцией данных в единое пространство. Это достигается стандартизацией метаданных, форматов предоставления данных, интерфейсов поиска и словарей. Таким образом, каждая из организаций-участников может хранить данные в собственных форматах и предоставлять свои сервисы, но в то же время
обеспечивать единые для всех интерфейсы, упомянутые выше.
Центральный узел системы должен обеспечивать навигацию, поиск и
предоставление данных по всем цифровым ресурсам в соответствии с унифицированными форматами и сервисами, то есть принцип единого окна доступа к запрашиваемым данным и информации, объединенной средствами
Дата-центра.
Общие (обязательные для всех звеньев) метаданные необходимо создавать на базе международных стандартов.
Функциональность Дата-центра науки, образования и инноваций. Основными элементами функциональности Дата-центра являются следующие.
• Доступ к информационным ресурсам - запрос, определение местоположения, извлечение, трансформация ресурса; поиск может осуществляться как по атрибутам ресурса, так и по полным текстам.
21
• Управление информационными ресурсами - создание новых информационных объектов и коллекций, внесение их в информационное хранилище Дата-центра, удаление ненужных и изменение существующих.
• Управление метаданными и словарями - их создание, поддержка в
актуальном состоянии и развитие.
• Управление пользователями - их регистрация, учет прав, определение объемов и типов получаемой пользователями информации, обеспечение
взаиморасчетов за оказываемые услуги, персональная информация о пользователях.
• Системное администрирование - установка, конфигурирование, необходимые периодические мероприятия, восстановление после сбоев, обеспечение сохранности данных.
• Мониторинг - учет и анализ посещаемости и цитируемости Датацентра и его отдельных частей различными категориями пользователей.
• Обеспечение защиты информации - создание развитой системы администрирования, пресечения попыток несанкционированного доступа к ресурсам.
Организационно-экономические условия реализации проекта
Организация работ по проекту. С учетом реальной ситуации должен
быть принят принцип постоянного и постепенного расширения круга участников проекта. На первом этапе в нем участвуют несколько организаций
РАН. Затем к ним должны присоединиться организации других ведомств,
государственных академий, в результате проект будет организован как межведомственный. На более поздних этапах может быть рассмотрена возможность расширения числа участников программы.
Для эксплуатации Дата-центра должна быть создана специальная эксплуатационная служба. Также необходимо создать службы эксплуатации в
организациях, участвующих в проекте своими инфраструктурными мощностями и информационными фондами.
Правовые основы создания Дата-центра. В России принят ряд важнейших государственных решений по вопросам создания и развития информационных технологий, суперкомпьютерных технологий, GRID-технологий,
создания ПО. В них отражается необходимость скорейших действий, направленных на достижение сравнимого с мировым уровня информационной инфраструктуры страны.
Приняты основы государственной политики в области создания и применения суперкомпьютерных и GRID-технологий в интересах национальной
безопасности. Одним из приоритетных направлений технологического прорыва является программа фундаментальных исследований Президиума РАН
на 2010 г. «Стратегические информационные технологии, включая вопросы
создания суперкомпьютеров и разработки программного обеспечения».
Представлен перечень поручений Президента РФ Правительству РФ от
24.01.2008 г., в котором отмечена необходимость принятия мер по обеспечению деятельности национальной научно-исследовательской информационно-
22
вычислительной сети, предоставляющей научным и образовательным центрам доступ к распределенным вычислительным средам высокой производительности.
Принята Стратегия развития информационного общества в РФ. В ней
задаются общие принципы создания инфраструктуры IT-технологий в России, предлагаются конкретные шаги по реализации этих принципов, определяются контрольные ориентиры на будущее.
Одним из важнейших решений стало принятие Федерального закона
РФ № 217-ФЗ от 2.08.2009 г. Вместе с вступившей в силу в конце 2006 г. Частью 4 Гражданского кодекса РФ, обеспечивающей охрану интеллектуальной
собственности и авторских прав в РФ, этот закон впервые позволил бюджетным научным учреждениям и научным учреждениям государственных академий наук совместно с коммерческими структурами создавать хозяйственные общества, деятельность которых заключается в практическом применении (внедрении) результатов интеллектуальной деятельности. При этом в Законе содержится прямое указание на то, что бюджетные научные учреждения
и созданные государственными академиями наук научные учреждения в качестве вклада в уставные капиталы таких хозяйственных обществ могут вносить право использования результатов интеллектуальной деятельности.
В перспективе управляемые Дата-центром ресурсы могут получить
статус федеральной межотраслевой информационной системы (согласно Федеральному закону «Об информации, информационных технологиях и защите информации»). При этом Дата-центр выступит ее оператором.
Взаимодействие с другими информационными системами. Важным
направлением функционирования и развития Дата-центра должна стать организация взаимодействия со смежными информационными ресурсами, научными электронными библиотеками и другими организациями, как российскими, так и зарубежными. Для этого необходимо разработать организационно-экономические и технологические регламенты такого взаимодействия,
предполагающие координацию сбора и обработки информации, в частности,
обмен информационными ресурсами. Регламент должен предусматривать
четкие указания на права сторон при различных способах использования материалов Дата-центра.
Текущее состояние и ожидаемые результаты
На данный момент создана устойчивая кооперация организацийучастников проекта, заинтересованных в размещении своих информационных ресурсов в информационном пространстве Дата-центра в соответствии с
разработанными регламентами и процедурами.
Проведены работы в направлении каталогизации научноинформационных ресурсов РАН и формирования их метаописаний. В качестве первого этапа интеграции ресурсов предложена система паспортизации
ресурсов, адекватно отражающая предметную область, типологию ресурса,
условия доступа и пр. [7].
23
На базе Вычислительного центра им. А.А. Дородницына РАН (г.
Москва) сформирована и функционирует пилотная зона Дата-центра. Основными компонентами хранилища данных Дата-центра являются система хранения Hitachi AMS 2100 емкостью 240 ТБ, набор серверов, объединенных
локальной сетью с подключением к сети Интернет.
Отработаны основные принципы распределенного хранения и обработки данных. Созданы и поддерживаются проблемно-ориентированные webплощадки (механика сплошной среды; пространственные данные, свойства
материалов; структурная протеомика).
Реализация проекта по созданию Дата-центра как технического, технологического и организационного ядра единого интегрированного информационного пространства науки, образования и инноваций обеспечит решение
ряда важных задач и послужит достижению следующих основных целей.
• Создание принципиально новой системы организации и использования информационных ресурсов в сфере науки, образования и инноваций, а
также реализация распределенной архитектуры для самостоятельного создания участниками проекта информационных ресурсов и централизованной
поддержки программных, лингвистических и технологических средств, обеспечивающих необходимую функциональность и единство системы, в частности, одноразовый ввод и обработку информации.
• Обеспечение интеграции разнородных материалов, в том числе
электронных копий репозиториев научных данных, фондов электронных
научных библиотек, банков и баз данных, объектов библиотечного, архивного и музейного хранения.
• Обеспечение надежной сохранности различных материалов в цифровой форме, а также возможность подключения новых организаций, коллекций и типов информационных ресурсов за счет архитектуры и технологии
функционирования Дата-центра.
• Разработка и реализация организационно-экономической и правовой модели межотраслевой постоянно действующей и развивающейся информационной системы.
Дата-центр науки, образования и инноваций должен стать образцом
добровольного сотрудничества и эффективного взаимодействия научных,
образовательных и информационных учреждений России в создании общего
научно-образовательного информационного пространства.
Download