ТОГУ: текущее состояние и перспективы развития

advertisement
УДК 681.3.06+519.68
С. И. Смагин, А. А. Сорокин, С. М. Бурков, А. Г. Тарасов,
С. И. Мальковский
РАСПРЕДЕЛЕННАЯ ВЫЧИСЛИТЕЛЬНАЯ СИСТЕМА ВЦ ДВО
РАН - ТОГУ: ТЕКУЩЕЕ СОСТОЯНИЕ И ПЕРСПЕКТИВЫ
РАЗВИТИЯ
Смагин С. И. – директор, чл.-корр. РАН, Вычислительный центр ДВО РАН,
д.ф.-м.н.;
Сорокин А. А. – зав. лабораторией информационно-телекоммуникационных
систем, Вычислительный центр ДВО РАН, к.т.н.;
Бурков С. М. – директор ХабЦНИТ ТОГУ, д.т.н. ;
Тарасов А. Г. – научный сотрудник, Вычислительный центр ДВО РАН;
Мальковский С. И. – младший научный сотрудник, Вычислительный центр
ДВО РАН
В докладе рассматривается архитектура единой распределенной вычислительной системы Вычислительного центра ДВО РАН и Тихоокеанского государственного университета, а также описание ряда
совместных проектов и исследований в области информационновычислительных технологий.
Современный уровень развития вычислительной техники и методов математического моделирования дает уникальную возможность
для перевода, как промышленного производства, так и научных исследований на качественно новый уровень [1]. Это может быть достигнуто с использованием суперкомпьютерных технологий. В силу сложности алгоритмов и объёма обрабатываемых данных, решение прикладных задач в различных областях науки и промышленности требует
значительных вычислительных ресурсов.
В конце 90-х годов XX-го столетия большое внимание стало уделяться организации высокопроизводительных вычислений. Эта область знаний выделилась в самостоятельную отрасль со своей методологией, технологиями и подходами. Широкое распространение получили кластерные системы и технологии их объединения в распределенные вычислительные системы (РВС).
Существуют различные типы вычислительных систем, наиболее
распространенным из них является Grid. Grid представляется согласованной, открытой и стандартизованной средой, которая обеспечивает
гибкое, безопасное, скоординированное разделение ресурсов в рамках
виртуальной организации – то есть динамически формирующейся совокупности независимых пользователей, учреждений и ресурсов [2].
Grid-системы позволяют объединять элементы географически распределенной информационно-телекоммуникационной и вычислительной инфраструктуры разных организаций. Это обеспечивает более
эффективное использование ресурсов, даёт возможность коллективно
их наращивать и формировать более производительную вычислительную среду.
В настоящее время, такие системы используется для решения трудоемких фундаментальных и прикладных научных задач, в таких областях как ядерная физика, молекулярная биология, экономическое прогнозирование, моделирование и анализ природных и техногенных процессов и другие. Вычислительный центр (ВЦ) ДВО РАН и Тихоокеанский государственный университет (ТОГУ) объединили усилия в области развития и популяризации суперкомпьютерных технологий в ДФО.
В 2010 году была организована распределенная вычислительная система [3]. В ее основу легла следующая информационнотелекоммуникационная и вычислительная инфраструктура:
1. Два вычислительных кластера c общей производительностью 3
Тфлопс.
Кластер ВЦ ДВО РАН, состоящий из 1 управляющего и 17 вычислительных узлов, построенных на базе процессоров Intel Xeon и AMD
Opteron. Всего пользователям доступно 168 вычислительных ядер и
496 Гбайт оперативной памяти. Вычислительный кластер ТОГУ, состоящий из одного управляющего и пяти вычислительных узлов. Всего
пользователям доступно 96 процессорных ядер и 192 Гбайт оперативной памяти.
Интеграция вычислительных кластеров осуществлена при помощи
системы диспетчеризации задач PBS Torque путем подключения вычислительных узлов к единому управляющему серверу. Синхронизация директорий на узлах кластера выполняется с использованием протокола NFS [4].
2. Волоконно-оптические линии связи, на основе которых организован канал ВЦ ДВО РАН - ТОГУ пропускной способностью 1 Гбит/с.
Через действующие сетевые подключения, ресурсы вычислительной системы доступны пользователям Корпоративной сети ДВО РАН
(http://www.febras.net), РАН (http://www.jscc.ru/rasnet.shtml), Федеральной университетской сети России (http://www.runnet.ru) и глобальной
сети Internet.
На базе ВЦ ДВО РАН создан ресурсный центр гридинфраструктуры Национальной нанотехнологической сети ГридННС
(http://www.ngrid.ru), предоставляющий доступ к вычислительным ресурсам участников данного проекта и возможность работы с широким
перечнем специализированного программного обеспечения (например,
ABINIT, VASP, Flowfision, GAUSSIAN, GAMESS и др.). Совместно с
НИЦ «Курчатовский институт» ведутся работы, направленные на разработку проблемно-ориентированных интерфейсов к пакетам прикладных программ ABINIT и VASP в ГридННС. В настоящее время созданы прототипы интерфейса взаимодействия предметных специалистов с
указанным программным обеспечением, реализованы системные
функции формирования файлов описания задач предметной области,
ведутся испытания по запуску и контролю выполнения заданий в Grid.
Организованная вычислительная инфраструктура используется сотрудниками учреждений ДВО РАН и ТОГУ для выполнения исследований по широкому спектру задач. Наиболее активными её пользователями являются ученые ВЦ ДВО РАН и Института материаловеденья
ХНЦ ДВО РАН, которые проводят работы в области квантовомеханического моделирования атомной и электронной структуры
наноматериалов и объемных материалов.
В рамках проекта выполнения унаследованного в двоичном коде
программного обеспечения (ПО) проводятся исследования в сфере
применения систем виртуализации на вычислительных кластерах. В
настоящий момент создаётся предварительная версия информационной
системы для работы через библиотеку libvirt. Цель применения libvirt –
унификация процесса работы с виртуальными машинами, относящимися к различным системам реализации, таким как KVM, Xen,
VMWare. Преимущество данной библиотеки заключается в обеспечении унифицированного интерфейса доступа к возможностям, предоставляемым различными системами виртуализации. Конечная цель
данного направления исследования - предоставление механизма использования ранее разработанных программных продуктов в современных вычислительных системах, например Grid. Это позволит повторно использовать имеющиеся наработки в области библиотек компьютерных прикладных программ и повысить эффективность их использования за счёт возможности массового запуска таких приложений
на удаленных вычислительных узлах. Хотя приложения не станут
“настоящими” параллельными программными продуктами, тем не менее, для ряда задач такой подход позволит решать быстрее задачи, для
которых свойственен параллелизм данных или возможно разделение
области поиска решения на независимые подобласти.
В 2011-2012 гг. в рамках выполнения программы развития инновационной инфраструктуры ТОГУ, будут проведены работы по поэтапной модернизации вычислительного кластера Университета, которые
позволят увеличить общую пропускную способность распределенной
вычислительной системы ВЦ ДВО РАН - ТОГУ до 30-32 Тфлопс.
Интеграция усилий ВЦ ДВО РАН и ТОГУ позволили создать один
из крупнейших на Дальнем Востоке России научно-образовательных и
технических центров в области информационно-вычислительных технологий. Участие и успешная работа его сотрудников в реализации ряда высокотехнологичных проектов Министерства связи и массовых
коммуникаций РФ (http://minsvyaz.ru/ru/directions/?direction=20), Министерства образования и науки РФ, ДВО РАН, РФФИ позволяют, на
наш взгляд, ставить вопрос о возможности организации на его базе
межведомственного вычислительного центра уровня ДФО.
Библиографические ссылки
1. Суперкомпьютерные технологии в науке, образовании и промышленности / Под редакцией: академика В.А. Садовничего, академика Г.И. Савина,
чл.-корр. РАН Вл.В. Воеводина.-М.: Издательство Московского
университета, 2009.-232 с
2. Foster I., Kesselman C., Tuecke S. The Anatomy of the Grid: Enabling
Scalable Virtual Organizations // International Journal of High Performance Computing Applications, 15 (3). 2001,- P. 200-222.
3. Смагин С.И., Шаповалов Т.С., Сорокин А.А., Мальковский С.И., Бородулин В.В., Бурков С.М. Создание распределенной вычислительной системы ТОГУ - ВЦ ДВО РАН. Материалы международной научно-практической
конференции «Суперкомпьютеры: вычислительные и информационные технологии». - Хабаровск, Изд-во Тихоокеанского гос. ун-та. - 2010. - C. 112-115.
4. Тарасов А.Г., Шаповалов Т.С., Мальковский С.И. Интеграция вычислительных ресурсов ТОГУ и ВЦ ДВО РАН с применением Grid-технологий.
Материалы международной научно-практической конференции «Суперкомпьютеры: вычислительные и информационные технологии». - Хабаровск,
Изд-во Тихоокеанского гос. ун-та. - 2010. - C. 133-138.
Download