вопросы развития высокопроизводительных вычислений в

advertisement
ВОПРОСЫ РАЗВИТИЯ ВЫСОКОПРОИЗВОДИТЕЛЬНЫХ ВЫЧИСЛЕНИЙ В
КЕМЕРОВСКОМ ГОСУДАРСТВЕННОМ УНИВЕРСИТЕТЕ
К.Е.Афанасьев, А.М.Гудов, С.В.Стуколов
Кемеровский государственный университет, Кемерово
Тел.: (3842) 23-44-03, факс: (3842) 23-44-03, e-mail: keafa@kemsu.ru, good@kemsu.ru, serg@kemsu.ru
В докладе обсуждаются проблемы построения вычислительного кластера на базе локальной сети рабочих станций,
представлены результаты тестирования реально работающего кластера, установленного на кафедре НИТ Юнеско
КемГУ.
В настоящее время вместе со стремительным ростом вычислительных мощностей растет интерес к
суперкомпьютерным технологиям. Последние разработки в области параллельных высокопроизводительных
вычислений способны обеспечить решение очень сложных задач науки и техники, что, в свою очередь, способствует
созданию спроса на соответствующих специалистов. Уже многие вузы начали подготовку таких элитарных
специалистов в рамках образовательных стандартов.
Решению этой задачи способствуют различные федеральные программы (такие, как программа "Интеграция" и
"Создание национальной сети компьютерных телекоммуникаций для науки и высшей школы") и гранты Министерства
Науки, РФФИ и других фондов. Эти программы ориентированы, в первую очередь, на создание Центров
высокопроизводительных вычислений с возможностью динамического использования разделяемых вычислительных
ресурсов. Это, несомненно, позволяет многим образовательным и научным учреждениям решать свои задачи,
требующие значительных вычислительных мощностей. Однако, использовать эти Центры в учебной деятельности
малоэффективно и экономически неоправданно. С другой стороны, наверное, каждый средний вуз имеет возможность
создавать прототипы высокопроизводительных систем, основанных либо на SMP-архитектуре (что, конечно, является
дорогим решением), либо на MPP-архитектуре.
Примером такого недорогого решения являются кластерные системы, основанные на платформе персональных
компьютеров. Основные достоинства кластеров на основе сети ПК – возможность постепенного расширения и
модернизации, а также режим эксплуатации сети днем для обычных нужд (обучение студентов и т.д.), а ночью или в
выходные дни – для научных расчетов. Но при реализации такого технического решения приходится учитывать ряд
существенных проблем. Во-первых, требуется высокоскоростное коммуникационное оборудование, обеспечивающее
среду передачи сообщений с минимальными узлами коммутации или маршрутизации информационных пакетов. Вовторых, при создании программ необходимо учитывать физическую топологию сети, параллельные свойства
реализуемых алгоритмов и необходимость специальным образом распределять данные между процессорами с целью
минимизации числа пересылок и объема передаваемых данных. Таким образом, существенно усложняется написание
параллельных алгоритмов по сравнению с традиционными последовательными.
Кемеровский госуниверситет имеет развитую телекоммуникационную инфраструктуру, включающую не только
локальные сети факультетов и подразделений, но и корпоративные сети филиалов университета и других
образовательных учреждений, расположенных в крупных городах Кузбасса: Кемерово, Новокузнецк, Белово, АнжероСудженск. Гетерогенные сегменты корпоративных сетей связаны в единое информационное пространство через
Региональную сеть передачи данных Кемеровского университета, построенную на основе цифровой технологии
передачи данных со скоростями 2 Мбит/с по существующим радиорелейным линиям между городами и беспроводных
технологий, обеспечивающих скорости до 11 Мбит/с внутри городских сегментов. Такая телекоммуникационная
структура характерна для большинства вузов и ее необходимо учитывать при развитии новых наукоемких и
образовательных технологий.
Около года назад в КемГУ создана кафедра ЮНЕСКО по новым информационным технологиям, которая начала
подготовку специалистов по специальности "Высокопроизводительные системы и сети". Для обеспечения учебного
процесса в КемГУ доступны следующие вычислительные ресурсы: сервер Alpha-2000 (1 CPU 266 MHz, 128 Mb RAM, 10
Gb HDD), SMP-система Sun Enterprise 2 (2 CPU 200 MHz, 256 Mb RAM, 50 Gb HDD) и MPP-система Parsytec P-Cube 168-P (16 CPU 100 MHz, 8Mb RAM на каждом).
Кроме того, для решения текущих задач был создан кластер кафедры Юнеско на базе существующего
компьютерного класса (10 компьютеров Celeron/400MHz, 64 Mb RAM, 6 Gb HDD, сетевые карты – Realtek 10/100 Mbps).
Программное обеспечение: свободно распространяемые операционная система – Redhat Linux 6.2 Intel, компиляторы –
GNU GCC/G77, стандартизованная коммуникационная библиотека – MPICH версии 1.2.1.
Производительность кластера определялась с использованием алгоритма из пакета LINPACK для решения систем
линейных алгебраических уравнений методом LU разложения, который представляет собой набор последовательных
фортрановских подпрограмм для матричных вычислений. Суммарная производительность нашего кластера составила
162 MFLOP (27 MFLOP на каждом узле) для чисел с плавающей точкой одинарной точности и 102 MFLOP (17 MFLOP на
каждом узле) для двойной точности при размерности обращаемой матрицы 1500х1500 в обоих случаях.
В сравнение на кластере установлена библиотека SCALAPACK для матричных вычислений, являющаяся
параллельным аналогом библиотеки LINPACK. Для тестирования кластера был выбран тот же самый алгоритм.
Полученная производительность кластера, состоящего из 6 узлов, составила 44 MFLOP для чисел двойной точности
при размерности обращаемой матрицы 3000x3000.
Полученные решения показали свою обоснованность и жизнеспособность для решения специальных задач. В
дальнейшем планируется сравнение кластерных технологий с МРР – системой P-Cube и SMP – системами.
1
Download