Кластерные суперкомпьютеры Статья 1

advertisement
Кластерные суперкомпьютеры и их применение в решении наукоемких задач
Поначугин А.В., к.э.н., доцент, НГПУ, 603950,
г. Нижний Новгород, ул. Ульянова, д.1,
E-mail: sasha3@bk.ru
Один из эффективных методов изучения сложных систем - компьютерное
моделирование. Компьютерная модель проще и удобнее для исследований по
сравнению с реальными экспериментами, так как они имеют финансовые и
физические препятствия или дают непредсказуемый результат.
Компьютерная модель основывается на абстрагировании от конкретной
природы явлений или исследуемого объекта-оригинала. Ее построение
включает в себя два этапа: создание качественной, а потом и количественной
модели. Задача компьютерного моделирования - это проведение
вычислительных экспериментов на компьютере. Цель таких экспериментов анализ, интерпретация и сопоставление результатов моделирования с реальным
поведением исследуемого объекта, а так же, при необходимости, уточнение
модели и пр.
На сегодняшний день можно утверждать, что кластерные системы
успешно применяются для выполнения всех задач суперкомпьютеринга включая и расчеты для науки и промышленности и управление базами
данных.
Практически
все
приложения,
которые
требуют
высокопроизводительных вычислений в настоящее время имеют параллельные
версии, которые позволяют разбить задачу на фрагменты и обсчитать ее
параллельно на нескольких узлах кластера. К примеру, для инженерных
расчетов традиционно применяются сеточные методы, когда область
вычислений разделена на ячейки, каждая из которых является отдельной
единицей расчета. Такие ячейки обсчитываются независимо друг от друга на
разных узлах кластера, и, чтобы получить обзор картины в целом на каждом
шаге расчета происходит обмен данными, распространенных в пограничных
областях.
При проведении практических расчетов (крэш-тесты, 3D-анимация,
прогнозирование погоды, разведка газовых и нефтяных месторождений) чаще
всего используют группы включающие в себя до 200 узлов. При этом главная
задача заключается в обеспечение эффективного функционирования кластера с
конкретными приложениями. Архитектура кластера должна гарантировать
масштабируемость программного обеспечения при увеличение числа узлов, то
есть увеличение производительности при добавлении новых модулей расчета.
Для этого важно грамотно сконфигурировать кластер в зависимости от
профиля обмена данными между экземплярами программы, работающих на
разных узлах. При этом необходимо учитывать общий объем передаваемой
информации, распределение длин сообщений, применение групповых
операций и пр.
На сегодняшний день даже такие задачи, которые решаются традиционно
с использованием многопроцессорных систем с общей памятью, как
управление большими базами данных, успешно решаются на кластерах.
Возникновение на рынке продуктов таких, как Oracle RAC (Real Application
Cluster), дало возможность реализовывать кластерные системы в сфере баз
данных, а в новой версии СУБД Oracle 10g, которая построена на основе
GRID-технологий, обеспечивать наиболее эффективное использование
кластерной архитектуры для решения подобных задач. Доступность
кластерных решений позволяет предприятиям существенно упростить и
ускорить работу с корпоративной базой данных, и количество предприятий
применяющих такое решение значительно увеличилось.
Кластерные решения - этот выбор наиболее экономически обоснованный.
Отличается от большего количества серверных систем с общей памятью тем,
что кластерные решения довольно просто масштабируются до систем с
большей производительностью. Следовательно, при ужесточении требований к
производительности есть возможность добавить стандартные вычислительные
узлы. При этом диапазон масштабируемости довольно широк: к примеру,
кластер "СКИФ-1000" с 288 узлами, имеющий пиковую производительность
2,5 TFlops, можно увеличить до системы мощностью 30 TFlops, за счет
объединения стандартных вычислительных модулей.
В последнее время в мире, в том числе в России наблюдается активное
применение вычислительных кластеров - локальных сетей, узлов рабочих
станций или персональных компьютеров, намеренно составленных из
нескольких вычислительных систем. Примером может служить МГУ им. М. В.
Ломоносова. Согласно информации, представленной на Интернет портале [1], в
научно-исследовательском вычислительном центре МГУ работает 4 кластера с
количеством рабочих станций (2xXeon, 2xAlpha, Pentium II, Pentium III) до18
штук в каждом. Помимо этого, создаются отдельные вычислительные кластеры
на физическом факультете и факультете вычислительной математики и
кибернетики МГУ. Крупнейшим вычислительным кластером в России (система
МВС-1000М/384) является кластер в Межведомственном компьютерном
центре (384 узла, 2xAlpha). Опыт применения вычислительных кластеров в
мире существенно шире: от 20-30 узлов кластеров в университетах до
гигантских вычислительных систем, включающих в себя 1000 - 2000 рабочих
станций, которые созданы в рамках специальных проектов.
При построение вычислительных кластеров обычно используют свободно
доступные компьютеры на базе процессоров Intel или AMD, свободно
распространяемая ОС Linux [2], коммуникационная библиотека MPI, которая
реализует связи между ветвями параллельного вычислительного процесса. Так,
современные вычислительные кластеры доступны, относительно дешевы и
являются альтернативой традиционным суперкомпьютерам. При довольно
большом
количестве
узлов
в
кластерной
системе
достигается
производительность сравнимая с суперкомпьютером [3]. Следует обратить
внимание, что основной успех кластерных вычислительных систем
заключается в том, что параллельные вычисления не имеют реальной
альтернативы, которая в области высокопроизводительных вычислений в
ближайшее время будет доступна для многих образовательных и научных
организаций.
Исследования в области неорганической химии требуют большого объема
вычислений, поэтому при решении ряда задач (например, квантово-химические
расчеты твердого тела, моделирование структуры вещества методом
молекулярной динамики и другие) можно использовать ресурсы
вычислительного кластера. Квантово-химические программы для расчетов ab
initio (Gaussian, ХОНДО) могут быть установлены на рабочей станции кластера
для дальнейшего тренинга специалистов.
Сейчас также проводятся исследования в области общей химии и
хроматографии, применяется метод газовой хроматографии сорбционных и
селективных свойств систем, которые содержат термотропные жидкие
кристаллы с разным типом мезофаз [4]. Расчеты в рамках простейшей
молекулярных систем модели связаны с объективным требованием
использовать
современные
высокопроизводительные
вычислительные
системы, в то время как детальное моделирование может быть реализовано
только в рамках технологий параллельного программирования.
На рисунке 1 представлен сравнительный анализ предприятий СНГ и
мировых держав, оснащенных суперкомпьютерами в различных отраслях
экономики. В основе лежат данные мирового суперкомпьютерного рейтинга
Тор500 и рейтинга Тор50 наиболее мощных компьютеров СНГ.
Рисунок 1. Сравнительные данные по использованию суперкомпьютеров
В настоящее время в России и за рубежом растет интерес к исследованию
проблемы глобальных вычислительных GRID-сетей, элементарными ячейками
которых являются отдельные кластерные системы, и широко распространяется
мнение, что применение таких сетей имеет существенное влияние на развитие
человечества, сравнимое с появлением единых электрических сетей.
Организация вычислительного кластера на предприятии или в научном центре
позволит сделать первый шаг в направлении создания данных вычислительных
сетей является подготовительным этапом к переходу в эру принципиально
новых вычислительных систем.
Список использованной литературы
1. Информационный портал Учебного-научного центра МГУ по
высокопроизводительным вычислениям. Текст сообщения, представленного на
семинаре "Высокопроизводительные параллельные вычисления на кластерных
системах" (Нижний Новгород, ноябрь 2001 г.) [Электронный ресурс] http://parallel.ru/cluster/nnov2001_thesis.html;
2. Официальный
сайт
ОС
Linux [Электронный
ресурс] http://www.linux.org;
3. Воеводин В.В., Воеводин Вл.В. Параллельные вычисления. БВХ-СанктПетербург. 2002. - 609 с;
4. Зайцев В.В., Панин Д.Н., Яровой Г.П. Численный анализ отражений от
слоя неоднородной плазмы // Физика волновых процессов и радиотехнические
системы. 2000. Т.3, №1.
Download