Подходы к построению облачных платформ для

advertisement
Подходы к построению облачных
платформ для университетских центров
Дмитрий Семынин, департамент инфраструктуры информационных систем,
AMT Group
1
Университетские сети сегодня
Университетские сети предоставляют исследовательскому
сообществу доступ к новейшим технологиям и выступают
своеобразными точками кристаллизации исследовательской мысли.
Как наиболее эффекивно объединить сети различных университетов
с использованием современных технологий облачных вычислений?
2
Dell в образовании
• Используется в более чем в 400 тыс учебных классов в мире
• Обслуживает 60% классов в США
• Свыше 14 тыс колледжей и университетов используют решения Dell в
своей инфраструктуре
3
Опыт
построения
межуниверситетского
облака на основе
технологий Dell и
ПО С ОТКРЫТЫМ КОДОМ
ANU/NCI
Openstack HPC Cloud
4
Задачи проекта
• Предоставить исследовательскому сообществу
суперкомпьютерный ресурс на основе облачных технологий
• Обеспечить доступ к ресурсу на базе одного университета внутри всей национальной сети
• Использовать технологии на основе ПО с открытым кодом
• Обеспечить мировой уровень производительности и
использование передовых технологий
5
Характеристики проекта
NATIONAL
COMPUTATIONAL
INFRASTRUCTURE
•
Dell Openstack HPC Cloud - крупнейший
проект в рамках программы NeCTAR
•
200 компьютерных узлов (C8000) на
процессорах Intel
•
Блочное и объектно-ориентированное
хранилище по технологии Ceph, на основе
референсной архитектуры «C8000 Ceph
Reference architecture».
•
Высокопроизводительная коммутация
Infiniband с возможностью реализации10/40
гигабитного Ethernet на отдельных портах при
необходимости.
•
В перспективе первое в мире “настоящее”
облако супервычислительных ресурсов.
Заказчик серьезно инвестировал в уникальные
программные разработки для переноса
низколатентных параллельных коммуникаций
Infiniband в виртуальную среду.
6
О проекте: NCI и NeCTAR
NATIONAL
COMPUTATIONAL
INFRASTRUCTURE
•
7
NCI - национальная суперкомпьютерная
инфраструктура для исследовательского сообщества
Австралии.
– Входит в top50 достаточно давно
– Серьезные инвестиции в Lustre и Infiniband
– Глубокая техническая экспертиза («HPC в чистом
виде»)
– Консорциум на базе Австралийского Национального
Университета (ANU) в Канберре.
•
NeCTAR – федеральная правительственная
программа по развитию облачных
технологических ресурсов для
исследовательских целей в Австралии.
–
–
Основывается на Openstack как на
ключевой технологии
Финансирует инфраструктуру и развивает
практики
Dell:
Мы верим в:
трансформацию
приложений и
инфраструктуры через
облака
Для этого мы:
Предоставляем выбор технологий для
построения, использования и
администрирования многооблачных сред,
ориентированных на гибкость, эффективность
и качество услуг
8
Red Hat Enterprise Linux OpenStack Platform
RED HAT ENTERPRISE LINUX
Dell Server, Storage, Networking
Dell ProSupport, Dell Professional Services
9
Элементы решения Dell для облака на OpenStack
Архитектуры решений
RHEL OSP v4, Openstack Havana,
RHEL 6.5, Dell PowerEdge,
Dell Storage, Dell Networking
Сертификация
Профессиональные
сервисы
Поддержка
Сообщество OpenStack
10
•
•
•
•
Dell
Dell
Dell
Dell
RHEL OpenStack Platform Ref. Arch.
POC configuration
Pilot/Pilot HA configuration
Production configuration
• Joint solution certification
• Dell services staff certifications
• Customer staff certifications
•
•
•
•
Dell Assessment Services
Dell Consulting Services
Dell Implementation Services
Red Hat Training and Certification services
• Dell ProSupport
• Red Hat Support & Updates (RHEL OSP)
• Joint code contributions
• OpenStack Foundation Board membership
• Active community engagements
Архитектура
Вычислители
Nova
Управляющие
узлы
Swift
C8220
Intel Xeon E52670 CPUs
128 GB RAM
Mellanox CX-3
Mezz
Intel SSDs
C8220X &
C8220XD
Intel CPUs &
Mellanox Mezz
LSI Controllers
Ceph
Intel SSDs
3.5” NL SAS HDDs
Mellanox
Высокопроизво
дительная сеть
коммутации
Intel CPUs & FDR
IB
LSI Controllers
Intel SSDs
3.5” NL SAS HDDs
11
Архитектура
Вычислители
Nova
Управляющие
узлы
Swift
C8220
Intel Xeon E52670 CPUs
128 GB RAM
Mellanox CX-3
Mezz
Intel SSDs
C8220X &
C8220XD
Intel CPUs &
Mellanox Mezz
LSI Controllers
Ceph
Intel SSDs
3.5” NL SAS HDDs
Mellanox
Высокопроизво
дительная сеть
коммутации
Intel CPUs & FDR
IB
LSI Controllers
Intel SSDs
3.5” NL SAS HDDs
12
Единая модель шасси C8000 с различными
типами модулей в нем. В проекте
задействованы все возможные варианты
модулей C8000 (GPUs, CPUs и Storage), причем
практически «plug’n’play».
Это также означает, что небольшой комплект
запасных элементов на объекте может
обеспечить быстрое восстановление в случае
выхода из строя каких-либо элементов.
Результат – снижение затрат и возможность при
использовании более экономичной поддержки
9x5 NBD обеспечить доступность,
приближенную к 24x7x4.
Архитектура
Вычислители
Nova
Управляющие
узлы
Swift
C8220
Intel Xeon E52670 CPUs
128 GB RAM
Mellanox CX-3
Mezz
Intel SSDs
C8220X &
C8220XD
Intel CPUs &
Mellanox Mezz
LSI Controllers
Ceph
Intel SSDs
3.5” NL SAS HDDs
Mellanox
Высокопроизво
дительная сеть
коммутации
Intel CPUs & FDR
IB
LSI Controllers
Intel SSDs
3.5” NL SAS HDDs
13
Текущая дистрибуция ПО
Openstack, используемая проектом
NeCTAR, не может (пока)
использовать Infiniband, поэтому
период эксплуатации в виде
кластера на 10-гигабитном ethernet
был неизбежен.
Двухпротокольные коммутаторы
и карты “VPI” от Mellanox
гарантируют, что заказчику не
придется выбрасывать
построенную 10-гигабитную сеть и
заменять ее на Infiniband позже,
когда программный стэк будет
доработан.
Все, что потребуется – это простое
программное переключение на
уровне отдельных портов или
шасси по мере внедрения
возможностей для Infiniband.
Архитектура
Вычислители
Nova
Управляющие
узлы
Swift
C8220
Intel Xeon E52670 CPUs
128 GB RAM
Mellanox CX-3
Mezz
Intel SSDs
C8220X &
C8220XD
Intel CPUs &
Mellanox Mezz
LSI Controllers
Ceph
Intel SSDs
3.5” NL SAS HDDs
Mellanox
Высокопроизво
дительная сеть
коммутации
Intel CPUs & FDR
IB
LSI Controllers
Intel SSDs
3.5” NL SAS HDDs
14
Партнерство Dell с Inktank, основным поставщиком
услуг и поддержки для Ceph, обеспечивает Dell
доступом к самой передовой экспертизе в области
разработки и систем хранения Ceph и реализации их
на аппаратном обеспечении Dell.
У Dell есть детально проработанная референстная
архитектура Ceph Reference Architecture на основе
C8000, снижающая риски внедрения для заказчиков.
Помимо того, производительность была ключевым
фактором в этом проекте. Узлы RADOS содержат
диски SSD для журналирования и распределяют
нагрузку на модули хранения C8220XD, содержащие
каждый по 12 x 3.5” NL SAS дисков. RAID-контроллеры
LSI обеспечивают требуемую производительность.
Конфигурация RADOS OSD Server
Шасси C8000 с двумя OSD-серверами
•
•
•
1:1 SAS Expansion via Mini-SAS Cable
Шасси C8000 A/C
–
Два модуля питания, 2 x 1400Вт БП в каждом (2+2)
–
Две пары “C8220X (DWC) + C8000XD (DWS)”
DWS
DWC
C8220X – вычислитель двойной ширины (DWC)
–
2x E5-2630L (2.0GHz, 6C, 60W)
–
1x 48GB Memory Option (6x 8GB 1333MHz LV DIMMs)
–
1x Mellanox CX3 SP FDR in Mezz
–
1x LSI 9265-8i in PCIe slot
–
1x LSI 9202-16e in PCIe slot
–
2x 2.5" SATA 500GB, 7.2K RPM
–
6x 2.5” Intel DCS3700 200GB SSD
–
2x 1G Base-T LOM for Mgmt.
Mezzanine Slot
C8000XD модуль хранения двлйной ширины (DWS)
–
15
12x 3.5” 3TB NL SAS HDD 7.2K
PCIe Slots
P
W
R
P
W
R
DWS
DWC
Infiniband: Топология Fat Tree
Core switches
36p
36p
36p
Fabric
cables
Edge
switches
18 nodes for
every IB switch.
-> Typically 72
nodes per rack.
16
36p
36p
36p
36p
Размещение ресурсов в стойках
Очень плотное размещение.
Оптимально для проекта
оказалось размещение 72
вычислительных узлов на
стойку:
•
Задействованы все порты
ToR - коммутатора Infiniband.
•
Заполнение шкафов 42 U
целиком, без пустых мест.
17
Размещение вычислительных ресурсов
18
Коммутация кабелей
Cable management is king in
large installations, and these
customers know it.
Our ability to take a position on
cable management issues was
important because it showed
that we had done it before.
The Dell HPC Solution
Foundation Book #3 is a great
primer on this topic.
19
20
АМТ Group краткая справка
20 лет на российском рынке системной интеграции. Техническая экспертиза,
привнесение лучших мировых практик и предложение эффективных
продуктовых решений делают АМТ-ГРУП одним из технологических лидеров
этого рынка.
АМТ-ГРУП осуществляет проектирование, внедрение и техническую
поддержку сложных инфраструктурных и ИТ-систем, а также выполняет
консалтинговые проекты и проводит обучение персонала заказчиков.
Партнеры – более 50 ключевых мировых производителей оборудования и
ПО.
Сервисная поддержка — партнерская сеть во всех регионах России и
странах СНГ.
Полный комплект лицензий на проведение работ и оказание услуг.
Более 400 сотрудников, среди которых 150 инженеров-проектировщиков и
инженеров технической поддержки различных специализаций.
21
22
Download