Пример профиля работы с памятью для задачи DIS

advertisement
Прогнозные оценки
развития высокопроизводительной
вычислительной техники.
Эйсымонт Л.К.
ОАО «НИЦЭВТ»
(Концерн радиостроения “Вега”)
Четыре сегмента рынка
суперкомпьютеров
Таблица 1. Зафиксированные в 2002 году объемы четырех
сегментов рынка суперкомпьютеров.
На самом деле оказалось,
что общий объем рынка
составил:
2008 ~ $9.000
Дальнейший рост
ожидается:
2010 ~ $15.000
2012 ~ $17.000
Таблица 2. Предсказанные в 2002 году объемы
сегментов рынка суперкомпьютеров.
Это 30% рынка серверных
платформ
Нас интересует Technical
Capability –
суперкомпьютеры для
решения задач,
требующих предельных
возможностей
(стратегические задачи)
Разные сегменты суперкомпьютерного рынка –
разные технологии, разные прогнозы (видение IBM).
Наиболее
чувствительный к
новым
технологиям
сегмент - CКСН
Специфика формирования прогнозных оценок
-- Прогнозные оценки даются с точки зрения архитектора
заказных суперкомпьютеров высшего диапазона
производительности, предназначенных для решения
уникальных стратегически важных для государства задач,
далее - суперкомпьютеров стратегического назначения (СКСН)
-- Выделяются два связанных друг с другом процесса будущего
развития (на примере США, Япония и Китай – по такому же образцу):
- революционное развитие, определяемое необходимостью
решения стратегических задач государства:
1) работы по программе DARPA HPCS создания заказных СКСН
с перспективной архитектурой и глобально адресуемой
памятью, далее – перспективных СКСН;
2) работы по Федеральному плану США разработок и
исследований в области СКСН, которые являются
усилением и обобщением программы DARPA HPCS.
- эволюционное развитие, определяемое рынком и появлением
массовой и коммерчески доступной элементной базы “новой
волны”, основа которой - многоядерно-мультитредовые
микропроцессоры и многосокетные платы на их основе,
являющиеся мощными SMP-узлами с разделяемой между
сокетами платы общей памятью.
Проекты создания суперкомпьютеров
стратегического назначения (СКСН)
с перспективной архитектурой
США – программа DARPA HPCS (2002)
- проект Cascade (Cray) - системы Baker, Granite, Marble. 250 млн $ на 2008-2010.
федеральный проект
- проект PERCS (IBM) - 250 млн $ на 2008-2010, федеральный проект
Япония – программа Next Generation Supercomputer Министерства
Образования, Культуры, Спорта, Науки и Технологий (2006)
- проект 3K (Институт физических и химических исследований (RIKEN) и
Fujitsu),1.2 млрд.$, федеральный проект.
Китай – программа 863 Министерства науки и технологий (2006)
- проект HPP (Институт вычислительных технологий (ICT), фирма Dawning,
Национальный университет оборонных технологий (NUDT)),
федеральный проект
Россия – в рамках ФЦП Минпромторговли РФ, Минобрнауки РФ (2005)
- проект Ангара (ОАО”НИЦЭВТ”)
Главная решаемая проблема в проектах
создания перспективных СКСН
– “стена памяти”
Что это за проблема ?
Интегральные оценки реальной производительности
– пакет HPC Challenge и метод “APEX-поверхности”
Cхема организации
APEX-теста
Пример профиля работы с памятью задачи CF-класса
(DGEMM)
Пример профиля работы с памятью для задачи DIS-класса
(SpMV)
Рис. Профиль обращений к памяти для теста SpMV (A*p=q)
Пример профиля работы с памятью для задачи DIS-класса
(FFT-одномерное быстрое преобразование Фурье)
Пример профиля работы с памятью для задачи DIS-класса
(BFS)
Пример профиля работы с памятью для задачи DIS-класса
(RandomAccess)
Коммуникационные профили разных задач.
Большой объем передаваемой информации,
нерегулярный и коллективный характер взаимодействий
приводят к деградации реальной производительности и
плохой масштабируемости.
Требования к перспективным CКСН
программы DARPA HPCS.
Общий взгляд на задачи для СКСН и
влияние базовых характеристик СКСН
на эффективность решения этих задач.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
Контроль боеготовности ядерных арсеналов и разработка новых боезапасов.
Радиоэлектронная разведка и другие задачи разведывательных сообществ.
Решение задач военного характера.
Предсказание климата.
Физика плазмы – решение задач создания термоядерных реакторов.
Решение инженерных задач в области машиностроения.
Биоинформатика и вычислительная биология, задачи влияния окружающей среды.
Предсказание землетрясений.
Геофизические расчеты.
Астрофизика (+ поиск новых источников энергии).
Материаловедение и нанотехнологии.
Исследования социальных систем – макроэкономика и социальная динамика.
Подробный комментарий к задачам,
для которых в первую очередь создаются
перспективные СКСН программы DARPA HPCS
(или в решении каких задач мы рискуем отстать)
Мирные приложения – значимость
перспективных СКСН для развития общества
V технологический уклад
- Компьютеры
- Малотоннажная химия
- Телекоммуникации
- Электроника
- Интернет
VI технологический уклад
- Биотехнологии
- Нанотехнологии
- Проектирование живого
- Вложения в человека
- Новое природопользование
- Роботехника
- Новая медицина
- Высокие гуманитарные
технологии
- Проектирование будущего и
управление им
- Технологии сборки и
уничтожения социальных
субъектов
Организация работ в области перспективных
СКСН в США,
контроль качества разработок с
использованием новых подходов
объективного оценочного тестирования
реальной производительности
Одновременно ведется программа DARPA PCA разработки
перспективных встроенных суперкомпьютеров (ВСК) , во многом
похожая по решаемым принципиальным проблемам на DARPA HPCS и
контролируемая той же организацией – Линкольновской лабораторией
Массачусетского технологического института.
В данном докладе это не рассматривается, требует отдельного
детального рассмотрения.
Об организации работ в области
суперкомпьютерных технологий в США
DARPA
Cray – проект CASCADE
IBM - проект PERCS
MIT
– проект RAW
Stanford Unv.
– проект Smart Memory
Unv.of South.Calif. (+Raytheon) – проект MONARCH
Unv.of Texas at Austin (+IBM) – проект TRIPS
Cистема тестов оценки производительности
CКСН программы DARPA HPCS
Сравнение NEC SX-9 с другими системами
(современный подход - kiviat-диаграмма,
на лучах – наименования тестов пакета HPC Challenge)
Примеры планов и основных решений
проектов создания перспективных СКСН
США, Японии и Китая
Базовые стратегии решения проблемы “стены памяти”
- обеспечение толерантности процессора к задержкам за
счет работы со скоростью, определяемой темпом
выполнения операций, а не задержками их выполнения
(мультитредовые и векторные архитектуры);
- обеспечение управляемой локализации как данных при
вычислениях, так и вычислений при данных (кэши,
удаленные вызовы процедур, DAE-архитектуры и модели
вычислений);
- применение статических и динамических потоковых
моделей вычислений с управлением вычислениями потоком
данных (streambased-архитектуры, dataflow-архитектуры,
одновременно решает проблему ограниченного ILP, т.е.
ограниченного параллелизма выполнения машинных
команд)
Планы создания новых суперкомпьютеров
фирмы Cray (+ унификация !)
Планы создания новых суперкомпьютеров
фирмы IBM (+ унификация!)
Новая политика Японии в области
стратегических вычислений
Фирма Сray, проект Cascade программы DARPA HPCS
– базовая концепция проекта
Cтруктура CКСН Сray Cascade Baker и Granite
• Глобально адресуемая память с унифицированной для всех типов узлов архитектурой
• Конфигурируемые сеть, память, процессоры и ввод-вывод
• Гетерогенная обработка на множестве узлов разного типа и внутри
тредово-векторных (MVP) узлов
• Возможность адаптации при конфигурировании, компиляции в процессе выполнения
Многоядерно-мультитредовый микропроцессор Power7 –
базовый микропроцессор CКСН IBM PERCS
Кристалл Power 7
- 8 ядер, в каждом ядре 4 треда, SMT-мультитредовость,
запуск в одном ядре 6 команд за такт;
- в одном мультитредовом ядре 12 функциональных
устройств: FXU -2, FPU – 4, LSU -2, VSX – 1, BRU – 1,
СRU-1, DFU -1;
- объем кэш-памяти L3 – 32 Мбайт, 2 контроллера
внешней DRAM - памяти;
- 32 сокета на плате, т.е. 1024 треда над общей памятью
- кристалл – 567 мм2 , 1.2 млрд.транзисторов, 4 Ггц.
Одно многоядерное ядро (Core)
Модифицированная сеть Клоса –
коммуникационная сеть СКСН IBM PERCS
Обычная свернутая сеть Клоса, при
передачах проходят несколько линков,
но это лучше, чем для сетей N-тор
Сеть IBM PERCS, при большинстве
передач проходят только один линк,
лучше, чем для сети Клоса
Многоядерный мультитредово-потоковый
микропроцессор СКСН “Ангара” (вариант J10)
Какие характеристики можно ожидать от
перспективных СКСН ?
Результаты оценочных тестовых
экспериментов на имитационной архитектурной
модели российской перспективной СКСН
“Ангара”
(данные по зарубежным перспективным СКСН
пока недоступны, ожидаются в 2010 году)
APEX-поверхности для микропроцессоров
разного типа и узла СКСН “Ангара”
APEX-поверхности для мультипроцессорных систем
разного типа (256 узлов) и СКСН “Ангара”
Эффективность СКСН “Ангара” на тесте
умножения разреженной матрицы на вектор
J7-2
J10-4
Эффективность СКСН “Ангара”
на тесте BFS работы с графами
Какие изменения происходят в области
коммерчески доступной элементной базы
“новой волны”и вычислительных средств?
“Вынужденные” решения проблемы стены
памяти из-за появления многоядерных
микропроцессоров.
Требуемого стратегическими приложениями
решения проблемы стены памяти
пока нет, хотя стало полегче…
Ослабление закона Мура,
многоядерные микропроцессоры
Прогнозируемые общие изменения
микроархитектуры процессоров
• применение малой и существенной мультитредовости
• применение гомогенных и гетерогенных реконфигурируемых полей ядер
• увеличение пропускной способности интерфейса с памятью и сетью
• обеспечение эффективной работы с глобально адресуемой памятью
Многосокетная плата нового поколения
с микропроцессорами AMD (HyperTransport-!)
Многосокетные платы нового поколения с
микропроцессорами Intel (QuickPath - !)
Реальная производительность одной многосокетной
платы на задаче UA расчета
на структурированной динамически изменяемой сетке.
Динамика изменений среднего времени обращения
к памяти для разной пространственно-временной
локализации и разной мультитредовости.
Динамика изменений среднего времени обращения
к памяти для лучшей и худшей точки APEX-поверхности
Сравнение современных многоядерных микропроцессоров и
многосокетных плат с массово-мультитредовыми
микропроцессорами перспективных СКСН. Задача CG, класс C.
Что будет после достижения целей DARPA
HPCS и похожих других программ создания
стратегических СКСН?
Прогнозы и планы дальнейшего развития в
соответствии с Федеральным планом США
2004 года по возрождению работ в области
стратегических информационных технологий
Экзафлопсная перспектива 2020 года
( усиление тредового и потокового параллелизма)
Додекатрон
Оценки предельных возможностей использования
кремниевой элементной базы при построении
высокопроизводительных систем
(ноябрь 2004, Sandia Lab).
Peta – 1015 , Exa – 1018 , Zetta – 1021 , Yotta – 1023
1 – обычная кремеиевая технология, программируемые микропроцессоры
2 – бычная кремниемая технология, но прямая аппаратная реализация решателей задач
3 – новая технология с транзисторами на квантовых точках и реверсивной логике,
программируемые средства - зеленая линия, прямая аппаратная реализация - красная
Развитие аппаратных средств-1.
Развитие аппаратных средств-2.
Развитие аппаратных средств-3.
Развитие программного обеспечения-1.
Развитие программного обеспечения-3.
Развитие СКСН - 1.
Развитие СКСН - 2.
Развитие СКСН - 3.
ОАО «Научно-исследовательский центр
электронной вычислительной техники»
Download