Доработка и оптимизация коммутатора данных МП «Эльбрус-S2»

advertisement
Выпускная квалификационная работа
Адаптация буферизующего коммутатора
данных МП «Эльбрус-S2»
Студент: Рогов А.С., ФРТК, 613 гр.
Научный руководитель: Костенко В.О.
МП «Эльбрус-S2»
Введение
• МП «Эльбрус-S2» - СБИС МП обработки
цифровой сигнальной информации
• Коммутатор данных (DataBox)
МП «Эльбрус-S2» разработан на основе
DataBox МП «Эльбрус-S»
• МП «Эльбрус-S» построен на ядре
архитектуры «Эльбрус»
• МП «Эльбрус-S2» состоит из двух ядер
архитектуры «Эльбрус» и 4-х ядерного DSPкластера ГУП НПЦ «ЭЛВИС»
МП «Эльбрус-S2»
Упрощённая структурная схема
Абоненты DataBox:
1. IOCOM –
коммутатор
устройств вводавывода;
2. MC – контроллер
памяти;
3. SC – системный
коммутатор;
4. CIC – межъядерный
коммутатор;
MAU – устройство
доступа к памяти
Постановка задачи
• Доработать DataBox с целью
выполнения следующих требований:
Требования
• Согласовать пропускные способности
каналов DataBox и его абонентов
(IOCOM, SC, MC, CIC/MAU)
• Минимизировать задержки передачи
данных
• Обеспечить работу DataBox на
номинальной частоте МП 500МГц
Абоненты DataBox
IOCOM
• Каналы выдачи данных по IO-чтению и DMA-записи
составляют единый канал выдачи данных из IOCOM
в DataBox шириной 64 бит (4ГБ/с)
Канал IO-чтения
Исходные данные
• Редкие короткие обмены
• В зависимости от запросчика
(локальный или удаленный МП)
данные направляются в MAU
(локальное IO-чтение)
или межпроцессорные линки (SC)
(удаленное IO-чтение)
• Темп выдачи данных из IOCOM: 4ГБ/с
Локальное IO-чтение
Проблемы и решения
Проблема
Решение
 Несоответствие
пропускных
способностей
IOCOM (4ГБ/с) и
MAU (1ГБ/с)
 Наличие задержки
передачи данных в
2 такта
 Расширение шины
передачи данных в
MAU
с 16 бит до 64 бит*
 Устранение
задержки*
* Произведены соответствующие изменения
протокола обмена DataBox-MAU
Локальное IO-чтение
Структурная схема
16
64
Канал DMA-записи
Исходные данные
• Передача больших массивов данных
• В зависимости от запросчика
(локальный или удаленный МП)
данные направляются в SC
(локальная DMA-запись)
или межпроцессорные линки (SC)
(удаленная DMA-запись)
• Темп выдачи данных из IOCOM: 4ГБ/с
• Размер буфера DMA-записи: 4x(32Б/64Б)
Локальная DMA-запись
Проблемы и решения
Проблема
Решение
 Несоответствие
пропускных
способностей
IOCOM (4ГБ/с) и
SC (2ГБ/с)
 Расширение шины
передачи данных в
SC
с 32 бит до 64 бит*
* Произведены соответствующие изменения
протокола обмена DataBox-SC
Локальная DMA-запись
Структурная схема
32
64
Буфер DMA-записи
Проблемы и решения
Проблема
Решение
 Наличие задержки
передачи данных за
счет частых
блокировок буфера.
Причина недостаточный
размер буфера:
4x(32Б/64Б)
 Увеличение размера
буфера до
16x(32Б/64Б)
* Проблема и соответствующее решение определены по
результатам тестирования RTL-модели МП (тесты на DMAобмен)
Удаленное IO-чтение /
Удаленная DMA-запись
• Пропускная способность данного
канала ограничена пропускной
способностью межпроцессорных линков
и составляет 2ГБ/с. Доработка
невозможна
Увеличение рабочей частоты
Устранение критических путей
1. IO-чтение (IOCOM -> DataBox -> SC(линки)).
Проходящий комбинационный путь 2.39ns
(slack: -0.49ns) устранен путем реализации
«непрозрачной» очереди вместо
«прозрачной»
Увеличение рабочей частоты
Устранение критических путей
+0.95ns
2. Чтение из памяти (DataBox -> SC(линки)).
Критический путь 2.14ns (slack: -0.24ns) устранен
путем реализации байпаса блочной памяти через
2-элементную регистровую очередь без внесения
дополнительных тактовых задержек
Исправление ошибок
• В процессе работы были обнаружены и
исправлены ошибки RTL-описания DataBox
(выявлено 14 ошибок, 3 ошибки – в других
модулях, 11 исправлено)
• В частности, одна ошибка была выявлена при
верификации системы e3s:
данные IO-чтения портятся другим
(спекулятивным) IO-чтением.
Причина: некорректная обработка признака
«spec» для данных
Результаты
• Выполнены необходимые доработки Verilogописания DataBox, позволившие:
– согласовать пропускные способности каналов
DataBox и его абонентов;
– минимизировать задержки передачи данных;
– Обеспечить работу DataBox на номинальной
частоте МП 500МГц.
• Исправлены обнаруженные ошибки
• Произведено тестирование в составе RTLмодели МП «Эльбрус-S2»
• В настоящее время производится
тестирование прототипа на ПЛИС
Спасибо за внимание!
Download