2008 Институт Проблем Информатики Российской Академии Наук

advertisement
Институт Проблем Информатики Российской Академии Наук
МЭС2008
Квазисамосинхронный вычислитель:
методологические и
алгоритмические аспекты
Ю.Г. Дьяченко1 , Ю.А. Степченков1 , С.Г. Бобков2
1Институт проблем информатики РАН
2Научно-исследовательский институт системных
исследований РАН
YStepchenkov@ipiran.ru
Институт Проблем Информатики Российской Академии Наук
МЭС2008
Типы синхронизаций систем
G
G
F
S
D1
●●●●●●
Di (a)
G
A
L
S
TI
D1
●●●●●
G
Di (б)
F
A
D1
●●●●●
TI
Di (в)
FS - Fully Synchronous; FA - Fully Asynchronous
GALS - Global Asynchronous/Local Synchronous
Институт Проблем Информатики Российской Академии Наук
МЭС2008
Временные потери в синхронных системах
100
+45 +25 +30 +10 +20
Real Computation Time WA SI V CS NBS
%
WA – Worst Average
SI - Signal Integrity
V – Variability
CS – Clock Skew
NBS - Non Balanced Stages
Институт Проблем Информатики Российской Академии Наук
МЭС2008
Структурная схема вычислителя
Институт Проблем Информатики Российской Академии Наук
МЭС2008
Алгоритмы деления и извлечения корня
Pi+1 = rPi – Dqi,
i=0,…n-1,
Pi+1, Pi – промежуточные остатки от деления;
r – основание алгоритма (radix); D – делитель;
qi – частичный результат; полученный на i-ом
шаге; n – число шагов алгоритма
Q = {q0q1q2…qn-1}
Pi+1 = 2Pi – (2Qi–1+qi2–i)qi
Qi–1 – результат извлечения корня, накопленный к
i-тому шагу алгоритма
Институт Проблем Информатики Российской Академии Наук
Стадия конвейера
МЭС2008
Институт Проблем Информатики Российской Академии Наук
МЭС2008
Блок выбора частичного результата
Из блока
ССП1
Из блока
ССП2
Si
Ci
qi
Е
4
4
4
4
4
4
Сумматор
"qi = +1"
Сумматор
"qi = –1"
Сумматор
"qi = 0"
4
4
4
3
Мультиплексор
3:1
4
Логика
принятия
решения
3
qi+
1
I
Институт Проблем Информатики Российской Академии Наук
МЭС2008
Варианты реализации конвейера
FF
CL
FF
CL
FF
(a)
CLR
Ack
FF
Req
CL
FF
CL
FF
(б)
DL
DL
Ack
FF
Req
CL
FF
CL
FF
(в)
Институт Проблем Информатики Российской Академии Наук
Полученные результаты
МЭС2008
эффективное решение ВУ в базисе СС-схем с
помощью 4 однотипных стадий;
одинаковое быстродействие ВУ обеих
операций – деления и извлечения квадратного
корня;
СС-реализация ВУ позволяет отказаться от
использования регистров для хранения
промежуточных результатов для снижения
энергопотребление схемы в целом
Институт Проблем Информатики Российской Академии Наук
МЭС2008
Сравнение ARM996HS и ARM968E-S
Частота
(в Мгц)
Производительнось
(DMIPS)
ARM
50
54
996HS (1,08 В,125ºС ) (1,08 В,125ºС )
77
83
(1.2В, 25 ºС)
(1.2В, 25 ºС)
ARM
968E-S
100
107
P
Кол-во
(Мвт Венти/Мгц) лей
0,045 89К
0,13
88К
Институт Проблем Информатики Российской Академии Наук
МЭС2008
Токовые пики и общая аккумулированная энергия
ARM968E-S
ARM966HS
X-ось: Время (в s); Y1-ось: ток (в А); Y2-ось: энергия (в J)
Институт Проблем Информатики Российской Академии Наук
МЭС2008
Уменьшенная интерференция на радиочастотах
ARM968E-S
X-ось: Частота (в Гц);
ARM966HS
Y-ось: Энергия (в Децибелах)
Институт Проблем Информатики Российской Академии Наук
МЭС2008
Низкая электромагнитная эмиссия
ARM968E-S
X-ось: Частота (в Гц);
ARM966HS
Y-ось: Энергия (в Децибелах)
Download