Процессоры персональных компьютеров от Intel Процессоры фирмы Intel

advertisement
Процессоры персональных
компьютеров от Intel
Процессоры фирмы Intel
18 июля 1968 года Гордон Мур (Gordon Moore) и Боб Ноис (Bob
Noyce) основали фирму INTEL (INTegral ELectronics). Практически
сразу после основания компании к ним присоединился нынешний
председатель совета директоров – Эндрю Гроув (Andrew Grove). В 1974
году в корпорацию пришел ее будущий президент и главный
управляющий Крейг Барретт (Craig Barrett).
Первой
идеей
нового
предприятия
было
создание
полупроводниковых запоминающих устройств, призванных заменить
запоминающие устройства на магнитных сердечниках. Первой
продукцией компании была микросхема памяти на биполярных
транзисторах Шотки. И хотя в данной области Intel добилась заметных
успехов, тем не менее мировую славу ей принесли совсем другие
изделия –
микропроцессоры.
Динамика
развития
первых
микропроцессоров и микроконтроллеров фирмы Intel представлена на
рис. 21.
Порядок наименования первых изделий Intel. Почему в
названии всех микропроцессоров, вплоть до появления семейства Intel®
Pentium®, фигурировало число 80? Ответ на этот вопрос дает
приведенная ниже таблица цифрового принципа наименования
продукции Intel.
Название микропроцессора 4004, созданного в 1971 году, принято
по маркетинговым соображениям и отражает 4-рязрядную архитектуру.
Созданный Intel в 1972 году, 8-разрядный PMOS-микропроцессор
унаследовал принцип наименования микропроцессора 4004. Этот чип
получил обозначение 8008. Аналогичным образом в семейство
продукции “8ххх” вошли все микросхемы RAM, ROM и EPROM,
поддерживающие микропроцессор 8008. Тот, однако, не отличался
простотой в эксплуатации, и в 1974 году появился более мощный NMOSмикропроцессор, известный под названием 8080, основанный на
несколько иной комбинации тех же самых цифр. Микропроцессор 8080
работал под напряжением +12, +5 и -5 вольт. Одновременно Intel
выпустила три вспомогательных чипа, обслуживавших 12-вольтовый
генератор тактовой частоты и обеспечивавших декодирование
управляющих сигналов шины. В 1976 году вышла 5-вольтовая версия со
встроенными вспомогательными чипами, по силе напряжения питания
названная “8085”. Тот же принцип лег в основу наименования
микропроцессора
8086,
представленного
в
1978
году.
2
Таблица 3
Схема поцифрового принципа наименования продукции Intel
Пример: чип 2 7 1 6 16K
(NMOS EPROM)
Порядковый номер
Категория продукции
Тип продукции
Категория продукции
Примеры
Тип продукции
Примеры
0
Контрольные чипы
Нет
0 Процессоры
4004*, 4040
1
Микросхемы PMOS
1101*, 1103
1 Микросхемы
статической и
динамической
памяти RAM
3101*, 2102,
2104
2
Микросхемы NMOS
2101, 2401,
2107В
2 Контроллеры
2201, 8251,
8253
3
Биполярные
микросхемы
3101*
3 Микросхемы ROM
3301*
4
4-разрядные
микропроцессоры
4004*, 4008, 4 Сдвиговые
4009
регистры˜
5
Микросхемы CMOS
5101, 5201*
6
(не использовалась)
7
Память на магнитных
доменах
7110*
8
8-ми и более зарядные
микропроцессоры и
микроконтроллеры
8008*, 8080, 8 Чипы наблюдения и
8085, 8086,
схемы
8088, 8048,
синхронизации в
8051, 8096
генераторах
импульсов
9
(не использовалась)
1406*, 2401
5 Микросхемы EPLD˜
6 Микросхемы PROM
1601*
7 Микросхемы
EPROM
1710*, 1702,
2716
9 Чипы для
телекоммуникаций
5801*, 5810
2910*, 2920
* Первое изделие в данной категории.
˜ Поначалу было несколько исключений. Сдвиговые регистры для
военных и коммерческих целей получили наименование, соответственно,
1406, 1906. Изделие 3404 было не сдвиговым регистром, а регистромзащелкой для подсистем памяти.
Это
название
частично
отражало
16-разрядную
архитектуру. Дорогостоящие 16-разрядные системы спустя год
столкнулись с достойным конкурентом в лице микропроцессора
8088, по сути дела представлявшего собой несложную
модификацию процессора 8086 с восьмиразрядной (отсюда и
наименование) внешней шиной данных. Принятие корпорацией
IBM на вооружение архитектуры 8086/88 при разработке первого
персонального компьютера резко взвинтило маркетинговую
ценность этого наименования, сохраненного последующими
процессорами в виде 5-значного обозначения: 80286, 80386 и,
наконец, 80486. Однако Intel не удалось зарегистрировать
обозначение “x86“ в качестве товарного знака. Так родилось
новое название процессоров – Intel® Pentium®.
Несмотря на то, что первый персональный компьютер был выпущен
фирмой Apple, сейчас персональными компьютерами называют в основном
IBM PC-совместимые компьютеры. Это связано, прежде всего, с тем, что
фирма IBM выбрала правильную рыночную политику: она не скрывала
принципов устройства своих компьютеров и не патентовала основных
решений. В результате многие производители стали выпускать совместимые
компьютеры, и они быстро стали фактическим стандартом. Из-за большого
объема выпуска персональные компьютеры начали быстро дешеветь. К тому
же для IBM-совместимых персональных компьютеров стали разрабатывать
множество программных средств, что еще больше способствовало их
распространению. Поэтому, несмотря на некоторые существенные
архитектурные недостатки, IBM-совместимые персональные компьютеры
сейчас уверенно занимают первое место на рынке.
С самого начала фирма IBM ориентировалась на процессоры Intel. У
этих процессоров были очень мощные конкуренты, например, процессоры
фирм Motorola или Zilog, превосходившие процессоры Intel по многим
параметрам, но именно благодаря персональным компьютерам процессоры
Intel смогли выйти победителями в конкурентной борьбе. К тому же еще
некоторые фирмы (например, AMD, VIA, Cyrix) выпускают Intelсовместимые процессоры. Поэтому мы рассмотрим основные особенности
процессоров фирмы Intel. Это позволит нам также проследить основные
тенденции в развитии процессоров за последние десятилетия.
Хронология разработки и выпуска рядаМП:
47
4














































1971, 15 ноября: 4004
1972, 4-й квартал: 4040
1972, 1 апреля: 8008
1974, 1 апреля: 8080
1976, Март: 8085
1978, 8 июня: 8086
1979, 1 июня: 8088
1981, 1 января: iAPX 432
1982: 80186
1982, 1 февраля: 80286
1985, 17 октября: 80386DX
1988, 5 апреля: i960 aka 80960
1988, 16 июня: 80386SX
1989, 16 января: 80376
1989, 27 февраля: i860 aka 80860
1989, 10 апреля: 80486DX
1990, 15 октября: 80386SL
1991, 22 апреля: 80486SX
1992, 3 марта: 80486DX2
1992, 9 ноября: 80486SL
1993, 22 марта: Pentium
1994, 7 марта: 80486DX4
1994, Август: Intel386 EX
1995, 1 ноября: Pentium Pro
1997, 8 января: Pentium MMX
1997, 7 мая: Pentium II
1998, 15 апреля: Celeron (Pentium II-based)
1998, 29 июня: Pentium II Xeon
1999, 26 февраля: Pentium III
1999, 25 октября: Pentium III Xeon
2000, 23 августа: XScale
2000, 20 ноября: Pentium 4
2001: Itanium
2001, 21 Мая: Pentium 4 Xeon
2002, Июль: Itanium 2
2003, Март: Pentium M
2003, Март: Celeron M
2003, Сентябрь: Pentium 4EE
2004, Весна: EM64T
2005, Pentium D
2006, Осень: Conroe, Merom
2007, Зима: Core 2 Extreme QX6700
2007, Зима: Core 2 Quad — Четырёхъядерный
2008, Зима: Сore 2 обновление линейки
2008, Весна: Centrino Atom
2008, Осень: Core i7
5
«Старые»,
«средние»,
«новые»
«Super новые» найменования процессоров от Intel
и
Первоначально основной характеристикой процессора была его тактовая частота, то
есть количество машинных циклов, выполняемых процессором за секунду. Таким
образом, производительность процессора напрямую зависит от тактовой частоты его
работы.
Однако эта система стала отказываться работать.
При покупке процессора следует иметь в виду, что, например, процессоры с одной и
той же тактовой частотой могут иметь различные технические характеристики и
различные типы процессорного ядра. Корпорация Intel для указания различия между
процессорами использовала дополнительную буквенную индексацию
Во-первых, в линейке Pentium 4 модели с одинаковыми частотами, но разными
шинами (400, 533 и 800 МГц) и объемом кэша L2 (512 кб , 1Мб и 2Мб).
• Отличаются они (например, Pentium 4 с частотой 2,8 ГГц) одной добавленной
буквой – A, B, C или Е ( ядро Prescott ).
• Pentium 4 2.8 GHz (Northwood, 512 KB L2, 533 MHz FSB)
• Pentium 4 2.8A GHz (Prescott, 1 MB L2, 533 MHz FSB)
• Pentium 4 2.8C (Northwood, 512 KB L2, 800 MHz FSB, Hyper-Threading)
• Pentium 4 2.8E (Prescott, 1 MB L2, 800 MHz FSB, Hyper-Threading)
«Cредние» найменования процессоров от Intel
6
2004 году компания Intel ввела другую маркировку МП типа Pentium. Единый
трехзначный номер МП учитывает сразу несколько характеристик: базовую архитектуру,
тактовую частоту МП и частоту системной шины, объем кэш-памяти и другие. Базовая
архитектура отображается старшим разрядом, было предложено три серии:
• ЗХХ — МП Celeron, Celeron М, Celeron М со сверхнизким энергопотреблением;
• 5ХХ — Pentium 4 для настольных и мобильных ПК, в том числе с технологией НТ;
• 7ХХ — Pentium с низким и сверхнизким энергопотреблением.
В новой маркировке, как и раньше, присутствует название фирмы (Intel), название
линейки процессоров (Pentium 4, Celeron D, Pentium Extreme Edition или Pentium D), а
также сам Processor Number, трёхзначное число, которое в новой маркировке заменяет
частоту, используемую в старой. Для того чтобы расшифровать трёхзначное число
маркировки, необходима таблица соответствий, по которой можно однозначно определить
все характеристики процессора.
7
Для МП семейства Core компания Intel ввела 5-значную маркировку: однобуквенный
префикс и 4-значный цифровой код. Буквенный префикс классифицирует МП по
Энергопотреблению
X - TDP более 75 Вт
E - TDP от 50 Вт и выше
T - TDP в пределах 25 Вт – 49 Вт
L - TDP в пределах 15 Вт – 24 Вт
U - TDP порядка 14 Вт и менее
В свою очередь 4-значный цифровой индекс также несёт смысловую нагрузку. В
общем случае, чем большее 4-значное число представлено маркировкой процессора,
тем большей производительностью и энергопотреблением он характеризуется. В то
же время первая цифра означает принадлежность чипа к определённому семейству
продуктов, вторая цифра – соответствующий расклад чипов внутри семейства.
Соответственно, чем больше цифра, тем производительнее чип.
Для четырехъядерных МП Core 2 Quad указывается буква Q.
Старшая цифра индекса показывает принадлежность МП к определенной группе
(процессоры на ядре Соnгое имеют серии 4000 и 6000, на ядре Мегоm — серии 5000 и
7000, на ядре Penryn — серии 8000 и 9000
Вот несколько примеров того, как выглядят маркировки современных
процессоров и как они расшифровываются:
Core 2 Extreme X6800 – 2,93 ГГц, 4 Мб кэша L2, 1066 МГц FSB
Core 2 Duo E6600 – 2,4 ГГц, 4 Мб кэша L2, 1066 МГц FSB
Core 2 Duo E6400 – 2,13 ГГц, 2 Мб кэша L2, 1066 МГц FSB
Core Duo T2500 – 2 ГГц, 2 Мб кэша L2, 667 МГц FSB
Core Duo U2500 – 1,06 ГГц, 2 Мб кэша L2, 533 МГц
Диапазон
Последовательность
нумерации
энергопотребленияпроцессоров
Intel Core 2Intel CoreIntel CoreIntel CoreCore
Extreme 2 Quad
2 Duo
Duo
Solo
-'
130 Вт (4 ядра)
QX6000
Q6000
75 Вт (2 ядра)
Х6000
50-74 Вт
E6000
E4000
25-49 Вт
T7000
T2000
T1000
T5000
15-24 Вт
L7000
L2000
14 Вт и менее
U7000
U2000
U1000
8
«Super новые» найменования процессоров от Intel
•
•
•
•
•
•
•
•
Корпорация Intel проводи в 2008г. ребрендинг своей продуктовой линейки.
В «Интел» отметила, что для процессоров и аппаратных платформ компании
используется слишком много различных торговых марок, что сбивает с толку
потребителей и зачастую вызывает путаницу. Введение новой системы
классификации продуктов облегчит покупателям выбор нужных комплектующих
или ПК, а также позволит точнее разграничить аппаратные решения на классы.
Ключевым брендом «Интел» станет Core. На сегодня существует множество
вариантов этой торговой марки, вроде Core 2 Duo, Core 2 Quad и Core 2 Extreme. С
течением времени корпорация намерена отказаться от этих производных, заменив
их тремя основными брендами: Core i3, Core i5 и Core i7. Процессоры с
маркировкой
Core i3 будут относиться к начальному уровню,
Core i5 — к средней ценовой категории,
Core i7 — к наиболее передовым продуктам.
Для чипов, ориентированных на недорогие компьютеры, «Интел» сохранит марку
Celeron, а для базовых решений — бренд Pentium. Кроме того, останется марка
Atom, под которой выпускаются процессоры для нетбуков и мобильных интернетустройств.
Компьютеры для бизнес-применения будут маркироваться либо Core i7 vPro, либо
Core i5 vPro.
А вот от бренда Centrino применительно к аппаратной платформе, включающей
центральный процессор и набор логики, собираются отказаться. Начиная с 2010
года марка Centrino будет использоваться для обозначения беспроводных решений
Wi-Fi и WiMAX.
9
Этапы развития архитектуры
универсальных микропроцессоров –
подробное описание
Первый микропроцессор был разработан фирмой Intel в 1971 году. Он получил
название I-4004, имел 4-разрядную структуру и был ориентирован на использование в
калькуляторах. Впоследствии этой же фирмой был выпущен еще один 4-разрядный
микропроцессор - I-4040.
На протяжении многих лет крупнейшими разработчиками и производителями
универсальных микропроцессоров в мире являются компании Intel (70-75 % мирового
производства) и Advanced Micro Devices (AMD), занимающая 20-25 % рынка. Их
разработки идут во многом параллельными путями. В нашем курсе мы будем
рассматривать развитие архитектуры универсальных микропроцессоров на примере
микропроцессоров фирмы Intel.
I-8080.
I8080 Объявлен: апрель 1974 г. Тактовая частота: 2 МГц 0,64 млн. операций в
секунду Количество транзисторов: 6 000 (6 мкм) Ширина полосы пропускания шины: 8
бит Адресуемая память: 64 Кбайт Применение: устройства управления уличным
освещением, компьютеры Altair computer (первые ПК) По сравнению с процессором 8008,
производительность возросла в десять раз.
Микропроцессор содержит входные и выходные интерфейсные сигналы,
обеспечивающие реакцию на сигналы запросов внешних прерываний, организацию
прямого доступа к памяти, а также согласование своего цикла работы с медленными
внешними устройствами (ВУ).
Его отличительной чертой стало создание микропроцессорного комплекта или
семейства, то есть набора БИС, совместимых между собой по интерфейсным сигналам и
функционально дополняющих друг друга. В нашей стране этот микропроцессорный
комплект выпускался в составе серии К580, в которую вошли следующие микросхемы:
КР580ВМ80А - однокристальный 8-разрядный микропроцессор;
КР580ВВ51А - программируемый последовательный интерфейс;
КР580ВИ53 - программируемый таймер;
КР580ВВ55А - программируемый параллельный интерфейс;
КР580ВТ57 - контроллер прямого доступа к памяти;
КР580ВН59 - контроллер прерываний;
КР580ВВ79 - интерфейс клавиатуры и дисплея;
КР580ВГ75 - контроллер ЭЛТ;
КР580ВК91А - интерфейс МП - канал общего пользования;
КР580ГФ24 - генератор тактовых сигналов и некоторые другие схемы,
предназначенные в основном для согласования работы отдельных частей
микропроцессорной системы.
БИС данного микропроцессорного комплекта вследствие хороших архитектурных
решений, широкой номенклатуры и совместимости до сих пор можно встретить в
некоторых цифровых устройствах, не требующих высокого быстродействия и
разрядности, а идеи, заложенные в таких схемах, как контроллер прерываний и
контроллер прямого доступа к памяти, используются в современных наборах системной
логики - чипсетах.
10
I-8086
I8086 Объявлен: 8 июня 1978 г. Тактовая частота: 5 МГц (0,33 млн. операций в
секунду) 8 МГц (0,66 млн. операций в секунду) 10 МГц (0,75 млн. операций в секунду)
Количество транзисторов: 29 000 (3 мкм) Ширина полосы пропускания шины: 16 бит
Адресуемая память: 1 мегабайт Применение: портативные ПК По сравнению с
процессором 8080, производительность возросла десятикратно
Очередным крупным шагом в развитии микропроцессорной техники стало
появление в 1978 году 16-разрядных универсальных микропроцессоров. Здесь прежде
всего следует выделить микропроцессор I-8086, выпускавшийся отечественной
электронной промышленностью в составе семейства К1810. Эти микропроцессоры,
заложившие основы архитектуры x86, использовались при производстве первых
персональных ЭВМ.
Основными отличительными чертами в архитектуре этого микропроцессора стали:
 увеличение разрядности регистров общего назначения до 16 бит;
 увеличение количества регистров общего назначения до 8;
 увеличение количества режимов адресации операндов;
 расширение количества флагов в регистре признаков, в том числе за счет
введения флагов управления, обеспечивающих, например, возможность
запрета внешних маскируемых прерываний;
 появление сегментного механизма обращения к памяти, который обеспечил
возможность обращения к памяти емкостью до 1 Мбайт при использовании
16-разрядных регистров.
Он мог адресовать 1 Мбайт памяти (то есть имел 20-разрядную шину адреса),
производительность его при тактовой частоте 5 МГц составляла 0,33 MIPS, но вскоре
появились процессоры с тактовой частотой 8 и 10 МГц. Чуть позже (через год) была
выпущена упрощенная версия процессора i8086 — i8088, который отличался только 8разрядной внешней шиной данных. За счет этого он был медленнее, чем i8086, на 20—
60% при той же тактовой частоте, но зато заметно дешевле. Именно на его основе был
собран очень популярный персональный компьютер IBM PC XT.
i286
I80286 Объявлен: февраль 1982 г. Тактовая частота: 6 МГц (0,9 млн. операций в
секунду) 10 МГц (1,5 млн. операций в секунду) 12 МГц (2,66 млн. операций в секунду)
Количество транзисторов: 134 000 (1,5 мкм) Ширина полосы пропускания шины: 16 бит
Адресуемая память: 16 мегабайт Виртуальная память: 1 гигабайт Применение: в то время
- стандартный микропроцессор для всех моделей ПК По сравнению с процессором 8086,
производительность возросла в три-шесть раз Просмотр энциклопедии Britannica с
применением этого процессора занял 45 секунд
11
Появившийся вслед за этим в 1982 году микропроцессор i286 явился переходной
ступенью к 32-разрядным универсальным микропроцессорам. В процессоре i286 было
реализовано два режима работы - защищенный и реальный. В реальном режиме работы
процессор был полностью совместим с выпускавшимися ранее 16-разрядными
микропроцессорами с архитектурой x86. В формировании адреса участвовали только 20
линий, поэтому максимальная емкость адресуемой памяти в этом режиме осталась
прежней - 1 Мбайт. В защищенном режиме процессор мог адресовать до 1 Гбайт
виртуальной памяти. Шина адреса увеличена до 24 бит, поэтому емкость адресуемой
памяти составляла 16 Мбайт. Для защиты от несанкционированного доступа к
программам и данным и выполнения привилегированных команд, которые могут
кардинально изменить состояние всей системы, в процессоре i286 была введена защита по
привилегиям. С этой целью микропроцессор поддерживал 4 уровня привилегий. Для
выполнения операций над числами с плавающей точкой была разработана отдельная БИС
- математический сопроцессор 80287
16-разрядный процессор i80286, был использован в персональных компьютерах IBM
PC AT. Принципиально новым было в нем то, что он мог адресовать до 16 Мбайт памяти
и имел помимо реального режима, аналогичного i8086, еще и так называемый
защищенный режим, позволяющий более гибко управлять памятью. Производительность
этого процессора при тактовой частоте 8 МГц составляла 1,2 MIPS.
В 1985 году был выпущен 32-разрядный универсальный микропроцессор i386 первый полноценный представитель архитектуры IA-32 (Intel Architecture-32). Данную
архитектуру отличает ряд изменений, некоторые из которых имеют чисто количественное
значение, а другие носят принципиальный характер.
Главным внешним отличием является увеличение разрядности шины данных и шины
адреса до 32 бит. Это, в свою очередь, связано с изменениями в разрядности внутренних
элементов микропроцессора.
Большие качественные изменения произошли на уровне работы микропроцессора в
защищенном режиме.
Принципиально меняется механизм формирования физического адреса. Прежде
всего, изменяется механизм использования сегментированной памяти. Сегменты в
12
защищенном режиме могут иметь произвольную длину и располагаться в памяти начиная
с произвольного адреса.
Каждый сегмент снабжается рядом атрибутов (базовый адрес, длина сегмента, его
тип, уровень защиты и т. п.), которые хранятся в специальной структуре, называемой
дескриптором
сегмента,
и
используются
блоком
управления
памятью
микропроцессора при формировании физических адресов операндов и команд.
Появляется возможность использования страничного механизма организации памяти.
Страница - это раздел памяти, который, в отличие от сегмента, имеет фиксированную
длину. Страничная организация памяти служит основой виртуальной памяти и
беспечивает более эффективное, по сравнению с сегментной, использование памяти.
Организуется аппаратная поддержка мультипрограммного режима работы, при
котором в памяти одновременно содержатся программы и данные для выполнения
нескольких задач. Каждой задаче предоставляется свой <виртуальный процессор>. В
каждый момент времени реальный процессор предоставляется одному из виртуальных
процессоров, выполняющему свою задачу.
С целью обеспечения защиты информации и упрощения организации
мультипрограммного режима работы микропроцессор снабжается специальными
механизмами, определяющими, какие операции и обращения к памяти разрешается
производить процессору при выполнении текущей задачи.
Он имел также более развитую систему управления памятью MMU (Memory
Management Unit). Производительность его при тактовой частоте 16 МГц составляла 6
MIPS. С появлением этого процессора стала бурно развиваться операционная система MS
Windows, существенно изменившая процесс работы с компьютерами типа IBM PC.
За время, прошедшее после появления первого 32-разрядного микропроцессора,
только фирмой Intel было выпущено несколько десятков модификаций 32-разрядных МП.
Изменения в некоторых моделях носили принципиальный характер, а ряд моделей
содержали в основном лишь количественные изменения отдельных параметров (частота,
емкость кэш-памяти и т. п.). Основные этапы развития этой архитектуры, которые, на наш
взгляд, носят принципиальный характер, представлены в табл.
13
. Этапы развития архитектуры IA-32
Макс
тактовая
частота,
МГц
Схема
обрабо
тки
данных
Наличие
кэшРегги
памяти
стры
на кристале
Колличе
ство
команд
в системе
команд
Кол-во
конвейер
ов/
ступиней
о
Модель
Число
Год начала
транзисторов
выпуска
на кристале
i386
1985
275 тыс.
40
SISD,
ФТ
нет
32 разрядные с 220
ФТ***
-
i486
1989
1,2 млн.
100
SISD,
ФТ,
ПТ
да
--- // ----- // --+80-разрядные
с ПТ***
---
Pentium
1993
3,1 млн.
200
--- // --- --- // ---
--- // ---
--- // ---
2/5
Pentium
MMX
1997
4,5 млн.
233
--- // --- --- // --+SIMD
, ФПБ
--- // ---
+ 57
4/14
Pentium
III
1999
9,5 млн. (28,1 1400
млн.) *
--- // --- --- // --+SIMD +кэш L2
, П3
--- // --+70
+128разрядные SSE
5/11
42 млн.
--- // --- --- // ---
--- // ---
9/31
Pentium 4 2000
3800
+144
I486
К основным нововведениям микропроцессора i486, выпущенного в 1989 году,
относятся два, которые связаны с расширившимися технологическими возможностями.
Это размещение непосредственно на кристалле БИС двух важных блоков, которые раньше
выполнялись в виде отдельных микросхем: кэш-памяти и блока процессора обработки
чисел с плавающей точкой (floating point unit - FPU). Кэш-память имела объем 8
Кбайт и предназначалась для хранения программ и данных. FPU имел внутренний
файл из восьми 80-разрядных регистров, свой регистр состояния и управления.
Еще одним принципиальным шагом стало создание в 1989 году процессора Intel
486DX, в котором появились встроенный математический сопроцессор, существенно
ускоривший выполнение арифметических операций, и внутренняя кэш-память,
ускоряющая обмен с оперативной памятью. Максимальный объем адресуемой памяти
этого процессора — 4 Гбайт. На тактовой частоте 25 МГц производительность была 16,5
MIPS. Начиная с процессора 486, получило распространение так называемое умножение
тактовой частоты, то есть внутреннее удвоение и даже учетверение внешней тактовой
частоты (обозначается 486DX2, 486DX4).
В 1993 году появились первые процессоры Pentium, открывшие новый этап в
развитии семейства. Они были 32-разрядными внутри, но имели 64-разрядную внешнюю
шину данных. Принципиальным отличием было использование в них так называемой
суперскалярной архитектуры, следствием чего стало более высокое быстродействие при
той же тактовой частоте, что и i486DX. При тактовой частоте 66 МГц производительность
процессора достигала 112 MIPS. В 1996 году тактовая частота Pentium была доведена до
200 МГц, а стоимость снизилась настолько, что он стал рядовым процессором
персональных компьютеров семейства IBM PC.
Основным нововведением разработанного в 1997 году микропроцессора Pentium
MMX стал блок, обеспечивавший новую схему обработки целочисленной информации SIMD (Single Instruction - Multiple Data: одна команда - множество данных). До этого
обработка велась по классической схеме SISD: каждая команда выполняла действия над
своей парой операндов. Введение SIMD-операций позволило обрабатывать одновременно
несколько операндов с использованием одной команды, что дало возможность
существенно поднять производительность микропроцессора на тех задачах, где над
14
большими массивами однородной информации выполнялись одинаковые операции,
например, в мультимедийных приложениях. Появление таких возможностей потребовало
введения в систему команд 57 новых инструкций, но регистровая структура
микропроцессора не изменилась.
В 1997 году Pentium был дополнен технологией MMX, призванной ускорять
выполнение мультимедийных приложений (обработку изображений и звука). И в этом же
году появился процессор Pentium II, который включает в себя технологию ММХ и имеет
более высокое быст Микропроцессор Pentium III, появившийся в 1999 году, позволил
обрабатывать по схеме SIMD не только целочисленные операнды, но и числа с плавающей
точкой. Для этого система команд была расширена на 70 инструкций, а в структуре
микропроцессора появился специальный блок SSE, содержащий, в частности, отдельный
регистровый файл из восьми 128-разрядных регистров. Еще одной новинкой,
использованной в Pentium III, было размещение на кристалле кэш-памяти второго уровня
(начиная с ядра Coppermine), работающей на частоте ядра. Но это носило скорее к.
Основным вкладом Pentium 4 в развитие архитектуры IA-32 стало еще большее
увеличение глубины конвейера - до 31 стадии, что позволило сильно нарастить частоту
процессора. Количество конвейеров возросло до 9. Кроме поддержки ставших
традиционными инструкций MMX и SSE, в Pentium 4 добавили еще 144 команды SSE2,
затем и SSE3, ориентированные в первую очередь на работу с потоковыми
данными.родействие. Возможная тактовая частота достигла более 400 МГц.
Процессоры Intel P6-Pentium-4
Название
Ядро
Разъём
Техпроцесс,
Характеристики
мкм
Klamath
Slot-1
0.25
66Mhz FSB, 32Kb L1,
512Kb
L2
на
процессорной плате
1997
Deschutes
Slot-1
0.25
100Mhz FSB, 32Kb
L1, 512Kb L2 на
процессорной плате
1998
Covington
Slot-1
0.25
66Mhz FSB, 32Kb L1,
совсем нет L2
1997
Slot-1
0.25
66Mhz FSB, 32Kb L1,
128Kb
L2
на
процессорной плате
1998
Socket 370
0.25
66Mhz FSB, 32Kb L1,
128Kb L2
1999
1999
Pentium II
Pentium
Celeron
II
Mendocino
Pentium III
Pentium
Celeron
III
Год выпуска
Katmai
Slot-1
0.25
100 или 133Mhz FSB,
32Kb L1, 512Kb на
процессорной плате,
SSE
Coppermine
Slot-1/
Socket 370
0.18
100 или 133Mhz FSB,
32Kb L1, 256Kb L2,
SSE
1999
Tualatin
Socket 370
0.13
133Mhz FSB, 32Kb
L1, 256 или 512Kb
L2, SSE
2001
Coppermine 128
Socket 370
0.18
66 или 100Mhz FSB,
32Kb L1, 128Kb L2,
SSE
1999
15
Tualatin
Socket 370
0.13
100Mhz FSB, 32Kb
L1, 256Kb L2, SSE
2001
Willamette
Socket 423
0.18
или 478
400Mhz FSB, 8KB L1,
256KB L2, SSE, SSE2
2000
Northwood
Socket 478
0.13
400, 533 или 800Mhz
FSB, 8KB L1, 256KB
L2,
SSE,
SSE2,
варианты с FSB 533
имеют
поддержку
Hyper
Threading
только
в
версии
3.06ГГц, а с 800MHz
– всегда имеют
2001
Xeon Gallatin
Socket 478
0.13
800Mhz FSB, 8KB L1,
256KB L2, 2Mb L3
SSE, SSE2
2003
Willamette
Socket 423
0.18
или 478
400Mhz FSB, 8KB L1,
128KB L2, SSE, SSE2
2000
Northwood
Socket 478
400Mhz FSB, 8KB L1,
128KB L2, SSE, SSE2
2001
Prescot
Socket 478
Pentium 4
Pentium 4
Extreme
Edition
Pentium
Celeron
4
0.13
Внимание!!!!! Несмотря на свое название, процессоры продаваемые как Intel Core
Duo и Core Solo фактически не используют микроархитектуру Core.
А вот Core 2 Duo и Penryn ---используют
Модель
МП
Core
U1300
Core
U1400
Core
L2300
Core
T2250
Core
T2500
Core
T2700
Core 2
E6300
Core 2
E6600
Core
Extreme
X6800
Core
Количес Техноия, Тактовая Частота
Энергопотребление, Размер
во
мкм
частота, Системной Вт
Кэшядер
ГГц
шины
памяти
(FSB)
L2,
, МГц
Мбайт
Solo 1
0,065
1,06
533
5,5
2
Solo 1
0,065
1,2
667
6
2
Duo 2
0,065
1,5
667
15
2
Duo 2
0,065
1,7
533
30
2
Duo 2
0,065
2,0
667
31
2
Duo 2
0,065
2,3
667
31
2
Duo 2
0,065
1,3
1066
65
2
Duo 2
0,065
2,1
1066
70
4
22
0.065
2,9
1066
80
4
22
0.065
2,6
800
80
4
16
Extreme
X7800
Core 2 Due 2
T7700
Core 2 Quad 4
QX6700
Core
24
Extreme
QuadQX6800
Core Penryn 2
E8300
Core Penryn 2
E8500
Core Penryn 4
QX9300
Core Penryn 4
QX9550
0,065
2,4
800
35
4
0,065
2,66
1066
85
8
0,065
2,93
1066
90
8
0,045
2,83
1333
65
6
0,045
3,16
1333
65
6
0,045
2,5
1333
95
6
0.0 45
2,83
1333
95
12
Pentium M
Представленный в марте 2003 года, Pentium M (произносится: Пентиум Эм) это
процессор с архитектурой x86 (i686) разработанный и произведённый компанией Intel и
предназначенный для использования в платформе Intel Centrino. Процессор первоначально
разрабатывался для использования в мобильных компьютерах, о чём говорит буква "M",
mobile. Перед официальным представлением широкой публике он носил кодовое имя
"Banias". Смотри также Pentium III.
Pentium M представляет собой новую и радикальную отправную точку Intel, он не
является доработанной, с целью снижения потребления энергии, версией процессора для
17
настольного компьютера Pentium 4, а представляет собой очень сильно доработанную
версию процессора Pentium III на ядре Tualatin, который, в свою очередь, базировался на
дизайне ядра Pentium Pro. Он специально оптимизирован с целью увеличения
энергетической эффективности, жизненно необходимой характеристики для продления
времени работы мобильных компьютеров от батареи. Работая с очень малым средним
потреблением энергии и, соответственно, малым тепловыделением, по сравнению с
настольными процессорами, Pentium M также работает и на малых тактовых частотах, но
со сравнимой производительностью. Например, Pentium M, работающий на частоте 1,6
ГГц показывает среднюю производительность, сравнимую с 2,4 ГГц Pentium 4 на ядре
Northwood (400 MT/s системная шина) без технологии Hyper-Threading.
Процессор представляет собой вычислительное ядро от Pentium III, системную шину,
совместимую с Pentium 4, усовершенствованные инструкции декодирования/выдачи,
улучшенный блок предсказания переходов, поддержку SSE2 и большой кэш.
Используется также новейший метод отключения неиспользуемых энергоёмких блоков
кэша. Другие методы энергосбережения включают в себя динамическое изменение
частоты и напряжения ядра, все Pentium M уменьшают свою тактовую частоту, если
система простаивает, с целью сохранения энергии. Последняя инновация в данной
области — технология SpeedStep 3 с расширенными количеством рабочих точек по
сравнению с предыдущими версиями SpeedStep. С данной технологией 1,6 ГГц Pentium M
способен эффективно выбирать свою частоту в зависимости от нагрузки и выставлять 600
МГц, 800 МГц, 1000 МГц, 1200 МГц, 1400 МГц и 1600 МГц. Это и другие выдающиеся
свойства Pentium M позволили добиться экстремально низкого энергопотребления,
варьирующегося от 5 Вт до 27 Вт при полной нагрузке. Эти свойства сильно
востребованы производителями мобильных компьютеров и позволяют использовать
Pentium M в тонких, лёгких и маленьких ноутбуках.
Хотя Intel позиционирует Pentium M исключительно как мобильный продукт,
производители материнских плат, такие как AOpen, DFI и MSI имеют в своём
ассортименте Pentium M совместимые материнские платы для энтузиастов, домашних
развлекательных центров, рабочих станций и серверных приложений. А благодаря
адаптеру CT-479, разработанному компанией ASUS, возможно использовать все
процессоры Pentium M в материнских платах этой компании разработанных для
процессоров Socket 478 Pentium 4. Компания Shuttle Inc. предложила компактный
настольный компьютер на процессоре Pentium M, позиционирующийся как очень тихий,
потребляющий минимум энергии и занимающий мало места.
Процессоры Pentium M получили широкое распространение в индустрии
встраиваемых систем. Низкое потребление Pentium M позволяет строить
безвентиляторные и высокоинтегрированные встраиваемые компьютеры, такие как
"Midget" компании Toradex.
Banias
Первый Pentium M который носил кодовое имя Banias без номеров моделей, или
модельный номер 705. Он производился с использованием 130нм техпроцесса, имел
частоты от 1,3 ГГц до 1,7 ГГц, использовал 400 MT/s системную шину и 1 МБ кэш 2-го
уровня. Процессор имеет среднее тепловыделение (Thermal Design Power) 24 Вт.
Dothan
Intel представил улучшенный Pentium M, также известный как Dothan, 10 мая 2004
года. Процессор Dothan Pentium M является первым процессором Intel, для
идентификации которого использовался так называемый «процессорный номер», который
является более предпочтительным, чем стандартный, основанный на значениях тактовых
частот. Старшие версии были известны как Pentium M 715 (1,5 ГГц), 725 (1,6 ГГц), 735
(1,7 ГГц), 745 (1,8 ГГц), 755 (2,0 ГГц) и 765 (2,1 ГГц).
Эта (700-я) серия процессоров Pentium M сохранила базовый дизайн оригинального
Pentium M, но при этом производилась с использованием техпроцесса 90нм, с
18
увеличенным вдвое кэшем. Размер ядра составлял 84 мм² сохраняя близость с
оригинальным Pentium M, кристалл 700-го содержал ~140 миллионов транзисторов, в
основном за счёт введения огромного 2 МБ кэша. Тепловыделение также уменьшилось до
21 Вт (против 24 Вт у Banias), несмотря на ненамного более низкие частоты. Большое
количество тестовых лаборaторий, тестировавших вышедший Dothan, пришли к выводу,
что сиcтемы, построенный на Banias и Dothan имеют схожее время жизни от батарей.
По состоянию на июнь 2005 года семейство процессоров Pentium M содержало
процессоры с тактовой частотой от 1 ГГц до 2,26 ГГц. Модели с низкими частотами были
низковольтными (англ. low voltage) и сверхнизковольтными (англ. ultra-low voltage), что
обеспечивало минимальное тепловыделение, а значит и большое время жизни от батарей.
Модели 718 (1,3 ГГц), 738 (1,4 ГГц) и 758 (1,5 ГГц) были низковольтными (1,116 В) с
тепловыделением 10 Вт. Модели 723 (1,0 ГГц), 733 (1,1 ГГц) и 753 (1,2 ГГц) являлись
сверхнизковольтнмии (0,940 В) с тепловыделением 5 Вт.
Ревизия ядра Dothan была представлена в первом квартале 2005 года одновременно с
набором системной логики Sonoma и поддерживает системную шину 533 MT/s и XD
(реализации технологии NX bit от компании Intel). Эта линейка включала модели 730 (1,6
ГГц), 740 (1,73 ГГц), 750 (1,86 ГГц), 760 (2,0 ГГц) и 770 (2,13 ГГц). Эти модели имели
среднее тепловыделение 27 Вт и 2 МБ кэш 2-го уровня.
В июле 2005 года Intel также представил 2 новые модели: 780 (2,26 ГГц) и
низковольтную 778 (1,60 ГГц).
Core Solo и Core Duo
Следующее поколение процессоров, использующий микроархитектуру Pentium M,
кодовое имя Yonah, которые представлены под новой торговой маркой Intel Core, как Core
Solo и Core Duo.
Intel Core (произносится: И́нтел Ко) — это название, используемое для процессоров с
кодовым именем Yonah (на иврите Yonah означает «голубка»; также, возможно, в
названии содержится указание на пророка Иону), представленных 5 января 2006 года. Оно
предназначено для замены торговой марки Pentium M, использовавшейся в ранних
версиях мобильных процессоров такой же архитектуры. Это название является частью
операции по ребрендингу, запущенной компанией Intel в январе 2006 года; следующее
поколение настольных и мобильных процессоров после Intel Core получило название Intel
Core 2, которое заменит торговую марку Pentium.
Yonah
Yonah — это кодовое имя первого поколения мобильных процессоров компании
Intel, произведённых с использованием техпроцесса 65нм, основанных на архитектуре
Banias/Dothan Pentium M, с добавленной технологией защиты LaGrande. Общая
производительность была увеличена за счёт добавления поддержки SSE3 расширений и
усовершенствования поддержки расширений SSE и SSE2. Но при этом общая
производительность немного снижается в связи с более медленным кэшем (а точнее, в
связи с его высокой латентностью). Дополнительно Yonah поддерживает технологию NX
bit.
Процессор Core Duo является лучшим в мире двуядерным процессором с
архитектурой x86 с точки зрения энергопотребления (меньше 25Вт), обогнав по этому
показателю предыдущих чемпионов — Opteron 260 и 860 HE с их 55Вт. Core Duo был
представлен 5 января 2006 года, наряду с другими компонентами платформы Napa. Это
первый процессор компании Intel, который используется в компьютерах Apple Macintosh
(компьютер, включённый в Apple Developer Transition Kit, использовал процессор Pentium
4, но он не поступал в широкую продажу и предназначался только для нужд
разработчиков).
В противовес предыдущим заявлениям, Intel Core Duo поддерживает технологию
виртуализации от компании Intel под названием Vanderpool, исключая модель T2300E, как
показывают the Intel Centrino Duo Mobile Technology Performance Brief и Intel's Processor
19
Number Feature Table. Тем не менее, кажется что многие производители предпочтут по
умолчанию выключить данную технологию, благо, это возможно сделать в виде опции
BIOS.
EM64T (расширения Intel x86-64) не поддерживаются Yonah. Однако, EM64T
присутствует в наследнике Yonah, Core 2, имеющего кодовое имя Merom.
Intel Core Duo имеет два ядра, 2Мб кэш 2-го уровня, на оба ядра, и шину управления
для контроля над кэшем 2-го уровня и системной шиной. В будущих степпингах
процессоров Core Duo так же ожидается возможность отключения одного ядра для
лучшего энергосбережения.
Intel Core Solo использует то же двойное ядро, что и Core Duo, но рабочим является
только одно ядро. Этот стиль высоко востребован для одноядерных мобильных
процессоров, и это позволяет Intel отключением одного из ядер создать новую линейку
процессоров, физически выпуская лишь одно ядро. В конечном итоге это позволяет Intel
без сильного ущерба для себя сбывать процессоры, у которых одно из ядер оказалось
дефектным (ядро просто отключается и процессор идёт в продажу под маркой Core Solo).
Ядро Core Duo содержит 151 миллион транзисторов, включает в себя общий для
обоих ядер, 2Мб кэш 2-го уровня. Конвейер Yonah содержит 12 стадий, предсказатель
переходов работающий на частоте от 2.33 до 2.50ГГц. Обмен данными между кэшем 2-го
уровня и ядрами осуществляется посредством арбитражной шины, что уменьшает
нагрузку на системную шину. В результате операция обмена данными ядро-кэш 2-го
уровня составляет от 10 циклов (Dothan Pentium M) до 14 тактов. С возрастанием
тактовых частот начинают очень сильно расти задержки. Компоненты управления
питанием ядра включают в себя блок температурного контроля, который способен
управлять отдельно питанием каждого ядра, добиваясь в результате очень эффективного
управления питанием.
Процессоры Intel Core осуществляют соединение с набором системной логики
посредством 667 T/s системной шины (против 533MT/s системной шины, которая
применялась в Pentium M).
Yonah поддерживают наборы системной логики Intel 945GM, 945PM и 945GT. Core
Duo и Core Solo используют упаковку FCPGA6 (478 пин), но при этом распиновка их не
совпадает с распиновкой, использовавшейся в предыдущих Pentium M, соответственно,
они требуют новых материнских плат.
Во многих приложениях (с поддержкой обоих ядер), Yonah демонстрирует
нехарактерно большое улучшение производительности над своими предшественниками
два вычислительных ядра без значительного увеличения потребления энергии
выдающаяся производительность
выдающийся коэффициент «производительность на ватт»
Недостатки Yonah в значительной степени наследует от предыдущей архитектуры
Pentium M:
 высокая задержка при обращении к памяти из-за отсутствия на ядре
интегрированного
контроллера
памяти
(ещё
более
усугубляется
использованием памяти DDR2)
 слабая производительность блока операций с плавающий точкой (FPU)
 отсутствует поддержка 64-bit (EM64T)
 отсутствует hyper-threading
иногда показывает худшую «производительность на ватт» в однопоточных и
слабораспаралеливающихся задачах, по сравнению со своими предшественниками
Платформа Yonah устроена таким образом, что любые обращения к оперативной
памяти проходят через северный мост, что увеличивает задержки по сравнению с
платформой от компании AMD Turion. Эта слабость присуща всей линейке процессоров
Pentium (настольным, мобильным и серверным). Однако, синтетические тесты
показывают, что огромный кэш 2-го уровня вполне эффективно компенсирует задержки
20
при
обращении
к оперативной памяти, что
минимизирует
уменьшение
производительности из-за больших задержек в реальных приложениях.
Многие считают, что недостаток поддержки 64 бит в Yonah приведёт к
значительным ограничениям в будущем. Однако, распространение 64 битных ОС сейчас
ограничено отсутствием спроса на рынке сбыта, и ситуация начнёт меняться после 2008
года. К тому же мало каким ноутбукам требуется поддержка более 2Гб оперативной
памяти, соответственно, нет необходимости в 64-битной адресации. Отсюда многие люди
склонны доверять производителям и продавцам мобильных компьютеров, утверждающих,
что поддержка EM64T в данный момент не востребована.
Процессор Sossaman для серверов, который базируется на ядре Yonah, также
является EM64T совместимым. Для рынка серверов, являющегося более требовательным,
все основные ОС уже имеют поддержку EM64T.
Исходя из этого, некоторые рассматривают Core как временную замену, которая
позволила Intel закрыть переход между серией Pentium и 64-битными Intel Core 2
процессорами, которые стали доступны летом 2006 года.
В соответствии с планами Intel по выпуску мобильных процессоров на 2005 год
видится, что Intel в основном собирается сфокусироваться на большом энергопотреблении
своих p6+ Pentium M и намеревается уменьшить его на 50 % при помощи Yonah. Intel
планирует продолжить выпуск настольной (NetBurst) архитектуры с уменьшенным
энергопотреблением для производительных мобильных решений и использование
процессоров Pentium M/Core для средне и низкопроизводительных решений, с низким
энергопотреблением. Данная политика была изменена позже, когда стало тяжело
сохранять энергопотребление и при этом наращивать производительность там, где это
только возможно. Intel сменил политику и отказался от NetBurst и заменил его на p6+
Pentium M/Core. Это вывело p6+ Pentium M/Core в высокопроизводительные и
низкопотребляющие решения.
Производное от Yonah, кодовое имя Sossaman, представлено 14 марта 2006 года как
Dual-Core Xeon LV. Sossaman фактически является Yonah, за исключением того, что
Sossaman поддерживает конфигурации с двумя процессорными разъёмами (всего 4 ядра).
Преемник Core, линейка процессоров Intel Core 2 основывается на микроархитектуре
Intel Core. Выход Intel Core 2 привёл к прекращению разделения процессоров Intel на
настольные и мобильные, процессоры Core 2 будут представлены как двух- так и
одноядерными продуктами для настольных и мобильных компьютеров, в то время как
процессоры Intel Core предназначены для ноутбуков. Среди основных отличий Core 2
стоит отметить 64-разрядность и поддержку технологии EM64T, что на практике
позволяет использовать в системе более 4 Гб оперативной памяти в 64-битных системах
Microsoft. Unix-совместимые системы и некоторые версии Windows NT поддерживают
адресацию памяти до 64Гб и на 32-битных процессорах, за счет применения PAE.
Intel's Leading
Microprocessors
Mobile
Intel®
Pentium
® III
processor
-M
Mobile
Intel®
Pentium
®4
processor
-M
Intel®
Pentium® M
processor
Intel®
Celeron® M
processor
Intel®
Celeron® M
processor 6
Intel®
Core™ Duo
processor
Intel®
Core™ Solo
processor
Intel®
Core™ 2
Duo
mobile
processor
Single or Dual
Core
Single
Single
Single
Single
Single
Dual-Core
Single
Dual-Core
On-die L2 cache
512 KB
512 KB
or 1MB
1 MB or 2
MB
512 KB or
1MB
1MB
2MB
2MB
2MB or 4MB
Processor system
bus
133 MHz
400 MHz
or
533 MHz
400 MHz
or
533 MHz
400 MHz
533 MHz
667 MHz
667 MHz
667 MHz
Processor
1.33 GHz
3.33 GHz
2.26 GHz
1.60 GHz
1.73 GHz
2.33GHz
1.83 GHz
2.33 GHz
21
frequency up to
Power-optimized
processor system
bus
No
No
Yes
Yes
Yes
Yes
Yes
Yes
No
No
No
No
Yes
Yes
Yes
Yes
Intel® Mobile
Voltage
Positioning (Intel®
MVP IV)
No
No
Yes
Yes
Yes
Yes
Yes
Yes
Intel's
Recommended
Chipsets
Intel®
830
Chipset
Family
Intel®
845
Chipset
Family
Intel® 855
Chipset
Family or
Mobile
Intel® 915
Express
Chipset
Family
Intel® 855
Chipset
Family or
Mobile
Intel® 915
Express
Chipset
Family
Mobile
Intel® 945
Express
Chipset
Family
Mobile
Intel® 945
Express
Chipset
Family
Mobile
Intel® 945
Express
Chipset
Family
Mobile
Intel® 945
Express
Chipset
Family
Support up to 2GB
of DDR24
No
No
Yes
Yes
Yes
Yes
Yes
Yes
USB 2.0 support
No
No3
Yes
Yes
Yes
Yes
Yes
Yes
Discrete and
integrated graphics
chipset solutions
Yes
No3
Yes
Yes
Yes
Yes
Yes
Yes
Dynamic Cache
Sizing
No
No
No
No
Yes
Yes
Yes
Yes
Intel's Verified
Wireless Solution
N/A
N/A
Intel®
PRO/Wireles
s Network
Connection
Intel®
PRO/Wireles
s Network
Connection
Intel®
PRO/Wireles
s Network
Connection
Intel®
PRO/Wireles
s Network
Connection
Intel®
PRO/Wireles
s Network
Connection
Intel®
PRO/Wireles
s Network
Connection
Single & dual band
support
(802.11b, 802.11a/
b, 802.11b/g,
802.11 a/b/g)
N/A
N/A
Yes
Yes
Yes
Yes
Yes
Yes
Industry standard
and extended
wireless security
support (LEAP,
WPA, 802.1x,
WEP)5
N/A
N/A
Yes
Yes
Yes
Yes
Yes
Yes
Intel® PROSet
with advanced
profile
management
support5
N/A
N/A
Yes
Yes
Yes
Yes
Yes
Yes
Power Saving
Technology
N/A
N/A
PSP2
PSP
NCPA
NCPA
NCPA
NCPA
Intel® Advanced
Thermal Manager
with per-core
Digital
Temperature
Sensors
Представленные летом 2006 года х86-процессоры Intel с новой микроархитектурой
Сore впервые за последние годы резко опередили процессоры AMD по
производительности, обладая при этом более низкоим энергопотреблением.
Основные вехи в истории создания двухъядерных процессоров таковы:
1999 год – анонс первого двухъядерного процессора в мире (IBM Power4 для
серверов)
2001 год – начало продаж двухъядерного IBM Power4
22
2002 год – почти одновременно AMD и Intel объявляют о перспективах создания
своих двухъядерных процессоров
2002 год – выход процессоров Intel Xeon и Intel Pentium 4 с технологией HyperThreading, обеспечивающей виртуальную двухпроцессорность на одном кристалле
2004 год – свой двухъядерный процессор выпустила Sun (UltraSPARC IV)
2004 год – IBM выпустила второе поколение своих двухъядерных процессоров (IBM
Power5). Каждое процессорное ядро Power5 поддерживает аналог технологии HyperThreading
2005 год, 18 марта – Intel выпустила первый в мире двухъядерный процессор
архитектуры x86
2005 год, 21 марта – AMD анонсировала полную линейку серверных двухъядерных
процессоров Opteron, анонсировала десктопные двухъядерные процессоры Athlon 64 X2 и
начала поставки двухъядерных Opteron 8xx
2005 год, 20-25 мая – AMD начинает поставки двухядерных Opteron 2xx
2005 год, 26 мая – Intel выпускает двухъядерные Pentium D для массовых ПК
2005 год, 31 мая – AMD начинает поставки Athlon 64 X2
С момента выхода первых процессоров Intel на архитектуре предыдущего поколения
(NetBurst), старые приверженцы (кто сказал «фанаты»?) компании пребывали в состоянии
постоянной встревоженности: или по поводу того, что процессоры AMD демонстрировали
в среднем более хорошие результаты, или по поводу того, что Intel удавалось AMD
обогнать — но всё же не настолько, чтобы можно было успокоиться. В результате, к 2006
году большинство было настроено успокоиться окончательно. Либо одним способом
(увидев превосходные результаты новой архитектуры), либо другим (увидев результаты
«не превосходные», и окончательно разочаровавшись). Третьего дано не было, и Intel сама
это отлично понимала
2006-й год в процессорной отрасли, по-видимому, так навсегда и останется «годом, в
который вышел Conroe»-Меrоm-
Микроархитектура Intel Core
Микроархитектура Pentium 4 NetBurst и ее последняя модификация в процессорах
Prescott/Nocona были суперконвейерными, нацеленными на максимальные тактовые
частоты. Корпорация Intel выпускала уже и двухъядерные процессоры, однако их
микроархитектура не была специально оптимизирована для достижения высокой
производительности при низком энергопотреблении. Для многоядерных процессоров с
более низкими частотами ее понадобилось существенно переделывать, и была создана
новая микроархитектура, Core. В ней число стадий основного, целочисленного конвейера
было уменьшено более чем вдвое — до 14. Интересно, что почти столько же стадий имеет
IBM Power4 — 15, в AMD Opteron — 12 стадий . Самый короткий конвейер в Sun
UltraSPARC T1 (шесть стадий), но отдельные его ядра не нацелены на максимум
производительности, а тактовая частота не превышает 1,2 ГГц [3].
Конечно, много важных компонентов микроархитектуры остались в Core
неизменными. Можно сказать, что базовые особенности были заложены еще в
суперскалярном процессоре Pentium Pro, когда появилась перекодировка CISC-команд x86
во внутренние RISC-подобные микрооперации, внеочередное (Out of Order, OoO)
спекулятивное выполнение микроопераций из буфера переупорядочения (ReOrder Buffer,
ROB) и др.
Однако в распоряжении разработчиков Core были сразу две разные
микроархитектуры — кроме «высокочастотной линии» NetBurst-Prescott-Pentium D
(двухъядерный процессор для ПК) и Dempsey (двухъядерный серверный процессор Xeon
DP), имелись еще израильские разработки Pentium M — Core Duo (бывшее кодовое
23
название Yonah) для мобильных ПК, в которых частоты и тепловыделение ниже. И
микроархитектура Core взяла лучшие черты от обеих линий.
Чрезвычайно важно отметить, что процессоры с микроархитектурой Core обладают
поддержкой 64-битных расширений Enhanced Memory 64 Technology (EM64T). Это
существенное отличие новой микроархитектуры от микроархитектуры процессоров
Pentium M, которые, как и более современные их последователи Core Duo, 64-битные
режимы работы не поддерживают в силу заложенных в них ограничений.
Что же касается более конкретных деталей, то первые процессоры, входящие в Intel
Core Microarchitecture, имеют двухъядерный дизайн (выполненный на едином
полупроводниковом кристалле), обладают кеш-памятью первого уровня объёмом 64
Кбайта (которая разделяется на две части по 32 Кбайта для кода и данных) и
комплектуются общей (разделяемой) на оба ядра кеш-памятью второго уровня объёмом 2
или 4 Мбайта.(См. рис)
Процессоры с новой микроархитектурой для ноутбуков, получившие кодовое имя
Merom, выпускаются исходя из их требуемого типичного тепловыделения, не
превышающего 35 Ватт. Это позволит при сохранении того же, как и у мобильных
компьютеров на базе современных процессоров Intel Core Duo, времени работы от
аккумулятора, достичь более чем 20-процентного прироста в производительности.
Серверные варианты процессоров, названные кодовым именем Woodcrest, по
сравнению с предыдущими двухъядерными CPU линейки Xeon, получили 80-процентный
прирост в быстродействии, а их типичное энергопотребление снизилось примерно на 35%
и составляет около 80 Вт.
Что же касается процессоров для "настольного" сегмента рынка, то им присвоено
кодовое имя Conroe. Рост производительности Conroe по сравнению со старшими
моделями линейки Pentium D 9XX составляет около 40%. При этом типичное
энергопотребление ниже примерно на такую же величину. В результате,
энергопотребление процессоров для настольных компьютеров (исключая модели,
нацеленные на энтузиастов) лежит в пределах 65 Вт.
24
Какие же микроархитектурные инновации внесены в Intel Core
Microarchitecture.
1. Технология Intel Wide Dynamic Execution призвана обеспечить выполнение
большего количества команд за каждый такт, повышая эффективность
выполнения приложений и сокращая энергопотребление. Каждое ядро
процессора, поддерживающего эту технологию, теперь может выполнять до
четырех инструкций одновременно с помощью 14-стадийного конвейера.
2. Технология Intel Intelligent Power Capability, активируя отдельные узлы
чипа только по мере необходимости, значительно снижает энергопотребление
системы в целом.
3. Технология Intel Advanced Smart Cache подразумевает наличие общей для
всех ядер кэш-памяти L2, совместное использование которой снижает
энергопотребление и повышает производительность. При этом, по мере
необходимости, одно из ядер процессора может использовать весь объём кэшпамяти при динамическом отключении другого ядра.
4. Технология Intel Smart Memory Access повышает производительность
системы, сокращая время отклика памяти и оптимизируя, таким образом,
использование пропускной способности подсистемы памяти.
5. Технология Intel Advanced Digital Media Boost позволяет обрабатывать все
128-разрядные команды SSE, SSE2 и SSE3, широко используемые в
мультимедийных и графических приложениях, за один такт, что увеличивает
скорость их выполнения.
Теперь остановимся подробнее на каждом из них.
Первое упоминание термина Dynamic Execution (динамическое исполнение)
относится к процессорам Pentium Pro, Pentium II и Pentium III. Говоря о динамическом
исполнении команд в этих процессорах, Intel подразумевал принципиально новую
суперскалярную микроархитектуру P6, способную выполнять анализ потока кода, и
обладающую возможностями спекулятивного (упреждающего) и внеочередного
исполнения команд. При переводе процессоров для настольных компьютеров на
микроархитектуру NetBurst, Intel стал говорить уже об усовершенствованном
динамическом исполнении, которое, помимо перечисленных выше свойств, обладало
более глубоким уровнем анализа кода и значительно улучшенными алгоритмами
предсказания переходов.
Теперь же, в новой микроархитектуре Core, речь идёт о "широком" динамическом
исполнении. Широким оно стало благодаря тому, что будущие процессоры Intel смогут
исполнять больше операций за такт, нежели их предшественники. Благодаря добавлению
в каждое ядро дополнительного декодера и исполнительных устройств, каждое из ядер
будущих процессоров сможет выбирать из программного кода и исполнять до четырёх
x86 инструкций одновременно, в то время как остальные процессоры AMD и Intel (как
"настольные", так и мобильные), могут обрабатывать не более трёх инструкций за такт. На
четыре декодера (один для сложных инструкций и три – для простых) микроархитектура
Core предполагает наличие шести портов запуска (один – Load, два – Store и три
универсальных). Кроме того, микроархитектура Core получила более совершенный блок
предсказания переходов и более вместительные буферы команд, используемые на
различных этапах анализа кода для оптимизации скорости исполнения.
Следует напомнить, что предшественники микроархитектуры Core, процессоры
Pentium M, обладали чрезвычайно интересной технологией micro-ops fusion, направленной
на снижение "накладных расходов" при выполнении некоторых x86 команд. Суть
технологии micro-ops fusion чрезвычайно проста. В случае если x86 команда распадается
на зависимые друг от друга микроинструкции, декодер осуществляет их привязку друг к
другу. Такие последовательности микроинструкций, "склеенные" технологией micro-ops
fusion для исполнения процессором в определённом порядке, представляются
25
процессором на всех этапах, кроме собственно исполнения, одной командой. Это
позволяет избежать ненужных простоев процессора в случае, если связанные
микроинструкции оказываются оторванными друг от друга в результате работы
алгоритмов внеочередного выполнения.
В дополнение к весьма удачной технологии micro-ops fusion, микроархитектура Core
получила технологию macrofusion. Данная технология направлена на увеличение числа
исполняемых за такт команд и заключается в том, что ряд пар связанных между собой
последовательных x86 инструкций, таких как, например, сравнение со следующим за ним
условным переходом, представляются внутри процессора одной микроинструкцией. Такая
микроинструкция рассматривается планировщиком и выполняется на исполнительных
устройствах как одна команда. Таким путём достигается как увеличение темпа
исполнения кода, так и некоторая экономия энергии.
Таким образом, по данным Intel, в общем случае удаётся снизить нагрузку операций
до 15% и сократить число микроопераций до 10%. Как видно на иллюстрации ниже,
модули префетча (предварительной выборки) подготавливают ряд x86 команд, при этом
до пяти из них могут одновременно обрабатываться четырьмя блоками декодирования. В
случае возможности слияния двух команд (Macro-Fusion), появляется фактическая
возможность параллельной обработки пяти инструкций за такт (единовременно может
образовываться не более одной макрокоманды).
Отдельным направлением, по которому выполнялось совершенствование
микроархитектуры Core, стала переработка блоков исполнения SIMD инструкций (SSE,
SSE2, SSE3). Современное программное обеспечение, например, для обработки
изображений, видео и звука, шифрования, научной и финансовой деятельности,
достаточно широко использует наборы команд SSE, которые позволяют работать со 128битовыми операндами различного характера (векторами и целочисленными либо
вещественночисленными данными повышенной точности).
Именно этот факт заставил инженеров Intel задуматься об ускорении работы SSE
блоков процессора, тем более что до недавнего времени процессоры Intel исполняли одну
SSE-инструкцию, работающую с 128-битными операндами, лишь за два такта. Один такт
тратился на обработку старших 64 бит, второй такт – на обработку младших. Новая же
микроархитектура Core позволила ускорить работу с SSE инструкциями в два раза.
Блоки SSE в процессорах полностью 128-битовые, что даёт возможность увеличить
количество данных, обрабатываемых процессором за такт. И особенно в тех задачах,
которые используют SIMD инструкции наиболее активно, а это, в первую очередь,
различного рода мультимедиа-приложения.
Помимо увеличения скорости работы блоков исполнения SIMD инструкций, Intel в
очередной раз провёл ревизию системы команд SSE. Результатом стало то, что уже
ставший привычным набор инструкций SSE3 был вновь дополнен восемью новыми
командами. Вообще говоря, указанное расширение набора команд SSE3 задумывалось
ещё при внедрении процессоров с кодовым именем Tejas, но в силу их отмены
соответствующая модификация нашла своё место в микроархитектуре Core.
Поскольку микроархитектура Core изначально проектировалась в двухъядерном
варианте,
разработчики
получили
возможность
оптимизировать
отдельные
функциональные блоки процессоров с учётом их этой особенности. Так, в отличие от
предыдущих CPU для настольных компьютеров, процессоры с микроархитектурой Core
получили разделяемый между вычислительными ядрами L2 кеш. Алгоритмы работы этой
кеш-памяти во многом подобны тем механизмам, которые реализованы в настоящее время
в двухъядерных мобильных процессорах Intel Core Duo.
Плюсов такого подхода к реализации кеш-памяти видится несколько. Во-первых, у
процессора появляется возможность гибко регулировать размеры областей кеша,
используемых каждым из ядер. Иными словами, доступ ко всему объёму L2 кеша может
получить любое из ядер процессора с микроархитектурой Core. Это, в частности, значит и
26
то, что когда одно из ядер бездействует, второе получает в своё полное распоряжение весь
объём кеш-памяти. Если же одновременно работают два процессорных ядра, то кеш
делится между ними пропорционально, в зависимости от частоты обращений каждого
ядра к оперативной памяти. Более того, если оба ядра работают синхронно с одними и
теми же данными, то хранятся они в общем L2 кеше только однократно. То есть,
разделяемый интеллектуальный L2 кеш процессоров с микроархитектурой Core гораздо
более эффективен и, даже можно сказать, более вместителен, чем два отдельных кеша,
разделённых между ядрами.
Разделяемая кеш-память может оказаться полезной двухъядерным процессорам и в
некоторых других случаях. Например, в технологии Core Multiplexing Technology,
обеспечивающей механизм динамического отключения второго ядра, в зависимости от
характера нагрузки на процессор. Очевидно, что в этом случае единый на два ядра кеш
второго уровня решил массу проблем с технической реализацией этой технологии.
Второй значительный плюс объединённой кеш-памяти второго уровня заключается в
том, что благодаря такой его организации значительно снижается нагрузка на
оперативную память системы и на процессорную шину. Дело в том, что в этом случае
перед системой не стоит задача контроля и обеспечения когерентности кеш-памяти
различных ядер. В системах с двухъядерными процессорами с раздельными кешами, в
случае, если оба ядра работают с одними и теми же данными, эти данные дублируются в
кеш-памяти каждого из ядер. Таким образом, возникает необходимость в контроле их
актуальности. Перед тем, как извлечь такие данные из L2 кеша для обработки, каждое
процессорное ядро должно проверить, не изменило ли эти данные другое ядро. И если это
так, то требуется обновление содержимого кеш-памяти, которое в системах на базе
процессоров с микроархитектурой NetBurst выполняется через системную шину и
оперативную память. Общий же на два ядра кеш позволяет полностью отказаться от этого
неэффективного алгоритма.
Кроме того, посредством управляющей логики, предусмотренной в процессорах с
микроархитектурой Core, стал возможным более простой обмен данными и между кешпамятью первого уровня каждого из ядер через общий L2 кеш, что в итоге даёт
возможность гораздо более результативного взаимодействия ядер при совместной работе
над одной задачей.
Технологии, объединенные под этим собирательным названием, направлены на
уменьшение задержек, которые могут возникнуть при доступе процессора к
обрабатываемым данным. Очевидно, что для этой цели как нельзя лучше подходит
предварительная выборка данных из памяти в обладающие гораздо более низкой
латентностью L1 и L2 кеши процессора. Надо сказать, что алгоритмы предварительной
выборки данных эксплуатируются в процессорах Intel достаточно давно. Однако с
выходом микроархитектуры Core соответствующий функциональный узел был
усовершенствован.
Микроархитектура Core предполагает реализацию в процессоре шести независимых
блоков предварительной выборки данных. Два блока нагружаются задачей
предварительной выборки данных из памяти в общий L2 кеш, ещё по два блока работают
с кешами первого уровня каждого из ядер CPU. Каждый из этих блоков независимо друг
от друга отслеживает закономерные обращения (потоковые, либо с постоянным шагом
внутри массива) исполнительных устройств к данным. Базируясь на собранной
статистике, блоки предварительной выборки стремятся подгружать данные из памяти в
процессорный кеш ещё до того, как к ним последует обращение.
Также, L1 кеш каждого из ядер процессоров, построенных на базе Intel Core
Microarchitecture, имеет по одному блоку предварительной выборки инструкций,
работающий по аналогичному принципу.
Кроме улучшенной предварительной выборки данных, Intel Smart Access
предполагает ещё одну интересную технологию, названную memory disambiguation
27
(устранение противоречий в памяти). Данная технология направлена на повышение
эффективности
работы
алгоритмов
внеочередного
исполнения
инструкций,
осуществляющих чтение и запись данных в памяти. Дело в том, что в современных
процессорах, осуществляющих внеочередное исполнение команд, не допускается
выполнение команды чтения до того, как не будут завершены все инструкции сохранения
данных. Объясняется это тем, что планировщик заранее не обладает информацией о
зависимости загружаемых и сохраняемых данных.
Однако достаточно часто последовательные инструкции сохранения и загрузки
данных из памяти не имеют между собой никакой взаимной зависимости. Поэтому,
отсутствие возможности изменения порядка их выполнения зачастую снижает загрузку
исполнительных устройств и эффективность работы CPU в целом. Для решения этой
проблемы и предусматривается новая технология memory disambiguation. Она
предусматривает специальные алгоритмы, позволяющие с достаточно высокой
вероятностью устанавливать зависимость последовательных команд сохранения и
загрузки данных, и даёт возможность, таким образом, применять внеочередное
выполнение инструкций к этим командам.
Таким образом, при условии правильной работы алгоритмов memory disambiguation
процессор получает возможность более эффективного использования собственных
исполнительных устройств. В случаях же ошибок в определении зависимых инструкций
загрузки и сохранения данных, которые, согласно информации разработчиков, случаются
достаточно редко, технология memory disambiguation детектирует возникший конфликт,
перезагружает корректные данные и инициирует повторное исполнение "ошибочно"
выполненной ветви кода.
Совместное использование предварительной выборки данных и технологии memory
disambiguation повышает эффективность работы процессора с памятью не только за счёт
минимизации возможных простоев исполнительных устройств, но и благодаря более
эффективному использованию пропускной способности шины и снижению латентностей
при обращениях к памяти.
Так как при разработке новой микроархитектуры Core инженеры стремились к
оптимизации параметра "производительность на ватт", а также из-за того, что данная
микроархитектура используется и в основе процессоров для ноутбуков, разработчики Intel
сразу предусмотрели набор технологий, направленных на снижение энергопотребления и
тепловыделения. Безусловно, процессоры получили в своё распоряжение хорошо
зарекомендовавшие себя технологии семейства Demand Based Switching (в первую
очередь, Enhanced Intel SpeedStep и Enhanced Halt State). Но речь в данном случае идёт не
о них.
Процессоры, основанные на микроархитектуре Core, получили возможность
интерактивного отключения тех собственных подсистем, которые не используются в
данный момент. Причём речь в данном случае идёт не о ядрах целиком. Декомпозиция
процессора на отдельные функциональные узлы выполнена на гораздо более низком
уровне. Каждое из процессорных ядер поделено на большое количество блоков и
внутренних
шин,
питание
которыми
управляется
раздельно
посредством
специализированных дополнительных логических схем. Главной особенностью этих схем,
входящих в Intel Intelligent Power Capability, является то, что их работа не влечёт за собой
увеличение времени отклика процессора на внешние воздействия, вызванное
необходимостью приводить отключенные блоки в функциональное состояние.
Следует отметить, что возможность деактивации различных блоков CPU во время
его работы заставило разработчиков пересмотреть подход к измерению температуры
процессора. Процессоры с микроархитектурой Core снабжаются несколькими
температурными датчиками, расположенными на ядре в тех местах, которые
предрасположены к сильному нагреву.
28
Для обработки показаний этих многочисленных датчиков процессор содержит
специальную схему, определяющую максимальную температуру. Именно эта температура
и рапортуется процессором пользователю и системам аппаратного мониторинга.
Каждая из этих технологий по отдельности способна значительным образом
повысить эффективность процессора, а все вместе они значительная сила для
установления новых стандартов производительности в сочетании с экономным
энергопотреблением.
Таким образом, новая микроархитектура Intel Core задействовала все плюсы, уже
реализованные в первых поколениях мобильных процессоров Intel Pentium M, взяла всё
самое лучшее из наработок архитектуры Intel NetBurst, и, в дополнение, обогатилась
самыми свежими инновационными идеями разработчиков.
Penryn построены на базе усовершенствованной микроархитектуры Intel Core.
Основным их отличием стал переход на 45-нм техпроцесс и некоторые архитектурные
новшества, вследствие чего повысилась энергоэффективность, расширился частотный
потенциал, увеличилось количество выполняемых команд за такт и прочее.
Усовершенствования, которые принес переход на новый техпроцесс, интересно
рассмотреть с позиций количественного сравнения. Например, четырехъядерные
процессоры Penryn включают около 820 млн. транзисторов, которые разместились на двух
кристаллах площадью 107 мм2. Для сравнения, современные четырехъядерные
процессоры Intel Kentsfield имеют 582 млн. транзисторов, при этом площади кристаллов
четырехъядерных процессоров, выпускающихся по 65-нм нормам, составляют 143 мм2.
Новшества, которые принесло следующее поколение процессоров, можно
рассматривать по отношению к пяти современным технологиям Intel: Wide Dynamic
Execution, Advanced Smart Cache, Smart Memory Access, Advanced Digital Media Boost,
Intelligent Power Capability.
Механизм Wide Dynamic Execution обеспечивает выполнение большего числа
команд за один тактовый цикл, что увеличивает производительность и помогает добиться
повышения энергоэффективности. В рамках этой технологии компания Intel представил
усовершенствованный более быстрый блок деления, основанный на базе методики radix16, а также улучшенную технологию виртуализации Enhanced Intel Virtualization
Technology. Инновационная архитектура на базе radix-16 позволяет существенно
уменьшить задержки при выполнении целочисленных операций деления, а также
операций деления с плавающей запятой.
Технология Advanced Smart Cache нацелена на обеспечение более высокой
производительности и эффективности кэш-памяти. В процессорах семейства Penryn
компания Intel решила увеличить объем кэша. Так, двухъядерные процессоры оснащаются
кэшем L2 емкостью до 6 Мб, а отдельные четырехъядерные модели обзавелись 12-Мб
кэш-памятью. Частотные характеристики преодолели планку 3 ГГц.
В рамках технологии Smart Memory Access говорится об увеличении пропускной
способности шины. Подтверждилась информация об освоении шины FSB 1600 МГц.
Шина FSB 1600 МГц появилась в некоторых моделях процессоров для серверов и рабочих
станций.
Технология Advanced Digital Media Boost применяется для ускорения обработки
видео, изображения и речевых потоков. Для повышения производительности при
обработке медиаданных Intel решила добавить к архитектуре ISA набор расширений SSE4
(Streaming SIMD Extensions 4), который стал доступным для большинства массовых
секторов рынка ПК с появлением 45-нм процессоров. Этот новый набор команд включает
множество инновационных инструкций (их насчитывается около 50), которые условно
можно разделить на две группы:
Примитивы векторизации для компиляторов и ускорители мультимедийных
приложений;
Ускорители обработки строк и текстовой информации.
29
Пожалуй, на SSE4 остановимся детальнее, поскольку технология является одним из
ключевых нововведений. Для начала опишем приложения, которые затронуло это
усовершенствование. Улучшения коснулись графики, кодирования и обработки видео,
создания трёхмерных изображений, игр, Web-серверов, серверов приложений. Как
утверждает Intel, увеличилась производительность приложений с высокой
интенсивностью вычислений – анализа хранилищ данных, СУБД, сложных алгоритмов
поиска и сопоставления, алгоритмов сжатия звука, видео, изображений и данных,
алгоритмов синтаксического анализа и анализа логических состояний, а также многих
других.
По словам Intel, SSE4 – самое масштабное и значительное расширение архитектуры
Intel ISA со времени появления SSE2. Набор команд SSE4 содержит несколько
примитивов векторизации для компиляторов, обеспечивающих дальнейшее увеличение
производительности и эффективности мультимедийных приложений. Имеются также и
новые инновационные инструкции для обработки строк.
Еще одним усовершенствованием является механизм перестановок – Super Shuffle
Engine. Новый блок умеет выполнять перестановки значений сразу во всем 128-разрядном
регистре за один такт. Это существенно повышает производительность при обработке
операций, связанных с перестановкой (упаковка, распаковка, сдвиг упакованных
значений, вставка). В среднем наблюдается двукратное увеличение производительности.
Интересные новшества касаются уменьшения уровня потребления мощности и
увеличения показателя «производительность на ватт». В связи с этим Intel представила
две новые технологии: Deep Power Down Technology и Enhanced Dynamic Acceleration
Technology.
Технология Deep Power Down Technology внедрена, в первую очередь, в процессоры
для мобильных платформ (Mobile Penryn). Для понижения энергопотребления в режиме
бездействия добавлено еще одно особое состояние процессора, именуемое как Deep Power
Down Technology State, или C6. В этом режиме предусмотрено отключение ядер, при этом
также полностью отключается кэш-память. Это позволяет существенно понизить
напряжение ядра и потребляемой мощности, что, в свою очередь, увеличивает время
работы батареи.
Интересным нововведением является технология Enhanced Dynamic Acceleration
Technology (EDAT). Её идея состоит в следующем. Для простоты возьмём случай с
двухъядерным процессором. Поскольку в однопоточных приложениях от многоядерности
толку мало, основную роль здесь играет производительность отдельно взятого ядра.
Поэтому Intel предусмотрела увеличение частоты работающего ядра (non-idle core), в то
время как второе (idle core) находится в одном из состояний бездействия (C3-C6) и его
тепловыделение резко сокращается. Эту разницу использует работающее ядро и повышает
свою частоту до достижения процессором граничного уровня TDP.
Теперь об уровне TDP 45-нм процессоров. Двухъядерные Penryn для настольных ПК
попадут в энергетический класс 65 Вт, а для их четырехъядерных родственников
предусмотрены тепловые пакеты 95 и 130 Вт. В серверном сегменте для двухъядерных
Intel Xeon уровни TDP составят 40, 65 и 80 Вт, а для четырехъядерных – 50, 80 и 120 Вт.
Для маркировки Penryn в качестве 4-й цифры индекса используется 8 и 9 (серии 8000
и 9000).
У МП Penryn используются новые технологии:
Deep Power Down, снижающая энергопотребление путем уменьшения токов утечки
транзисторов в моменты их простоя,
усовершенствованная Dynamic Acceleration Technology, повышающая производительность однопоточных приложений путем отключения простаивающих ядер и
повышения тактовой частоты работающего ядра
усовершенствованная Intel Virtualization Technology, уменьшающая время
переключения виртуальных машин.
30
МП семейства Penryn поддерживают расширенный набор команд Intel Streaming
SIMD Extension 4 (SSE4), а также кэш-память L2 большего объема:
двухъядерные до 6 Мбайт,
а четырехядерные до 12 Мбайт.
Согласно внутренним тестам Intel, в игровых приложениях наблюдается 20-ти
процентный прирост производительности новых чипов, а в операциях с декодированием
видео (при условии использования SSE4) – более 40% прирост. Если сравнивать
серверный процессор Penryn с частотой более 3 ГГц и Xeon X5355, 2,66 ГГц, FSB 1333
МГц, прирост в приложениях, интенсивно использующих операции с плавающей запятой
и чувствительных к пропускной способности, составляет около 45%.
После наладки массового производства чипов Penryn, Intel представил процессоры
Nehalem с новой одноименной микроархитектурой – на смену Intel Core. Примерно через
два-три года после анонса 45-нм процессоров – ориентировочно, ближе к 2009-2010, Intel
надеется представить новый, более прецизионный 32-нм техпроцесс. Пока эти планы
довольно туманны: даже переход на 45 нм сопровождался большими трудностями и
потребовал задействования совершенно новых материалов (high-k диэлектрики и
металлические затворы). В рамках 32 нм техпроцесса будут представлены процессоры с
рабочим названием Westmere, ранее известные как Nehalem-C, с той же
микроархитектурой Nehalem.
Через два года после появления Nehalem на смену придёт микроархитектура Gesher.
О ней пока очень мало сведений. Известно лишь, что первые процессоры Gesher будут
выпускаться по 32-нм техпроцессу. На этом прогнозы относительно развития процессоров
заканчиваются.
Примеры процессров с микроархитектурой
Intel Core
Core 2
Это потомок микроархитектуры Intel P6, на которой, начиная с процессора Pentium
Pro, построено большинство микропроцессоров Intel, исключая процессоры с
архитектурой NetBurst.
Введя новый бренд, от названий Pentium и Celeron Intel не отказалась, в 2007 году
переведя их также на микроархитектуру Core, и на данный момент доступны процессоры
Pentium Dual-Core (не путать с Pentium D) и Core Celeron (400-я серия). Но теперь
воссоединились мобильные и настольные серии продуктов (разделившиеся на Pentium M
и Pentium 4 в 2003 году).
Первые процессоры Core 2 официально представлены 27 июля 2006 года. Также как
и их предшедственники, процессоры Intel Core, они делятся на модели Solo
(одноядерные), Duo (двухъядерные), Quad (четырёхъядерные) и Extreme (двух- или
четырёхъядерные с повышенной частотой и разблокированным множителем). Процессоры
получили следующие кодовые названия — «Conroe» (двухъядерные процессоры для
настольного сегмента), «Merom» (для портативных ПК), «Kentsfield» (четырёхъядерный
Conroe) и «Penryn» (Merom, выполненный по 45 нанометровому техпроцессу). Хотя
процессоры «Woodcrest» также основаны на архитектуре Core, они выпускаются под
маркой Xeon.[1]. С декабря 2006 года все процессоры Core 2 Duo производятся на 300миллиметровых листах на заводе Fab 12 в Аризоне, США и на заводе Fab 24-2 в County
Kildare, Ирландия.
31
В отличие от процессоров архитектуры NetBurst (Pentium 4 и Pentium D), в
архитектуре Core 2 ставка делается не на повышение тактовой частоты, а на улучшение
других параметров процессоров, таких как кэш, эффективность и количество ядер.
Рассеиваемая мощность этих процессоров значительно ниже, чем у настольной линейки
Pentium. С параметром TDP, равным 65 Вт, процессор Core 2 имеет наименьшую
рассеиваемую мощность из всех доступных в продаже настольных чипов, в том числе на
ядрах Prescott (в системе кодовых имён Intel) с TDP, равным 130 Вт, и на ядрах San
Diego’s (в системе кодовых имён AMD) с TDP, равным 89 Вт.
Особенностями процессоров Intel Core 2 являются EM64T (поддержка архитектуры
EM64T), технология поддержки виртуальных x86 машин Vanderpool (en), NX-бит и набор
инструкций SSSE3. Кроме того, впервые реализованы следующие технологии: LaGrande
Technology, усовершенствованная технология, SpeedStep (EIST) и Active Management
Technology (iAMT2).
Процессорные ядра
Conroe
Intel Core 2 Duo E6600 «Conroe»
Первые процессорные ядра Intel Core 2 Duo с кодовыми именами Conroe и Allendale
были представлены 27 июля 2006 года. Эти процессоры созданы с использованием 65 нм
техпроцесса и предназначены для настольных систем, заменяя линейки Pentium 4 и
Pentium D. Intel заявляет, что Conroe обеспечивает на 40 % большую производительность
при меньшем на 40 % энергопотреблении по сравнению с Pentium D. Все Conroe
процессоры имеют 4 Мб L2-кэша, однако, у процессоров E6300 и E6400 половина L2кэша отключена, поэтому для использования им доступно только 2 Мб.
Младшие модели Conroe E6300 (1.86 ГГц) и E6400 (2.13 ГГц), традиционно имеют
урезанный кэш второго уровня (L2) и, зачастую, являются полноценными процессорами,
не прошедшими контроль качества для старших моделей. На время запуска Intel
установила стоимость для процессоров Core 2 Duo E6300 и E6400 соответственно $183
USD и $224 USD за штуку в партиях от 1000 штук. Процессоры Conroe отличаются
высоким разгонным потенциалом — процессор E6300 способен достичь тактовой частоты
в 3 ГГц при использовании хорошей материнской платы, поддерживающей высокие
частоты системной шины. Согласно обзорам, разница в производительности между 2 Мб
и 4 Мб кэша второго уровня составляет 0-9 % в основных приложениях, и 0-16 % в
играх.Нередко, пользователям удаётся достичь производительности топовых моделей
семейства. Однако, низкий множитель на младших процессорах требует наличия
материнской платы, поддерживающей высокие скорости системной шины.
Высокопроизводительные процессоры Conroe получили названия E6600 и E6700
Core 2 Duo, с тактовой частотой соответственно — 2,4 ГГц и 2,67 ГГц. Семейство имеет
частоту системной шины 1066 МГц, 4 MB общего L2-кэша, и 65-ваттный TDP. Сравнение
с топовыми процессорами AMD показывает, что процессоры от Intel показывают
значительно лучшую производительность.[4] Результаты разгонов показывают, что E6700
и E6600 стабильно работают на частоте 4 ГГц с воздушным охлаждением и 6.1 ГГц при
охлаждении жидким азотом, несмотря на заблокированный множитель.[5] Во многом
подобные результаты стали возможны благодаря настраиваемому множителю, который
может принимать значения от x6 до x9. Также, использование 65 нм техпроцесса
уменьшило тепловыделение процессоров, вследствие чего, стал возможен разгон и без
использования дорогих систем охлаждения. Однако, последние изменения над
процессором E6600 (считающийся самым популярным и приятным для разгона) могут
«свести на нет» эти преимущества — процессоры последней серии с маркировкой L640
(производятся в Малайзии с 1 января 2007 года по сей день) выделяют больше тепла, чем
модели из предыдущих партий. Поэтому, уже при частоте в 3.2 ГГц возникают трудности
с обеспечением стабильной работы системы.[5]
32
Процессоры E6320 (1,86 ГГц) и E6420 (2,13 ГГц) были выпущены 22 апреля 2007
года. Отличительной особенностью данных моделей является полноценный кэш L2,
размером в 4 Мб.
Conroe XE
Топовая линейка Core 2 Extreme была официально представлена 29 июля 2006 года.
Однако некоторые продавцы представили данный процессор ещё 13 июля, хотя и за
высокую цену. Менее мощные модели E6x00 Core 2 Duo были представлены
одновременно с моделью X6800, которая сейчас доступна в ограниченном количестве.
Она построена на ядре Conroe XE и заменила такие процессоры как Pentium 4 Extreme
Edition и двухъядерный Pentium Extreme Edition. Core 2 Extreme имеет тактовую частоту
2,93 ГГц и 1066 МГц FSB, хотя сначала ожидалось 3,33 ГГц и 1333 МГц, соответственно.
TDP этого семейства составляет 75—80 ватт. При максимальной нагрузке X6800 не
греется выше 45 °C, а с включённой технологией SpeedStep средняя температура в
простое составляет 25 °C.[6]
Также как и настольные Core 2 Duo, он имеет 4 Мб общего L2-кэша. Это значит,
что главное отличие от обычных Core 2 Duo —— тактовая частота и разблокированный
множитель, позволяющий симулировать любой E6x00 с 4 Мб L2-кэша. Это даёт ему
лучшие возможности для разгона с помощью поднятия множителя до 14X. Все
предыдущие Intel Extreme Editions имели уникальные особенности, такие как, повышенная
FSB, больше L2-кэша, или добавленный L3-кэш.
Тестирование в игровых и мультимедийных приложениях показывает, что X6800
имеет на 40 % выше производительность, чем ведущие процессоры от AMD. X6800 может
быть разогнан до 3.6 ГГц с обычным боксовым кулером без повышения напряжения, до
4,1 ГГц с хорошим воздушным кулером и повышением напряжения, и выше 5,5 ГГц с
помощью жидкого азота.[7]
Allendale
Intel Core 2 Duo E6300 «Allendale»
Allendale — это кодовое имя для процессоров Conroe с урезанным до 2 Мб L2-кэшем
и с 800 МГц FSB. Есть некоторые предположения считать новые процессоры E6300 и
E6400 относящимися к семейству Allendale, однако, Intel утверждает, что эти процессоры
продолжают называться «Conroe».
Подтверждение этого факта можно обнаружить в различных частотах FSB серий
E6000 (Conroe) и E4000 (Allendale) (4х266 МГц у E6000 и 4х200 МГц у E4000). Также
семейство E4000 лишилось технологии поддержки аппаратной виртуализации Intel VT.
Производимые сейчас Core 2 Duo E4300, выпущенные 21 января 2007 года,
несомненно основываются на ядре Allendale. Из-за уменьшения кэша второго уровня до 2
Мб появилась возможность производить больше процессоров на одной подложке.
Процессоры Allendale с ещё вдвое уменьшенным кэшем L2 вышли в середине мая под
маркой Pentium Dual-Core (часто называется Pentium E).
Merom
Merom — первая мобильная версия Core 2, выпущенная 27 июля 2006 года (хотя, без
привлечения всеобщего внимания Merom начал поступать к производителям ПК ещё в
середине июля вместе с Conroe
Merom — премьер-линейка мобильных процессоров Intel с преимущественно теми
же функциональными возможностями как у Conroe, но с большим вниманием к низкому
энергопотреблению, чтобы достичь более длительной работы ноутбука на одном заряде
аккумулятора. Intel заявил, что Merom обеспечит на 20 % бо́льшую производительность
при том же энергопотреблении, как у основанных на ядре Yonah процессорах Core Duo.
Merom — первый мобильный процессор Intel, расширенный до 64-битных инструкций
(EM64T).
Conroe-L
33
Intel предлагает дешевую одноядерную версию Conroe, с кодовым названием
«Conroe-L», начиная со второго квартала 2007, согласно статье на DailyTech. Новые
процессоры Conroe-L не будут придерживаться терминологии Core. Вместо этого Intel
планирует «оживить» бренды Pentium и Celeron для продуктов, основанных на Conroe-L
Conroe, Conroe XE и Allendale
Conroe, Conroe XE и Allendale используют сокет LGA775; однако не каждая
материнская плата совместима с этими процессорами. Поддерживаемые чипсеты — это
Intel: P31, P35, P45, 945P/PL/G, 965, 955X, 975X, P/G/Q965, Q963, 946GZ/PL (обратите
внимание, что 865PE поддерживает 800 MHz FSB QDR, тогда как процессор использует
1066 MHz FSB QDR); ATI Radeon Xpress 200, RD600 и RS600; NVidia nForce 4 SLI Intel
Edition и nForce 570/590 Intel Edition; VIA PT880/PT880 Ultra, PT890, PM880 и PM890.
Даже, если материнская плата основана на требуемом чипсете, она может не
поддерживать Conroe. Это происходит, потому что любые процессоры, основанные на
Conroe, требуют более новый модуль регуляции напряжения (VRM), VRM 11, так как по
сравнению с ЦПУ предыдущего поколения (Pentium 4/D) Conroe потребляет значительно
меньше энергии. Если плата имеет и поддерживаемый чипсет, и VRM 11, необходима
последняя версия BIOS для распознавания Conroe.
При приобретении комплектующих, в частности, материнских плат, необходимо
убедиться в совместимости её с Core Duo 2, возможность поддержки процессора может
отличаться даже в рамках одной модели плат (разная ревизия).
Penryn
Новая микроархитектура, являющаяся модернизированной архитектурой Intel Core,
кодовое имя Penryn, дебютировала, будучи первой архитектурой производимой по 45
нанометровому технологическому процессу изготовления, использующий металлические
затворы и диэлектрики High-k, который также будет использован в микроархитектуре
Nehalem. На основе новой микроархитектуры появятся такие дизайны ядер как Wolfdale и
Yorkfield. Сообщения о выходе Penryn появились в 2007 году.
Wolfdale
Core 2 Duo E8400 на ядре Wolfdale
Wolfdale — это преемник двухъядерного процессора Conroe, созданный по 45
нанометровому процессу и основанный на микроархитектуре Penryn. Процессоры Intel
Core 2 Duo серий Е7ххх и Е8ххх основаны именно на этом дизайне ядер. Процессоры
Pentium Dual-Core серий Е5ххх и Е6ххх построены на дизайне ядер Wolfdale-2М и имеют
2Мб L2 кеша.
Yorkfield
Yorkfield — это преемник четырёхъядерного Kentsfield. Создан по 45 нанометровому
процессу и так же как и Kentsfield, представляет по сути два размещенных в одном сокете
корпуса Wolfdale(45 нанометровый потомок Conroe). Yorkfield располагает 6 или 12 МБ
L2 разделённой кэш-памяти, по 3 или 6 МБ на каждую пару ядер соответственно.
Скорости шины (подключение к северному мосту) до 1333 МГц или более (1600 Мгц в
некоторых редакциях Extreme Edition), как и для большинства процессоров скорость
ограничена полосой пропускания шины на материнской плате. Процессоры Yorkfield
выпускаются под именами: Intel Core 2 Quad (Q9300, Q9450, Q9550, Q9650) и Intel Core 2
Extreme (QX9650, QX9770)
Nehalem
34
Новая процессорная микроархитектура созданная на основе микроархитектуры Intel
Core, но имеющая множество отличий от своего предшественника, такие как интерфейс
QuickPath Interconnect (QPI) или Direct Media Interface (DMI) в бюджетных решениях,
первый позволяет повысить пропускную способность до 25Гб/сек против 12,5Гб/сек у
Intel Core, поддержка модернизированной технологии Hyper-Threading, носящей название
Simulation Multi-Threading (SMT), позволяющая задействовать два потока на одно ядро,
интегрированный контроллер оперативной памяти стандарта DDR3 SDRAM или даже
полностью интегрированный северный мост набора системной логики в более поздних
решениях, поддержка технологии Turbo Boost, позволяющая повысить тактовую частоту
на пять пунктов множителя одного, наиболее загруженного ядра и т. д. Первые
процессоры основанные на этой микроархитектуре, имеющие дизайн ядер Bloomfield
вышли в открытую продажу 17 ноября 2008 года.
Bloomfield
Первый дизайн ядер на основе микроархитектуры нового поколения Nehalem. Так
как он является флагманским, в нём осуществлены все нововведения новой
микроархитектуры. Дизайн Bloomfield обладает четырьмя физическими ядрами и
находится на одной кремниевой подложке изготовленной с соблюдением норм 45-нм. Он
уступает дизайну Yorkfield по количеству транзисторов, 731 млн против 820 млн, но
несмотря на это у него больше площадь, 263 кв. мм против 214 кв. мм. Поддержка
технологии Simulation Multi-Threading обеспечивает до 8 потоков одновременно. Так же
особенностью дизайна можно назвать технологию Turbo Boost. Системная шина QuickPath
Interconnect использующаяся для связи с северным мостом имеет два стандарта 4.8ГТ/с и
6.4ГТ/с и пропускную способность 19 200Мбайт/с и 25 600Мбайт/с соответственно. В нём
используется впервые, за всю историю процессоростроения, поддержка трехканальной
оперативной памяти стандарта DDR3 SDRAM. Интеграция контроллера памяти —
переходное решение от традиционно отдельного северного моста до его полной
интеграции начиная с решения Lynnfield. Для него требуется разъем LGA1366 и набор
системной логики Intel X58. Процессоры под торговой маркой Intel Core i7 вышли в
продажу в конце 2008 года.
35
Lynnfield
Более экономичная и упрощенная версия дизайна Bloomfield, в которой удалены
такие характеристики, как трехканальный контроллер оперативной памяти, системная
шина QuickPath Interconnect и поддержка Simulation Multi-Threading в бюджетных
моделях. Вместо этого в процессор интегрирован двухканальный контроллер памяти с
поддержкой DDR3 1333МГц и системная шина Direct Media Interface, однако её
пропускная способность остается в пределах 2 ГБ/с, что очень мало по сравнению с 25
ГБ/с, которые обеспечивает шина QPI в случае использования Bloomfield. Но несмотря на
это, процессор не испытывает проблем с быстродействием, за счет интегрированных
контроллеров PCI Express 2.0 и оперативной памяти. Этот дизайн не имеет связи с
северным мостом, так как в наборе системной логики P55 Express фактически отсутствует
северный мост. Ведь северный мост представляет собой сочетание контроллеров
оперативной памяти, PCI Express 2.0 и интерфейса с процессором, но все это находится
непосредственно в самом дизайне ядер, а скорости 2 ГБ/с хватает для полноценной связи с
южным мостом. Благодаря интеграции северного моста в дизайн ядер уровень
производительности повышается, и старшие модели по производительности близки к
младшим моделям Bloomfield. Благодаря некоторым доработкам техпроцесса уровень
энергопотребления не будет превышать отметку 95 Вт. Этот дизайн также обладает
четырьмя ядрами на одной подложке, 8Мб общего кеша третьего уровня и поддержкой
SMT в дорогих моделях. Для него требуется разъем LGA1156. Первые продукты на основе
этого дизайна — Intel Core i5 750 с частотой 2667МГц, Intel Core i7 860 и 870 с частотами
2800МГц и 2933МГц соответственно, вышли в открытую продажу 8 сентября 2009 года.
Intel-проведет ребрендинг своих продуктов 18 июня
2009 г
В «Интел» отмечают, что сейчас для процессоров и аппаратных платформ компании
используется слишком много различных торговых марок, что сбивает с толку
потребителей и зачастую вызывает путаницу. Введение новой системы классификации
продуктов облегчит покупателям выбор нужных комплектующих или ПК, а также
позволит точнее разграничить аппаратные решения на классы.
Ключевым брендом «Интел» станет Core. На сегодня существует множество
вариантов этой торговой марки, вроде Core 2 Duo, Core 2 Quad и Core 2 Extreme. С
течением времени корпорация намерена отказаться от этих производных, заменив их
тремя основными брендами: Core i3, Core i5 и Core i7. Процессоры с маркировкой Core i3
будут относиться к начальному уровню, чипы Core i5 — к средней ценовой категории, а
решения Core i7 — к наиболее передовым продуктам.
Для чипов, ориентированных на недорогие компьютеры, «Интел» сохранит марку
Celeron, а для базовых решений — бренд Pentium. Кроме того, останется марка Atom, под
которой выпускаются процессоры для нетбуков и мобильных интернет-устройств.
Компьютеры для бизнес-применения будут маркироваться либо Core i7 vPro, либо
Core i5 vPro. А вот от бренда Centrino применительно к аппаратной платформе,
включающей центральный процессор и набор логики, собираются отказаться. Начиная с
2010 года марка Centrino будет использоваться для обозначения беспроводных решений
Wi-Fi и WiMAX.
Теперь исполнение платформы двухкорпусное – процессор плюс контроллер вводавывода. Процессоры Intel Core, основанные на микроархитектуре Nehalem, позволяют
создавать ноутбуки в корпусах тоньше 2,5 см с достаточной мощностью и длительным
временем автономной работы.
Новые Intel Core i7 и Core i5 используя технологии Intel TurboBoost и Intel HyperThreading, адаптируются к работе, управляя производительностью по запросам программ.
Intel Hyper-Threading позволяет каждому из ядер обрабатывать по два потока данных
36
одновременно. Это еще ощутимее увеличивает производительность при разумном
расходования энергии – компоненты процессора не потребляют электричества в моменты
простоя.
Судя по этим планам, Intel придерживается прежней стратегии смены
микроархитектур и перехода на новый техпроцесс каждые два года. Удастся ли лидеру
процессорной индустрии удерживать такие высокие темпы развития, сказать сложно. В
Intel такую стратегию выпуска продукции называет “tick-tock” (“тик-так”). Каждый “тик”
отражает новый этап развития полупроводниковых производственных технологий и
усовершенствования в области микроархитектуры (например, Penryn). Каждый “так”
соответствует созданию новой микроархитектуры (например, Nehalem)
Ядра
Cedar Mill,
Dempsey, Presler,
Yonah
Allendale,
Clovertown,
Conroe, Kentsfield,
Merom, Tigerton,
Woodcrest
Dunnington,
Harpertown, Penryn,
Wolfdale, Yorkfield
Beckton, Bloomfield,
Clarksfield, Gainestown,
Lynnfield
Arrandale, Clarkdale,
Gulftown
Процессоры
Intel Core,
Pentium 4,
Pentium D,
Xeon
Микроархитектура
Тех
процесс
Начало
выпуска
январь
2006
Intel P6,
NetBurst
65 нм
Intel Core 2,
Xeon
июль
2006
Микроархитектура Intel Core
(не путать с процессорами Intel
Core!)
январь
2008
Intel Core i5,
Intel Core i7,
Xeon
Intel Core i3,
Intel Core i5,
Intel Core i7,
Intel Core i9,
Xeon
45 нм
Intel Nehalem
ноябрь
2008
Westmere (усовершенствованная
Nehalem)
конец
2009 [3]
32 нм
Intel Sandy Bridge
Ivy Bridge (усовершенствованная
Sandy Bridge)
22 нм
Intel Haswell
начало
2011 [4]
2011
2012
Сейчас компания выпускает 32-нм процессоры (кодовое название чипов —
Westmere). Процессоры Intel Westmere поддерживают технологии Intel Turbo Boost и
Hyper-Threading, а также новый набор команд для ускоренного шифрования и
дешифровки посредством алгоритма Advanced Encryption Standard (AES). Технология Intel
Turbo Boost динамически повышает тактовую частоту процессора максимум на 75% от
базовой в случае необходимости, удовлетворяя потребности приложений и пользователей,
не представляя угрозы теплового разрушения устройства (перегрева). Технология HyperThreading позволяет видеть одно физическое ядро процессора как два логических и, таким
образом, выполнять большее число вычислительных процессов одновременно. Для реализации этой технологии необходимо, чтобы ее поддерживал не только процессор, но и
чипсет, и ОС. Наконец, процессоры Westmere впервые в продуктовой линейке Intel будут
обладать интегрированным графическим ядром, которое будет размещено на том же куске
кремния, что и вычислительные ядра центрального процессора.
После перехода на 32-нм технологию компания Intel представит новую
микроархитектуру — Sandy Bridge, следуя принципу развития "тик-так" (первый год —
новый техпроцесс, второй год — новая архитектура и так далее). Архитектура Sandy
37
Bridge также подразумевает размещение графического ядра на том же кристалле, что и
вычислительные ядра центрального процессора.
Предыдущее поколение, микроархитектура Westmere в исполнении Arrandale и
Clarkdale для мобильных и настольных систем, представляет собой конструкцию из
двух кристаллов - 32-нм процессорного ядра и дополнительного 45-нм
«сопроцессора» с графическим ядром и контроллером памяти на борту,
размещённых на единой подложке и производящих обмен данными посредством
шины QPI. По сути, на этом этапе инженеры Intel, используя преимущественно
предыдущие наработки, создали этакую интегрированную гибридную микросхему.
Микропроцессоры под кодовым названием Sandy Bridge будут основаны на
новой "умной" микроархитектуре, современной 32-нанометровой технологии
производства с использованием транзисторов с металлическим затвором и диэлектриков
Hi-K второго поколения. Новое семейство процессоров будет включать "кольцевую"
архитектуру, которая позволяет интегрировать графический контроллер и использовать
кэш команд и данных совместно с ядрами процессора, увеличивая скорость работы
графической подсистемы и системы в целом при сохранении эффективных значений
энергопотребления.
Процессоры Intel Core второго поколения также будут включать улучшенную
версию технологии Intel Turbo Boost. Она будет автоматически перераспределять
38
нагрузку на ядра процессора и графические ресурсы в зависимости от запущенных
приложений, мгновенно увеличивая производительность при необходимости.
Встроенный в процессоры Intel новый графический контроллер обеспечит
увеличенную производительность и новые возможности при просмотре HD-видео, в 3Dиграх, при одновременном запуске нескольких приложений в режиме многозадачности,
воспроизведении мультимедийных файлов и общении в социальных сетях. Процессоры
2011 года также будут поддерживать набор команд Advanced Vector Extensions (AVX),
который обеспечивает повышенную производительность и более широкую
функциональность, а также улучшенные возможности для управления данными, их
перемещения и сортировки. Новый 256-разрядный набор команд ускорит работу
приложений с интенсивной обработкой цифр с плавающей запятой, к которым относятся
приложения для редактирования фотографий, создания цифрового контента и другие.
Самыми быстрыми процессорами Sandy Bridge, выход которых намечен на начало
2011 года, станут Core i7-2600 и Core i5-2500. Их основные характеристики можно
увидеть в таблицах.
Мы заметим, что данные модели CPU получат самое производительное видеоядро
Intel HD Graphics 200 с частотой 850 МГц. При помощи технологии Turbo Boost GPU
могут разгоняться с 850 до 1350 МГц, количество исполнительных блоков у Intel HD
Graphics 200 равно 12.
Остальные процессоры обзаведутся более медленным видеочипом Intel HD Graphics
100. Его частота также равна 850 МГц, но разгон упирается в отметку 1100 МГц (1250
МГц у Core i5-2500T), а число исполнительных блоков уменьшено с 12 до 6.
Закончить нашу новость хотелось бы словами о суффиксах, которые фигурируют в
названиях моделей процессоров Sandy Bridge. Они придуманы для того, чтобы
пользователи имели представление о значении TDP той или иной модели, а также о её
разгонном потенциале. Итак, суффикс K говорит о том, что данный CPU имеет
незаблокированный множитель, S – TDP равен 65 Вт, T – TDP равен 35 или 45 Вт.
Будущие процессоры
Larrabee
39
Кодовое название Larrabee (Intel Larrabee) объединяет семейство находящихся в
стадии разработки сопроцессоров с упором на графических задачах. Для пользователей
компьютеров на базе данного решения результатом станут исключительные визуальные
эффекты, говорится в прессрелизе компании. Появление первого решения на базе Larrabee
запланировано на 2010 год. Первоначально Larrabee появится на отдельных графических
платах, но со временем архитектура будет интегрирована в центральный процессор
наряду с массой других технологий.
Чип создаётся как новое, ранее не встречавшееся решение, которое заменит собой
линейку графических процессоров Intel GMA. Чип Intel Larrabee проектируется как
сочетание центрального и графического процессоров, наподобие AMD Fusion.
Видеокарты, основанные на чипах Larrabee, будут конкурировать с решениями nVidia
GeForce и AMD Radeon (ранее ATI Radeon) от компаний nVidia и AMD соответственно.
Larrabee также будет конкурировать на рынках GPGPU и высокопроизводительных
вычислений.
Фактически, в отличие от большинства продуктов Intel, у Larrabee нет специального
назначения. Он будет фигурировать
 на рынке процессоров,
 на рынке GPGPU и даже
 на рынке дискретных графических акселераторов (это вызвано тем, что Intel
планирует снова занять устойчивою позицию на рынке видеокарт).
Процессор Intel Larrabee будет обладать тридцатью двумя х86 совместимыми
ядрами, что приведет к огромному увеличению площади кристалла. Ядра будут
действовать по прогрессивной схеме Multiple Instructions Multiple Data, хотя они были
созданы на основе устаревшей архитектуры Intel P5, которая применялась в процессорах
Intel Pentium. Intel Larrabee по производительности на уровне NVIDIA Fermi (GF100), у
которого 512 унифицированных суперскалярных процессоров. Процессор Larrabee будет
производиться с соблюдением норм 32-нм технологического процесса изготовления, но
несмотря на это его площадь будет около 600 мм², а энергопотребление — около 300 Вт
из-за большого количества блоков, наличие которых требует архитектура х86. Выход
продукта был намечен на середину 2010 года.
Intel планирует получить инженерные образцы Larrabee в конце 2008 года, а первые
продукты на базе этого чипа предположительно должны выйти в конце 2009 или начале
2010 года.
40
Download