Архитектура многокристального микропроцессора К10 и К10.5

Федеральное агентство связи

Бурятский филиал ГОУ ВПО «СибГУТИ»

Кафедра ИВТ

Курсовая работа

По дисциплине: Организация и архитектура ЭВМ

На тему: Архитектура многокристального МП К10 и К10.5

Специальность: 230100: ИВТ

Улан-Удэ

2011 г.

Введение

Построение ЭВМ на основе микропроцессорных БИС позволяет уменьшить стоимость микроЭВМ, сравнимых по своим параметрам с ранее созданными ЭВМ, в 103 - 104 раз, габаритным размерам - в (2-3)x104 раз, по мощности потребления - в 105 раз. Это означает, что без увеличения общих затрат микроэлектронная технология позволяет обществу произвести в сотни и тысячи раз больше ЭВМ, чем ранее.

Микропроцессор – функционально законченное устройство обработки информации, управляемое хранимой в памяти программой. Появление микропроцессоров (МП) стало возможным благодаря развитию интегральной электроники. Это позволило перейти от схем малой и средней степени интеграции к большим и сверхбольшим интегральным микросхемам (БИС и СБИС).

По логическим функциям и структуре МП напоминает упрощенный вариант процессора обычных ЭВМ. Конструктивно он представляет собой одну или несколько БИС или СБИС.

По конструктивному признаку МП можно разделить на однокристальные МП с фиксированной длиной (разрядностью) слова и определенной системой команд; многокристальные (секционные) МП с наращиваемой разрядностью слова и микропрограммным управлением (они состоят из двух БИС и более).

В последнее время появились однокристальные МП с микропрограммным управлением.

Архитектура многокристального МП с микропрограммным управлением позволяет достичь гибкости в его применении и сравнительно простыми средствами организовать параллельное выполнение отдельных машинных операций, что повышает производительность ЭВМ на таких МП.

В данной курсовой работе будут рассмотрены два поколения микропроцессорной архитектуры – К10 и К10.5

История создания

K10 — поколение архитектуры микропроцессоров x86 компании AMD. Процессоры этой архитектуры появились в продаже в конце 2007 года.

Первое упоминание о микроархитектуре следующего поколения появилось в 2003 году, на форуме Microprocessor Forum 2003. На форуме отмечалось, что в новую микроархитектуру будет положено многоядерность процессоров, которые будут работать на тактовых частотах до 10 ГГц. Позднее тактовые частоты были в несколько раз занижены. Первые официальные упоминания AMD о разработке четырёхъядерных процессорах появились в мае 2006-го в роадмапе, опубликованном на срок до 2009 года. Правда, тогда новая микроархитектура значилась под кодовым наименованием AMD K8L, и только в феврале 2007 года было утверждено окончательное наименование AMD K10. Процессоры, основанные на улучшенной архитектуре AMD K8, должны были стать первыми четырёхъядерными процессорами AMD, а также первыми процессорами на рынке, в котором все 4 ядра расположены на одном кристалле (ранее ходили слухи о появлении четырёхъядерного процессора AMD, представляющего собой два двухъядерных кристалла Opteron).

Серийный выпуск четырёхъядерных Phenom II X4 начался в январе 2009 года, трёхъядерных Phenom II X3 – в феврале 2009 года, двуядерных Phenom II X2 – в июне 2009 года, а шестиядерных Phenom II X2 – в апреле 2010 года.

Athlon II – замена Sempron – представляет собой Phenom II, лишённый одного из важнейших его достоинств – большой кэш-памяти третьего уровня (L3), общей для всех ядер. Выпускается в дву-, трёх- и четырёхъядерных вариантах. Athlon II X2 производится с июня 2009 года, X4 – c сентября 2009 года, а X3 – c ноября 2009 года.

В 2008 году осуществлен выпуск архитектуры К10.5, основанной на К10.

Описание К10

К10 представляет собой 65нм процессор SOI. Состоит из 450 млн. транзисторов и имеет площадь ядра: 283 кв.мм. Напряжение:1.05V-1.38V. Socket: AM2+(940 pin)/F(1207 pin)

Оригинальное ядро K10 имеет кодовое имя Barcelona (AMD), для сопроцессоров, предназначенных для серверов. Позже были выпущены процессоры для настольных компьютеров, там ядро K10 получило название Agena.

Все процессоры с ядром К10, попавшие на рынок в 2007 году, имеют степпинг В2 и ВА и содержат ошибку в контроллере памяти, из-за которой в определённых условиях микропроцессор может неправильно функционировать (так называемый «TLB bug»).

TLB bug

В связи с процессорами Agena и Barcelona (AMD) часто упоминается так называемая TLB bug или ошибка TLB. Данная ошибка встречается во всех четырёхъядерных процессорах AMD ревизии B2 и может привести в очень редких случаях к непредсказуемому поведению системы при высоких нагрузках. Данная ошибка критична в серверном сегменте, что явилось причиной приостановки всех поставок процессоров Barcelona (AMD) ревизии В2. Для настольных процессоров Phenom был предложен TLB patch который предотвращает возникновение ошибки путём отключения части логики TLB. Данный патч, хоть и спасает от TLB bug но также негативно влияет на производительность. Ошибка исправлена в ревизии B3.

TDP и ACP

С выходом процессоров Opteron 3G на ядре Barcelona (AMD) компания AMD ввела новую энергетическую характеристику под названием ACP (Average CPU Power) — средний уровень энергопотребления новых процессоров при нагрузке. AMD также продолжит указывать и максимальный уровень энергопотребления — TDP.

Обозначение

C появлением процессоров поколения К10 в ассортименте AMD изменились также их обозначения — под новыми обозначениями скрываются как модели, основанные на К10, так и на AMD K8

Система обозначений процессоров AMD

Серия процессоров

Обозначение

Phenom X4 quad-core (Agena)

X4 9xx0

Phenom X3 triple-core (Toliman)

X3 8xx0

Athlon dual-core (Kuma)

7xx0

Athlon single-core (Lima)

1xx0

Semporn single-core (Sparta)

1xx0

Описание К 10.5

Следующее за Barcelona ядро серверных процессоров имеет кодовое имя Shanghai и производиться по 45 нм нормам. Однако это не простой перенос архитектуры K10 на новый техпроцесс. Его архитектура называется K10.5 и имеет расширенный набор инструкций, обладает 6 Мб распределенного кэша L3 и поддержкой сокета 1207+Ядро Deneb (Shanghai) представляет собой 45нм процессор поколения К10.5. Состоит из ~758 млн транзисторов и имеет площадь в 243 мм (против 731 млн и 246 мм у Intel Nehalem). Отличается увеличенным кэшем L3 (с 2 МБ до 6 МБ), а также незначительными оптимизациями архитектуры.

Основная цель — повышение частот процессорной линейки Phenom, снижение TDP, а также себестоимости производства. По словам AMD, процессоры Deneb/Shanghai обходят равночастотные Agena/Barcelona на величину до 35 %, обладая энергопотреблением на 30% ниже. Анонс процессоров Opteron на ядре Shanghai состоялся 13 ноября 2008. Процессоры Deneb ожидались в 1ом квартале 2009. Первые процессоры на ядре Deneb выпущены AMD 8 января 2009 года под именем Phenom II X4 (модели 920 и 940 Black Edition).

Особенности архитектуры К10

    Основным отличием процессоров поколения K10 от своих предшественников на базе AMD K8 является объединение четырёх ядер на одном кристалле, обновления протокола Hyper-Transport до версии 3.0, общий для всех ядер кэш L3, а также перспективная поддержка контроллером памяти DDR3. Сами ядра также были модернизированы по сравнению с ядрами AMD K8.

    Чипы K10 могут выполнять 64-битные SSE-инструкции как одну. Именно поэтому увеличение разрядности SSE-блоков так важно и производительность должна вырасти довольно значительно.

    Увеличена разрядность интерфейса между SSE-блоками и кэшем данных первого уровня. Теперь за один такт стала возможной загрузка двух 128-битных инструкций за такт против двух 64-битных у K8.

    Связь между кэшем L2 и контроллером памяти также увеличила разрядность и теперь составляет 128 бит.

    Поддерживаются инструкции SSE4a, которые, помимо стандартного набора, включают: комбинированный набор инструкций (EXTRQ/INSERTQ) и векторные потоковые инструкции (MOVNTSD/MOVNTSS). 

    Архитектура K10 позволяет отслеживать гораздо больше переходов и ветвлений, за счет чего повышается точность предсказаний. А чем точнее предсказания переходов, тем более полно процессор способен загрузить работой свои исполнительные блоки.

    Также вдвое в сравнении с K8 увеличен размер стека возврата. У K8 при выполнении длинной цепочки запросов возможна ситуация, когда места для записи начального адреса в стеке возврата не хватает и тогда предсказания ветвлений становятся невозможными. Теперь вероятность этого значительно снизилась.

    Позволяет увеличить производительность и эффективность путём прямого соединения контроллера памяти и канала ввода/вывода с ядром.

    Разработана для одновременного выполнения как 32-битных, так и 64-битных вычислений.

    Интеграция контроллера памяти стандарта DDR2 (вплоть до режима 533 (1066) МГц, а также с перспективной поддержкой DDR3)

Особенности архитектуры К10.5

    Ширина шины памяти контроллера: 128 бит

    Поддержка шины Hyper Transport 3.0

    Частота системной шины: 1800 - 2600 МГц (эффективная 3600 - 5200 МГц)

    Поддержка технологии AMD64 Technology

    Поддержка 64-битных вычислений

    Поддержка технологий AMD Cool'n'Quiet 3.0, AMD CoolCore, Dual Dynamic Power Management

    Поддержка технологий EVP (Enhanced Virus Protection) и AMD Virtualization Techology

    Поддержка инструкций SSE, SSE2, SSE3, SSE4a, ABM, MMX, 3DNow!

    Максимальная температура: 62°С

    Рассеиваемая мощность (TDP) 125 Вт

Сравнение К10 и К10.5

Наиболее примечательной особенностью четырёхъядерных процессоров с микроархитектурой К10 является улучшенная схема управления питанием и тактовой частотой. Теперь каждое процессорное ядро вправе само "решать", на какой частоте ему работать, причём изменение происходит динамически и никак не влияет на частоту работы остальных ядер.

Иначе говоря, чем больше загружен процессор, тем больше ядер участвуют в работе. При этом нагрузка может быть распределена неравномерно, и каждое ядро, в зависимости от своей "участи", будет работать на собственной тактовой частоте, оптимальной с точки зрения производительности. Кроме того, часть ядер может быть попросту отключена, когда их участие в работе процессора не требуется.

Подобная технология была реализована и в более ранних процессорах AMD и Intel и также была призвана снизить среднюю потребляемую мощность. Однако для четырёхъядерных решений AMD проблема тепловыделения стала особенно актуальной, поскольку процессоры могли запросто рассеивать колоссальные 250 Вт тепла. Для сравнения, четырёхъядерные процессоры Intel ограничивались куда более скромным значением в 130 Вт.

Преимущества К10

Увеличение производительности приложений путём сокращения задержек при обращении к памяти.

Распределяет полосу пропускания памяти в зависимости от запросов.

Технология Hyper-Transport обеспечивает соединение на пиковой скорости до 16,0 ГБ/сек для предотвращения задержек.

До 33,1 ГБ/сек суммарной пропускной способности между процессором и системой (с учетом шины Hyper-Transport и контроллера памяти).

В процессорах архитектуры K8, а также Intel NetBurst (Pentium 4) процессор выгружает обработанные данные только после получения новых, что несколько снижает производительность. Часть исполнительных блоков процессора простаивает.

Архитектура K10 дает возможность загружать новые данные до выгрузки обработанных. Подобное отличие существует и между архитектурами NetBurst и Core, но реализация технологии у AMD и Intel разная. Если у Intel используется предсказатель, который предотвращает опережение загрузки данных над их выгрузкой из одной и той же ячейки памяти, то чипы AMD адрес выгрузки рассчитывают, что исключает возможность ошибки. Если подобная ошибка происходит, то данные будут потеряны и выполнение команды придется начинать сначала.

Реализация технологии внеочередной загрузки команд у K10 выглядит привлекательней.

Преимущества К10.5

Номинальная частота работы процессора, составляющая 3,7 ГГц, формируется по схеме: множитель 18,5 x шаг 200 МГц. На кристалле процессора располагаются четыре вычислительных ядра на базе архитектуры x86-64, каждое из которых оснащается индивидуальным кэшем 512 Кб, при этом размер общей для всех четырёх ядер кэш-памяти третьего уровня составляет 6 Мб. Платой за высокую частоту работы является весьма немалое энергопотребление процессора, составляющее 125 Вт. Интегрированный контроллер памяти поддерживает работу с памятью DDR2 и DDR3 в двухканальном режиме. Новый процессор AMD с Socket AM3 обратно совместим с процессорным разъёмом AM2+, что предполагает возможность его использования в материнских платах на базе сокета AM2+. Для связи с чипсетом используется шина HyperTransport с полосой пропускания 41.6 Гт/с.

Перспектива развития К10 и К10.5

В июле 2011 года будут выпущены первые гибриды процессоров, созданных по старой технологии К10 и К10.5 – Llano.

Процессоры Llano будут выпускаться по 32 нм технологии с применением материалов, имеющих высокое значение диэлектрической константы (high-k), а также транзисторов с металлическим затвором. Технология "напряжённого кремния" будет соседствовать с соединениями германия и кремния. При производстве процессоров будет задействована технология иммерсионной литографии второго поколения. Как мы уже сообщали, каждое из четырёх процессорных ядер Llano будет иметь площадь 9.69 кв.мм без учёта кэш-памяти второго уровня объёмом 1 Мб, на этой площади разместится более 35 млн. транзисторов.

Процессоры Llano смогут работать на частотах свыше 3 ГГц, уровень энергопотребления будет колебаться от 2.5 до 25 Вт, номинальное напряжение будет лежать в пределах от 0.8 до 1.3 В. Каждое процессорное ядро получит 1 Мб кэша второго уровня, архитектурно ядра Llano будут представлять собой усовершенствованные Phenom II. Встроенное графическое ядро поколения Evergreen с поддержкой DirectX 11 по своим возможностям будет соответствовать бюджетным решениям семейства Radeon HD 5xxx. Графическое и вычислительные ядра будут размещаться на одном кристалле. микропроцессор архитектура структура

Процессоры Llano будут потреблять очень мало энергии в состоянии покоя, чему будут способствовать продвинутые механизмы управления питанием, внедрённые на уровне процессорного ядра. Предполагается, что вслед за процессорами Thuban поддержку некоего аналога Turbo Boost получат и процессоры Llano. Технология будет позволять динамически повышать или понижать частоту каждого ядра пропорционально уровню нагрузки. Переход из одного энергетического состояния в другое потребует от процессоров Llano в два раза меньших затрат электрической энергии по сравнению с предшественниками.

Заключение

Сочетание превосходной производительности, высокой тактовой частоты, впечатляющей пропускной способности системной шины и надежная конструкция делают процессоры архитектуры К10, К10.5 наиболее оправданным выбором для настольных ПК высокого уровня, рабочих станций и серверов.

Основными принципами стали:

    Модульность;

    Масштабируемость;

    Мобильность;

    Доступность и открытость;

    Совместимость и эффективность.

За этим набором слов скрываются большие возможности (согласно планам компании) по построению систем, которые можно переконфигурировать для различных задач с целью достижения более высокой эффективности, возможность линейного увеличения производительности при решении однопоточных и многопоточных задач, применение энергоэффективных технологий для использования в мобильных системах, открытость для внедрения инновационных решений, обратная совместимость и возможность обновления, использование эффективных встроенных систем ввода-вывода.

Данная курсовая работа была подготовлена по материалам интернета.

Список использованной литературы

    http://ru.wikipedia.org/wiki/K10

    http://www.amd.com/ru/products/Pages/processors.aspx

    http://www.computerra.ru/print/338908

    http://www.mobimag.ru/Articles/2580/AMD_K10_arhitektura_markirovka_i_drugie_osobennosti_gryadushei_revolyucii.htm

    http://www.overclockers.ru/hardnews/27803.shtml

    http://www.ixbt.com/news/hard/index.shtml?08/92/09

    http://www.overclockers.ru/hardnews/36100/AMD_rasskazyvaet_o_gibridnyh_processorah_Llano.html

    http://www.upweek.ru/bulldozer-i-bobcat-novye-arxitektury-amd.html

    http://www.3dnews.ru/news/dati-vihoda-amd-bulldozer-i-llano-popali-v-set/