Процессор - это основной компонент компьютера, без него ничего работать не будет. С момента выпуска первого процессора эта технология развивается семимильными темпами. Менялись архитектуры и поколения процессоров AMD и Intel.

В одной из предыдущих статей мы рассматривали , в это статье мы рассмотрим поколения процессоров AMD, рассмотрим из чего все начиналось, и как совершенствовалось пока процессоры не стали такими, как они есть сейчас. Иногда очень интересно понять как развивалась технология.

Как вы уже знаете, изначально, компанией, которая выпускала процессоры для компьютера была Intel. Но правительству США не нравилось, что такая важная для оборонной промышленности и экономики страны деталь выпускается только одной компанией. С другой стороны, были и другие желающие выпускать процессоры.

Была основана компания AMD, Intel поделилась с ними всеми своими наработками и разрешила AMD использовать свою архитектуру для выпуска процессоров. Но продлилось это недолго, спустя несколько лет Intel перестала делиться новыми наработками и AMD пришлось улучшать свои процессоры самим. Под понятием архитектура мы будем подразумевать микроархитектуру, расположение транзисторов на печатной плате.

Первые архитектуры процессоров

Сначала кратко рассмотрим первые процессоры, выпускаемые компанией. Самым первым был AM980, он был полным восьмиразрядного процессора Intel 8080.

Следующим процессором был AMD 8086, клон Intel 8086, который выпускался по контракту с IBM, из-за которого Intel была вынуждена лицензировать эту архитектуру конкуренту. Процессор был 16-ти разрядным, имел частоту 10 МГц, а для его изготовления использовался техпроцесс 3000 нм.

Следующим процессором был клон Intel 80286- AMD AM286, по сравнению с устройством от Intel, он имел большую тактовую частоту, до 20 МГц. Техпроцесс уменьшился до 1500 нм.

Дальше был процессор AMD 80386, клон Intel 80386, Intel была против выпуска этой модели, но компании удалось выиграть иск в суде. Здесь тоже была поднята частота до 40 МГц, тогда как у Intel она была только 32 МГц. Техпроцесс - 1000 нм.

AM486 - последний процессор, выпущенный на основе наработок Intel. Частота процессора была поднята до 120 МГц. Дальше, из-за судебных разбирательств AMD больше не смогла использовать технологии Intel и им пришлось разрабатывать свои процессоры.

Пятое поколение - K5

AMD выпустила свой первый процессор в 1995 году. Он имел новую архитектуру, которая основывалась на ранее разработанной архитектуре RISC. Обычные инструкции перекодировались в микроинструкции, что помогло очень сильно поднять производительность. Но тут AMD не смогла обойти Intel. Процессор имел тактовую частоту 100 МГц, тогда как Intel Pentium уже работал на частоте 133 МГц. Для изготовления процессора использовался техпроцесс 350 нм.

Шестое поколение - K6

AMD не стала разрабатывать новую архитектуру, а решила приобрести компанию NextGen и использовать ее наработки Nx686. Хотя эта архитектура очень отличалась, здесь тоже использовалось преобразование инструкций в RISC, и она тоже не обошла Pentium II. Частота процессора была 350 МГц, потребляемая мощность - 28 Ватт, а техпроцесс 250 нм.

Архитектура K6 имела несколько улучшений в будущем, в K6 II было добавлено несколько наборов дополнительных инструкций, улучшивших производительность, а в K6 III добавлен кєш L2.

Седьмое поколение - K7

В 1999 году появилась новая микроархитектура процессоров AMD Athlon. Здесь была значительно увеличена тактовая частота, до 1 ГГц. Кэш второго уровня был вынесен на отдельный чип и имел размер 512 кб, кэш первого уровня - 64 Кб. Для изготовления использовался техпроцесс 250 нм.

Было выпущено еще несколько процессоров на архитектуре Athlon, в Thunderbird кэш второго уровня вернулся на основную интегральную схему, что позволило увеличить производительность, а техпроцесс был уменьшен до 150 нм.

В 2001 году были выпущены процессоры на основе архитектуры процессоров AMD Athlon Palomino c тактовой частотой 1733 МГц, кэшем L2 256 Мб и техпроцессом 180 нм. Потребляемая мощность достигала 72 Ватт.

Улучшение архитектуры продолжалось и в 2002 году компания выпустила на рынок процессоры Athlon Thoroughbred, которые использовали техпроцесс 130 нм и работали на тактовой частоте 2 ГГц. В следующем улучшении Barton была увеличена тактовая частота до 2,33 ГГц и увеличен в два раза размер кэша L2.

В 2003 году AMD выпустила архитектуру K7 Sempron, которая имела тактовую частоту 2 ГГц тоже с техпроцессом 130 нм, но уже дешевле.

Восьмое поколение - K8

Все предыдущие поколения процессоров были 32 битной разрядности и только архитектура K8 начала поддерживать технологию 64 бит. Архитектура притерпела много изменений, теперь процессоры теоретически могли работать с 1 Тб оперативной памяти, контроллер памяти переместили в процессор, что улучшило производительность по сравнению с K7. Также здесь была добавлена новая технология обмена данными HyperTransport.

Первые процессоры на архитектуре K8 были Sledgehammer и Clawhammer, они имели частоту 2,4-2,6 ГГц и тот же техпроцесс 130 нм. Потребляемая мощность - 89 Вт. Дальше, как и с архитектурой K7 компания выполняла медленное улучшение. В 2006 году были выпущены процессоры Winchester, Venice, San Diego, которые имели тактовую частоту до 2,6 ГГц и техпроцесс 90 нм.

В 2006 году вышли процессоры Orleans и Lima, которые имели тактовую частоту 2,8 ГГц, Последний уже имел два ядра и поддерживал память DDR2.

Наряду с линейкой Athlon, AMD выпустила линейку Semron в 2004 году. Эти процессоры имели меньшую частоту и размер кэша, но были дешевле. Поддерживалась частота до 2,3 ГГц и кэш второго уровня до 512 Кб.

В 2006 году продолжилось развитие линейки Athlon. Были выпущены первые двухъядерные процессоры Athlon X2: Manchester и Brisbane. Они имели тактовую частоту до 3,2 ГГц, техпроцесс 65 нм и потребляемую мощность 125 Вт. В том же году была представлена бюджетная линейка Turion, с тактовой частотой 2,4 ГГц.

Десятое поколение - K10

Следующей архитектурой от AMD была K10, она похожа на K8, но получила много усовершенствований, среди которых увеличение кэша, улучшение контроллера памяти, механизма IPC, а самое главное - это четырехъядерная архитектура.

Первой была линейка Phenom, эти процессоры использовались в качестве серверных, но они имели серьезную проблему, которая приводила к зависанию процессора. Позже AMD исправили ее программно, но это снизило производительность. Также были выпущены процессоры в линейках Athlon и Operon. Процессоры работали на частоте 2,6 ГГц, имели 512 кб кэша второго уровня, 2 Мб кэша третьего уровня и были изготовлены по техпроцессу 65 нм.

Следующим улучшением архитектуры была линейка Phenom II, в которой AMD выполнила переход техпроцесс на 45 нм, чем значительно снизила потребляемую мощность и расход тепла. Четырехъядерные процессоры Phenom II имели частоту до 3,7 ГГц, кэш третьего уровня до 6 Мб. Процессор Deneb уже поддерживал память DDR3. Затем были выпущены двухъядерные и трех ядерные процессоры Phenom II X2 и X3, которые не набрали большой популярности и работали на более низких частотах.

В 2009 году были выпущены бюджетные процессоры AMD Athlon II. Они имели тактовую частоту до 3.0 ГГц, но для уменьшения цены был вырезан кэш третьего уровня. В линейке был четырехъядерный процессор Propus и двухъядерный Regor. В том же году была обновлена линейка продуктов Semton. Они тоже не имели кэша L3 и работали на тактовой частоте 2,9 ГГц.

В 2010 были выпущены шести ядерный Thuban и четырехъядерный Zosma, которые могли работать с тактовой частотой 3,7 ГГц. Частота процессора могла меняться в зависимости от нагрузки.

Пятнадцатое поколение - AMD Bulldozer

В октябре 2011 года на замену K10 пришла новая архитектура - Bulldozer. Здесь компания пыталась использовать большое количество ядер и высокую тактовую частоту чтобы опередить Sandy Bridge от Intel. Первый чип Zambezi не смог даже превзойти Phenom II, уже не говоря про Intel.

Через год после выпуска Bulldozer, AMD выпустила улучшенную архитектуру, под кодовым именем Piledriver. Здесь была увеличена тактовая частота и производительность примерно на 15% без увеличения потребляемой мощности. Процессоры имели тактовую частоту до 4,1 ГГц, потребляли до 100 Вт и для их изготовления использовался техпроцесс 32 нм.

Затем была выпущена линейка процессоров FX на этой же архитектуре. Они имели тактовую частоту до 4,7 ГГц (5 ГГц при разгоне), были версии на четыре, шесть и восемь ядер, и потребляли до 125 Вт.

Следующее улучшение Bulldozer - Excavator, вышло в 2015 году. Здесь техпроцесс был уменьшен до 28 нм. Тактовая частота процессора составляет 3,5 ГГц, количество ядер - 4, а потребление энергии - 65 Вт.

Шестнадцатое поколение - Zen

Это новое поколение процессоров AMD. Архитектура Zen была разработана компанией с нуля. Процессоры выйдут в этом году, ожидается что весной. Для их изготовления будет использоваться техпроцесс 14 нм.

Процессоры будут поддерживать память DDR4 и выделять тепла 95 Ватт энергии. Процессоры будут иметь до 8 ядер, 16 потоков, работать с тактовой частотой 3,4 ГГц. Также была улучшена эффективность потребления энергии и была заявлена возможность автоматического разгона, когда процессор подстраивается в под возможности вашего охлаждения.

Выводы

В этой статье мы рассмотрели архитектуры процессоров AMD. Теперь вы знаете как они развивались процессоры от AMD и как обстоят дела на данный момент сейчас. Вы можете видеть что, некоторые поколения процессоров AMD пропущены, это мобильные процессоры, и мы их намерено исключили. Надеюсь, эта информация была полезной для вас.

С установленным на ней ядром процессора (во всех модификациях), а также микросхемами кеш-памяти BSRAM (во всех модификациях, кроме процессоров на ядре Thunderbird). Процессор предназначен для установки в 242-контактный щелевой разъём Slot A .

В процессорах, основанных на ядрах Argon, Pluto и Orion, кеш-память второго уровня работает на частоте от трети до половины частоты ядра , а в процессорах на ядре Thunderbird - на частоте ядра.

На процессорной плате также находится ножевой 40-контактный технологический разъём, закрытый картриджем. Разъём содержит контакты, отвечающие за установку напряжения питания и тактовой частоты. С помощью специального устройства, подключаемого к процессору, возможно изменение этих параметров.

Картридж состоит из двух частей: металлической теплоотводной пластины, контактирующей с кристаллом процессора и микросхемами кэш-памяти (в случае с процессорами, имеющими внешний кэш), а также пластикового кожуха, закрывающего процессорную плату и защищающего установленные на ней элементы от повреждений. Маркировка находится на верхней грани картриджа.

Процессоры Athlon в корпусе типа FCPGA предназначены для установки в системные платы с 462-контактным гнездовым разъёмом Socket A и представляют собой подложку из керамического материала с установленным на ней открытым кристаллом на лицевой стороне и контактами на обратной (453 контакта). Существовали также процессоры с органической подложкой, выпущенные ограниченной партией. На стороне ядра расположены SMD-элементы , а также контакты, задающие напряжение питания и тактовую частоту (обычно называемые мостиками). Контакты располагаются группами, которые имеют обозначения L1 - L7. Маркировка нанесена на кристалл процессора.

Изначально кристалл не был защищён от сколов, которые могли происходить в результате перекоса радиатора при его неправильной установке неквалифицированными пользователями, однако вскоре появилась защита от перекосов в виде четырёх круглых прокладок, расположенных в углах подложки. Несмотря на наличие прокладок, при неаккуратной установке радиатора неопытными пользователями кристалл всё же мог получать трещины и сколы (процессоры с такими повреждениями обычно назывались «ко́лотыми»). В ряде случаев процессор, получивший существенные повреждения кристалла (сколы до 2-3 мм с угла), продолжал работать без сбоев или с редкими сбоями, в то же время, процессор с незначительными сколами мог полностью выйти из строя. Простейший способ проверки процессора на наличие сколов кристалла заключался в проведении по граням кристалла ногтем. В случае наличия сколов палец явно ощущал шероховатость. При наличии лупы или микроскопа сколы определялись визуально. Однако соблюдение мер предосторожности при сборке или установка опытным сборщиком, вместо самостоятельной установки, исключали механические повреждения процессоров с открытым ядром, таких, как процессоры семейства AMD K7 или Intel Pentium III и Celeron с ядром Coppermine.

Модели

На выставке Comdex Fall, проходившей осенью 1997 года в Лас-Вегасе (США), компанией AMD было объявлено о разработке принципиально нового процессора под кодовым названием K7, который должен прийти на смену процессорам серии . В октябре 1998 года были выпущены первые инженерные образцы нового процессора.

Первые процессоры Athlon (ядро Argon) предназначались для настольных компьютеров и производились по 250-нм КМОП -технологии. На смену ядру Argon пришло 180-нм ядро Pluto. Модель, работавшая на частоте 1 ГГц , получила наименование Orion.

Следующим ядром, использованным в процессорах семейства Athlon, стало 180-нм ядро Thunderbird, получившее интегрированный кеш второго уровня . Дальнейшим развитием семейства десктопных процессоров Athlon стали процессоры Athlon XP , вышедшие в октябре 2001 года .

Процессоры Athlon на ядре Argon
Тактовая частота , МГц 500 550 600 650 700
Частота FSB, МГц 200
Анонсирован 23 июня 9 августа 1999 4 октября 1999
Цена, долл. 324 479 699 849 849
Процессоры Athlon на ядрах Pluto и Orion
Тактовая частота, МГц 550 600 650 700 750 800 850 900 950 1000
Частота FSB, МГц 200
Анонсирован 29 ноября 6 января 11 февраля 2000 6 марта 2000
Цена, долл. - - - - 799 - 849 899 999 1299
Процессоры Athlon на ядре Thunderbird
Тактовая частота, МГц 700 750 800 850 900 950 1000 1100 1200 1000 1133 1200 1333 1300 1400 1400
Частота FSB, МГц 200 266 200 266
Анонсирован 5 июня 28 августа 2000 17 октября 2000 30 октября 2000 22 марта 6 июня 2001
Цена, долл. - - - - - - 853 612 - - - 350 318 253

Argon (Model 1)

Первое ядро, использованное в процессорах Athlon, имеет принципиально новую архитектуру по сравнению с предыдущими процессорами компании AMD.

Ключевыми особенностями процессоров архитектуры К7 являются:

  • Новый блок целочисленных вычислений (ALU), содержащий три конвейера глубиной 10 стадий. Это позволяет процессору выполнять до трёх инструкций за такт.
  • Новый блок вещественночисленных вычислений (FPU), содержащий три конвейера глубиной 15 стадий. В предыдущих процессорах компании AMD блок FPU не был конвейерным и не мог начать выполнять новую команду, пока не закончится выполнение предыдущей, что приводило к сильному падению производительности.
  • Системная шина EV6 , лицензированная у компании DEC , обеспечивающая передачу данных по обоим фронтам тактового сигнала. Это позволило при физической частоте 100 МГц получить эффективную частоту 200 МГц, что соответствует пропускной способности 1,6 Гб/с. Кроме того, шина EV6 использует протокол точка-точка, что позволяет организовать более эффективную многопроцессорную систему.
  • Кеш-память первого уровня объёмом 128 Кбайт (64 Кбайт кеш инструкций и 64 Кбайт кеш данных).
  • Расширенный набор инструкций Extended 3DNow! .

Положение на рынке и сравнение с конкурентами

Athlon являлся флагманским процессором компании AMD для настольных компьютеров с момента выхода в июне 1999 года и до появления на рынке процессора Athlon XP в октябре 2001 года . Параллельно с Athlon существовали следующие x86 -процессоры:

  • Intel Pentium III (Katmai). Конкурировал с процессорами Athlon на ядрах Argon, Pluto и Orion. Во многих задачах уступал процессору Athlon, в некоторых - опережал за счёт наличия поддержки расширений SSE .
  • Intel Pentium III (Coppermine). Конкурировал с процессорами Athlon на ядрах Pluto, Orion и Thunderbird. В некоторых задачах уступал процессорам Athlon за счёт архитектурных преимуществ процессоров семейства К7, в некоторых - опережал их за счёт наличия поддержки расширений SSE и за счёт быстрой 256-битной шины кэш-памяти (против 64-битной у Athlon)
  • Intel Pentium 4 . Серьёзно уступал всем конкурентам на равных частотах, однако за счёт архитектуры NetBurst имел значительно более высокий частотный потенциал, что позволяло их опережать в оптимизированных под эту архитектуру приложениях. При некотором преимуществе в тактовой частоте процессоры Pentium 4, выпущенные одновременно с процессорами Athlon, на большинстве приложений уступали конкуренту, но в некоторых задачах были быстрее за счёт поддержки расширений SSE и SSE2 .
  • Intel Celeron (Coppermine-128). Предназначался для рынка недорогих настольных компьютеров. Уступал как процессорам Athlon, так и конкуренту - AMD Duron - в основном за счёт использования медленной системной шины (66 / 100 МГц против 200 / 266 МГц у AMD Athlon и Duron). Уменьшенный до 128 Кбайт кэш второго уровня также не позволял процессорам Celeron приблизиться к конкурентам.
  • AMD Duron . Предназначался для рынка недорогих настольных компьютеров. Уступал процессорам Athlon за счёт меньшего объёма кэша второго уровня, а впоследствии и за счёт менее быстрой системной шины, чем у процессоров Athlon.
  • VIA C3 . Предназначался для компьютеров с низким энергопотреблением, имел крайне низкую производительность и уступал всем конкурирующим процессорам.
  • Transmeta Crusoe . Предназначался для использования в портативных компьютерах. Имел очень низкое энергопотребление, по производительности отставал от равночастотного Athlon.

«Битва за гигагерц»

Технические характеристики

Argon Pluto Orion Thunderbird
Десктопный
Тактовая частота
Частота ядра, МГц 500-700 550-950 1000 650-1000 650-1400
Частота FSB , МГц 200 200-266
Характеристики ядра
Набор инструкций IA-32 , MMX , 3DNow! , Extended 3DNow!
Разрядность регистров 32 бит (целочисленные),
80 бит (вещественночисленные),
64 бит (MMX)
Глубина конвейера Целочисленный: 10 стадий, вещественночисленный: 15 стадий
Разрядность ША 43 бит [ ]
Разрядность ШД 64 бит + 8 бит ECC
Количество транзисторов , млн 22 37
Кеш
Кэш данных 64 Кбайт, 2-канальный наборно-ассоциативный, длина строки - 64 байта, двухпортовый
Кэш инструкций 64 Кбайт, 2-канальный наборно-ассоциативный, длина строки - 64 байта
Кеш
Объём, Кбайт 512 256
Частота 1/2 частоты ядра (модели до 700 МГц)
1/2,5 частоты ядра (модели 750-850 МГц)
1/3 частоты ядра (модели от 900 МГц)
частота ядра
Разрядность BSB 64 бит + 8 бит ECC
Организация Объединённый, наборно-ассоциативный; длина строки - 64 байта Объединённый, наборно-ассоциативный, эксклюзивный; длина строки - 64 байта
Ассоциативность 2-канальный 16-канальный
Интерфейс
Разъём Slot A Socket A
Корпус SECC керамический FCPGA , OPGA
Шина EV6 (DDR)
Технологические, электрические и тепловые характеристики
Технология производства 250 нм КМОП 180 нм КМОП (шестислойный, алюминиевые соединения) КМОП (шестислойный, алюминиевые или медные соединения )
Площадь кристалла, мм² 184 102 120
Напряжение ядра, В 1,6 1,6-1,8 1,8 1,7-1,75
Напряжение кэша L2, В 2,5-3,3 напряжение ядра
Напряжение цепей I/O , В 1,6
Максимальное тепловыделение, Вт 50 62 65 54 72

Наименование моделей

Маркировка процессоров Athlon состоит из трёх строк. Первая строка является наименованием модели, вторая содержит информацию о ревизии ядра процессора и дате его выпуска, третья - информацию о партии процессоров.

Ниже представлена расшифровка строки наименования модели процессоров Athlon с различными ядрами.

Argon (AMD-K7xxx MTR51B):

  • AMD-K7 - процессор AMD K7.
  • xxx - тактовая частота , МГц .
  • M - тип корпуса (картридж).
  • T - напряжение питания (1,6 ).
  • 5 - объём кэш-памяти второго уровня (512 Кбайт).
  • 1 - частота кэш-памяти второго уровня (1/2 частоты ядра).

Pluto, Orion (AMD-K7xxx My R5z B):

  • AMD-K7 - процессор AMD K7.
  • xxx - тактовая частота, МГц.
  • M - тип корпуса (картридж).
  • y - напряжение питания (T: 1,6 В; P: 1,7 В; N: 1,8 В).
  • R - максимальная температура корпуса (70 °C).
  • 5 - объём кэш-памяти второго уровня (512 Кбайт).
  • z - частота кэш-памяти второго уровня (1: 1/2 частоты ядра; 2: 1/2,5 частоты ядра; 3: 1/3 частоты ядра;).
  • B - частота системной шины (200 МГц).

Thunderbird для Slot A (AMD-Axxxx My R24B):

  • AMD-A - процессор AMD Athlon.
  • xxxx - тактовая частота, МГц.
  • M - тип корпуса (картридж).
  • y - напряжение питания (M: 1,75 В; N: 1,8 В; P: 1,7 В; T: 1,6 В).
  • R - максимальная температура корпуса (70 °C).
  • 2 - объём кэш-памяти второго уровня (256 Кбайт).
  • 4 - частота кэш-памяти второго уровня (равна частоте ядра).
  • B - частота системной шины (200 МГц).

Thunderbird для Socket A (Axxxxgyz 3v ):

  • A - процессор AMD Athlon.
  • xxxx - тактовая частота, МГц.
  • g - тип корпуса (A: керамический PGA, D: органический PGA).
  • y - напряжение питания (H: 1,55 В; U: 1,6 В; K: 1,65 В; P: 1,70 В; M: 1,75 В).
  • z - максимальная температура корпуса (T: 90 °C; S: 90 °C).
  • 3 - объём кэш-памяти второго уровня (256 Кбайт).
  • v - частота системной шины (B: 200 МГц; C: 266 МГц).

Ревизии ядер процессоров

Argon Pluto, Orion Thunderbird

Ревизия CPU Id Примечание
A4 0x642h модели AMD-A1000MMR24B A, AMD-A0950MMR24B A, AMD-A0900MMR24B A, AMD-A0850MPR24B A, AMD-A0800MPR24B A, AMD-A0750MPR24B A, AMD-A0700MPR24B A, AMD-A0650MPR24B A (

С появлением микроархитектуры Zen стратегия AMD на процессорном рынке стала базироваться на очень простом принципе: компания старается обеспечивать лучшие характеристики (в первую очередь по числу ядер и поддерживаемых потоков) по более выгодной цене. Семейства Ryzen 7, Ryzen 5 и Ryzen 3 при таком подходе оказались более дешёвыми альтернативами для Core i7, i5 и i3, и именно это во многом обеспечивает их популярность у покупателей. Но несмотря на то, что цена - это один из самых важных аргументов в продвижении процессоров AMD, совсем дешёвых Socket AM4-процессоров в ассортименте у этого производителя до недавних пор не существовало. Для тех покупателей, которые не располагали как минимум 100-долларовым бюджетом, выделенным на покупку CPU, AMD могла лишь предложить старые процессоры для Socket FM2+ семейств и либо ещё более старые процессоры AMD FX класса Piledriver. Но привлекательность таких предложений в современных условиях вызывает обоснованные сомнения, и это стало заметной проблемой.

Данная проблема дополнительно усугубилась тем, что компания Intel с внедрением дизайна Kaby Lake начала выпускать очень привлекательные процессоры начального уровня - двухъядерные . Такие недорогие четырёхпоточные CPU быстро завоевали признание и стали очень популярным вариантом для бюджетных конфигураций.

Тем не менее оставлять Pentium c Hyper-Threading совсем без конкуренции в начальном рыночном сегменте AMD всё же не стала. Спустя примерно полгода после их появления в продаже «красный чипмейкер» принял решение создать свою альтернативу «гиперпням» и пустить для этого в дело имевшиеся в его распоряжении четырёхъядерные чипы Bristol Ridge. Такие процессоры поставлялись AMD по OEM-каналам примерно с середины прошлого года, но летом было объявлено, что теперь для исправления ситуации в нижнем ценовом сегменте Bristol Ridge станут доступны и для розничных покупателей.

Вообще, семейство Bristol Ridge в первую очередь включает в себя гибридные процессоры A-серии с интегрированным графическим ядром Radeon (поколения Volcanic Islands). Однако для конкуренции с Pentium были спроектированы специальные модели с отключённой графикой - такие процессоры AMD отнесла к отдельному модельному ряду Athlon X4. В результате покупатели бюджетных систем с дискретными видеокартами получили выбор между двухъядерными Kaby Lake с Hyper-Threading и четырёхъядерными процессорами Bristol Ridge, которые базируются на микроархитектуре Excavator. Какой вариант лучше - мы и решили выяснить в нашем очередном материале.

Для проведения тестирования нам пришлось взять модель Athlon X4 950. Несмотря на то, что в серии Bristol Ridge компания AMD запланировала три модификации процессоров без интегрированной графики, в продаже реально доступна только эта, средняя модель. Тем не менее благодаря наличию даже одного такого процессора экосистема Socket AM4 приобрела необходимую полноту. Сегодня для этой платформы можно приобрести процессор с ценой от $51 до $499, и доступный Athlon X4 950 может стать отличным вариантом начального уровня, который со временем можно будет заметить одним из существующих Ryzen серии Summit Ridge или даже перспективным Ryzen серии Pinnacle Ridge.

⇡ Athlon X4 для Socket AM4: что нового

В теории всё выглядит достаточно неплохо. Новая версия Athlon X4 представляет собой производную от наиболее современных APU компании AMD, относящихся к поколению Bristol Ridge. Такие APU пришли на рынок мобильных решений ещё в 2016 году, а в этом году семейство расширилось за счёт чипов для настольных систем. Конструктивно Bristol Ridge можно охарактеризовать как перенос в современную экосистему. В процессе этого переноса в APU сохранились вычислительные ядра Excavator и графическое ядро класса Volcanic Islands (дискретный аналог архитектуры R9 Fury с меньшим количеством потоковых процессоров), но добавился более новый контроллер памяти, поддерживающий DDR4 SDRAM. Кроме того, архитектурно Bristol Ridge больше напоминают системы-на-чипе (SoC), что позволило вписать их в экосистему Socket AM4.

Интересующие нас представители серии Athlon X4, как и раньше, интегрированной графики лишены. Графический процессор, естественно, присутствует на полупроводниковом кристалле, но он аппаратно заблокирован, что позволяет AMD задействовать при производстве Athlon X4 кремниевую отбраковку, которая не смогла попасть в полноценные гибридные процессоры A-серии. В результате Athlon X4 представляют собой недорогие четырёхъядерники для платформы Socket AM4, которые кардинально отличаются от схожих по количеству ядер чипов Ryzen 3 своей базовой микроархитектурой. Процессорные ядра в Bristol Ridge были спроектированы в эпоху, предшествовавшую появлению архитектуры Zen, а значит, Athlon X4 для Socket AM4, как и их Socket FM2+-собратья, относятся к прямым потомкам Bulldozer.

Если конкретнее, то лежащие в основе актуального поколения APU вычислительные ядра Excavator представляют собой эволюционное развитие ядер Steamroller, которые, в свою очередь, появились в результате оптимизации Piledriver. Как говорит сама AMD, по показателю IPC (по числу выполняемых за такт инструкций) Excavator превосходит предшествующее ядро Steamroller примерно на 5-15 процентов. Прогресс достигается за счёт увеличения объёма кеш-памяти данных первого уровня до 32 Кбайт на ядро , а также благодаря полуторакратному расширению буфера адресов ветвлений, что улучшает результативность работы алгоритмов предсказания переходов. Кроме того, в Excavator добавлена поддержка 256-битных векторных инструкций из набора AVX2.

Однако не стоит переоценивать все такие дополнения, ведь они сделаны на откровенно устаревшем фундаменте. Ждать каких-то чудес производительности от Excavator явно не следует, и хорошей иллюстрацией слабости данной микроархитектуры может послужить тот факт, что во время представления первых процессоров серии Ryzen представители AMD говорили о 52-процентном превосходстве Zen над Excavator по показателю IPC. То есть при прочих равных четырёхъядерные Ryzen 3 способны обеспечить как минимум в полтора раза более высокую производительность, чем современные Athlon X4. А это значит, что между Athlon X4 для Socket AM4-систем и «полноценными» процессорами Ryzen существует колоссальный разрыв хотя бы с точки зрения эффективности базовой микроархитектуры. И этим дело не ограничивается. В бюджетных CPU компания AMD заложила ещё несколько дополнительных «ухудшений».

Одна из основных потерь, которую понёс современный Athlon X4, касается системы кеширования. В отличие от представителей серий FX или Ryzen, в процессорах этого семейства вообще нет кеш-памяти третьего уровня. Кроме того, в ядрах Excavator сократился и объём L2-кеша. Раньше в CPU такого класса на каждый двухъядерный модуль Bulldozer приходился кеш второго уровня объёмом по 2 Мбайт. Теперь он стал вдвое меньше, и четырёхъядерные Athlon X4 для Socket AM4 располагают лишь небольшим L2-кешем ёмкостью 2 Мбайт суммарно.

Серьёзные претензии вызывает и встроенный в Bristol Ridge двухканальный контроллер памяти. AMD реализовала в этих процессорах поддержку DDR4, но она совсем не такая, как в Ryzen. Bristol Ridge проектировался заметно раньше, и контроллер памяти в нём оказался намного хуже. В частности, максимальная частота поддерживаемой памяти ограничена режимом DDR4-2400, причём более высокие скорости недоступны и через разгон - для них банально не предусмотрены делители. Не впечатляет и эффективность этого контроллера. Bristol Ridge ощутимо проигрывает Ryzen в латентности подсистемы памяти и катастрофически уступает в реальной пропускной способности. Таким образом, переход на использование DDR4 производительность представителей семейства Athlon X4 только ухудшил.

Athlon X4 950 Ryzen 3 1200

Что касается встроенных в процессор элементов SoC, то и они у новых Athlon X4 тоже сильно отличаются от того, что предлагает AMD в процессорах семейства Ryzen. Самая серьёзная потеря затронула шину для взаимодействия с дискретными графическими ускорителями: для этой цели Athlon X4 предлагает лишь восемь линий PCI Express 3.0. То есть видеокарты в Socket AM4-платформах, построенных на базе таких бюджетных процессоров, будут работать «не в полную силу».

В дополнение к урезанной графической шине процессорная SoC в Bristol Ridge поддерживает две дополнительные линии PCI Express 3.0, которые могут быть конвертированы в два порта SATA, а также четыре порта USB 3.0. Расширить этот набор можно за счёт подключения внешнего южного моста, для соединения с которым в процессоре зарезервировано ещё четыре линии PCI Express 3.0. Поскольку способ взаимодействия с набором системной логики у Athlon X4 точно такой же, как и у Ryzen, процессоры поколения Bristol Ridge полностью совместимы с любыми Socket AM4-материнскими платами, включая модели, построенные на чипсетах A320, B350 и даже X370.

Скудные характеристики Athlon X4 объясняются его происхождением. Изначально дизайн Bristol Ridge был нацелен на применение в мобильных системах, поэтому многое из того, в чём нет острой необходимости в ноутбуках, пошло под нож ради оптимизации энергопотребления. И в этом есть некоторая положительная сторона: энергосберегающие технологии в Bristol Ridge сделали большой шаг вперёд, позволяя соблюдать тонкий баланс между производительностью и энергопотреблением.

Но самое важное заключается в том, что, несмотря на использование при производстве Bristol Ridge полупроводниковой технологии с разрешением 28 нм, данный процессорный дизайн получился вполне энергоэффективным. В частности, все представители десктопного семейства Bristol Ridge вписываются в 65-ваттный тепловой пакет, в том числе даже модели с графическим ядром и рабочими частотами порядка 4 ГГц. Достигается это во многом благодаря тому, что производственный партнёр AMD, компания TSMC, внедрил специальную «высокоплотную» разновидность 28-нм техпроцесса, похожую на технологию, которая применяется при выпуске GPU. В результате современные Athlon X4 смогли получить не только сравнительно невысокое тепловыделение и энергопотребление, но и конфигурируемый TDP. Номинальный тепловой пакет этих процессоров, как и у полноценных APU, установлен на уровне 65 Вт, но в случае необходимости его рамки могут быть ужесточены до 35 Вт.

⇡ Athlon X4 950 в подробностях

Когда AMD объявляла о начале розничных продаж десктопных процессоров семейства Bristol Ridge, она говорила о модельном ряде, состоящем из восьми APU A-серии и трёх процессоров Athlon X4 без встроенной графики. Новые модификации Athlon X4 должны были получить модельные номера 940, 950 и 970 и, согласно спецификации, различались бы тактовыми частотами, установленными на уровне 3,2, 3,5 и 3,8 ГГц соответственно. Однако впоследствии AMD решила отказаться от розничной реализации бюджетных Socket AM4-процессоров «широким фронтом» и ограничилась поставками лишь единичной четырёхъядерной модели Athlon X4 950.

Стоит напомнить, что в экосистеме Socket FM2+ модельный ряд процессоров Athlon X4 был весьма представителен. Он формировался из многочисленных четырёхъядерных чипов Kaveri с частотами от 3,0 до 4,0 ГГц и впоследствии получил дополнение в виде Carrizo с частотой 3,5 ГГц. При переносе Athlon X4 в более актуальную платформу Socket AM4 от былого изобилия не осталось и следа. Причём единственный Athlon X4 для Socket AM4 - это ещё и сильно «зарезанный» по характеристикам процессор. Если пытаться провести параллели между Athlon X4 950 и предшественниками для Socket FM2+, то наиболее близкой по характеристикам моделью окажется Athlon X4 845, в то время как популярные Athlon X4 860K (и более быстрые модели) родом из 2015 года новинку заметно превосходят.

Зато это позволило компании AMD установить на Athlon X4 950 очень привлекательную цену. Его официальная стоимость составляет $51, что делает данный процессор самым доступным четырёхъядерником, который вдвое дешевле младшего представителя в серии Ryzen 3. Благодаря такому предложению AMD надеется привлечь на свою сторону покупателей бюджетных систем, которые до настоящего момента ориентировались на Intel Pentium поколения Kaby Lake с поддержкой Hyper-Threading.

При этом характеристики Athlon X4 950 на фоне прочих дешёвых процессоров с возможностью исполнения четырёх потоков выглядят достаточно многообещающе:

AMD Athlon X4 950 AMD Ryzen 3 1200 Intel Pentium G4560
Кодовое имя Bristol Ridge Summit Ridge Kaby Lake
Технология производства, нм 28 14 14+
Ядра/потоки 4/4 4/4 2/4
Базовая частота, ГГц 3,5 3,1 3,5
Частота в турборежиме, ГГц 3,8 3,4 -
Технология XFR Нет +50 МГц Нет
Разгон Поддерживается Поддерживается Не поддерживается
L2-кеш 2 × 1 Мбайт 4 × 512 Кбайт 2 × 256 Кбайт
L3-кеш Нет 2 × 4 Мбайт 3 Мбайт
Поддержка памяти DDR4-2400 DDR4-2666 DDR4-2400
Линии PCI Express 3.0 для GPU 8 16 16
TDP, Вт 65 65 54
Разъём Socket AM4 Socket AM4 LGA1151 v1
Официальная цена $51 $109 $64

Основная проблема Athlon X4 950 - устаревшая микроархитектура с низкой удельной производительностью, в остальном же никаких очевидных изъянов в приведённом списке спецификаций не видно.

В диагностической программе CPU-Z характеристики Athlon X4 950 выглядят следующим образом.

Реальные рабочие частоты Athlon X4 950 оказываются немного выше номинала. В Bristol Ridge работа технологии Turbo Core привязана исключительно к показаниям встроенных в ядро датчиков температуры и потребляемой мощности и никак не зависит от того, какое количество ядер процессора реально работает, а какое находится в состоянии простоя. Поэтому, несмотря на то, что номинальная частота Athlon X4 950 - 3,5 ГГц, в большинстве случаев он работает на 3,7-3,8 ГГц. Причём активация турборежима нередко происходит даже при исполнении ресурсоёмких многопоточных программ.

В таком состоянии расчётное тепловыделение Athlon X4 950 остаётся в 65-ваттных рамках. Однако имеется возможность снизить TDP через настройки UEFI BIOS материнской платы. Минимальный уровень потребления составляет 35 Вт, что в теории может быть востребовано в случае использования такого CPU в компактных системах. В таком экономичном режиме реальная частота Athlon X4 950 оказывается ниже номинала и в ресурсоёмких приложениях плавает в интервале от 3,0 до 3,4 ГГц.

⇡ Разгон

Хотя в названии Athlon X4 950 нет литеры K, коэффициент умножения у этого процессора не зафиксирован, что открывает путь к сравнительно простому разгону. Впрочем, не стоит забывать, что процессорный дизайн Bristol Ridge пришёл в десктопы из мобильной среды, а это значит, что основанные на нём чипы оптимизированы скорее под низкое энергопотребление, чем под высокие частоты.

Поэтому вполне закономерно, что на практике разгонный потенциал Athlon X4 950 оказался достаточно скудным, и с повышением напряжения питания до 1,5 В нам удалось добиться устойчивой работы нашего экземпляра всего лишь на частоте 4,2 ГГц.

Хотя 28-нм Athlon X4 с ядрами Excavator по оверклокерскому потенциалу немного превосходит 14-нм Ryzen, которые обычно удаётся разогнать до частот порядка 4,0 ГГц, хорошим результатом такой разгон всё равно назвать невозможно. Более ранние потомки Bulldozer были способны работать на значительно более высоких частотах. Например, предшествующие Athlon X4 950 процессоры той же серии с модельными номерами из девятой сотни, предназначенные для платформы Socket FM2+ и базирующиеся на дизайне Kaveri, без особого труда брали частоты в диапазоне от 4,5 до 4,8 ГГц.

При этом максимально доступные для представителей поколения Bristol Ridge частоты ограничиваются отнюдь не тепловыделением. Температура Athlon X4 950 в разгоне остаётся сравнительно невысокой. Повышение же частоты стопорится из-за каких-то глубинных ограничений в полупроводниковой структуре, которые препятствуют безошибочной работе CPU на скоростях сильно выше номинальной.

После прорыва начала «нулевых» AMD благополучно вернулась в своё обычное состояние вечно догоняющего и, несмотря на довольно интересные и, бесспорно, передовые технические решения, даже не пытается конкурировать с Intel по объёмам продаж.

По данным на середину 2009 года, на долю компании приходится порядка 14,5% рынка микропроцессоров.
При этом некогда фирменные «фишки» чипов AMD - например, 64-разрядные расширения инструкций или встроенный в процессор контроллер оперативной памяти - давно используются в чипах главного конкурента.

Продукция AMD сегодня занимает две весьма узкие ниши: ультрабюджетных процессоров для постройки компьютеров эконом-класса и производительных моделей, предлагаемых в три-пять раз дешевле сравнимых по возможностям чипов Intel.

Именно этим объясняется тот факт, что на прилавках магазинов можно обнаружить процессоры AMD самых разных семейств и поколений - от доисторических Sempron и Athlon на базе заслуженной архитектуры K8 для разъёма Socket 939 до ультрасовременных шестиядерных Phenom II X6.

Как бы то ни было, в AMD сейчас делают ставку на архитектуру K10, поэтому речь пойдёт именно о процессорах, сконструированных на её основе.
К ним относятся Phenom и Phenom II, а также их бюджетный вариант, застенчиво названый Athlon II.

Исторически первыми чипами на базе K10 были четырёхъядерные Phenom X4 (кодовое название Agena), выпущенные в ноябре 2007 года.
Чуть позже, в апреле 2008 года появились трёхъядерные Phenom X3 - первые в мире центральные процессоры для настольных компьютеров, в которых на одном кристалле расположено три ядра.

В декабре 2008 года с переходом на 45-нанометровый техпроцесс было представлено обновлённое семейство Phenom II, а в феврале чипы получили новый разъём Socket AM3.
Серийный выпуск четырёхъядерных Phenom II X4 начался в январе 2009 года, трёхъядерных Phenom II X3 - в феврале 2009 года, двухъядерных Phenom II X2 - в июне 2009 года, а шестиядерных Phenom II X2 - буквально только что, в апреле 2010 года.

Athlon II - современная замена Sempron - представляет собой Phenom II, лишённый одного из важнейших его достоинств - большой кэш-памяти третьего уровня (L3), общей для всех ядер.
Выпускается в двух-, трёх- и четырёхъядерных вариантах.
Athlon II X2 производится с июня 2009 года, X4 - c сентября 2009 года, а X3 - с ноября 2009 года.

Архитектура AMD K10

Каковы принципиальные отличия архитектуры K10 от K8 ?
Прежде всего, в процессорах K10 все ядра выполнены на одном кристалле и снабжены выделенной кэш-памятью L2.
В чипах Phenom/Phenom 2 и серверных Opteron также предусмотрена общая для всех ядер кэш-память L3, объём которой составляет от 2 до 6 Мб.

Второе важное преимущество K10 - новая системная шина HyperTransport 3.0 с пиковой пропускной способностью до 41,6 ГБайт/с в обоих направлениях в 32-битном режиме или до 10,4 ГБайт/с в одном направлении в 16-битном режиме и частотой до 2,6 ГГц.
Напомним, что максимальная рабочая частота предыдущей версии HyperTransport 2.0 составляет 1,4 ГГц, а пиковая пропускная способность - до 22,4 или 5,6 ГБайт/с.

Широкая шина особенно важна для многоядерных процессоров, при этом в HyperTransport 3.0 предусмотрена возможность конфигурации канала, что позволяет предоставить каждому ядру собственную независимую линию.
Кроме того, процессор K10 способен динамически изменять ширину и рабочую частоту шины пропорционально собственной частоте.

При этом нужно отметить, что в настоящее время в чипах AMD шина HyperTransport 3.0 работает с намного меньшей скоростью, чем максимально допустимая.
В зависимости от модели применяются три режима: 1,6 ГГц и 6,4 ГБайт/с, 1,8 ГГц и 7,2 ГБайт/с и 2 ГГц и 8,0 ГБайт/с.
В выпускаемых чипах пока не используются ещё два заложенных в стандарт режима — 2,4 ГГц и 9,6 ГБайт/с и 2,6 ГГц и 10,4 ГБайт/с.

В процессоры K10 встраиваются два независимых контроллера оперативной памяти, что ускоряет доступ к модулям в реальных условиях эксплуатации.
Контроллеры способны работать с памятью DDR2-1066 (модели для разъёма AM2+ и AM3) или DDR3 (чипы для разъёма AM3).

Поскольку интегрированный в Phenom II и Athlon II для Socket AM3 контроллер поддерживает оба типа оперативной памяти, а разъём AM3 обратно совместим с AM2+, новые ЦП могут устанавливаться на старые платы для AM2+ и работать с памятью DDR2.

Это означает, что при покупке Phenom II для апгрейда вам не придётся сразу же менять и системную плату, а также приобретать оперативную память другого типа - как, например, в случае с чипами Intel i3/i5/i7.

В микропроцессорах с архитектурой K10 реализован целый набор модернизированных технологий энергосбережения - AMD Cool’n’Quiet, CoolCore, Independent Dynamic Core и Dual Dynamic Power Management.

Эта сложная система позволяет автоматически снижать энергопотребление всего чипа в режиме простоя, обеспечивает независимое управление питанием контроллера памяти и ядер и способна отключать неиспользуемые элементы процессора.

Наконец, сами ядра также были существенно усовершенствованы.
Была переработана конструкция блоков выборки, предсказания переходов и ветвлений, диспетчеризации, что позволило оптимизировать загрузку ядра и, в конечном итоге, повысить производительность.

Разрядность блоков SSE была увеличена с 64 до 128 бит, появилась возможность выполнять 64-разрядные инструкции как одну, была добавлена поддержка двух дополнительных инструкций SSE4a (не путать с наборами инструкций SSE4.1 и 4.2 в процессорах Intel Core).

Здесь необходимо упомянуть о конструктивном дефекте, выявленном в серверных Opteron (кодовое название Barcelona) и в Phenom X4 и X3 первых выпусков — так называемой «ошибке TLB», которая в своё время привела к полному прекращению поставок всех Opteron ревизии B2.
В очень редких случаях при высокой загрузке из-за конструктивного недостатка блока TLD кэш-памяти L3 система могла вести себя нестабильно и непредсказуемо.

Дефект был признан критически важным для серверных систем, из-за чего и была приостановлена отгрузка всех выпущенных Opteron.
Для десктопных Phenom был выпущен специальный патч, отключающий средствами BIOS дефектный блок, но при этом производительность процессора заметно падала.
С переходом на ревизию B3 проблема была полностью устранена, и в продаже такие чипы уже давно не встречаются.

Длительное время Advanced Micro Devices, подобно Cyrix, производила центральные процессоры 286, 386 и 486, которые были основаны на разработках Intel. К5 был первым независимо созданным х86 процессором, на который AMD возлагала большие надежды.

Однако, покупка компанией AMD основанного в Калифорнии конкурента весной 1996 года, кажется, создала возможность лучше подготовиться к своей следующей атаке на Intel. К6 начал жизнь как Nx686, будучи переименованным после приобретения NextGen. Серия ММХ-совместимых процессоров К6 была запущена в середине 1997 года, за несколько недель до Cyrix 6х86МХ, и сразу была одобрена пользователями.

Изготовленный по 5-слойной 0.35-мкм технологии, К6 был почти на 20 % меньше, чем Pentium Pro и при этом содержал на 3.3 миллионов транзисторов больше (8.8 против 5.5 миллионов). Большинство этих дополнительных транзисторов находилось в кэше первого уровня на 64 Кбайт (на кэш команд 32 Кбайт и на кэш данных 32 Кбайт). Это равносильно четырем Pentium Pro или двум Pentium ММХ и Pentium 2.

Центральный процессор К6 поддерживал технологию ММХ Intel, включая 57 новых х86 команд, разработанных для развития мультимедийного программного обеспечения. Как и Pentium Pro, К6 был многим обязан классическим технологиям RISC. Используя суперскалярную микроархитектуру AMD RISC86, чип декодировал каждую х86-инструкцию в ряд более простых действий, которые могли быть обработаны, используя типичные принципы RISC - такие, как выполнение вне естественного порядка, переименование регистров, предсказание переходов, спекулятивное исполнение, опережающая выборка данных.

Центральный процессор К6 начинал с версий 166.200 и 233 МГц. Уровень его производительности был очень схож с Pentium Pro соответствующих частот с его максимальным 512 Кбайт кэшем второго уровня. Общее с чипом Cyrix MX (но в несколько меньшей степени) - работа с плавающей запятой - была областью относительной слабости по сравнению с Pentium Pro или Pentium 2. Однако проникновению процессора на рынок в конце 1997 - начале 1998 года препятствовали проблемы, которые возникли у AMD при перемещении ее нового производственного 0.25-мкм процесса из лабораторий на заводы-изготовители. Это привело к падению производства центральных процессоров на 200 и 233 МГц, задержке введения чипа 266 МГц и отмене чипа 300 МГц.

Процессор AMD К6-2

Процессоры AMD К6-2 с 9.3 миллионами транзисторов производились по 0.25-микронной технологии AMD. Процессор был упакован в 100 МГц Sирег7-совместимую, 321-контактную керамическую плату (ceramic pin grid array (CPGA) package).

K6-2 включает инновационную эффективную микроархитектуру RISC86, большой (64 Кбайт) кэш первого уровня (двухпортовый кэш данных на 32 Кбайт, кэш команд на 32 Кбайт с дополнительным предрасшифровывающим кэшем на 20 Кбайт), а также улучшенный модуль работы с плавающей запятой. Эффективная производительность при его запуске в середине 1998 года была оценена в 300 МГц, к началу 1999 года самым быстрым из доступных процессоров была версия 450 МГц.

Трехмерные возможности К6-2 представляли другое важное достижение. Они были воплощены в AMD технологии 3DNow!, как новый набор из 21 команды, который дополнял стандартные команды ММХ, уже включенные в архитектуру К6, что ускоряло обработку трехмерных приложений.

Процессор AMD K6-3

В феврале 1999 года AMD объявила о начале выпуска партии 400 МГц AMD К6-lll процессора под кодовым названием «Sharptooth» и опробовала 450 МГц версию. Ключевой особенностью этого нового процессора была инновационная разработка - «Трехуровневый кэш».

Традиционно процессоры персональных компьютеров использовали два уровня кэша:

  • кэш первого уровня (L1), который обычно расположен на кристалле;
  • кэш второго уровня (L2), который мог располагаться либо вне центрального процессора, на материнской плате или слоте, либо непосредственно на чипе центрального процессора.

Общее эмпирическое правило при проектировании подсистемы кэша - чем больше и быстрее кэш, тем выше производительность (ядро центрального процессора может быстрее получить доступ к инструкциям и данным).

Признавая выгоды большого и быстрого кэша в удовлетворении потребностей приложений, все более требовательных к производительности персональные компьютеры, «Трехуровневый кэш» компании AMD вводил архитектурные новшества кэша, разработанные для увеличения производительности персонального компьютера на основе платформы Super7:

  • внутренний L2-кэш (256 Кбайт), работающий на полной скорости процессора AMD-K6-3 и дополняющий кэш L1 (64 Кбайт), который был стандартен для всего семейства процессоров AMD-K6;
  • многопортовый внутренний кэш, позволяющий одновременное 64-битовое чтение и запись как кэшу L1, так и L2;
  • первичную процессорную шину (100 МГц), обеспечивающую соединение с резидентной кэш памятью на системной плате, расширяемой от 512 до 2048 Кбайт.

Таблица основных характеристик процессоров AMD

Тип процессора Архитектура Год выпуска Кодовое наименование Количество транзисторов, млн Ядро, мм L1 -кэш, Кбайт L2-кэш, Кбайт
AMD K5 K5 1996 SSA/5 4.3 271-161 8+16 Внешн.
1996 Godot 4.3 181 8+16 Внешн.
AMD К6 К6 1997 Nx686 (Model 6) 8.8 162 32+32 Внешн.
1998 Little Foot 8.8 88 32+32 Внешн.
K6-2 1998-2001 Chompers 9.3 81 64 Внешн.
К6 3 1999 Sharptooth 21.3 118 64 256
Athlon К7 1999 Argon 22.0 184 128 512
2000 Pluto 22.0 102 128 512
2000-2001 Thunderbird 37.0 120 64+64 256
Duron 2000-2001 Spitfire 25.0 100 64(|) + 64(D) 64-128
2001-2002 Morgan 25.18 106 128 64
2003 Applebred 37.2 85 128 64
Athlon ХР/МР 2001-2002 Palomino 37.5 130 128 256
2002 Thoroughbred 37.2 85 128 256
2003-2004 Barton 54.3 101 64+64 512
Sempron К7 2004 Thorton 54.3 101 128 256
2004 Thoroubred 37.2 85 128 256
2005 Winchester 68.5 84 128 128
Sempron К7 2005 Palermo 68-75 84 64+64 128-256
2006 Manila 103 81 128 128-256
Athlon 64 К8 2003-2004 Clawhammer 105.9 193 128 512-1024
2004 Newcastle 68.5 144 128 512
2004 Winchester 68.5 84 128 512
2005 Venice 76 84 128 512
2005 San Diego 114 115 128 512-1024
2006 Orleans 129 125 128 512
2006 Manchester 154 147 128 512
Opteron 2003 Sledgehammer 64+64 1024
2005 Venus, Troy, Athens 64+64 1024
Athlon 64 x 2 2-ядерные 2005 Manchester 154 147 128 x 2 512 x 2
2005 Toledo 233 199 128 x 2 512 x 2
2006 Windsor 243 220 128 x 2 512 x 2
2006 Brisbane 153.6 183 128 x 2 1024 x 2
Тип процессора Архитектура Размер минимальной структуры, мкм Тактовая частота шины, МГц Тактовая частота процессора, МГц Потребляемая мощность, Вт Интерфейс
AMD K5 K5 0.5-0.35 50-66 75-100 11-15 Socket 5/7
0.35 60-66 90-115 12-16 Socket 5/7
AMD К6 К6 0.35 CMOS 66 166-300 13-28 Socket 7
0.25 66 200-300 13-28 Socket 7
K6-2 0.25 66-100 266-550 15-30 Super7(321 p)
К6 3 0.25 100 400-450 18-30 Super7
Athlon К7 0.25 200 500-700 36-54 Slot A(575 p)
0.18 200 550-950 31-62 Slot A
0.18 200 700-1.4 ГГц 38-72 Socket A/Slot A
Duron 0.18 200 600-950 27-41 Socket A (Socket 462)
0.18 200 900-1.3 ГГц 44-60 S 462
0.13 266 1.4-1.8 57 S 462
Athlon ХР/МР 0.18 266 1.4-1.7 62-72 Socket 462
0.13 266 1.4-2.25 49-74 S 462
0.13 266-400 1.86-2.33 66-77 Socket A
Sempron К7 0.13 333 1.5-2.0 62 S 754/S 939
0.13 333 1.5-2.0 62 S462
0.09 400 1.6 62 S 754
Sempron К7 0.09 400 1.6-1.8 59-64.0 Socket А/ Socket 754
0.09 400 1.6-2.0 35-62 AM2
Athlon 64 К8 0.13 400 1.8-2.4 89 S 754
0.09 400 1.6-2.4 89 S754
0.09 400 1.8-2.2 67 S 939
0.09 400 2.0-2.4 16-89 S 754
0.09 400 2.2 89 S 939
0.09 400 1.8-2.4 35-62 AM2
0.09 400 2.0-2.2 67 S 939
Opteron 0.13 800/НТ 1.4-2.4 55-95 S 940
0.09 1000/НТ 1.6-3.0 55-95 S 940
Athlon 64 x 2 2-ядерные 0.09 667-800 2.0-2.4 69-110 S939
0.09 2.0-2.4 89-110 S 939
0.09 2.0-2.6 65-89 AM2
0.09 2.0-2.8 65-89 AM2

Проект многопортового внутреннего кэша процессора AMD-K6-3 позволил как кэшу L1 (64 Кбайт), так и кэшу L2 (256 Кбайт) выполнять одновременное 64-битовое чтение и запись операций за один такт процессора. В дополнение к этому многопортовому проекту кэша ядро процессора AMD-K6-I11 было в состоянии получить доступ к кэшам L1 и L2 одновременно, что увеличивало общую пропускную способность центрального процессора.

Процессор AMD Athlon

Выпуск процессора Athlon летом 1999 года был наиболее удачным ходом AMD. Это позволило им гордиться тем, что они произвели первый процессор седьмого поколения (у него было достаточно много радикальных архитектурных отличий от Pentium ll/lll и К6-3, чтобы заслужить название процессора следующего поколения), и это означало также, что они вырвали технологическое лидерство у Intel.

Древнегреческое слово Athlon означает «трофей», или «игры». Athlon - процессор, с помощью которого AMD надеялась увеличить реальное конкурентоспособное присутствие в корпоративном секторе, помимо его традиционного преимущества на потребительском рынке и рынке трехмерных игр. Ядро размещается на кристалле в 102 квадратных миллиметров и содержит приблизительно 22 миллиона транзисторов.

Основные элементы ядра Athlon

Многократные декодеры

Три полных декодера переводят х86-команды в макрооперации (MacroOPs) с фиксированной длиной для более высокой пропускной способности команд и увеличения мощности обработки. Вместо того чтобы выполнять х86 команды с длиной 1-15 байтов, процессор Athlon выполняет макрооперации фиксированной длины.

Блок контроля команд

Как только макрооперация расшифрована, за цикл посылаются до трех макроопераций блоку управления инструкциями (ICU). Это буфер перенаправления макроопераций с 72 входами (ROB), который управляет выполнением каждой макрооперации в целом, осуществляет переименование регистра для операндов, управляет любыми условиями исключения и действиями команды. ICU посылает макрооперацию планировщику исполнения.

Конвейеры исполнения

Athlon содержит 18-разрядный планировщик макроопераций и 36-разрядный планировщик операций мультимедиа и ПТ. Эти планировщики распределяют MacroOPs по девяти независимым конвейерам - три для вычислений с ФТ, три для вычисления адресов и три для выполнения команд ММХ, 3DNow! и операций ПТ для х87.

Супер скалярный блок плавающей точки FPT

Предыдущие центральные процессоры AMD были недостаточно производительными при работе с ПТ по сравнению с Intel. К этому недостатку более чем ответственно отнеслись в Athlon, который характеризуется суперскалярной архитектурой, включающей три конвейера выполнения команд с ПТ вне естественного порядка - FMUL (перемножение с ПТ), FADD (сложение с ПТ) и FSTORE (запись с ПТ). «Суперскалярность» означает способность центрального процессора выполнять более одной команды за такт процессора. Athlon же может выполнять одну операцию над 32-битовым числом с ПТ за такт процессора, что дает производительность в 2.4 Гфлопс при частоте в 600 МГц.

Прогнозирование переходов

Процессор Athlon предлагает сложную динамическую логику прогнозирования ветвления, чтобы минимизировать или устранить задержки из-за команд перехода, широко распространенные в программном обеспечении х86.

Системная шина

Системная шина Athlon - первая системная шина на 200 МГц для х86-платформ. Основанная на протоколе Digital Alpha EV6, первичная шина (FSB) - потенциально расширяемая до 400 МГц и более и, в отличие от разделяемой шины SMP (Symmetric Multi-Processing) проекта Pentium 3, использует архитектуру «точка-точка», чтобы обеспечить широкую полосу пропускания для одно- и многопроцессорных х86 платформ.

Архитектура кэша

Архитектура кэша Athlon существенно превосходит обычные центральные процессоры шестого поколения - полноценный кэш первого уровня 128 Кбайт, в 4 раза больший, чем у Pentium 3, и быстродействующий 64-битовый контроллер вторичного кэша 2-го уровня, поддерживающий от 512 Кбайт до 8 Мбайт.

Расширенный 3D Now

В ответ на Streaming SIMD Extensions (Intel Pentium 3) реализация 3DNow! в Athlon была модернизирована добавлением 24 новых команд к исходной 21 инструкции 3DNow!

Athlon был первоначально доступен в диапазонах скорости 500.550 и 600 МГц и 650 МГц немного позднее (все изготовлены по 0.25-мкм технологии). К концу 1999 года AMD еще более повысила частоту: его ядро К75 (750 МГц) является первым процессором, построенным с использованием алюминиевой 6-слойной технологии 0.18-мкм компании AMD.

Утверждение о том, что это был самый быстрый х86 совместимый центральный процессора тысячелетия, спорно, поскольку Intel быстро ответила объявлением 800 МГц Pentium 3. Однако AMD вскоре вернула лидерство в 2000 году выпуском версий на 800 и 850 МГц и преуспела в опережении Intel в преодолении барьера 1 ГГц буквально через несколько недель.

Процессор Thunderbird

В середине 2000 года была выпущена улучшенная версия Athlon с кодовым названием «Thunderbird».

Технология 0.18-мкм, кэш память 2-го уровня (L2) размером в 256 Кбайт расположена на плате процессора и работает на полной частоте процессора (первые процессоры Athlon имели кэш L2, работавшую на меньших частотах, например при частоте в 1 ГГЦ, память L2 работала на 330 МГц).

Интерфейсы - 462-контактный Socket А и Slot А. Частоты от 0.75 до 1 ГГц. Размещение 256 Кбайт памяти на кристалле привело к увеличению его размера до 120 квадратных миллиметров (102 квадратных миллиметров для ядра). Однако он меньше исходного (0.25-micron) К7 Athlon, который занимает 184 квадратных миллиметров. Добавление 256 Кбайт к L2-кэшу на кристалле весьма увеличивает число транзисторов. Центральный процессор Thunderbird включает 37 миллионов транзисторов, то есть 15 миллионов добавились для размещения кэша L2.

Осенью 2000 года был выпущен чипсет AMD760, обеспечивающий поддержку для памяти DDR SDRAM РС1600 (200 МГц FSB) и РС2100 (266 МГц FSB). Другие особенности - AGP 4-х, 4 порта USB , адресация памяти 8 Гбайт на 4 DIMM и поддержка АТА-100. С этого момента процессоры Athlon выпускались только для разъемов Socket А. Последние из процессоров Athlon/Thunderbird были выпущены летом 2001 года, достигнув частоты 1.4 ГГц.

Процессор Duron

В середине 2000 года был выпущен процессор Duron, предназначенный для дома и офиса. Название происходит от латинского «durare» - «вечный», «длительный». Кэш-память L1 (128 Кбайт) и L2 (64 Кбайт) размещается на плате. Первичная системная шина работает на частоте 200 МГц. Поддерживается улучшенная технология 3DNow! Технология 0.18-мкм, частоты 600.650 и 700 МГц. Интерфейс - 462-контактный разъем Socket А.

Процессор Palomino (Athlon ХР - EXtra Performance)

Процессор выполнен по 0.18-мкм технологии с использованием медных проводников на плате (вместо алюминия), содержит 37.5 миллионов транзисторов на кристалле в 128 квадратных миллиметров. Достигнуто понижение на 20 % энергопотребления сравнительно с Thunderbird. Введен ряд новшеств, в совокупности именуемых AMD как «QuantiSpeed Architecture»:

  • введение дополнительного буфера - буфера быстрого преобразования адреса (БПА, TLB - Processor`s Transition Lookaside Buffer). Это дополнительная кэш память, расположенная между L1 и L2. В частности, TLB содержит данные, которые используются для перевода виртуальных адресов в физические и наоборот;
  • поддержка SSE технологии Intel. В Palomino добавлены еще 52 новые команды SIMD по отношению к ранее имевшимся. Удвоено количество исходных 21 SIMD-команд, реализующих «3DNow!», и получена технология «Enhanced 3DNow!» («3DNow! Professional»);
  • использование технологии упаковки OPGA (organic PGA) для замещения CPGA (ceramic PGA), которая использовалась ранее. Использование пластмасс вместо керамики технологичнее, платы оказываются легче и обладают лучшими тепловыми свойствами. Кроме того, можно плотнее размещать навесные элементы, что уменьшает наводки и помехи. OPGA размещаются на уже известном разъеме Socket А.

Процессор Morgan

Morgan первоначально представлял собой ядро Palomino c удаленными 3/4 кэша L2 (64 Кбайт вместо 256 Кбайт). Размер кристалла - 106 квадратных миллиметров, число транзисторов - 25.18 миллионов. Напряжение питания было изменено с 1.6 до 1.75 В.

Процессор Thoroughbred

Летом 2002 года AMD начала поставлять первый процессор с 0.13-мкм технологией и медными соединениями. Площадь кристалла - 80 квадратных миллиметров (у его предшественников - 128 квадратных миллиметров). Питание - 1.65 В, размеры кэша на кристалле - 128 Кбайт для L1 и 256 Кбайт для L2, разъем - Socket А. Эквивалентная производительность Athlon ХР - 2400+ или 2600+.

Однако ядро Thoroughbred рассматривать как простую переделку Palomino с учетом новых норм технологического процесса все же не совсем верно. Thoroughbred по своей внутренней структуре значительно отличается от Palomino, в чем можно убедиться по микроснимкам процессорных ядер.

  • а - Palomino.
  • б - Thoroughbred.

Процессор Sempron

Летом 2004 года AMD объявила о выходе центрального процессора семейства Sempron. Первоначально задуманный как преемник успешного центрального процессора Duron и прямой конкурент процессору Celeron D (Intel, 90 нм), диапазон применения Sempron фактически перекрыл диапазон Athlon AMD ХР и поставил фирмы, выпускающие настольные и мобильные персональные компьютеры, перед выбором - либо Sempron, либо Athlon 64.

Все первые центральные процессоры базировались на 130 нанометровой технологии AMD. Наиболее мощные образцы (3100+) выпускаются в формате интерфейса Socket 754 (Athlon 64 - в формате Socket 939). Другие участники семейства - от 2 ГГц (2800+) до 1.5 ГГц (2200+) - используют Socket А.

В дальнейшем Sempron предполагается перевести на 90 нанометровую технологию и интерфейс Socket 939.

Архитектура процессора К8

Эта архитектура используется во всех современных серверных, настольных и мобильных процессорах AMD (Opteron, Athlon 64 и Athlon 64 Х2). Первым из процессоров К8 являлся Hammer (середина 2000 года).

Одним из главных новшеств К8 является 64-разрядная архитектура х86-64 ISA. Примером 64-разрядных процессоров (IA-64) является Intel Itanium. Однако между 64-разрядными архитектурами процессоров Itanium и К8 мало общего. Itanium - процессор, несовместимый с системой команд х86, тогда как К8, напротив, таковым является.

Стратегия AMD на 64 бита (х86-64) заключается в следующем - за основу взято производительное х86-ядро и расширен набор инструкций для возможности адресации 64-битового пространства памяти. Особенности архитектуры х86-64 (AMD64):

  • обратная совместимость с инструкциями х86;
  • 8 новых 64-битовых РОН плюс 64-битовые версии прежних 8 РОН х86 (доступны лишь в 64-битовом «длинном» режиме);
  • поддержка SSE и SSE2 помимо восьми новых регистров SSE2;
  • увеличен объем адресуемой памяти для приложений, работающих с большими объемами данных (доступно лишь в «длинном» режиме);
  • высокая производительность 32-битовых приложений плюс поддержка появляющихся 64-битовых приложений, хороший вариант переходного процессора.

Таблица режимов процессоров К8

Режим Подрежим Назначение Адресуемая память, Гбайт Операционная система Примечания
«Преемственности» (Legacy Mode) Нет Работа со всеми 16- или 32-бито-выми х86-прило-жениями 4 32-раз-рядная Используются только 32 разряда в 64-разрядных регистрах. Дополнительные 64-разрядные регистры не задействованы. Перекомпиляция ПО не требуется
«Длинный» (Long Mode) Полный (64 разряда) Работа с 64-разрядными приложениями (инструкции х86-64) Более 4 64-разрядная Используются 64-разрядные основные и дополнительные регистры. Требуется перекомпиляция старых программ
Совместимости (Compatibility Mode) Запуск 32-разрядных программ в 64-разрядной операционной системы 2 в 32-битовой операционной системе. 4 в 64-битовой операционной системе Используются только 32 разряда е 64-разрядных регистрах. Дополнительные 64-разрядные регистры не задействованы. Перекомпиляция ПО не требуется

Основные недостатки:

  • процессор продолжает поддерживать архитектуру х86, которая достаточно устарела;
  • новые РОН можно использовать лишь в 64-битовом режиме, что не позволяет повысить производительность 32-битовых приложений посредством улучшения архитектуры системы команд.

Для реализации возможности работы как с 32-битовыми, так и с 64-битовыми приложениями процессоры К8 поддерживают два режима работы - Long Mode и Legacy Mode. В режиме Long Mode также предусмотрено два подрежима - 64-битовый и Compability mode (режим совместимости).

Некоторые прочие особенности К8

  • контроллер памяти интегрирован в сам процессор. Традиционно он располагается в «северном мосте» чипсета на системной плате. Собственно, контроллер памяти - это основной функциональный блок «северного моста» (в чипсетах Intel его так и называют - МСН, Memory Controller Hub); встроенный порт («линк») шины HyperTransport - универсальной шины межчипового соединения. В процессорах К8 Opteron может быть до 3-4 линков НТ, что позволяет комбинировать их в кластерные структуры

  • архитектура К8 разработана с перспективой создания многоядерных процессоров и многопроцессорных систем: если центральные процессоры Intel Хеоn может продемонстрировать лишь 11 процентов увеличения производительности при переходе к двум процессорам, то в случае с Opteron оно составляет 24 процента;
  • усовершенствован блок предсказания переходов - для увеличения точности он содержит историю 16 000 переходов, а также 2000 адресов назначения.

Исполнение инструкций на конвейере К8 начинается с блока выборки инструкций. За один такт блок выбирает из кэша 16 байт данных и выделяет из них от одной до трех инструкций х86 - сколько в выбранных данных поместилось. Поскольку средняя длина команды х86 составляет 5-6 байт, то, как правило, блоку удается выбрать три команды за такт.

На втором такте конвейера выбранные команды распределяются по трем блокам декодирования инструкций. Самые сложные команды отправляются в декодер сложных команд (VectorPath), другие - в декодеры простых команд (DirectPath).

Исходные х86-инструкции на завершающих этапах работы декодера К7/К8 переводятся в макрооперации, или МакОПы (mOPs). Большинству х86-инструкций соответствует одна МакОП, некоторые преобразуются в 2 или 3, а наиболее сложные, например деление или тригонометрические, - в последовательность из нескольких десятков МакОП. Макрооперации имеют фиксированную длину и регулярную структуру.

Условно можно считать что в определенный момент МакОп может «расщепляться» на две микрооперации (МкОП). Как правило, в К7 и в К8 МакОП содержит две МкОП - одну для АЛУ (ALU) (или блока ПЗ - FPU), другую - для УВА (устройства вычисления адреса, AGU - Address Generation Unit).

За счет конвейеризации возможны ситуации, когда одновременно в разных блоках процессора будут выполняться до двух десятков команд - и в К7, и в К8 имеется десять исполнительных устройств - три ALU, три FPU, три AGU и отдельный блок умножения.

Подобно тому, как объединение двух отдельных МкОП в одну МакОП дает явные преимущества, точно так же дела обстоят и с самими МакОП - практически везде они выступают не в виде самостоятельных единиц, а в виде группы. Группу образуют три МакОП, которые одновременно запускаются на параллельные каналы.

Вся дальнейшая работа идет не с одиночными, а с «тройками» МакОП («линиями», line). Такая «линия», с точки зрения центрального управляющего блока процессора - ICU (Instruction Control Unit) воспринимается как единое целое: все основные действия выполняются именно над «линиями», в первую очередь выделение внутренних ресурсов.

Сгенерированные «линии» от декодеров по одной за такт поступают в блок управления командами - Instructions Control Unit (ICU), где подготовленные к исполнению линии накапливаются в специальной очереди (24 линии).

Из очереди в 24 линии по три МакОП в каждой ICU выбирает в наиболее удобной для исполнения последовательности (одна-три МакОП) и пересылает их либо на АЛУ, либо на блок ПЗ в зависимости от типа микрооперации. В случае АЛУ микрооперации сразу же попадают в очередь планировщика (шесть элементов по три МакОП), который подготавливает необходимые для исполнения микрооперации ресурсы, дожидается их готовности и только потом отправляет. Причем при исполнении одной МакОП на самом деле может происходить исполнение сразу двух действий (МкОП).

Процессор Athlon 64х2

AMD снова оказалась впереди Intel, продемонстрировав действующий экспериментальный образец двухъядерного процессора летом 2004 года и поэтому Intel вызвала всеобщее удивление, все же выйдя первой на рынок с двухъядерным процессором весной 2005 года Однако, мало того, что AMD 64 Х2 был только короткое время позади Pentium Extreme Edition и Pentium D по датам выхода на рынок, он значительно опережал их по показателям эффективности.

Athlon 64 Х2 включает все возможности, заложенные в единственном ядре Athlon 64 (такие, как HyperTransport и Enhanced Virus Protection - EVP). Когда центральный процессор работает под операционной системой Windows ХР (SP2), EVP интерпретирует области системной памяти как «только данные», так что любой находящийся здесь фрагмент кода может быть либо прочитан, либо записан, но не может быть выполнен как код программы. Тем самым EVP действует как профилактическая мера против обычных злонамеренных вирусов, локализуя и обезвреживая их.

Основная архитектура ядра Х2 по существу та же, как и у Athlon 64. Различие в том, что новые чипы, размещаемые на единственном кристалле в 199 квадратных миллиметров, причем каждый содержит более чем 233 миллиона транзисторов, изготовлены по 90 нанометровой технологии AMD.

Таким образом, спецификации первоначально объявленного диапазона Athlon 64 Х2 были эквивалентны таковым из существующих центральных процессоров на 3500+, 3700+, 3800+ и 4000+ с изменением кэша L2 и тактовой частоты. Модели с 512 Кбайт кэша на ядре базируются на двойном ядре «Winchecter», в то время как версии версии кэша L2 на 1 Мбайт используют дизайн «Toledo». К лету 2005 года диапазон был расширен с появлением нового чипа (3800 +).