Не только новая платформа, но и «слишком» новая микроархитектура

Не так давно мы изучали производительность новой HEDT-платформы AMD и убедились в том, что на данный момент процессоры семейства Ryzen Threadripper являются самыми быстрыми из имеющихся в продаже. Впрочем, пока еще точка в этом вопросе не поставлена, процессоры с более чем 10 активными ядрами Intel обещает только осенью. В итоге и сравнение сейчас не совсем прямое: продукты AMD имеют преимущество в количестве ядер. С другой стороны, если привязываться к цене, то все корректно: 12 (и более) ядер у Intel все равно будут стоить дороже, чем даже 16 у AMD. Но некоторых читателей интересует прямое сравнение при паритете по количеству ядер, тем более что не так давно еще не было ни Ryzen Threadripper, ни Skylake-X, а максимумом для (условно) настольных процессоров было 10 ядер платформы LGA2011-3. И с учетом цены той 10-ядерной модели (единственной на рынке), наибольший интерес покупателей вызывали процессоры с 6 и 8 ядрами. Не говоря уже о том, что для первого поколения решений для этой платформы (Haswell-E) восемь ядер было максимальным количеством.

Что же касается новой платформы Intel, LGA2066, то ее нужно считать новым решением, а не развитием предыдущих разработок. Именно с этим и связаны многие особенности функционирования сегодняшних (да и завтрашних) процессоров семейства Core X-series — в том числе, и производительность с энергопотреблением. Ранее мы этот вопрос подробно не рассматривали, поскольку знакомились с платформой на примере процессора Core i7-7740X , который относится к семейству Kaby Lake-X, так что его все это в принципе не касается. Позднее, правда, мы протестировали и нынешнего флагмана Core i9-7900X , и вот тут уже сполна насладились новшествами:) Сегодня же мы вкратце остановимся на том, чем Skylake-X отличаются ото всех предыдущих разработок Intel и чем это нам грозит.

Все решают связи

Как можно увеличить производительность процессора? С учетом того, что таковой давно уже умеет выполнять одновременно несколько потоков кода, есть два пути — интенсивный и экстенсивный. Первый — повышение производительности каждого потока. Прекрасный и универсальный способ (поскольку неважно — распараллеливается ли задача, как она распараллеливается и т. п.), но сложный и ограниченный технически. Экстенсивный — наращивать количество ядер в каждом процессоре, а если и это не помогает — количество самих процессоров в системе. Метод более затратный и менее универсальный, но иногда ничего другого и не остается.

Правда вот даже в идеальном случае масштабирование будет далеко не линейным, поскольку нужны и быстрые интерфейсы. В том числе, и с периферийными устройствами. Особенно относительно скоростными — оперативной памятью, например. Когда-то производительность центральных процессоров была такой, что контроллер памяти можно было располагать и «подальше» от ядер в отдельном кристалле (а то и в нескольких) — со временем пришлось его «приближать» для увеличения скорости обмена данными. Но и шину памяти тоже приходилось делать более быстрой и широкой, по мере увеличения количества ядер в процессорах. В первых Athlon 64 на каждое ядро приходился один канал памяти, позднее — даже два и это было огромным запасом. Однако давно уже массовые процессоры вынуждены обходиться одним каналом памяти на пару ядер, а в немассовых на каждый канал (несмотря на большее их количество) приходится уже четыре ядра и больше. Впрочем, с тех пор подросла и пропускная способность канала: начинали-то мы с DDR-400 (если говорить об ИКП), а сейчас уже речь идет о DDR4-2400+, что сильно ослабляет проблему. Но не решает ее полностью.

Тем более важны интерфейсы между ядрами, а также между ними и контроллером памяти. В первых двухъядерных настольных процессорах, типа Athlon 64 X2 или Pentium D, об этом никто особо не заботился — фактически представляли они собой склейки из пары одноядерных, но тогда этого хватало. Зато Core Duo (и, позднее, Core 2 Duo) оказались очень эффективными двухъядерными процессорами из-за наличия единой кэш-памяти второго уровня, работающей синхронно с ядрами. На тот момент схема была идеальной, однако не масштабируемой — когда возникла необходимость выпускать четырех- и шестиядерные модели с использованием этой микроархитектуры, Intel пришлось вернуться к все тем же «склейкам» и обмену данными между двухъядерными модулями через контроллер шины FSB. Впрочем, массовому рынку тогда многоядерные процессоры еще не слишком и требовались (шесть ядер Core2, например, существовали только в виде Xeon под Socket 604), но уже очевидно было, что за ними будущее.

Первыми попытками решить проблему стали процессоры AMD Phenom и Intel Core первого поколения, в которых использовалась общая для всех ядер кэш-память третьего уровня. К сожалению, работала она на относительно низкой частоте, причем асинхронно с ядрами — в результате чего производительность оказывалась более низкой, чем могла бы. Core это мешало не слишком — в этих процессорах изменений сравнительно с предшественниками и без того оказалось достаточно, чтобы вытягивать производительность на «хороший» уровень: интегрированный контроллер памяти (впервые в процессорах Intel), Turbo Boost, Hyper-Threading и т. п. Но, все-таки мешало. Поэтому в лабораториях компании ковалось «оружие победы», собственно и определившее развитие платформ Intel на протяжении последних шести лет. Таковым стала основанная на протоколе QPI двунаправленная кольцевая шина. Точнее, физически речь шла о четырех отдельных шинах: данных (ширина 32 байта + ЕСС), запросов, мониторинга и подтверждения. Решение простое, но позволяющее быстро обмениваться данными между процессорными ядрами, GPU (при его наличии) и кэш-памятью L3, которую удалось синхронизировать с ядрами. Первыми процессорами, использующими кольцевую шину, стали серверные восьмиядерные Nehalem-EX под LGA1567, появившиеся в 2010 году, однако знакомство с ней массового пользователя началось в 2011 — с настольных Sandy Bridge для LGA1155. С этого момента она стала стандартом и для настольных, и для серверных (стало быть, и HEDT) процессоров всех последующих поколений. Более того — в настольных наследниках Skylake/Kaby Lake кольцевая шина тоже сохранится. Но не в Skylake-X и других многоядерных процессорах.

В принципе, проблемы с многоядерными решениями начались еще пару лет назад. Кольцевая шина, вообще говоря, идеальна для двухъядерных процессоров — недаром компании даже приходилось первое время искусственно сдерживать их развитие:) Хорошо подходит она и для четырех, шести или восьми ядер — в общем там, где число «потребителей» на шине невелико, так что каждый из них до того же общего L3 может быстро «дотянуться». В общем-то, восемь ядер максимум на момент создания кольцевой шины и было, однако быстро выяснилось, что такая конфигурация уже не может быть столь же быстрой, как в настольных «малоядерных» системах: нужно использовать более низкие частоты и шины, и кэш-памяти. Собственно, с чем и связано отставание четырехъядерных процессоров для LGA2011 от своих аналогов для LGA1155, несмотря на большую емкость L3 и формальное равенство по другим параметрам. Начиная с Haswell проблему решили волюнтаристски — совпадения по количеству ядер в «настольной» и HEDT-платформе просто исчезли:) Теперь снова появились, но просто потому, что Kaby Lake-X на деле имеют такое же внутреннее устройство, как и «обычные» Kaby Lake, так что и ведут себя одинаково.

Но до 12 ядер в Ivy Bridge-EX дошли. Планировалась масштабируемость кольцевой шины и дальше — до 20 ядер. Выяснилось, что для одной шины — это перебор:) В итоге многоядерные процессоры фактически разделились на две линейки. Кристаллы, включающие в себя до 8 ядер в Haswell или 10 в Broadwell, были построены на классических принципах — с единой кольцевой шиной. В принципе, только их и можно было официально встретить в условно-настольных системах. А в мультисокетных серверах использовались и процессоры на других версиях кристаллов, использующих две кольцевые шины и коммутаторы между ними. В Intel решили, что наилучшим образом кольцевая шина может работать при числе ядер до 12 — соответственно, старшие версии процессоров Broadwell-EX получили 24 процессорных ядра. И 60 МБ кэш-памяти L3, но также разбитой на два блока — т. е. доступ к памяти соседнего кластера осуществлялся с существенно-большими задержками, чем к собственной. На самом деле, версий было даже три — средняя тоже содержала две шины, но замкнутой была лишь одна из них, а вторая с точки зрения математики «кольцевой» быть перестала.

Фактически в итоге компания пришла к тому же, от чего уходила — только на более высоком уровне. Несложно заметить, что и AMD в Ryzen сделала нечто подобное — только кластеры меньше: четыре ядра плюс 8 МБ L3. На подложке таковых два, а дальше уже нужно объединять восьмиядерные «двухкластерные» кристаллы в сборки из двух (Ryzen Threadripper) или четырех (Epyc), причем последних в одной системе может быть две, что в сумме позволяет предоставить пользователю 64 ядра. У Intel же в Broadwell-EX каждый кластер содержит 12 ядер и 30 МБ L3, но точно также два таковых объединяются в одном кристалле. Подобных «сборок» в одной системе может быть уже не две, а до восьми, но это требует соответствующих габаритов для своего размещения, да и стоимость подобной «максимальной» системы со 192 процессорными ядрами оказывается слишком высокой. А чтобы увеличить производительность «на единицу объема» необходимо увеличивать количество ядер, приходящихся на каждый сокет. Причем делать это нужно не увеличением количества ядер на кластер (упираемся в кольцевую шину) и не увеличением их количества (что еще сильнее ухудшит связность), а коренным образом меняя структуру связей.

Собственно, еще при анонсе Broadwell-EX было озвучено, что следующее поколение многоядерных процессоров Intel будет первой существенной переделкой архитектуры со времен Nehalem. Именно это мы и получили — причем, как всегда, одним достанутся «пироги и пышки», а другим «синяки и шишки». Серверным системам — скорее, первое. Новые процессоры используют mesh-архитектуру, хорошо зарекомендовавшую себя в Xeon Phi (Knights Landing) с их десятками ядер. В первом приближении можно считать, что одномерная топология превратилась в двумерную — с увеличением количества связей и сокращением длины маршрута передачи данных. И с увеличением количества возможных маршрутов тоже, что позволяет избегать появления узких мест. Да и размеры структуры можно увеличивать без существенного роста задержек. Казалось бы, есть повод для радости... Если не вспоминать, что для HEDT-платформы Intel пока отгружает лишь процессоры с 10-ю ядрами, для чего, в общем-то, хватало и кольцевой шины. Да и для 12 ядер тоже. Теоретически, конечно, и в этих моделях можно что-то ускорить в части задач, но ведь и «младшие» Core i7 для LGA2066 тоже получили идентичную архитектуру связей — на свои-то 6-8 ядер. К тому же, на данный момент частота синхронизации сети составляет 2,4 ГГц — против 2,8 ГГц в Broadwell-E: на старших моделях возможно ускорение межпроцессорного обмена данными за счет сокращения длины маршрутов, но вот в младших ему взяться неоткуда.

А само по себе количество пересылок данных по сети должно даже увеличиться, поскольку радикально изменилась архитектура кэш-памяти. В Broadwell она была инклюзивной, благо 2,5 МБ L3 на ядро было более чем достаточно и для хранения его 256К L2, и того, что туда «не влезло». В Skylake-X разработчики решили увеличить общую эффективность кэширования, для чего резко изменили емкость кэш-памяти L2, имеющей более низкие задержки. В итоге вместо 256К с четырехканальной ассоциативностью каждое ядро получило 1024К с 16-канальной. Это серьезное усовершенствование (впервые с момента создания первых Core на основе Nehalem фактически — уж по размеру точно), однако не позволившее сохранить старую схему с полной инклюзивностью: иначе бы пришлось и пропорционально увеличить емкость L3, а на кэши и без того требуется много транзисторов. В итоге емкость кэш-памяти третьего уровня вообще уменьшилась, а данные теперь могут находиться в L2 одного ядра и отсутствовать при этом в L3. Ассоциативность последнего тоже уменьшилась, да еще и работает он теперь не на 2,8 ГГц, а на частоте mesh, т. е. 2,4 ГГц. Отметим, что и старого значения было маловато (на фоне «малоядерных» решений), а теперь о быстром обмене данными через L3 вообще можно забыть. С другой стороны, производительность на поток может и вырасти, а еще неплохое ускорение даже при прочих равных могут получить и задачи, разбивающиеся на большое количество независимых фрагментов, но среди настольных приложений их не так уж и много. Хотя из тех, которым может пригодиться много ядер — немало.

В общем, подытоживая, новая микроархитектура изначально ориентирована на выпуск процессоров, где ядер будет много или очень много. Собственно, в уже поставляемых Xeon для LGA3647 их бывает до 28 (что по некоторым данным не предел, причем не только в отдаленном будущем), а упаковано все это в монолитный кристалл с шестиканальным контроллером памяти. А HEDT Skylake-X под LGA2066 оказались своеобразными заложниками ситуации — пока в них всего 10 ядер, с чем нормально справлялась и кольцевая шина. В какой-то степени «подсластить пилюлю» могут обещанные на осень модели с 12-18 ядрами, но только тем, кто готов за них платить. В любом случае речь идет о новой микроархитектуре, заметно отличающейся от всех знакомых нам ранее — на протяжении шести-семи лет, когда каждое поколение было просто эволюционным развитием предыдущего. Где-то она, безусловно, будет вести себя лучше, где-то хуже (и то, и другое мы на примере Core i9-7900X и Core i7-6950X уже видели), но главное — по-другому. И это необходимо учитывать и при оптимизации программного обеспечения, что несколько лет не требовалось: Core оно и есть Core; просто в каждом поколении чуть лучше. Skylake-X — новые процессоры, от представителей массового сегмента отличающиеся не только количеством ядер. И не только связями между ними, но и самими ядрами. И даже системой команд — если поддержка AVX и AVX2 внедрялись во все процессоры Core и Xeon (и даже в серверные Pentium, в отличие от настольных и мобильных), то к AVX-512 это не относится. Это расширение, предназначенное для работы с векторами длиной 512 бит (в отличие от 256 бит предыдущих версий) в виде дополнительных команд и соответствующих регистров, впервые дебютировало в Xeon Phi, но и сейчас, и в ближайшем будущем так и останется «визитной карточкой» этого семейства процессоров и, как раз, Skylake-X. Соответственно, ожидать активной работы с ним в массовом ПО не стоит. В общем-то, и использование AVX/AVX2 его разработчиками оставляет желать много лучшего (хотя в некоторых программах формально используются, но, в основном «для галочки» - чтоб добавить красивую строчку в описание новых версий, а не на практике), но тут и такого не будет: слишком мала инсталляционная база. И такой и останется, так что рассматривать AVX-512 как преимущество новых процессоров могут разве что пользователи, способные непосредственно повлиять на софт, с которым они работают. В предельном случае — если они сами себе его пишут:) Для НРС-систем — нормальное и распространенное явление, но не для абстрактных «персональных компьютеров». Пусть даже и High-End .

Конфигурация тестовых стендов

Процессор Intel Core i7-7800X Intel Core i7-7820X Intel Core i9-7900X
Название ядра Skylake-X Skylake-X Skylake-X
Технология пр-ва 14 нм 14 нм 14 нм
Частота ядра, ГГц 3,5/4,0 3,6/4,3 3,3/4,3
Кол-во ядер/потоков 6/12 8/16 10/20
Кэш L1 (сумм.), I/D, КБ 192/192 256/256 320/320
Кэш L2, КБ 6×1024 8×1024 10×1024
Кэш L3, МиБ 8,25 11 13,75
Оперативная память 4×DDR4-2666 4×DDR4-2666 4×DDR4-2666
TDP, Вт 140 140 140
Количество линий PCIe 3.0 28 28 44
Цена T-1729322998 T-1729322808 T-1729323741

C другой стороны, простому покупателю это знание дает не слишком много — для него в первом приближении это просто самые быстрые и дорогие процессоры Intel, все еще продающиеся как «настольные» (хотя в их случае такое позиционирование становится как никогда нечетким: в «настоящих» настольных и мобильных уже и ядра несколько другие, а не только их обвязка). При равном количестве ядер — чуть менее дорогие, чем ранее, хотя благодарить за это, скорее всего, стоит внешние факторы. Может, и не только их — добавление пары ядер на планке $999 наблюдалось и при переходе от LGA2011 к LGA2011-3, а чем внедрение LGA2066 хуже-то? :) Вот чем не лучше — видно по количеству линий PCIe в паре младших решений: их снова меньше. Во времена 2011-3 определенная логика в этом была, ибо оба процессора были шестиядерными (а разные тактовые частоты при всех разблокированных множителях аргумент не слишком убедительный), но подобной хирургической операции подлежал только младший из них. Теперь же оба, хотя они отличаются уже и количеством ядер. Поэтому оставим цены в покое — какие они сейчас мы точно знаем, а какими могли бы быть можно только гадать.

Процессор Intel Core i7-5960X Intel Core i7-6800K Intel Core i7-6900K Intel Core i7-6950X
Название ядра Haswell-E Broadwell-E Broadwell-E Broadwell-E
Технология пр-ва 22 нм 14 нм 14 нм 14 нм
Частота ядра, ГГц 3,0/3,5 3,4/3,6 3,2/3,7 3,0/3,5
Кол-во ядер/потоков 8/16 6/12 8/16 10/20
Кэш L1 (сумм.), I/D, КБ 256/256 192/192 256/256 320/320
Кэш L2, КБ 8×256 6×256 8×256 10×256
Кэш L3, МиБ 20 15 20 25
Оперативная память 4×DDR4-2133 4×DDR4-2400 4×DDR4-2400 4×DDR4-2400
TDP, Вт 140 140 140 140
Количество линий PCIe 3.0 44 28 44 44
Цена T-11008382 T-13974485 T-13974488 T-13974634

Поэтому можно спокойно провести сравнение с решениями для предыдущей платформы, воспользовавшись формальным равенством по количеству ядер: две тройки процессоров у нас и получаются. Ко второй мы решили добавить в качестве ориентира еще и Core i7-5960X — в первом поколении LGA2011-3 он был самым быстрым. А также и первым «настольным» восьмиядерным процессором по совместительству тоже. Причем на тот момент альтернатив платформам Intel в рамках х86-архитектуры совсем не было, так что все вышеприведенные эпитеты относятся и к рынку в целом — еще один повод в обязательном порядке протестировать «старичка» (которому, понятно, еще жить да жить, если уж был куплен).

Процессор AMD Ryzen 5 1600Х AMD Ryzen 7 1800Х
Название ядра Ryzen Ryzen
Технология пр-ва 14 нм 14 нм
Частота ядра, ГГц 3,6/4,0 3,6/4,0
Кол-во ядер/потоков 6/12 8/16
Кэш L1 (сумм.), I/D, КБ 384/192 512/256
Кэш L2, КБ 6×512 8×512
Кэш L3, МиБ 16 16
Оперативная память 2×DDR4-2667 2×DDR4-2667
TDP, Вт 95 95
Количество линий PCIe 3.0 20 20
Цена T-1723154074 T-1720383938

С конкурентами из ассортимента AMD тоже все просто: Threadripper нам не нужен, поскольку уже убедились в том, что и 1920Х (не самый быстрый в семействе) вполне соответствует и старшему на данный момент Core i9-7900X. Впрочем, у него и ядер больше, при этом моделей с 10-ю у AMD нет и не предвидится в скором будущем (понятно почему), а 6 и 8 доступны и в рамках массовой и недорогой платформы АМ4. Формально несколько ограниченной по периферийной составляющей, но... Вспоминаем про 28 линий PCIe 3.0 Core i7-7800X/7820X: на пару видеокарт по схеме х16+х16 этого не хватит, а одну плюс NVMe-накопитель (что будет наиболее массовым вариантом) «тянет» и обычный Ryzen. В общем, если и не совсем паритет, то близко к тому с точки зрения обычного пользователя. А для сугубых эстетов, напомним, в скором времени AMD обещает начать отгрузки «бюджетного» Ryzen Threadripper 1900Х, который по производительности будет практически полным аналогом Ryzen 7 1800X, так что в отдельном тестировании не слишком нуждается (да и нет его у нас пока на руках), но с точки зрения подключения памяти и периферии идентичен старшим моделям для TR4.

Объем памяти только у разных систем немного разный, поскольку мы устанавливаем 8 ГБ на канал, а количество каналов у платформ разное. Однако проведенные на данный момент внутренние экспресс-тесты показали, что для Ryzen 7 1800X и задач из тестового набора суммарные 16 ГБ вполне достаточны, так что необходимости в смене концепции нет. Впрочем, работа этих процессоров с памятью, а также ее влияние на другие компоненты системы — отдельный вопрос, до которого мы надеемся (наконец-то!) подробно «докопаться» в ближайшее время. Пока лишь отметим, что для процессоров под АМ4 мы (как и в предыдущих тестированиях) используем DDR4-2933, что немного выше штатного значения, но проблем не составляет. Для процессоров Intel — штатные частоты памяти. Что для них, в общем-то, большого значения не имеет — при желании увеличить производительность, разгонять надо в первую очередь не память и даже не ядра (тем более, как видим, в решениях под LGA2066 Intel и без того частоты ядер заметно подняла), а шины и кэш.

Методика тестирования

Методика . Здесь же вкратце напомним, что базируется она на следующих четырех китах:

  • Методика измерения энергопотребления при тестировании процессоров
  • Методика мониторинга мощности, температуры и загрузки процессора в процессе тестирования
  • Методика измерения производительности в играх образца 2017 года

Подробные результаты всех тестов доступны в виде полной таблицы с результатами (в формате Microsoft Excel 97—2003) . Непосредственно же в статьях мы используем уже обработанные данные. В особенности это относится к тестам приложений, где все нормируется относительно референсной системы (AMD FX-8350 с 16 ГБ памяти, видеокартой GeForce GTX 1070 и SSD Corsair Force LE 960 ГБ) и группируется по сферам применения компьютера.

iXBT Application Benchmark 2017

Задача хорошо масштабируется путем разбиения на небольшие независимые фрагменты, что хорошо «ложится» как на Ryzen, так и на новые Core X-Series. Впрочем, для LGA2011-3 прирост производительности при переходе от шести ядер к восьми тоже квазилинейный, а вот от восьми до десяти — намного меньший, чем можно было ожидать. Вполне возможно, что это как раз связано со снижением эффективности работы кольцевой шины при увеличении количества ядер (напомним, что де-факто в Intel ограничили их количество в кластере 12-ю, что не на много больше 10). Зато Skylake-X масштабируются отлично «по всему фронту» - в результате чего уже Core i7-7820X обгоняет былого флагмана компании. Да и Core i7-7800X может сделать это же, но с предыдущим лидером для 2011-3. Тоже немало. Это делает оба упомянутых процессора самыми быстрыми при сравнении «ядро к ядру»: Ryzen немного превосходил Broadwell-E, но не Skylake-X.

Аналогичные по логике работы приложения, так что и распределение результатов тоже аналогичное. Фактически не будь у AMD такого «туза в рукаве», как Ryzen Threadripper, LGA2066 с т. з. производительности могла бы считаться очень успешной платформой (цены и энергопотребление — вопросы отдельные и к ним мы вернемся позднее). Однако история, как известно, не терпит сослагательного наклонения.

В принципе, радикально ничего не изменилось — просто в этих программах степень утилизации многоядерности вообще оставляет желать лучшего, так что на роль метода для увеличения производительности она подходит слабо. Но подходит. Но выглядит все, конечно, куда менее впечатляюще, хотя и явным провалом не является.

Вот с обработкой фотографий — скорее всего, он. Восемь ядер еще «переварить» можно, хотя в паре «новых» платформ и переход с шести до восьми уже крайне невелик. Дальше можно и не дергаться. LGA2066 со своими самыми эффективными (без шуток) ядрами выглядит, конечно, победителем в таких условиях. Хотя понятно, что, сравнительно с массовыми решениями, прирост производительности явно непропорционален увеличению затрат.

Распознавание текста тоже хорошо разбивается на независимые задачи, что позволяет утилизировать практически все возможности современных процессоров (правда это, к сожалению, и по их энергопотреблению хорошо заметно, но об этом позже). Результат, правда, не столь впечатляющий, как в видеокодировании или рендеринге (в частности Core i7-7800X все же отстает от Core i7-5960X), но очень хороший. Впрочем, как мы уже знаем , это все равно не позволяет Core i9-7900X считаться «царем горы» (поскольку против лома нет приема , а этот самый «лом» в виде большого количества ядер в нужный момент времени оказался в руках AMD), но при паритете по ядрам процессоры для LGA2066 в очередной раз выигрывают. А для 2011-3 — вообще проигрывали.

Небольшая разница в производительности между Core i7-6900K и i7-6950X связана с тем, что уровень производительности обоих этих процессоров оказался достаточным, чтобы уже немного начал влиять и накопитель. Это хорошо заметно, если сравнить результаты выполнения обоих подтестов WinRAR (напомним, что второй мы вводили специально для тестов дисковой подсисстемы) — они уже достаточно близки, чего на массовых процессорах (и не только ультрабучных) даже в помине нет.

Но новых Skylake-X «былая роскошь» тоже никак не касается: они в этом тесте намного медленнее. Производительность с увеличением количества ядер растет, но очень медленно — очевидно, что «узкое место» где-то в «другом месте». И мы его уже знаем — в этих процессорах кэш L3, как уже было сказано, стал работать медленнее, да еще и не может считаться средством быстрого обмена данными между ядрами. Если сравнить производительность с процессорами семейства AMD Ryzen, то там, в общем-то, аналогичные проблемы в виде двухсегментного L3 присутствуют и итоговая производительность тоже существенно ниже, чем могла бы быть.

Можно ли обойти проблему оптимизациями программного обеспечения? Разумеется, можно. Но это нужно делать специально — и для Ryzen, и для Skylake-X тоже. А ведь ранее, как уже было сказано, на протяжении многих лет единая кольцевая шина и быстрый L3 были неотъемлемым компонентом всех процессоров Intel всех сегментов — начиная от Celeron (за исключением «атомного» семейства) и заканчивая HEDT-процессорами. Теперь последние превратились в нечто отдельное — плюс добавились альтернативные разработки, тоже претендующие на высокую производительность. И это обязательно нужно учитывать.

Ну а в этих программах — в общем-то, необязательно. Впрочем, хорошо видно и то, что в них вообще масштабируемость относительно невысокая — высокий темп прироста производительности наблюдается лишь до восьми ядер Intel, а у процессоров AMD и вовсе до шести. Но последние тут и от Broadwell-E отставали, да и Skylake-X это семейство при прочих равных не то, чтоб сильно превосходят (в отличие от некоторых примеров выше, где новые шестиядерники могут тягаться и со старыми восьмиядерниками).

В принципе, сводный результат производительности к новой платформе Intel скорее благосклонен, чем нет. Новые процессоры стали быстрее старых, да и при сравнении с продуктами AMD уже паритета в ситуации «ядро к ядру» не наблюдается. Масштабируемость в линейке тоже улучшилась, что особенно важно в ожидании выхода в свет моделей с 12+ ядрами. Словом, с производительность все неплохо. Она ниже, конечно, чем у Ryzen Threadripper, но лишь до тех пор, пока последние имеют фору в количестве ядер — с «качеством»-то у Intel все лучше. Но это только если ограничиться производительностью.

Энергопотребление и энергоэффективность

Intel часто ругали за небольшое увеличение производительности процессоров от поколения к поколению, забывая при этом о том, что параллельно компании удавалось и снижать энергопотребление своих изделий. В рамках тренда на всеобщую мобилизацию, второе было как раз более актуальным — иначе бы компактных ноутбуков на четырехъядерных процессорах, способных часами работать в автономном режиме, мы бы не увидели, равно как и тонких моноблоков с «настольными» процессорами внутри. Да и в серверных платформах энергопотребление давно уже является главным сдерживающим фактором, так что там тоже приходилось работать над ним очень плотно. И мы уже отмечали ранее, что успехи AMD несколько скромнее — даже при последнем «большом рывке» по сути удалось достичь лишь уровня Haswell-E. Потом еще и выяснилось, что на Ryzen 7 1800X кристаллы явно отбираются специально — более дешевый процессор этого семейства с индексом 1700Х не только работает медленнее, но и «жрет» больше. Но в этом нет ничего особенного — с процессорами Intel та же история. Из-за чего, собственно, энергопотребление i7-6950X и i7-6800K различалось на какие-то 10%, а вовсе не в полтора раза, как можно было предположить по числу ядер.

Но сравнение единиц Ватт разницы потеряло всякий смысл после выхода Skylake-X — потребление энергии ими резко увеличилось. Особенно если обратить внимание на чисто «процессорную» линию +12 В: i9-7900X первый попавший к нам в руки процессор, который и по ней в некоторых тестах «прокачивал» 200 Вт. Младшие модели более «экологичны», но все равно — в среднем шестиядерный i7-7800X, потребляет больше, чем восьмиядерный Ryzen 7 1800X или десятиядерный i7-6950X на максимуме.

В итоге имеем резкое падение энергоэффективности — даже ниже уровня Haswell-E, до которого, напомним, AMD подрасти удалось. Новая платформа Intel же отступила куда-то на рубежи старых Ivy Bridge-E. Понятно, что над решением этой проблемы компания будет работать, да и новые Skylake-X с большим количеством ядер скорее всего удастся «уложить» в те же рамки, что и имеющиеся при увеличении производительности, но факт остается фактом: новая платформа «очень горячая» в прямом смысле этого слова. Вполне возможно, что виновата в этом как раз новая архитектура межъядерных связей — которая будет эффективной (сравнительно со старыми) при большом их количестве, но вот для младших моделей радости от этого мало. Для них это шаг назад. И очень большой.

iXBT Game Benchmark 2017

В данном случае (как и в предыдущем тестировании) результаты игровых приложений мы дадим «одной строкой» и без подробных комментариев: понятно, что HEDT-платформы игровыми решениями считать сложно — как бы AMD и Intel не стремились убедить в обратном. Не потому, что они не подходят для игр — просто избыточны. Где-то даже могут и проиграть «обычным» настольным решениям, но лишь тогда, когда производительность не ограничена видеокартой — что в современных игровых проектах обычно редкость. Да и не в современных тоже с поправкой на время выпуска соответствующих видеокарт, т. е. не тогда, когда мы запускаем игру пятилетней давности на современном топе. Впрочем, мы в основной линейке тестов используем и «не топ» изначально, а карту уровня чуть выше среднего. И на практике это более массовый случай, разумеется, чем самые дорогие видеоускорители или несколько таких, однако ничего удивительного, что тут основные вопросы «хватит-не хватит» возникают у покупателей процессоров за сто долларов (или старых за 200, что в принципе сопоставимо), а не новейших многоядерных решений.









В принципе, все как и ожидалось. Хотя если докапываться до запятых , можно сказать, что кое-где процессоры для новой платформы отстают от старой. Однако в этом тоже нет ничего удивительного — в таких условиях если что и сказывается пока на результатах, так это емкость и скорость работы кэш-памяти, а в этом плане Skylake-X похвастаться особо нечем.

Итого

Если бы процессоры под LGA2066 появлялись «в нормальных условиях», но такими же, как сейчас, им бы наверняка простили и выросшее энергопотребление: все-таки производительность увеличилась, цены упали, рост количества ядер на горизонте замаячил... А что не все характеристики стали лучше — так на этапе внедрения технических нововведений часто возникают определенные шероховатости. В конце концов, если вспомнить историю, то, например, к LGA1366 серьезных претензий не было — разве что брюзжание части потенциальных (а не реальных) покупателей, но не более того. Дело в том, что альтернативы новой платформе Intel тогда, в общем-то, практически не было. Вот процессоры под LGA1156 были встречены чуть более прохладно, поскольку на рынке уже присутствовала LGA1366 по сравнимым ценам и с несколько более широкими перспективами. Ну а с момента выхода Sandy Bridge в разных своих ипостасях конкуренция как таковая в сегменте высокой производительности стала внутрифирменной и легко предсказуемой. Благо все процессоры начали использовать сходные архитектурные принципы, плавно эволюционируя от поколения к поколению.

Теперь же альтернативные решения есть. И речь не только о Ryzen Threadripper, который спустя считанные месяцы после анонса LGA2066 занял место самого производительного решения на рынке, — альтернативой могут считаться и в некоторой степени претендующие на массовый рынок Ryzen под АМ4. Правда, в прямом сравнении при равном количестве ядер преимущество в производительности опять за Intel, но «альтернативное решение» не обязательно должно быть лучше или хуже по всем параметрам — главное, что оно альтернативное и оно есть . Принцип «зато дешевле» вполне работоспособен и сам по себе, а тут к нему добавляется «и экономичнее» . Собственно говоря, даже если бы в AMD специально выбирали момент выпуска Ryzen на рынок, сложно было бы сделать это удачнее. В прошлом году Intel могла прибегнуть к ценовой коррекции Broadwell-E, да и Kaby Lake (а следовательно, и Kaby Lake-X) оказались бы немного не такими, как вышло. Но когда с основными характеристиками платформ всё уже определено, что-либо серьезно «переиграть» сложно. Остается только импровизировать, чем в Intel ныне активно и занялись, заодно решив пустить в ход некоторые «домашние заготовки», типа шестиядерных модификаций настольных процессоров (напомним, что изначально их многие ожидали еще в рамках «обычных» Skylake два года назад). К чему это со временем приведет — только время и покажет.

Мы же на этом пока откладываем в сторону столь интересные многим теоретически HEDT-платформы и примкнувшие к ним топовые процессоры. В следующем материале займемся более приземленными материями, скучными с точки зрения технологий и не поражающими воображение ценой или энергопотреблением, зато более доступными любому покупателю и продающимися массовыми тиражами.

Если вы всерьез задумались о сборке высокопроизводительного ПК, который подойдет для любых ресурсоемких задач и оверклокинга, выбор процессора так или иначе падет современные многоядерные чипы Intel с архитектурой Skylake-X и Kaby Lake-X. И здесь стоит обратить внимание на то, что платы, обладающие процессорным гнездом , не подойдут для установки данных CPU.

Процессоры Skylake-X и Kaby Lake-X выпускаются в новом исполнении LGA 2066 и требуют соответствующей материнской платы. Стоимость последних далеко не самая бюджетная. Мы выбрали 12 самых доступных по цене моделей (их вы найдете в таблице снизу), которые занимают ценовой отрезок от 13 000 до 19 000 рублей. За пределами психологической отметки в 20 000 рублей начинаются более крутые, но вместе с тем и более дорогие, решения, покупка которых не всегда оправдана.

3 лучших по цене материнских платы LGA 2066

Выбор материнских плат с сокетом LGA 2066 не шибко большой. На момент написания статьи в продаже доступно около 40 моделей. Но и этого достаточно, чтобы потеряться в выборе. Самый большой минус таких плат — они ощутимо дорогие. В первой пятерке мы разместили устройства стоимостью до 15 000 рублей: пока это самые доступные варианты для приобретения.

Первое место: Gigabyte X299 AORUS Gaming (rev. 1.0)

Продукция компании Gigabyte покрывает все ценовые категории. Неудивительно, что в обойме у производителя оказалась и самая доступная по цене материнская плата. Игровую модель можно приобрести по минимальной цене в 12 500 рублей, но такие предложения в интернет-магазинах единичны.

Gigabyte X299 AORUS Gaming построена на базе чипсета Intel X299 и совместима только с 4-ядерными процессорами и Intel Core i7-7640X. Несмотря на досадное ограничение в выборе CPU, 4-ядерной модели вполне хватит для погружения в VR-миры. К тому же сама плата хорошо нафарширована: на борту доступно 4 разъема для установки оперативной памяти DDR4 (всего 64 Гбайт), возможна установка до 3 видеокарт в режиме SLI/CrossFireX, есть поддержка технологии Intel Optane Memory, а аудиоподсистема реализована на базе чипа Realtek ALC1220, что позволяет подключать акустику стандарта 7.1.

Разъемы для подключения дополнительного охлаждения и возможность управления вращением лопастей кулеров через специализированное ПО позволят создать в системном блоке оптимальный отвод горячего воздуха для эффективного охлаждения компонентов. А шесть термодатчиков на плате своевременно предупредят об опасности перегрева.

По части подключения накопителей отметим наличие у Gigabyte X299 AORUS Gaming двух разъемов M.2 для подключения твердотельных решений стандарта NVMe, а также 8 портов SATA (6 Гбит/с). Для правильной установки внутренних хранилищ настоятельно рекомендуем ознакомиться с руководством пользователя, которое идет в комплекте с платой. Внешние накопители и устройства можно подключить к плате, задействовав 10 портов USB 3.1 Gen 1 и 4 порта USB 2.0.

Фирменная подсветка RGB Fusion, которой можно управлять через мобильное приложение, легко превратит системный блок в яркий геймерский куб. А еще к Gigabyte X299 AORUS Gaming можно подключить дополнительные светодиодные ленты, что, впрочем, уже стало мейнстримом для современных материнских плат. Возможности для моддинга по сути безграничны.

Модель: Gigabyte X299 AORUS Gaming
Средняя розничная цена:
13 500 рублей

Второе место: MSI X299 RAIDER

Материнская плата относится к классу профессиональных решений. Отточенная система охлаждения позволяет независимо управлять всеми вентиляторами, подключать СВО и, в целом, моделировать систему теплоотвода по собственному вкусу. Как и более доступная модель от Gigabyte, MSI предлагает поддержку современных высокоскоростных накопителей формата M.2 (до 2 устройств) и U.2, а также поддержку модулей Intel Optane Memory.

А вот слотов для установки оперативной памяти здесь в два раза больше: 8 планок DDR4 с суммарной емкостью до 128 Гбайт позволяет установить данная материнская плата. Работать они могут как в двухканальном, так и в четырехканальном режиме, с максимальной частотой до 4500 МГц. К тому же данная плата не ограничивает пользователя в выборе процессоров из серии Intel Core X.

Установив в материнскую плату две видеокарты в режиме Hybrid SLI, конечный пользователь получит не только максимальную производительность в ресурсоемких приложениях и играх, но и пониженное энергопотребление в простое или при выполнении несложных операций в двухмерных программах. Если быть точнее — в рамках концепции Hybrid SLI дискретная графика может отключаться, перекидывая нагрузку на встроенное графическое ядро CPU.

Здешняя аудиоподсистема также основана на базе многоканального кодека Realtek ALC1220, благодаря которому к плате можно подключить акустику формата 7.1 и наслаждаться объемным звуком при воспроизведении музыкальных треков, просмотра кинофильмов или во время погружения в миры видеоигр.

Для подключения внешних устройств на предусмотрено 8 портов USB 3.1 Gen1, 5 портов USB 2.0, 2 интерфейса USB 3.1 Gen2 и один USB 3.1 Gen2 Type-C. Кому этого покажется мало — тот может подключить к материнской плате выносной USB-хаб еще на три разъема 2.0. А если учесть, что данная плата всего на 1000 рублей дороже варианта от Gigabyte, — логичнее приобретать именно ее. По соотношению цена/оснащение эта модель определенно выбивается в лидеры.

Модель:
Средняя розничная цена:
14 500 рублей

Третье место: ASRock X299 Extreme4

Одиннадцатифазная подсистема питания материнской платы с двухкристалльными транзисторами обеспечивает стабильную подачу тока на процессор, что делает ее хорошей платформой для экспериментов с разгоном компонентов. Высококачественное исполнение коннекторов и системы пассивного теплоотвода также положительно сказывается на работе с серьезными нагрузками. По цене плата идентична устройству от MSI, но есть отличия в оснащении, которые играют не в пользу данного продукта.

Например, на плате не предусмотрен разъем U.2. Для подключения высокоскоростных твердотельных накопителей можно использовать только 2 разъема M.2. А в отношении оперативной памяти максимальная рабочая частота планок DDR4 составляет 4200 4200 МГц. Суммарная емкость при этом идентична конкуренту — 128 Гбайт. Этого более чем достаточно для реализации любых амбициозных проектов.

Количество слотов PCI-E X16 здесь тоже меньше: их всего 3, тогда как у конкурента на один больше. Не добирает плата и в отношении количества USB-портов. Таким образом, при учете одинаковой цены плата от MSI все-таки выигрывает у в оснащении.

Как и в случае с платой от Gigabyte, поклонники компьютерного моддинга вкупе с платой получат LED-подсветку, которая также управляется через мобильное приложение. А сама плата позволяет подключать к себе декоративные светодиодные ленты для украшения внутреннего убранства системного блока.

Приятно, что в комплекте с материнской платой идет SLI-мостик для объединения двух видеокарт NVIDIA GeForce GTX серий 1080 и 1070. А вот Wi-Fi-модуль в комплектацию, увы, не входит, хотя поддержка подключения к беспроводным сетям стандарта «ac» через разъем M.2 (Key E) здесь предусмотрена.

Модель:
Средняя розничная цена:
14 500 рублей

Топ-12 доступных материнских плат с разъемом LGA 2066 (до 20 000 рублей)

1 13 500 руб.
2 14 500 руб.
3 14 500 руб.
4 Gigabyte X299 UD4 (rev. 1.0) 15 300 руб.
5 Gigabyte X299 UD4 Pro (rev. 1.0) 15 800 руб.
6 MSI X299 SLI PLUS 16 000 руб.
7 ASRock X299 Killer SLI/ac 16 000 руб.
8 ASUS TUF X299 MARK 2 16 500 руб.
9 MSI X299 TOMAHAWK 17 000 руб.
10 MSI X299 Tomahawk Arctic 17 800 руб.
11 ASUS Prime X299-A 18 300 руб.
12 Gigabyte X299 AORUS Gaming 3 (rev. 1.0) 18 600 руб.

Унификация почти всегда является благом, в том числе и для производителей аппаратного обеспечения. Например, наличие двух процессорных разъёмов, LGA 2011-3 и LGA 1151, вынуждает Intel затрачивать ресурсы на поддержание двух платформ, не считая экзотических серверных разъёмов, таких как LGA 3647. Вывод на рынок платформы LGA 2066 должен упростить задачу, поскольку под этот разъём, как мы знаем, уже намечен выпуск как процессоров класса HEDT (Skylake-X), так и массовых чипов (Kaby Lake-X). Никаких проблем с технической точки зрения это не несёт, просто при установке в такую плату Kaby Lake-X будет работать только половина разъёмов DIMM (два канала DDR4 против четырёх) и не все слоты PCI Express (у Kaby Lake-X меньше линий встроенного контроллера PCIe — 16 против 44 у Skylake-X).

Изначально планировалось, что платформа LGA 2066, она же Basin Falls по классификации Intel, будет представлена в августе на выставке Gamescom, но Intel, вероятно встревоженная успехом AMD Ryzen (AM4), решила форсировать вывод новой платформы на рынок. По сообщениям таких источников, как Benchlife , анонс Basin Falls может состояться уже в июне на выставке Computex 2017. Она пройдет с 31 мая по 3 июня, так что ждать осталось не слишком-то долго. Основой новой платформы Intel станет системный контроллер (PCH) X299 с достаточно широкими возможностями, хотя с процессором он по-прежнему будет связан интерфейсом DMI 3.0 (PCIe 3.0 x4). Этот чип предложит пользователю до 10 портов USB 3.0, до 8 портов SATA 6 Гбит/с и до 24 линий PCIe 3.0 для подключения различной периферии (хотя, разумеется, узким местом всё равно будет интерфейс DMI).

По имеющимся данным, массовое производство процессоров Skylake-X начнётся на 25-й неделе этого года (19‒25 июня), тогда же стартует и производство Kaby Lake-X, а чипсет X299 пойдёт в производство ещё раньше, начиная с 24-й недели. Квалификационные образцы процессоров (маркировка QS) появятся ещё раньше, в районе с 29 мая по 4 июня. Именно на этом основываются прогнозы наших коллег с ресурса Benchlife и, на наш взгляд, они выглядят вполне обоснованно. Серия процессоров класса HEDT будет включать в себя как минимум четыре модели с различными характеристиками и количеством активных ядер от 6 до 10 (но во всех случаях будет использоваться кристалл типа LCC — Low Core Count). А вот Kaby Lake-X по-прежнему будут ограничены четырьмя ядрами. Теплопакеты Skylake-X будут равны 140 ваттам, у Kaby Lake-X эта цифра будет скромнее — 112 ватт. Забавно, что вся серия получит наименование из пула Core i7-7000, что может вызвать определённую путаницу, особенно среди не очень опытных покупателей. Там же, на Computex 2017, мы, скорее всего, увидим и плеяду системных плат с разъёмом LGA 2066.