Видеокартой GeForce GTX 1060 компания NVIDIA открыла широкий доступ к новой микроархитектуре Pascal и новому 16-нм техпроцессу. Если до выхода данной модели указанные атрибуты были доступны лишь видеокартам топового сегмента, таким как и , то теперь и массовый рынок может испытать все преимущества новых технологий от NVIDIA.

Архитектура Pascal и новый техпроцесс принес возможность значительного повышения тактовых частот GPU. В режиме графический процессор может достигать частоты в 1,8 ГГц. Вкупе с улучшенным алгоритмом сжатия текстур, это позволяет выйти видеокартам на совершенно новый уровень производительности. При этом потребление энергии снизилось благодаря применению FinFET–транзисторов.

Компания NVIDIA представила GeForce GTX 1060 в двух модификациях. Их отличия заключаются в количестве универсальных процессоров и объёме видеопамяти. Так первый вариант имеет 1280 ядер CUDA и 6 ГБ видеопамяти, а второй 1152 ядер CUDA и память 3 ГБ. Также имеется разница в количестве текстурных блоков — 80 и 72 соответственно. В остальных параметрах эти модели идентичны, в том числе и в потребляемой мощности. На практике разница в производительности этих двух модификаций составляет примерно 7-9 процентов. Соответственно и цена на версию с 3 гигабайтами будет ниже. Рассмотрим технические характеристики новинки в сравнении с предшественницей .

Минимальные системные требования по питанию для GeForce GTX 1060 составляют 400 Вт. видеокарты находится на отметке 94 °С.

Рассматриваемый графический ускоритель поддерживает технологии Multi-Projection, VR Ready, NVIDIA Ansel, NVIDIA SLI Ready, NVIDIA G-SYNC, NVIDIA GameStream, Microsoft DirectX 12 API, Vulkan API, OpenGL 4.5.

Тестирование GeForce GTX 1060 (6 GB) в играх* (среднее количество FPS)

Игры/Настройки Ультра 1920х1080 px Ультра 2560х1440 px Metro: Exodus 55 fps 34 fps FarCry New Dawn 65 fps 47 fps Battlefield 1 81 fps 62 fps Watch Dogs 2 44 fps 36 fps FarCry Primal 69 fps 44 fps DOOM 2016 87 fps 54 fps Fallout 4 70 fps 47 fps The Division 52 fps 37 fps GTA V 62 fps 48 fps The Witcher 3: Wild Hunt 52 fps 37 fps Battlefield 4 90 fps 58 fps

*Для тестирования использовалась следующая конфигурация стенда: процессор Intel Core i5-6600, материнская плата ASUS Maximus VIII Extreme, оперативная память G.Skill 16 Гб, SSD Plextor PX-256M6Pro, блок питания Corsair AX1500i, операционная система Windows 10 (64 Bit). Версия драйвера NVIDIA GeForce: 375.95 (Metro Exodus, FarCry ND — 419.17).

В игровых и производительность GeForce GTX 1060 с объемом видеопамяти 6 Гб значительно превосходит предшественницу , приближаясь к недавнему флагману . А модель с памятью 3 Гб, как отмечалось выше, уступает ей в среднем на 8%, и в производительности находится на уровне . Что касается цены, то на референсную модель с 6 Гб видеопамяти она составляет $299, однако официально в Россию референсные видеокарты поставляться не будут. Рынок должны наполнить партнерские модели со средней стоимостью от $249. На начало 2017 года средняя цена на GeForce GTX 1060 6 GB в интернет-магазинах России составляет 18500 рублей, а версия с 3-мя гигабайтами стоит в районе 15500 рублей. И за эти деньги мы получаем видеокарты с очень приличной производительностью. Как говорится, прогресс налицо.

До сих пор NVIDIA предлагала новую архитектуру Pascal с новым 16-нм техпроцессом только на high-end сегменте, с объявленной две недели назад GeForce GTX 1060 архитектура Pascal распространяется и на массовый рынок. Сегодня мы протестируем видеокарту GeForce GTX 1060 в эталонном дизайне Founders Edition.

Кроме Founders Edition на рынок выйдут модели партнеров NVIDIA с альтернативным дизайном PCB и/или системы охлаждения. Некоторые модели уже представлены, другие выйдут позднее. В ближайшие дни мы планируем опубликовать сводный обзор подобных видеокарт, как мы уже сделали с и . Но в момент объявления видеокарт мы публиковали тесты эталонных моделей и , что мы сделаем и сегодня.

Поскольку NVIDIA представила GeForce GTX 1060 еще несколько дней назад, сюрпризов по цене нет. Версия Founders Edition видеокарты GeForce GTX 1060 будет стоить от 319 евро, видеокарты с альтернативным дизайном появятся в продаже от 279 евро. В России видеокарты Founders Edition официально продаваться не будут, цена кастомных версий составит от 18.990 рублей. Будет интересно посмотреть, оправдает ли видеокарта свою цену. Но сначала технические подробности:

Обзор технических спецификаций NVIDIA GeForce GTX 1060 Founders Edition
Модель NVIDIA GeForce GTX 960 NVIDIA GeForce GTX 1060 Founders Edition AMD Radeon RX 480
Цена от 12,3 тыс. рублей
от 160 евро
319 евро от 18,9 тыс. рублей
от 270 евро
Сайт производителя NVIDIA NVIDIA AMD
Техническая информация
GPU Maxwell (GM206) Pascal (GP106) Polaris 10 XT
Техпроцесс 28 нм 16 нм 14 нм
Число транзисторов 2,94 млрд. 4,4 млрд. 5,7 млрд.
Тактовая частота GPU (базовая) 1.126 МГц 1.506 МГц 1.120 МГц
Тактовая частота GPU (Boost) 1.178 МГц 1.708 МГц 1.266 МГц
Частота памяти 1.750 МГц 2.000 МГц 2.000 МГц
Тип памяти GDDR5 GDDR5 GDDR5
Объём памяти 2 GB 6 GB 4/8 GB
Ширина шины памяти 128 бит 192 бит 256 бит
Пропускная способность памяти 112,2 Гбайт/c 192 Гбайт/c 256 Гбайт/c
Версия DirectX 12 12 12
Потоковые процессоры 1.024 1.280 2.304
Текстурные блоки 64 80 144
Конвейеры растровых операций (ROP) 32 48 32
Тепловой пакет 120 Вт 120 Вт 150 Вт (*1)
SLI/CrossFire SLI - CrossFire

(*1) - пакет 150 Вт у Radeon RX 480 соблюдается только в Compatibility Mode

GPU GP106 производится TSMC по 16-нм техпроцессу, как и все новые GPU NVIDIA. Число транзисторов составляет 4,4 млрд., так что GPU даже менее сложный, чем Polaris 10 XT в видеокарте Radeon RX 480. Площадь кристалла NVIDIA указывает на уровне 200 мм². Число потоковых процессоров составляет 1.280, они распределены по 10 потоковым мультипроцессорам (10 x 128). Последние, в свою очередь, организованы в два кластера Graphics Processing Clusters. На каждый Streaming Multiprocessor доступны восемь текстурных блоков, в сумме мы получаем 80. 48 конвейеров растровых операций (ROP) напрямую подключены к 32-битным контроллерам памяти. Шесть контроллеров памяти образуют 192-битную шину. У GPU GP104 в видеокартах GeForce GTX 1080 и GeForce GTX 1070 присутствует 2.048 кбайт кэша L2. Но у GPU GP106 в GeForce GTX 1060 мы получаем только 1.536 кбайт.


NVIDIA для GPU GeForce GTX 1060 указывает базовую частоту 1.506 МГц, в режиме GPU Boost мы получаем увеличение частоты, как минимум, до 1.708 МГц. 6 Гбайт памяти GDDR5 работают на 2.000 МГц. 192-битный интерфейс обеспечивает пропускную способность до 192 Гбайт/с. Энергопотребление по информации NVIDIA составляет всего 120 Вт, то есть на уровне GeForce GTX 960. Но по производительности GeForce GTX 1060 Founders Edition должна работать не хуже GeForce GTX 980. Свежий конкурент потребляет до 150 Вт, но только в .

Если вам интересны подробности архитектуры Pascal, мы рекомендуем обратиться к нашему , в котором мы рассмотрели детали Pascal, 16-нм техпроцесса FinFET и обсудили новые функции.


Скриншот GPU-Z подтверждает приведенную выше информацию NVIDIA GeForce GTX 1060 Founders Edition.

Как мы уже отмечали во многих тестах GPU, будь то AMD или NVIDIA, видеокарты показывают лучшие результаты в паре с альтернативными системами охлаждения, поскольку производительность зависит от частот и температур.

В отличие от GeForce GTX 1080 и GeForce GTX 1070 в вариантах Founders Edition, новая GeForce GTX 1060 Founders Edition не упирается в планку по максимальной температуре, в тестах она составляла 77-78 °C. Таким образом, ограничивающим фактором оказывается не температура, а напряжение. Это можно видеть и по частоте Boost 1.860 МГц, значительно выше заявленной NVIDIA планки 1.708 МГц. Ниже мы более внимательно рассмотрим производительность видеокарты.

В чём плюсы и минусы каждой? Ну и, конечно же, какую версию купить выгоднее?

Многие пользователи считают, что "трёшка” является неполноценной видеокартой и чуть ли не самой худшей моделью во всей линейке. Давайте разберемся, так ли это. Аргументация антагонистов сводится в основном к двум фактам. Первый это то, что 3 гига видеопамяти в настоящее время очень мало и нет никакого запаса на будущее. Второй это то, что GTX 1060 3gb была выпущена после GTX 1060 6gb и, мол, анонсировали сначала только вторую, а первая появилась чуть позже в качестве жалкой пародии.

Тему про количество видеопамяти предлагаю несколько отложить, так как впереди я вам подготовил большой абзац, который будет связан с производительностью. А вот второй аргумент я легко могу парировать. Важно понимать, что в любой крупной, ведущей компании в своей сфере работают очень умные люди, одни из лучших в своем деле. И если они выпускают, какую либо продукцию, то значит, на это есть определенные причины. Безусловно, некоторые продукты оказываются далеко не самыми удачными, но отрицать факт того, что у выпуска каждой модели видеокарты есть свои предпосылки – это глупо. И понять причины появления на свет GTX 1060 с 3 гигами очень просто. Для этого давайте обратим внимание на ценовую политику. Возьмем самые популярные модели последней линейки в среднем ценовом сегменте, а именно: GT 1030, GTX 1050, GTX 1050 Ti, GTX 1060 3gb, GTX 1060 6gb.

Цены мы будем рассматривать за начало второго квартала, ибо нынешние цены являются неадекватными в связи с майнинговым бумом.

Первая - GT 1030

Появилась она не так давно, поэтому цену возьмем нынешнюю, да и майнерам она не нужна из-за своей относительно низкой производительности.

Обойдется она нам примерно в 5 тысяч рублей.

Вторая - GTX 1050

На примере Mingying GTX1050Ti 4GB

На данный момент её можно было урвать такую карту за 12000 а то и меньше тысяч рублей.

Третья - GTX 1060 3G

На примере довольно популярная видеокарта MSI GTX1060 3G которую можно приобрести за 13000руб

Ну и наконец, Четвёртая - GTX 1060 6gb

На примере выделим такую ZOTAC GTX 1060 6G

Около 17 тысячи рублей и хочется отметить,что эта цена для этой видеокарты более чем приемлема.

Не трудно догадаться для чего я решил посмотреть на эти цены. Прослеживается очень четкая закономерность. Каждая последующая модель дороже предыдущей в среднем на 3-4 тысячи рублей. А теперь представим, что мы выкинули одно любое звено из этой цепочки. В таком случае разница между соседними картами будет составлять 7-8 тысяч рублей!

То есть появляется здоровенная такая пропасть, и предложение на рынке не будет соответствовать спросу. В случае если бы не было "трешки”, то, что покупать человеку, имеющему 15-16 тысяч рублей в кармане? Купить более дешевую модель? Или подкопить на более дорогую? Нет, в большинстве случаев такой человек пойдет смотреть цены у конкурентов, и подберет себе подходящую под бюджет модель. Да, это маркетинг, но не всегда маркетинг это плохо. В данном случае мы получили более широкий выбор в магазинах и это хорошо. В общем, зачем и почему появилась трех гиговая модель, мы разобрались. Теперь к вопросу о производительности и целесообразности к покупке.

Для начала предлагаю сравнить видеокарты, чтобы понять их различия.

Мы видим, что самое главное отличие это количество видеопамяти. Так же количество CUDA ядер, старшая модель имеет на 128 ядер больше, что в условиях таких цифр является не такой уж и большой разницей. +11%. В остальном же видеокарты абсолютно идентичны.

UserBenchmark говорит нам о том, что более сильная модель превосходит сестру всего лишь на 5%.

Я проведу небольшие математические расчеты, основываясь на количестве кадров в секунду в различных играх.

Составляем уравнение, в котором берем кадры в секунду, выдаваемые обеими видеокартами и ищем Х – производительность старшей версии относительно младшей в процентах. Результаты легких игр я не буду брать, так как в них разница в FPS минимальна, возьму сразу требовательные игры. В Fallout 4, GTX 1060 3gb выдала 66.2 кадра, а GTX 1060 6gb выдала 74 кадра в среднем.

Составляем уравнение и получаем следующее:

  • 66.2х=74*100
  • 66.2х=7400
  • Х=7400/66.2
  • Х=111.7

111.7 это производительность старшей версии в процентах (за 100% мы брали производительность младшей карты). То есть конкретно в этой игре 6-ти гигабайтная версия сильнее 4-х гиговой всего лишь на 11.7%. Разница в цене между видеокартами составляет, как вы помните, 3 тысячи рублей. Считаем, стоит ли переплачивать. 11.7% от 16000 рублей (цена "трешки”) это 1872 рубля (16000/100*11.7). А за такую производительность вы переплачиваете 3 тысячи рублей. Останавливаться на одной игре и делать выводы я, конечно же, не буду. Давайте произведем расчеты еще для пары игр для наглядности.

Возьмем Battlefield 4. 1060 3gb выдала 89.6 кадров, 1060 6gb выдала 97.8 кадров в среднем. По аналогии составляем уравнение. Получаем:

  • 89.6х=97.8*100
  • 89.6х=9780
  • X=9780/89.6
  • Х=109.1
  • 109.1-100=9.1%. Всего лишь на 9.1% старшая версия мощнее, если опираться на кадры в секунду. 9.1% от 16000 это 1456. Разница еще больше. Ну и последняя требовательная игра на основе которой я проведу расчет это The Witcher 3: Wild Hunt.
  • 50.3 кадра у младшей против 56.2 кадра у старшей.
  • 50.3х=56.2*100
  • 50.3х=5620
  • Х=5620/50.3
  • Х=11.7

Хах, результат такой же, как в случае с Fallout 4. Тут даже считать ничего не нужно, цифры точно такие же.

Ну а теперь давайте перейдем к моим выводам и рассуждениям. По поводу производительности вывод очевиден. Да, шести гиговая версия смотрится получше и является немного мощнее, но с точки зрения целесообразности к покупке, младшая версия предпочтительней. Я наглядно это продемонстрировал своими незамысловатыми вычислениями. Брал я специально такие игры, которые являются требовательными к видеопамяти и съедают 5-7 гигов на максимальных настройках (Fallout 4, The Witcher 3, Battlefield 4). Но как же так получается, что при таком большом потреблении памяти "трешка” держится на уровне с "шестеркой”?

Все дело в том, что по своей сути это одна и та же видеокарта, одно и то же графическое ядро, только различается объем видеопамяти. Но видеопамять это не самая главная характеристика для видеокарты, куда важнее частота и количество CUDA ядер. На мой взгляд, 6 гигабайт видеопамяти для такого графического процессора это избыток. В играх, в которых проседает "четвёрка”, проседает и "шестерка” вместе с ней, потому что неважно, сколько у тебя видеопамяти, если производительность уперлась в максимум, выдаваемый кристаллом, а кристалл у этих видеокарт идентичный. Безусловно, есть такие игры, в которых разница довольно большая по производительности, но такие игры скорее исключение из правил, нежели норма. В общем, на мой взгляд, GTX 1060 3gb получилась более удачной версией своей старшей сестры, и именно поэтому я взял ее себе и рекомендую ее к покупке и вам.

Огромная просьба к владельцам шести гиговой версии не разводить бугурт в комментариях, я готов только к конструктивной критике и аргументам. На этом я с вами прощаюсь, до скорых встреч!

Nvidia GeForce GTX 1060 6 ГБ 192-битной GDDR5 PCI-E
Параметр Значение Номинальное значение (референс)
GPU GeForce GTX 1060 (GP106) (P/N 900-1G410-2530-000 G2)
Интерфейс PCI Express x16
Частота работы GPU (ROPs), МГц 1507—1860 1507—1860
Частота работы памяти (физическая (эффективная)), МГц 2000 (8000) 2000 (8000)
Ширина шины обмена с памятью, бит 192
Число вычислительных блоков в GPU 10
Число операций (ALU) в блоке 128
Суммарное количество блоков ALU 1280
Число блоков текстурирования (BLF/TLF/ANIS) 80
Число блоков растеризации (ROP) 48
Размеры, мм 270×100×35 270×100×35
Количество слотов в системном блоке, занимаемые видеокартой 2 2
Цвет текстолита черный черный
Энергопотребление Пиковое в 3D, Вт 117 117
В режиме 2D, Вт 28 28
В режиме «сна», Вт 11 11
Уровень шума В режиме 2D, дБА 20,0 20,0
В режиме 2D (просмотр видео), дБА 20,0 20,0
В режиме максимального 3D, дБА 26,5 26,5
Выходные гнезда 1×DVI (Dual-Link/HDMI), 1×HDMI 2.0b, 3×DisplayPort 1.2/1.3/1.4
Поддержка многопроцессорной работы Нет
Максимальное количество приемников/мониторов для одновременного вывода изображения 4 4
Дополнительное питание: количество 8-контактных разъемов Нет Нет
Дополнительное питание: количество 6-контактных разъемов 1 1
Максимальное разрешение 2D Display Port 4096×2160
HDMI 4096×2160
Dual-Link DVI 2560×1600
Single-Link DVI 1920×1200
Максимальное разрешение 3D Display Port 4096×2160
HDMI 4096×2160
Dual-Link DVI 2560×1600
Single-Link DVI 1920×1200

Комплектация локальной памятью

Карта имеет 6 ГБ памяти GDDR5 SDRAM, размещенной в 6 микросхемах по 8 Гбит на лицевой стороне PCB.

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010) . Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры DetailTessellation11 и PNTriangles11 (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia — Realistic Water Terrain , также известная как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • GeForce GTX 1060 GTX 1060 )
  • GeForce GTX 1080 со стандартными параметрами (сокращенно GTX 1080 )
  • GeForce GTX 960 со стандартными параметрами (сокращенно GTX 960 )
  • Radeon RX 480 со стандартными параметрами (сокращенно RX 480 )
  • Radeon R9 390X со стандартными параметрами (сокращенно R9 390X )

Для анализа производительности новой модели видеокарты GeForce GTX 1060 мы выбрали несколько решений от обоих производителей GPU. GeForce GTX 960 является прямым предшественником новинки, основанном на примерно аналогичном по позиционированию и площади графическом процессоре из предыдущего поколения Maxwell. Видеокарта GeForce GTX 1080 взята как топовое решение нынешнего поколения с максимальной производительностью, основанное на чипе GP104 — сравнение с ним покажет, насколько медленнее теоретически вдвое урезанная GTX 1060.

Из видеокарт конкурирующей компании AMD для нашего сравнения мы выбрали две видеокарты разных поколений. Чисто технически, по сложности и площади GPU, реальным соперником для GeForce GTX 1060 от AMD является новая одночиповая видеокарта модели Radeon RX 480, но она стоит дешевле рассматриваемой калифорнийской новинки. Поэтому мы взяли еще и Radeon R9 390X, основанную на старом графическом процессоре Hawaii, до сих пор продающемся на рынке и составляющем неплохую конкуренцию многим новым решениям в синтетических тестах.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

От устаревших DirectX 9 тестов мы отказались, а во вторую версию RightMark3D вошли два ранее знакомых теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Эти тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в данном тесте зависит от количества и эффективности блоков TMU, влияет на результат также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются несколько ниже, чем при детализации «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, компания AMD лидирует еще со времени выпуска первых видеочипов на базе архитектуры GCN. Именно платы Radeon и по сей день являются лучшими в этих сравнениях, что говорит о большей эффективности выполнения ими этих программ, особенно это касается GPU предыдущего поколения. Вывод подтверждается и сегодняшним сравнением — рассматриваемая нами новая видеокарта Nvidia проиграла обоим решениям конкурента, включая Radeon R9 390X на устаревшем графическом процессоре. Впрочем, сравнение с RX 480 не столь плачевное, как это было раньше, ведь новинка проиграла лишь 15-16%.

В нашем первом Direct3D 10 тесте новая видеоплата модели GeForce GTX 1060 показала производительность в 66-69% от скорости топовой модели текущего поколения, и серьезно обошла своего предшественника на основе чипа GM206. В целом, это можно считать неплохим результатом. Посмотрим на этот же тест, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации что-то должно измениться, и ПСП с филлрейтом будут влиять меньше:

В усложненных условиях результаты теста уже интереснее. Новая видеокарта модели GeForce GTX 1060 в этот раз опережает аналогичную по позиционированию модель из прошлого поколения GTX 960 почти вдвое. А вот от топовой GTX 1080 она отстала чуть больше — уступив уже до 42%, что соответствует теории. Неудивительно, что новинка отстала от конкурентов в виде Radeon RX 480 и R9 390X, но отставание оказалось примерно таким же.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».

Диаграмма в целом схожа с предыдущей, если рассматривать вариант без включения суперсэмплинга, и в этот раз новая модель видеокарты GeForce GTX 1060 снова оказалась заметно быстрее своей прямой предшественницы GTX 960, и снова показала скорость 65-66% от скорости топовой модели на графическом процессоре GP104, что близко к теории. Если же рассматривать сравнение с видеокартами AMD, то и в этом случае новинка уступает обеим платам Radeon, но если брать RX 480, то разница между ними — все те же 15-16%. Посмотрим, что изменит включение суперсэмплинга:

При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

А нашем сегодняшнем сравнении такие условия почти не изменили соотношение сил, если не смотреть на топовую видеокарту Nvidia. Графические решения AMD Radeon в этом D3D10-тесте пиксельных шейдеров работают эффективнее конкурирующих плат GeForce, хотя новая модель GeForce GTX 1060, основанная на втором чипе архитектуры Pascal, смогла подобраться ближе к уровню Radeon RX 480. Хотя устаревшее решение конкурента оказалось еще быстрее их, а GTX 1080 стала явным лидером. По сравнению с решениями Nvidia, новинка показала скорость на 40-45% медленнее GeForce GTX 1080 и обогнала GTX 960 более чем в полтора раза.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП. В случае нашего теста Mineral, мощные видеокарты явно не показали актуальные результаты, — похоже, что тест не отражает реальной разницы в производительности.

В таких условиях рассматриваемая сегодня GeForce GTX 1060 в этом тесте смогла даже опередить прямого конкурента в виде Radeon RX 480, что можно считать маленькой, но важной победой. Хотя старая уже модель R9 390X обошла вообще всех в этом тесте. Зато предшественница на базе чипа архитектуры Maxwell оказалась примерно в полтора раза медленнее, а топовый вариант на GP104 лишь на 29% быстрее новинки, что не так уж и много.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Второй математический тест из нашего RigthMark показывает обычно уже более-менее похожие на реальное положение дел результаты видеокарт относительно друг друга. Так, новая модель GeForce GTX 1060 в этот раз на 60% опережает прямую предшественницу GTX 960, и показывает скорость на уровне 66% от топовой модели GTX 1080 — похоже, что это и есть реальная разница между ними при двукратном отличии в количестве исполнительных блоков.

Если сравнивать второй GPU архитектуры Pascal с платами Radeon, то более новая модель из видеокарт на чипах компании AMD снова показала чуть меньший результат, и разница между GeForce GTX 1060 и Radeon RX 480 снова оказалась в пользу новинки. Хотя графический процессор Hawaii, несмотря на то, что он был выпущен очень давно, до сих пор весьма силен в математических тестах, и поэтому Radeon R9 390X явно быстрее этой пары свежих среднеценовых GPU.

Direct3D 10: тесты геометрических шейдеров

В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт довольно простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.

Наблюдаемая разница между результатами видеокарт на чипах Nvidia и AMD в этот раз явно в пользу решений калифорнийской компании и она обусловлена отличиями в геометрических конвейерах чипов этих компаний. В тестах геометрии платы GeForce всегда были конкурентоспособнее Radeon, в нашем случае хорошо заметно, что современные видеочипы Nvidia имеют большее количество блоков по обработке геометрии и выигрывают с заметным преимуществом.

Новая модель GeForce GTX 1060 отстает от GTX 1080 лишь на 27-30%, оказавшись до двух раз быстрее аналогичной по позиционированию платы прошлого поколения в виде GeForce GTX 960. Видеокарты Radeon показывают результаты между GTX 960 и новинкой, причем разница между Radeon R9 390X на старом GPU и новой RX 480 совсем невелика. Обе они проиграли GeForce GTX 1060, хоть и не в разы. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры изменились незначительно для плат AMD и для решений Nvidia. И это ничего особенно не меняет. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и наши выводы остаются неизменными. GeForce GTX 1060 в этом подтесте показала отличный результат, обогнав все остальные видеокарты, кроме топовой GTX 1080, от которой она отстала на 25-32%. Отставание свежей Radeon RX 480 от новинки получилось примерно такое же — 25-33%.

К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD не работает. Этот тест давно перестал запускаться на платах этой компании, и ошибка не исправлена вот уже несколько лет. Так что рассматриваем в этом тесте только результаты видеокарт Nvidia:

На этой диаграмме мы видим почти то же самое, что и в тесте Galaxy. Новая видеоплата на базе чипа GP106 оказалась на четверть быстрее решения предыдущего поколения GeForce GTX 960, а вот от топовой платы своего же поколения Pascal в виде модели GTX 1080 она отстала на 32-36% — снова мы видим примерно две трети от скорости GP104, на что примерно и стоит рассчитывать в реальных условиях. Возможно, в тяжелом режиме что-то изменится:

В таких условиях результаты видеокарт компании Nvidia изменились, но это не сильно сказалось на их взаимном положении. У новинки GTX 1060 мы видим все те же 66-70% от скорости топовой GeForce GTX 1080, а плата из предыдущего поколения Maxwell, основанная на аналогичном по позиционированию GPU, проиграла новинке около 33%. В целом, можно сказать, что в тестах на основе геометрических шейдеров новинка показала себя неплохо.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, ограничивающая производительность, что хорошо заметно по результатам плат Nvidia в простых режимах. Все новые видеокарты компании Nvidia в этом тесте показывают скорость явно заниженную — этот тест не очень хорошо исполняется на всех платах GeForce.

Явным лидером в этом тесте является старая плата компании AMD на базе видеочипа Hawaii — в этот раз она оказалась сильнее всех остальных плат сравнения, от Nvidia и новинки AMD. Кстати, если сравнивать GTX 1060 с прямым конкурентом RX 480, то они весьма близки друг к другу, и GeForce лишь немного быстрее Radeon. Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, но с увеличенным количеством текстурных выборок:

Ситуация на диаграмме слегка изменилась, и решения компании AMD в тяжелых режимах потеряли значительно больше плат GeForce. Новая модель GeForce GTX 1060 в сложных условиях показала скорость около 75% от производительности GTX 1080, заметно обогнав предшественницу в лице GTX 960. К слову, если сравнивать новинку со свежей же моделью Radeon, то GeForce GTX 1060 явно выигрывает у платы AMD уже во всех режимах, но особенно — в самом тяжелом, где разница достигает 40%.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» во многом похожи на то, что мы видели на предыдущих диаграммах. Скоростные показатели GeForce GTX 1060 в этом тесте явно выше производительности Radeon RX 480, хотя старенькая Radeon R9 390X оказалась быстрее их всех, и даже GTX 1080 обогнала. Если сравнивать новое решение Nvidia с GeForce, то GTX 960 отстал вдвое, а топовая GTX 1080 оказалась лишь на 20-22% быстрее. Рассмотрим второй вариант этой же задачи:

С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, и видеокарты Nvidia пострадали несколько больше. Но в выводах ничего не меняется, новая модель GeForce GTX 1060 снова где-то на 20-26% медленнее топовой видеокарты на чипе GP104 этого же поколения, и более чем вдвое быстрее своей предшественницы из предыдущего поколения Maxwell. Если сравнивать GeForce GTX 1060 с Radeon RX 480, то решение Nvidia все же побыстрее — до 27%. Правда, старая Radeon R9 390X снова впереди всех.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage могут показать нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших. При анализе результатов новейшей видеокарты GeForce GTX 1060 в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между GeForce GTX 960 и GTX 1060 оказалась почти двукратной в пользу более нового решения на базе чипа архитектуры Pascal, естественно. Ну а по сравнению с GTX 1080, новинка отстала от топовой модели почти вдвое, как примерно и должно получаться, исходя из теоретической разницы.

Что касается сравнения скорости текстурирования новой видеоплаты от Nvidia с имеющимися на рынке решениями конкурента, то новинка все же уступает видеокарте Radeon RX 480 около 10%, ну а модель предыдущего поколения 390X впереди них обеих. Так что результаты этого теста в очередной раз показали, что видеокарты компании AMD с текстурированием справляются весьма неплохо, и плата на GP106 не смогла достать Polaris 10 от конкурента по текстурированию — у последнего блоков TMU заметно больше.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры из второго подтеста 3DMark Vantage показывают производительность блоков ROP, без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест измеряет именно производительность ROP. Рассматриваемая нами сегодня плата GeForce GTX 1060 отстала от лучшей из плат сравнения на все те же почти 50%. Неудивительно, что GeForce GTX 1080 почти вдвое быстрее, ведь так и должно быть по теории. А вот прямая предшественница GTX 960 более чем в полтора раза медленнее сегодняшней новинки, так что с эффективностью работы блоков ROP в Pascal все нормально.

Ну а если сравнивать скорость заполнения сцены новой видеокартой GeForce GTX 1060 с решениями компании AMD, то рассматриваемая нами сегодня плата в этом тесте снова показала чуть меньшую скорость заполнения сцены по сравнению с Radeon RX 480 (разница составила всего 6%). Ну а R9 390X очень сильно отстал от обеих современных видеокарт. Судя по всему, на результате сказалось не только большое количество блоков ROP, но и эффективные оптимизации по сжатию данных у современных GPU обоих производителей.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае, важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая плата GeForce GTX 1060 показала довольно неплохой результат, оказавшись на 78% быстрее аналогичной модели предыдущего поколения, основанного на базе схожего графического процессора архитектуры Maxwell — GTX 960. А старшая модель текущего поколения GTX 1080 на основе GP104 все так же почти вдвое быстрее новинки. Среднеценовая плата Nvidia в этом тесте показала результат почти на одном уровне с Radeon RX 480 (разница составила лишь 4%), но обе они отстали от R9 390X.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны бы являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть сильные стороны чипов Nvidia должны проявляться, но мы давно уже отмечаем весьма странные результаты, увы. В этом тесте очередная новая видеокарта Nvidia показала низкую скорость, ровно на уровне старшей сестры GeForce GTX 1080, поэтому вряд ли можно судить о реальной скорости обработки геометрии по этому тесту.

Сравнение с платами Radeon в этом тесте для новинки в таких условиях далеко не самое радостное. Несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности у чипов AMD, по сравнению с конкурирующими решениями, обе платы Radeon в этом тесте работают весьма эффективно, обгоняя все видеокарты GeForce, представленные в сравнении. Соответственно, RX 480 в таких условиях аж на 36% быстрее новинки.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

А вот во втором «геометрическом» тесте из 3DMark Vantage ситуация изменилась. В этот раз новая GeForce уже показывает очень хорошие результаты, чуть-чуть обогнав обе платы соперника, да и решение архитектуры Maxwell. Новая плата GeForce GTX 1060 в этот раз отстала от GTX 1080 лишь на 32%, обогнав предшественницу из предыдущего поколения почти на 60%. Сравнение новинки от Nvidia с конкурирующими видеокартами компании AMD в этот раз более позитивное — новая плата на втором GPU семейства Pascal показала результат чуть лучше обеих одночиповых видеокарт компании-соперника.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом для GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В этом математическом тесте производительность решений хоть и не полностью соответствует теории, но очень близка к тому, что должна быть, исходя из пиковых показателей. В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, сильно отличающееся по сравнению со схожими тестами из нашего тестового пакета.

Хотя видеочипы компании AMD с архитектурой GCN до сих пор справляются с подобными задачами лучше решений конкурента в случаях, когда выполняется интенсивная «математика», но последние модели графических процессоров от компании Nvidia, основанные на архитектуре Pascal, почти достают своих прямых конкурентов по скорости. Так, GeForce GTX 1060 пусть и не достала Radeon R9 390X и RX 480, но отстала от последней лишь на 9%, что вполне можно назвать хорошим результатом, учитывая меньшую сложность GPU от Nvidia — у них наконец-то получились весьма производительные решения с точки зрения интенсивных вычислений, и во многом спасибо нужно сказать очень высокой тактовой частоте чипа.

Сравнивать новинку с предыдущей моделью компании из семейства GeForce GTX 900 смысла не очень много, в этом тесте разница довольно велика. Рассматриваемая сегодня видеокарта показала результат на 60% лучше, чем аналогичная ей GeForce GTX 960 из предыдущего поколения. Это очень хорошие показатели в таких тестах, которые намекают на достаточно сильные выступления GeForce GTX 1060 и в игровых приложениях.

Direct3D 11: Вычислительные шейдеры и производительность тесселяции

Обычно для тестов новых решений в задачах, использующих такие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы пользуемся примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD. Но увы, все наши привычные тесты, использующие вычислительные шейдеры и тесселяцию, на тестовой системе с DirectX 12 под управлением операционной системы Windows 10 работают некорректно. Они толком не работают ни в оконном режиме, ни в полноэкранном. И разрешение менять не дают, аварийно завершая работу. Для будущих материалов будет разработана новая методика с актуальными синтетическими тестами DirectX 11/12 и OpenCL — в комментариях к статье на нашем форуме вы можете написать свои пожелания по тестовому набору.

Исходя из результатов синтетических тестов новой видеокарты Nvidia GeForce GTX 1060, основанной на совершенно новом графическом процессоре GP106, ставшем уже вторым представителем архитектуры Pascal, а также результатам других моделей видеокарт от обоих производителей дискретных видеочипов, можно сделать вывод о том, что рассматриваемая нами сегодня видеокарта способна стать одним из наиболее производительных решений в своем классе, опередив даже такие решения предыдущего поколения более высокого ценового уровня, как GeForce GTX 980.

Новая видеокарта компании Nvidia показала достаточно сильные результаты в большинстве синтетических тестов, примерно на уровне с основным конкурирующим решением от компании AMD в лице Radeon RX 480. Хотя в некоторых тестах мы наблюдали и явные проигрыши, но практика показала, что в играх картина будет несколько иной, так как не всю синтетику можно перенести на игры. В очередной раз отмечаем, что у Radeon и GeForce есть разные сильные стороны: если решения компании AMD традиционно отличаются весьма эффективным исполнением сравнительно интенсивных вычислительных задач, то графические процессоры Nvidia отыгрываются в геометрических тестах с применением тесселяции и тестах с более сложными вычислениями.

В реальных игровых приложениях все равно положение будет несколько иным, по сравнению с синтетическими тестами. Судя по опыту предыдущих сравнений, модель GeForce GTX 1060 должна показать в играх скорость чуть выше уровня GeForce GTX 980 и явно опередить Radeon RX 480, пусть и не с подавляющим преимуществом. На первый взгляд, новинка от Nvidia кажется неплохо сбалансированным решением, особенно для противодействия Radeon RX 480, даже с учетом существующей разницы в ценах. А уж если затронуть тему энергоэффективности и производительности на 1 мм² площади GPU или на транзистор, то GeForce GTX 1060 выйдет явным победителем. Архитектура Pascal получилась действительно эффективной!

В следующей части нашего материала мы предлагаем оценить производительность новинки в играх по сравнению с ее конкурентами. Мы протестировали GeForce GTX 1060 в нашем привычном наборе современных игровых тестов и сравнили ее показатели со скоростью основных конкурентов и предшественников.

Модули памяти G.Skill Ripjaws4 F4-2800C16Q-16GRK для тестового стенда предоставлены компанией G.Skill Corsair Hydro SeriesT H100i CPU Cooler для тестового стенда предоставлен компанией Corsair
Монитор Dell UltraSharp U3011 для тестовых стендов предоставлен компанией Юлмарт Системная плата ASRock Fatal1ty X99X Killer для тестового стенда предоставлена компанией ASRock Жесткий диск Seagate Barracuda 7200.14 3 ТБ для тестового стенда предоставлен компанией Seagate 2 накопителя SSD Corsair Neutron SeriesT 120 ГБ для тестового стенда предоставлены компанией Corsair

Обзор Nvidia GeForce GTX 1060 6GB | Введение

Модельный ряд Nvidia постепенно заполняется видеокартами на базе дебютировавшей три месяца назад новой архитектуры Pascal. Nvidia начала с топовых моделей линейки: первой появилась GeForce GTX 1080 , которая предлагает на 30% больше производительности по сравнению с GeForce GTX 980 Ti, причём за меньшие деньги. Спрос на эту карту большой, и до сих пор её непросто найти в продаже. Затем вышла GeForce GTX 1070 : она также обгоняет 980 Ti, при этом её цена на несколько сотен долларов ниже.

Сегодня мы рассмотрим третью видеокарту на базе Pascal - GeForce GTX 1060 . Мы уже знаем, что некоторые её версии от партнёров Nvidia можно найти за $250. Модификация Founders Edition продается на сайте nvidia.com за $300, остальные ритейлеры предлагают только партнёрские версии карты.

GeForce GTX 1060 построена на новом графическом процессоре GP106. У него много общего с GP104, но он выполнен в более простой упаковке. Но не стоит сразу огорчаться. По данным Nvidia, при тепловом пакете 120 Вт GTX 1060 способна обеспечить частоту кадров уровня GTX 980. Два года назад такой уровень производительности обошёлся бы вам в $550 – мы прошли большой путь, вне всяких сомнений.

Встречаем GP106

В видеокарте GeForce GTX 1080 используется графический процессор GP104 с четырьмя кластерами обработки графики (GPC). В общей сложности, карта располагает 2560 ядрами CUDA и 160 блоками текстур. GTX 1070 построен на таком же GPU но с тремя активными GPC, в итоге получается 1920 ядер и 120 блоков обработки текстур.

Блок-схема графического процессора Nvidia Pascal GP106

В графическом процессоре карты GeForce GTX 1060 используются блоки точно такой же архитектуры. Вот выдержка из статьи о презентации GeForce GTX 1080:

"Каждый GPC включает пять кластеров обработки потоков/текстур (Thread/Texture Processing Clusters - TPC) и блок растеризации. Каждый TPC сочетает в себе один потоковый мультипроцессор (Streaming Multiprocessor SM) и движок PolyMorph. В состав SM входят 128 ядер CUDA одинарной точности, 256 Кбайт регистровой памяти, 96 Кбайт общей памяти, 48 Кбайт кэша L1/текстур и восемь текстурных блоков. Четвёртое поколение движка PolyMorph включает в себя новый блок логики, который находится в конце конвейера геометрии перед блоком растеризации, он управляет функцией мультипроекции Simultaneous Multi-Projection."

GPU GeForce GTX 1060 (GP106) GeForce GTX 980 (GM204)
SM 10 16
Количество ядер CUDA 1280 2048
Базовая частота GPU, МГц 1506 1126
Частота GPU в режиме Boost, МГц 1708 1216
Скорость вычислений, GFLOPs (при базовой частоте) 3855 4612
Количество блоков текстурирования 80 128
Скороть заполнения текселей, Гтекс/с 120,5 144,1
Скорость передачи данных памяти, Гбит/с 8 7
Пропускная способность памяти, Гбайт/с 192 224
Количество блоков растеризации 48 64
Объем кэша L2, Мбайт 1,5 2
Тепловой пакет, Вт 120 165
Количество транзисторов 4,4 млрд. 5,2 млрд.
Площадь кристалла, мм2 200 398
Техпроцесс, нм 16 28

GP106 оснащается двумя GPC, что даёт в общей сложности 1280 ядер CUDA и 80 блоков текстурирования. В чипе были также оптимизированы тайминги, это позволило поднять базовую частоту до 1506 МГц, а типичную частоту GPU Boost до 1708 МГц.

Бэкэнд нового процессора был также урезан. Шесть 32-разрядных контроллеров памяти обеспечивают совокупный канал передачи данных 192-бит. Как и в GP104, каждый контроллер связан с восемью ROP и 256 Кбайт кэша L2, всего получается 48 ROP и 1,5 Мбайт кэша. Nvidia устанавливает в карту 6 Гбайт памяти GDDR5 со скоростью передачи данных 8 ГТ/с, и пиковая пропускная способность достигает 192 Гбайт/с. Хотя этот показатель ниже, чем у GTX 980 (224 Гбайт/с), следует помнить, что Pascal использует новые методы сжатия без потерь, которые позволяют экономить канал память и повышают полезную пропускную способность. Из статьи о GTX 1080: "Алгоритм дельта-компрессии цветов стремится к уровню сжатия 2:1, причём этот режим был улучшен с целью более частого применения. Существует также новый режим 4:1, который применяется в тех случаях, когда различия между пикселями очень небольшие, что позволяет добиться ещё большего сжатия. Наконец, в Pascal представлен ещё один новый алгоритм 8:1, который применяет сжатие 4:1 к блокам 2х2, разница между которыми обрабатывается по алгоритму 2:1."

GP106, как и GP 104, производится с использованием техпроцесса TSMC 16FF+. Старший чип состоит из 7,2 миллиардов транзисторов на кристалле площадью 314 мм2, а младший имеет 4,4 миллиарда транзисторов FinFET и площадь 200 мм2. GP 106 – менее сложный процессор, работающий с меньшим объёмом памяти, он устанавливается на более простую PCA, а его термопакет составляет 120 Вт.

Нет SLI для массовых видеокарт верхнего уровня

Заметили отсутствие коннектора SLI? GTX 1060 не поддерживает SLI, а тем, кому не хватает производительности, Nvidia рекомендует GeForce GTX 1070 или 1080. Если вспомнить предыдущие поколения, то это видеокарта самого высокого класса без поддержки SLI. У GeForce GTX 750 Ti тоже не было коннектора, но он был у GTX 760 и GeForce GTX 950.

Официально в Nvidia утверждают, что руководствовались соображениями ценообразования. Геймеры редко используют массовые видеокарты в режиме SLI, поэтому в Nvidia решили не расходовать ресурсы на недорогие варианты и оптимизировали SLI для более быстрых видеокарт Pascal. Кроме того, разработчики игр всё больше используют новые эффекты постобработки и техники, которые завязаны на вычислениях и плохо сочетаются с AFR. А с появлением DirectX 12 в распоряжении независимых разработчиков появилось ещё больше возможностей как можно быстрее выпускать на рынок новый контент. Это значит, что значительная часть труда, который Nvidia вкладывает в свои драйверы, оказывается напрасной.

В нашем тестовом пакете есть одна игра, которая поддерживает работу на нескольких GPU в режиме DirectX 12 – это Ashes of the Singularity. Добавив вторую GeForce GTX 1060 и поставив соответствующий флажок, мы получили такой прирост производительности:










Хотя мы привыкли к более внушительному приросту производительности при использовании SLI, 50% - это тоже неплохо. К сожалению, без интегрированной поддержки нескольких графических адаптеров мы не можем поэкспериментировать с играми DirectX 11 и DX12.

Учитывая, что карта предназначена в основном для разрешения 1080p, Nvidia может задним числом включить SLI через интерфейс PCI Express в обновлённых драйверах, и мы надеемся, что так она и поступит. Независимо от того, сколько найдётся желающих установить две GTX 1060 в SLI, существует много игр под DX11, которые могут использовать преимущества многопроцессорных конфигураций. Любые проблемы, связанные с масштабированием под DX12, относятся не только к картам на базе GP106, но и GP104. Тесты покажут, насколько привлекательной может быть конфигурация SLI с GTX 1060 в SLI.

Обзор Nvidia GeForce GTX 1060 6GB | Особенности модели GeForce GTX 1060 Founders Edition

Перед нами снова кулер дизайна, характерного для линейки Nvidia Founders Edition, хотя по сравнению с GTX 1070 и 1080, в GTX 1060 используется его менее дорогая версия.

Но это не значит, что новая карта получилась компактной. Её длина составляет 25,4 см (от задней пластины до противоположного конца карты), высота - 10,7 см (от вершины слота системной платы к вершине карты), ширина – 3,8 см. Ширина карты самой составляет 3,5 см, но задняя пластина выступает за её границы ына 0,3 см.

GeForce GTX 1060 Founders Edition весит 845 г, и это весьма немало.

Дизайн, конструкция и разъемы

В кожухе кулера снова используется комбинация алюминия и пластмассы, но эта модель выглядит проще, чем более дорогие. Кожух и вентилятор можно снять как один блок. Сверху находится логотип GeForce GTX с подсветкой и 6-контактный разъём дополнительного питания.


Задний торец GeForce GTX 1060 немного отличается от предыдущих моделей. Видеокарты с короткой печатной платой часто имеют воздухозаборники в том месте, где кулер выходит за пределы платы, через них центробежный вентилятор получает воздух, но не в случае с GTX 1060. В целях экономии производитель также отказался от поддерживающей пластины.

У обратной стороны карты знакомый вид.

Панель ввода-вывода полностью скопирована с Nvidia GeForce GTX 1080 и 1070: на ней точно так же установлены три порта DisplayPort, совместимых со стандартом 1.2. При этом в Nvidia заявляют, что они готовы к работе с версиями 1.3 и 1.4, как и контроллер дисплея в графическом процессоре. Кроме того, здесь есть выход HDMI 2.0 и двухканальный DVI . Аналоговых разъёмов на карте нет.


Конструкция кулера, платы и источника питания

Чтобы посмотреть на систему охлаждения GeForce GTX 1060 , мы сняли кожух.

Сверху бросается в глаза странное расположение разъёма питания. Он находится в той части кулера, которая выходит за пределы печатной платы. Для подключения разъёма к плате потребовались дополнительные провода.


Реализация не самая изящная, к тому же она мешает партнёрам Nvidia создавать короткие версии GTX 1060. Длина самой платы составляет всего 17,5 см, и на ней нет свободного места для установки разъёма питания.

Тело кулера крепится к плате четырьмя винтами. В его составе есть массивный медный теплоотвод и металлический каркас под ним. Конструкция с закрытыми рёбрами радиатора напомнила нам систему охлаждения GeForce GTX 1070. Она должна быть достаточно производительной, особенно если учесть, что тепловой пакет карты составляет 120 Вт.

Массивная рама не только добавляет жёсткости конструкции, но и охлаждает стабилизаторы напряжения и модули памяти.

После откручивания винтов рамы, её необходимо поднять и аккуратно перевернуть, поскольку провода разъёма питания припаяны к плате. После этого перед нами предстаёт печатная плата во всей её красе.

Как обычно, GPU находится в центре и немного смещён вперед. Естественно, графический процессор GP106 немного меньше, чем GPU GP104, который используется в Nvidia GeForce GTX 1080 и 1070. Но на этом различия между платами не заканчиваются.

Возьмём, к примеру, память. На плате GTX 1060 имеет только шесть чипов памяти Samsung K4G80325FB-HC25 GDDR5. Каждый из них имеет ёмкость 8 Гбит (32 x 256 Мбит) и работает при напряжении 1,305 В – 1,597 В, в зависимости от тактовой частоты. Общий объём видеопамяти - 6 Гбайт.

К сожалению, контроллер ШИМ не описан в спецификациях. Он изготовлен компанией uPI Semiconductor и имеет номер модели uP9509. Возможно, это младшая версия контроллера uP9511P, который мы видели на картах с процессором GP104.

Модули памяти и одна из фаз GPU получают питание через слот PCIe системной платы. Две оставшихся фазы GPU и дополнительные компоненты карты питаются от 6-контактного разъёма. Чуть позже мы расскажем о том, что это означает с точки зрения распределения нагрузки по шинам.

Для стабилизации напряжения Nvidia использует только один двойной N-канальный МОП-транзистор E6930 на каждую фазу для высокой и низкой стороны. Отдельные усилители-преобразователи здесь не требуются. Высокая интеграция объясняет пустые места на плате.

Трёх фаз питания для этого GPU достаточно, и их распределение здесь выглядит более продуманным, чем в AMD Radeon RX 480.

В целом, референсная карта Nvidia GeForce GTX 1060 выглядит довольно хорошо, если не считать шестиконтактный разъём питания, которому места на плате не нашлось. Учитывая относительно невысокое тепловыделение, система охлаждения обещает быть вполне эффективной.

Обзор Nvidia GeForce GTX 1060 6GB | Методика тестирования

"Вместо Core i7-5930K (Haswell-E) с частотой 3,5 ГГц мы используем процессор Core-i7-6700K 4 ГГц на архитектуре Skylake, который обладает более современной логикой работы IPC и дополнительными 500 МГц к базовой тактовой частоте, что позволяет избежать возможных узких мест. Естественно, процессор с интерфейсом LGA 1151 потребовал новой системной платы. Для всех игровых тестов мы использовали модель MSI Z170A Gaming M7, в которую также установили набор памяти G.Skill F4-3000C15Q-16GRR, состоящий из четырех модулей DDR4-3000 по 4 Гбайт. Накопитель Crucial MX200SSD мы не меняли, как и процессорный кулер Noctua NH-12S и блок питания be quiet! Dark Power Pro 10 850W.

Мы отказались от Windows 8.1 в пользу Windows 10 Professional. Перед тестами мы установили чистую версию ОС. Также мы подобрали новый комплект популярных игр класса AAA в разных жанрах, часть из которых используют DirectX 12".

В сегменте массовых видеокарт референсные модели встречаются не так часто, как в классе high-end, поэтому мы используем несколько партнёрских видеокарт.

Фактическая частота ядра/памяти Эталонная частота ядра/памяти
Nvidia GeForce GTX 1060 1506/2000 1506/2000
Nvidia GeForce GTX 1070 1506/2000 1506/2000
AMD Radeon RX 480 1266/2000 1266/2000
MSI R9 390X Gaming 8G 1080/1500 1050/1500
MSI R9 390 Gaming 8G 1040/1500 1000/1500
MSI GTX 980 Gaming 4G 1190/1752 1126/1752
Gigabyte GTX 970 G1 Gaming 1178/1752 1050/1752
MSI GTX 960 Gaming 2G 1190/1752 1127/1752

Тестовый пакет остался тем же самым, что и в обзоре Radeon RX 480, включая настройки и опции. "Результаты Ashes of the Singularity представляют производительность под DirectX 12 с использованием встроенного в игру инструмента для тестирования и записи результатов. Hitman и Tomb Raider представляют показатели под DirectX 11. Однако, у нас есть результаты в этих играх с DirectX 12, и в большинстве случаев скорость снижается. Остальные игры используют DirectX 11, а результаты регистрировались с помощью Fraps".

Игра Настройки
Ashes of the Singularity DirectX 12, вариант настройки Extreme, встроенный бенчмарк
Battlefield 4 DirectX 11, вариант настройки качества Ultra, тест Tom’s Hardware (Tashgar jeep ride), 100 секунд записи в Fraps
Grand Theft Auto V DirectX 11, настройки качества Very High, 4x MSAA, встроенный бенчмарк (тест номер пять), 110 секунд записи в Fraps
Hitman DirectX 11, уровень детализации Ultra, FXAA, высокое качество текстур, встроенный бенчмарк, 100 секунд записи в Fraps
Metro Last Light Redux DirectX 11, уровень деталзиации Very High, SSAA откл., 16x AF, размытие движения Normal, тесселяция Normal, встроенный бенчмарк, 145 секунд записи в Fraps
Project CARS DirectX 11, настройки качества Ultra, высоки уровен сглаживания, высокое разрешение текстур, Nurburgring Sprint, 100 секунд записи в Fraps
Rise of the Tomb Raider DirectX 11, пользователькие настройки качества, настройки качества Very High, встроенный бенчмарк, 80 секунд записи в Fraps
The Division DirectX 11, пользователькие настройки качества, настройки качества Ultra, временное полноэрканное сглаживание (TSSAA), встроенный бенчмарк, 90 секунд записи в Fraps
The Witcher 3 DirectX 11, настройки качествса Highest, HairWorks откл., тест Tom’s Hardware, 100 секунд записи в Fraps

Обзор Nvidia GeForce GTX 1060 6GB | Результаты тестов

Ashes of the Singularity (DX12)


Частота кадров (больше – лучше)



Динамика средней частоты кадров в секунду в течение теста (больше – лучше)



Время рендеринга одного кадра по отношению к среднему показателю в тесте, мс (меньше – лучше)



Динамика колебаний времени рендеринга кадров, мс (меньше – лучше)



Колебания времени рендеринга соседних кадров (плавность), мс (меньше – лучше)

Мы добавили в тест сравнительных диаграмм, а также различные сценарии измерений. Кроме потребляемой мощности мы также исследуем силу тока, чтобы определить, не выходит ли видеокарта за пределы паспортных значений. Тем не менее, состав тестового оборудования остался без изменений.

Оборудование и методика измерения энергопотребления
Метод тестирования Бесконтактное измерение тока на слоте PCIe (с помощью карты-переходника) Оборудование для тестирования 2 x Rohde & Schwarz HMO 3054, 500 МГц (четырёхканальный осциллограф с функцией записи данных)
Бесконтактное измерение тока на внешнем кабеле питания БП 4 x Rohde & Schwarz HZO50 (токовые клещи)
Прямое измерение напряжения на блоке питания 4 x Rohde & Schwarz HZ355 (осциллографический пробник 10:1, 500 МГц)
Мониторинг и запись инфракрасной видеокамерой в реальном времени 1 x Rohde & Schwarz HMC 8012 (мультиметр с фукнцией записи данных)

Энергопотребление при различных нагрузках

Как видите, мы добавили диаграмму среднего энергопотребления в играх на разных разрешениях. Она позволяет взглянуть на этот параметр под другим углом. Для теста используется 170-секундная последовательность сцен различной интенсивности в игре Metro: Last Light (высокие предустановки, тесселяция – нормальная, SSAO откл.). Мы обсудим этот момент более подробно, когда доберёмся до тестов энергоэффективности.

Серый столбец показывает потребляемую мощность во время пиковых нагрузок, которые прошли через наш фильтр. Этот столбец не имеет практического значения, поскольку скачки слишком короткие, чтобы повлиять на общую картину (хотя самые короткие из них уже были отфильтрованы).


Энергопотребление при разных уровнях нагрузки, Вт (меньше – лучше)

Распределение нагрузки на разъеме питания

А теперь немного скучных подробностей. Измерения на различных шинах во время высокой нагрузки в игре и в стресс-тесте показывают, как Nvidia справляется с распределением нагрузки между основным слотом и 6-контактным разъёмом питания Мы не учитываем показатели 3,3-вольтовой шины системной платы, поскольку она здесь больше не используется.


Энергопотребление – измерения в течение двух минут, Вт (меньше – лучше)

Ниже представлены более подробные графики.


Сравнение энергопотребления в Metro: Last Light 4K, Вт



Сравнение энергопотребления в стресс-тесте (Furmark), Вт

Технические спецификации PCI-SIG касаются исключительно силы тока, эти замеры вы увидите в диаграмме ниже (энергопотребление – лишь половина всей картины). Nvidia GeForce GTX 1060 соответствует нормам, мы получили на слоте меньше 5 А, хотя согласно PCI-SIG, максимум может достигать 5,5 А.


Ток – измерения в течение двух минут, А (меньше – лучше)

Ниже представлены подробные графики измерений тока.


Мониторинг силы тока в Metro: Last Light 4K, А



Мониторинг силы тока в стресс-тесте (Furmark), А

Сравнение энергопотребления с другими картами

Давайте теперь посмотрим, как GeForce Nvidia GTX 1060 выглядит на фоне конкурентов. Здесь мы используем пиковые показатели потребляемой мощности, так как они сопоставимы с результатами, полученными в соответствии со старой методикой тестирования.


Энергопотребление в простое – все шины, Вт (меньше – лучше)



Энергопотребление в играх (макс.) – все шины, Вт (меньше – лучше)



Энергопотребление в Furmark – все шины, Вт (меньше – лучше)

В нашем игровом тесте энергопотребление GeForce GTX 1060 немного выше, чем у GTX 960. Но более низкая целевая мощность новой карты даёт о себе знать во время стресс-теста. Как ни крути, Nvidia GeForce GTX 1060 – это самая быстрая видеокарта из 120-ваттных моделей.

Обзор Nvidia GeForce GTX 1060 6GB | Показатели эффективности, разгона и снижения частоты

Выбор бенчмарков

Подобрать подходящий бенчмарк для этих тестов было довольно трудно. Нам пришлось ограничиться одним типичным показателем, поскольку генерировалось очень много данных. Но даже в этом случае потребовалось два дня, чтобы завершить этот раздел. В итоге, мы снова остановились на Metro: Last Light. Он даёт одинаковую нагрузку на карты Nvidia и AMD и отличается хорошим соотношением между требованиями к производительности и потребляемой мощностью. Однако, по вашим просьбам, мы изменили наши стандартные настройки.

Мы тестируем игру в трёх разрешениях: 1920x1080, 2460x1440 и 3840x2160. Вместо "очень высоких" настроек графики, мы используем "высокие" предустановки. Мы выбрали эти настройки, потому что GeForce GTX 1060 с технологией Turbo Boost 3.0 и Radeon RX 480 достигают максимальных значений потребляемой мощности только при повышенном разрешении.

Энергопотребление и тактовая частота

Результаты Radeon RX 480 приводятся в качестве эталонных, пусть это и обзор Nvidia GeForce GTX 1060 .

Прежде всего, мы установили минимальную потребляемую мощность и максимальную тактовую частоту. Затем, шаг за шагом, мы прогоняли тесты, изменяя параметры между двумя пороговыми значениями, так мы получили кривые результатов. Потребляемая мощность показана на оси Y, а частота GPU Boost на оси X.


Соотношение тактовой частоты и энергопотребления, ось Х – МГц, ось Y - Вт

Но для геймера главное – производительность. В семи из девяти игровых тестов GTX 1060 была быстрее, чем Radeon RX 480. Карта Nvidia уступила только в AotS и Hitman. Если считать в процентах, то разница между ними в среднем составляет 13,5% в разрешении 1920x1080. При увеличении разрешения до 2560x1440 точек разница сокращается до 12,5%. Но GTX 1060 не открывает вам доступ к более высокому разрешению. Она показывает превосходные результаты в FHD и, конечно, справляется с QHD, впрочем, как GeForce GTX 970, Radeon R9 390 и RX 480. Хотя с 1060 снижать графические настройки придётся чуть меньше. Она не догоняет GTX 980, как мы надеялись, и в большинстве случаев занимает позицию между GTX 970 и 980.

Прямым конкурентом GeForce GTX 1060 Founders Edition можно считать более дешёвую Radeon RX 480. Но разница в размере $50 рубит на корню любые споры о выгодности (мы начинаем сожалеть о том, что хвалили референсные модели компании). Однако такая ситуация, видимо, продлится недолго. Тираж карт Founders Edition ограничен, и они продаются только на сайте nvidia.com и через сеть Best Buy (в США). В других магазинах вы встретите только партнёрские решения.

Мы уже протестировали карту MSI GeForce GTX 1060 Gaming X 6G с базовой тактовой частотой 1595 МГц и слегка разогнанной памятью. Карта оснащается эффективным кулером Twin Frozr VI, 8-контактным разъёмом питания и светодиодной подсветкой. В компании намерены продавать эту карту за $290, хотя другие модели GTX 1060 в портфеле MSI стоят всего $250. С такой ценой битва между Pascal и Polaris становится более интересной. Хотя даже в этом случае ей будет трудно побить Radeon RX 480 4 Гбайт за $200, если рассматривать её как карту для игр в FHD. Скоро начнут появляться многочисленные видеокарты от сторонних производителей, и по мере возможности мы будем делать их обзоры. Оставайтесь с нами!