Сравнение карт geforce gtx 970. Видеокарты

Внедрение архитектуры Maxwell компания NVIDIA начала в сегменте бюджетных решений с выпуском GeForce GTX 750 Ti и GeForce GTX 750, которые удачно проявили себя на фоне предшественников. Эти графические решения продемонстрировали отличное сочетание производительности и энергоэффективности без перехода на новый техпроцесс. Такой старт укрепил уверенность в потенциале новых флагманов, на счет которых ранее не было особого оптимизма. Переход на 20-нм техпроцесс производства задержался, а нынешнее поколение графических процессоров уже достигло того предела, когда вопрос охлаждения стал краеугольным камнем. Maxwell изменил все. Представленные сегодня видеокарты GeForce GTX 980 и GeForce GTX 970 вновь это продемонстрировали.


В соответствии с маркировкой новый GPU GM204 станет заменой GK104, но при этом представленные графические решения призваны сменить GeForce GTX 780 и GeForce GTX 780 Ti, которые базируются на GK110. Так что не исключен вариант появления в будущем и какого-то GM210 в рамках последующей серии. Нынешние решения вызывают еще вопрос по поводу своей принадлежности к девятисотой серии, ведь представителей восьмисотой серии в настольном сегменте не было. Однако такие видеокарты были в сегменте графики для ноутбуков. У нас не так давно как раз был обзор топового решения с GeForce GTX 880M . Очевидно, что переход сразу к серии GTX 900 связан с поддержанием последовательной нумерации мобильных видеокарт.

GM204 напоминает усложненную версию GM107. Процессор насчитывает четыре графических кластера GPC по четыре крупных мультипроцессорных блока SMM в каждом. У GM107 был один кластер на пять SMM. GK104 насчитывал четыре кластера по два мультипроцессора SMX в каждом.


SMM оперирует 128 потоковыми процессорами (CUDA cores), сгруппированными в четыре массива обработки данных, каждый из которых имеет свою управляющую логику со своими планировщиками, диспетчерами, регистрами и внутренним буфером инструкций. Внутри SMM общими являются текстурные модули (в количестве 8 штук) с выделенным текстурным кэшем. Есть общее хранилище данных на 96 КБ. Обработка геометрии осуществляется движком Polymorph Engine.


Аналогичные блоки обработки геометрии присутствовали у GPU Kepler. У GK104 их было лишь 8, а у GK110 уже 15. Одно это сравнение говорит о возросшем потенциале в обработке сложной геометрии и тесселяции, которая заметно бьет по итоговой производительности в DirectX 11. По этому критерию обещано преимущество в два-три раза при сравнении вычислительного потенциала GM204 и GK104. Общее количество потоковых процессоров составляет 2048, что меньше количества вычислительных блоков у GeForce GTX 780 и GeForce GTX 780 Ti. Но в данном случае реализована другая организация этих вычислительных единиц внутри GPU с более гибким распределением задач. Текстурных блоков 128, что соответствует их числу у старого GK104, но против 240 блоков у GeForce GTX 780 Ti маловато.

На стороне новинок высокие тактовые частоты. Старший видеоадаптер GeForce GTX 980 работает при базовой частоте 1126 МГц и Boost Clock 1216 МГц. Это рекордные показатели для нынешних видеокарт.

GeForce GTX 970 от старшего брата отличается по частотам и количеству вычислительных блоков. У него отключены три SMM, поэтому потоковых процессоров только 1664, а текстурных блоков 104. Базовая частота понижена до 1051 МГц при Boost Clock 1178 МГц, что тоже заметно выше частот нынешних флагманов. Отметим еще, что указанная частота Boost является средним значением. В зависимости от условий эксплуатации и нагрузки она может быть выше или меньше. Сама технология GPU Boost корректирует частоты так, чтобы не выйти за определенные лимиты по мощности и температуре. С учетом энергоэффективности нового GPU в игровом режиме можно ожидать заметно более высоких значений Boost относительно указанных значений. Так что частотное преимущество относительно старых решений будет даже выше, чем при сравнении официальных данных по базовой частоте.

GM204 оснащен скоростным кэшем L2 объемом в 2 МБ. Количество блоков ROP возросло до 64. А вот работа с внешней памятью реализована через четыре 64-битных контроллера, т.е. общая разрядность шины составляет 256 бит. На фоне существующих флагманов с 384-битной шиной это выглядит узким местом. Частично компенсируется архитектурными улучшениями в подсистеме передачи данных. Используется новый метод сжатия данных в буфере кадра. А эффективная частота памяти GDDR5 установлена на высоком значении в 7010 МГц. По внутренним тестам компании NVIDIA эффективность ПСП у GeForce GTX 980 на 17-28% выше чем у GeForce GTX 680 (в зависимости от приложения). При этом частота памяти у новинки выше лишь на 16,7%.

Компания делает акцент на том, что новые решения проектировались с прицелом на разрешения выше стандарта Full HD. Поэтому новые GeForce GTX 980 и GeForce GTX 970 оснащены внушительным объемом памяти в 4 ГБ. С этой же целью их оснастили интерфейсом HDMI нового стандарта 2.0, который поддерживает передачу данных в разрешении 4K при частоте 60 Гц. При подключении по DisplayPort через Multi-Stream Transport возможен вывод изображения на четыре дисплея 4K. Сам же видеоадаптер умеет работать с еще большим разрешением 5120x3200 при 60 Гц.

Видеоадаптер GeForce GTX 980 GeForce GTX 970 GeForce GTX 780 Ti GeForce GTX 780 GeForce GTX 770
Ядро GM204 GM204 GK110 GK110 GK104
Количество транзисторов, млн. шт 5200 5200 7100 7100 3500
Техпроцесс, нм 28 28 28 28 28
Площадь ядра, кв. мм 398 398 561 561 294
Количество потоковых процессоров 2048 1664 2880 2304 1536
Количество текстурных блоков 128 104 240 192 128
Количество блоков рендеринга 64 64 48 48 32
Базовая частота ядра, МГц 1126 1051 875 863 1045
Boost Clock, МГц 1216 1178 926 900 1085
Шина памяти, бит 256 256 384 384 256
Тип памяти GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
Частота памяти, МГц 7010 7010 7010 6008 7010
Объём памяти, МБ 4096 4096 3072 3072 2048
Поддерживаемая версия DirectX 12 12 11.1 11.1 11.1
Интерфейс PCI-E 3.0 PCI-E 3.0 PCI-E 3.0 PCI-E 3.0 PCI-E 3.0
Уровень TDP, Вт 165 145 250 250 230

Серьезное преимущество новинок — низкое энергопотребление и нагрев. Заявленные значения в 165 и 145 Вт являются привычными для решений среднего уровня. Топовые графические ускорители с таким TDP выглядят очень привлекательно. По соотношению производительность на единицу мощности NVIDIA обещает для GeForce GTX 980 двукратный рост относительно GeForce GTX 680.

Среди нововведений в Maxwell — поддержка новой технологий просчета освещения и новые методы полноэкранного сглаживания. В играх уже давно используются разные алгоритмы моделирования глобального освещения. Среди них один из последних методов HBAO+, который изначально был разработан тоже NVIDIA. Но все они в той или иной степени лишь симулируют сложное отражение света от объектов. Воссоздать реалистичную картину с взаимным влиянием отраженного света от разных поверхностей, формирующим сложную картину бликов и теней, современным видеокартам пока не по силам. Новый алгоритм VXGI (Voxel Global Illumination) поднимает данную технологию на качественно новый уровень. 3D-сцена разбивается на отдельные воксели, для каждого из которых идет просчет отраженного света с учетом множества параметров. На выходе получается изображение приближенное к кинематографичному уровню.



Сцена с простыми геометрическими фигурами может быть еще более наглядной. На нижнем изображении отлично видно сложное взаимовлияние света, отраженного от поверхности цветных фигур.


VXGI позволяет моделировать сложное преломление и рассеяние света с отражениями в реальном времени при динамическом изменении параметров геометрии и освещения. Очень перспективная технология. На данный момент ее поддержка уже внедрена в движок Unreal Engine 4. Учитывая популярность прошлой версии движка, можно ожидать самого широкого применения VXGI в ближайшем будущем.

Одним из новых представленных методов сглаживания называется DSR (Dynamic Super Resolution). Работает он так — изображение рендерится в более высоком разрешении, а потом выводится с масштабированием до разрешения экрана. По сути ничего нового в этом нет. Уже год, как Battlefield 4 предлагает похожий метод, позволяя регулировать уровень масштабируемости от 100 до 200%. Такой метод в сравнении с обычным просчетом субпикселей очень ресурсоемкий. В упомянутом Battlefield производительность падает кардинально.

Пример сглаживания краев объектов при помощи DSR изображен ниже (правая часть изображения).


DSR может работать совместно с любым обычным методом сглаживания и в любом игровом приложении. Можно автоматически запускать это сглаживание через приложение GeForce Experience.

Другой метод сглаживания MFAA (Multi-Frame Antialiasing) является новой вариацией MSAA, используя вместо фиксированного гибкий метод выбора сэмплов. Позиции выборок меняются так, чтобы из соседних кадров формировалась итоговая выборка идентичная стандартному 4x MSAA. В итоге 4x MFAA дает изображение максимально близкое к 4x MSAA, но на 30% быстрее.


Не забыт метод сглаживания TXAA, который поддерживают все ближайшие проекты от Ubisoft. Продолжается развитие технологий симуляции физических эффектов. В играх Batman: Arkham Knight и Project CARS мы увидим привычную систему частиц и симуляцию турбулентности, реализованную с помощью NVIDIA PhysX. В Far Cry 4 будет реалистичная имитация шерсти животных, реализованная при помощи технологии NVIDIA Hairworks.


В этой же игре будет поддержка HBAO+, TXAA и продвинутая симуляции солнечных лучей. Мягкие тени будут реализованы по технологии PCSS (Percentage-Closer Soft Shadows). Особенностью визуализации таких реалистичных теней являются регулируемые параметры размытия в зависимости от расстояния до них. PCSS еще будет реализовано в Assasin"s Creed: Unity.


Новая часть Assasin"s Creed обещает порадовать и широким применением тесселяции, которая будет повсеместно задействована для улучшения геометрии и объема элементов окружения — от брусчатки и черепицы до барельефов и статуй.


Еще один важный проект, который обещает поразить красивой картинкой — перенесенный на следующий год The Witcher 3: Wild Hunt. В игре будет широкое применение PhysX не только для увеличения количества частиц, но и для симуляции более реалистичных разрушений и визуализации тканей. Отображение пышной шевелюры героя будет осуществляться при помощи технологии HairWorks — ответ на AMD TressFX.


Некоторые визуальные эффекты PhysX реализованы в Warface. В популярную многопользовательскую игру War Thunder обещают добавить продвинутую систему разрушений самолетов с использованием PhysX и симуляцию воды на базе технологии WaveWorks.

Представлена технология Turf Effect, которая позволяет визуализировать реалистичную динамическую траву с достоверной физикой. Практической реализации пока нет.

Кроме вполне ожидаемой поддержки всех спецификаций DirectX 11.2 новинки получили поддержку новых возможностей DirectX 12.

Что касается технической реализации конечных продуктов, то за основу взят дизайн плат от GeForce GTX 780/780 Ti, но с некоторым упрощением системы питания. Система охлаждения тоже позаимствована у старых флагманов. Если они пристойно справлялись с горячим GK110, то GM204 легко охладят и при более низких оборотах и шуме.


Наше практическое знакомство с новой серией начнется с младшего GeForce GTX 970 в исполнении MSI. В ближайшее время выйдет обзор и по GeForce GTX 980.

Gainward GeForce GTX 970 Phoenix Результаты тестирования Одной страницей

Продолжаем компенсировать отсутствие обзоров некоторых актуальных видеокарт на нашем сайте. GeForce GTX 970 периодически присутствовала в разных тестированиях по отдельным играм. Настало время для резюмирующего обзора. Мы опишем общие особенности GeForce GTX 970 и рассмотрим конкретную модель в исполнении компании Gainward. Будут проведены тесты при рекомендованных частотах, с заводским разгоном и при максимальных частотах, которых нам удалось достичь на этой карте. Производительность GeForce GTX 970 мы сравним с некоторыми флагманскими решениями и соперниками от AMD.

Видеокарта GeForce GTX 970 является младшим решением на базе графического процессора GM204 архитектуры Maxwell второго поколения, являясь по сути урезанной версией GeForce GTX 980. С этой картой связана неприятная история, когда в официальные спецификации вносились правки уже после выпуска продукта. Сам продукт при этом никоим образом не менялся, просто изначально NVIDIA не раскрыла все его технические особенности.

В полной версии GM204 оперирует 2048 потоковыми процессорами CUDA-cores и 128 текстурными блоками, которые организованы в два кластера по 8 блоков SMM в каждом. В GeForce GTX 970 отключено 3 SMM из 16, что дает 1664 активных CUDA-ядер и 104 текстурных блока. Без изменений осталась 256-битная шина памяти. Но, как оказалось позже, GeForce GTX 970 немного упрощена и по части ROP - их 56 вместо 64. Попутно отрезаны связанные с ними блоки кэш-памяти L2, и вместо 2 МБ в активе младшей карты 1792 КБ. Один из восьми 64-битных контролеров памяти лишился выделенной области кэш. Он работает с последним сегментом памяти. В результате из 4 ГБ видеобуфера у GeForce GTX 970 3,5 ГБ работают на максимальной пропускной, а последние 512 МБ выступают в роли добавочного сегмента, и скорость работы с ним значительно меньше. Если упрощать, то можно говорить о 3,5 ГБ эффективной памяти и 0,5 ГБ вспомогательной, которая не всегда используется.

Общая организация такой структуры изображена на блок-схеме. Для наглядности можно привести более привычную блок-схему ядра GM204, которую вы могли видеть в разных обзорах. На ней мы удалили деактивированные блоки.

Вместе с некоторыми упрощениями в GeForce GTX 970 удалось добиться высокой энергоэффективности и TDP на уровне 145 Вт. Частота Boost у ядра заявлена на среднем уровне 1178 МГц при базовом значении 1051 МГц. Эффективная частота чипов памяти 7 ГГц. Относительно GeForce GTX 980 младшая карта слабее на 23% по основным вычислительным блокам, по ROP разница 14%. Чуть ниже и частота GPU. Для лучшей наглядности сравним характеристики этих двух видеокарт в одной таблице.

Архитектура

Кодовое имя GPU

Количество транзисторов, млн.

Техпроцесс, нм

Площадь ядра, кв. мм

Количество текстурных блоков

Количество блоков ROP

Частота ядра, МГц

Шина памяти, бит

Тип памяти

Объём памяти, Мбайт

Интерфейс

Уровень TDP, Вт

Теперь взглянем на конкретную модель Gainward GeForce GTX 970 Phoenix.

Видеокарта поставляется в большой коробке. Комплектуется переходником питания, адаптером DVI/D-Sub и диском с программным обеспечением.

Gainward GeForce GTX 970 Phoenix - массивное устройство с системой охлаждения, которая занимает более двух слотов. Кулер использует два вентилятора. Пластиковый корпус накрыт декоративными элементами красного и серебристого цветов.

У карты два разъема питания, которые находятся ближе к центру. При этом сама плата полноформатная. Gainward защищен гарантийной пломбой на одном из винтов. По этой причине мы не имели возможность разобрать Phoenix и детально изучить плату.

Для вывода изображения реализовано четыре интерфейсных разъема: HDMI, два DisplayPort, DVI.

Оценить конструкцию кулера можно без разбора. Пластиковый корпус снимается отдельно. Под ним виден крупный радиатор с тремя медными тепловыми трубками.

В радиаторе есть «окно» под разъемы питания. В районе узла питания имеется ребристый радиатор на транзисторах.

Обдув осуществляется двумя вентиляторами Apistek диаметра 92 мм. Они прикручиваются к пластиковому съемному корпусу.

Рабочие частоты ядра у Gainward GeForce GTX 970 Phoenix выше рекомендованного уровня. Базовое значение 1152 МГц при Boost Clock 1304 МГц. Частоты памяти остались на стандартном уровне в 7012 МГц.

Частота Boost определяется ограничениями по мощности и температурным лимитом. Если они не превышены, частоты выше заявленного уровня Boost Clock. По мере нагрева или превышения ограничений по мощности частота может снижать до более низких значений. У нашего тестового экземпляра пиковый Boost достигал уровня 1367 МГц. Понижения относительно максимума небольшие, в некоторых приложениях лишь на 12-25 МГц, в некоторых играх больше. Например, во время прохождения бенчмарка Metro Last Light частота ядра иногда падала почти до 1300 МГц, но не ниже заявленного Boost Clock.

Уровень шума весьма умеренный. Температура держалась в пределах 75 °C.

Разгон осуществлялся через утилиту MSU Afterburner. Базовая частота была повышена до 1277 МГц, что позволило достичь Boost до 1505 МГц после небольшого повышения напряжения. Память удалось разогнать до уровня 8100 МГц.

Для сохранения стабильности пришлось поднять скорость вентиляторов, что уже чревато появлением определенного гула. Если вопрос шума крайне критичен, то без повышения напряжения при меньшем разгона видеокарта вполне сможет работать на том же уровне шума, что и в номинале.

Нас также интересует производительность самой простой версии GeForce GTX 970. По итогам изучения других обзоров можно прийти к выводу, что частота Boost во многом зависит от охлаждения и эксплуатационных условий, даже если технические характеристики у разных видеокарт одинаковы. В итоге мы подобрали такую базовую частоту, чтобы пиковое значение не превышало 1230 МГц. При этом понизили лимит мощности, что дало снижения Boost ядра до 1177 МГц в самых тяжелых моментах. В более простых играх результирующее значение Boost было ближе к максимуму.

При таких настройках видеокарта Gainward заменит референсную версию в нашем сравнении.

Характеристики участников тестирования

В тестирование добавлен старый флагман в лице GeForce GTX 780 Ti. Этот видеоадаптер оснащается меньшим объемом памяти, зато может похвастать 384-битной шиной. Интересно сравнить его возможности с GeForce GTX 970 в современных играх. Ранее мы делали сравнение флагманских карт двух поколений NVIDIA и AMD в отдельном обзоре , но младшая модель на GM204 в него не попала. Для наглядности добавлены результаты GeForce GTX 980 Ti. Эта самая мощная серийная карта. Ее уровень по умолчанию выше. Но интересно, каков будет разрыв с предельно разогнанной картой GeForce GTX 970.

Среди конкурентов от AMD топовые решения на базе процессора Grenada(Hawaii) - Radeon R9 390X и Radeon R9 290X, плюс Radeon R9 Fury.

В разгоне протестирован только графический ускоритель Gainward GeForce GTX 970, все остальные участники тестировались при рекомендованных частотах.

Технические характеристики всех участников указаны в таблице. По частотам приведены официальные данные для Boost. На диаграммах производительности указаны базовые и пиковые значения частот GeForce.

GeForce GTX 980 Ti

Gainward GeForce GTX 970 Phoenix

GeForce GTX 780 Ti

Архитектура

Кодовое имя GPU

Количество транзисторов, млн.

Техпроцесс, нм

Площадь ядра, кв. мм

Количество потоковых процессоров

Количество текстурных блоков

Количество блоков ROP

Частота ядра, МГц

Шина памяти, бит

Тип памяти

Эффективная частота памяти, МГц

Объём памяти, Мбайт

Интерфейс

Уровень TDP, Вт

Тестовый стенд

  • процессор: Intel Core i7-3930K @4,4 ГГц
  • материнская плата: ASUS Rampage IV Formula
  • память: Kingston KHX2133C11D3K4/16GX, 1866 МГц, 4x4 ГБ
  • жесткий диск: Hitachi HDS721010CLA332, 1 TБ
  • блок питания: Seasonic SS-750KM
  • операционная система: Windows 7 Ultimate SP1 x64
  • драйвер GeForce: NVIDIA GeForce 359.06
  • драйвер Radeon: AMD Radeon Crimson Edition 15.11

Тесты проводились в разрешении 2560x1440. На диаграммах слева указывается минимальный fps, справа указан средний fps. Список тестов не очень большой, поэтому описание методики тестирования не выносилось в отдельный блок статьи. Все описания и необходимые примечания идут перед результатами.

Тестовый стенд, методика тестирования
Конфигурация тестовых стендов
CPU Intel Core i7-3960X @ 4,6 ГГц (100x46) Intel Core i7-3970X @ 4,6 ГГц (100x46)
Материнская плата ASUS P9X79 Pro
Оперативная память DDR3 Kingston HyperX 4x2 Гбайт @ 1600 МГц, CL9
ПЗУ Intel SSD 520 240 Гбайт
Блок питания Corsair AX1200i, 1200 Вт Seasonic Platinum-1000, 1000 Вт
Охлаждение CPU Thermalright Archon
Корпус CoolerMaster Test Bench V1.0
Операционная система Windows 7 Ultimate X64 Service Pack 1
ПО для GPU AMD AMD Catalyst 13.4
ПО для GPU NVIDIA 344.07

Для измерения мощности системы используется стенд с блоком питания Corsair AX1200i. Энергосберегающие технологии CPU во всех тестах отключены. Шина PCI-Express работает в режиме 3.0. Для активации PCI-E 3.0 на видеокартах серий GeForce 600 и 700 в системе на чипсете X79 применяется патч от NVIDIA.

В настройках драйвера NVIDIA всегда в качестве процессора для вычисления PhysX выбирается CPU. Для карт AMD всегда настройка Tesselation переводится из состояния AMD Optimized в Use application settings. В CrossFire-конфигурациях остается включенной опция Frame Pacing.

Бенчмарки: синтетические
Программа API Настройки Разрешение
3DMark 2011 DirectX 11 Профиль Extreme
3DMark DirectX 11 Тест Fire Strike (не Extreme)
TessMark DirectX 11 Set 4 (2048x2048), tessellation x8/x16/x32/x64 AF Off 1920x1080
Unigine Heaven 4 DirectX 11 DirectX 11, макс. качество, тесселяция в режиме Extreme AF 16x, MSAA 4x 2560х1440 / 3840x2160
Бенчмарки: игры
Программа API Настройки Анизотропная фильтрация, полноэкранное сглаживание Разрешение
Far Cry 3 + FRAPS DirectX 11 DirectX 11, макс. качество, HDAO. Начало миссии Secure the Outpost AF, MSAA 4x 2560х1440 / 3840x2160
Tomb Raider. Встроенный бенчмарк DirectX 11 Макс. качество AF 16x, SSAA 4x 2560х1440 / 3840x2160
Bioshock Infinite. Встроенный бенчмарк DirectX 11 Макс. качество. Postprocessing: Normal AF 16x, FXAA 2560х1440 / 3840x2160
Crysis 3 + FRAPS DirectX 11 Макс. качество. Начало миссии Post Human AF 16x, MSAA 4x 2560х1440 / 3840x2160
Metro: Last Light. Встроенный бенчмарк DirectX 11 Макс. качество AF 16x, SSAA 4x 2560х1440 / 3840x2160
Company of Heroes 2. Встроенный бенчмарк DirectX 11 Макс. качество AF, SSAA 4x 2560х1440 / 3840x2160
Batman: Arkham Origins. Встроенный бенчмарк DirectX 11 Макс. качество AF, MSAA 4x 2560х1440 / 3840x2160
Battlefield 4 + FRAPS DirectX 11 Макс. качество. Начало миссии Tashgar AF 16x, MSAA 4x + FXAA 2560х1440 / 3840x2160
Thief. Встроенный бенчмарк DirectX 11 Макс. качество AF 16x, SSAA 4x + FXAA 2560х1440 / 3840x2160

Участники тестирования

В тестировании производительности приняли участие следующие видеокарты:

  • AMD Radeon R9 280 (918/5500 МГц, 2 Гбайт)
  • GIGABYTE GeForce GTX 970 G1 Gaming (1050/7012 МГц, 4 Гбайт)

Тактовые частоты, энергопотребление, температура, разгон

Хотя GTX 970 обладает меньшей базовой частотой по сравнению с GTX 980, на поверку у него оказался выше диапазон работы GPU Boost. В играх GPU достигает частот вплоть до 1213 МГц (на 163 МГц выше базовой), и, стало быть, в этом плане он ненамного отстоит от GTX 980 (1253 МГц). GTX 970 слегка ограничен по напряжению, которое не превышает 1,212 В, в то время как в GTX 980 достигает 1,225 В.

Что касается видеокарты GIGABYTE, то в ней при штатных настроках графический процессор работает на частотах от 1178 МГц (Base Clock) до 1342 МГц (максимальное значение, наблюдавшееся под нагрузкой).

BIOS допускает увеличение лимита мощности и температуры GPU до 112% и 91 °C соответственно. Также можно поднять максимальное напряжение на GPU до 1,256 В. Одновременно на несколько шагов увеличивается диапазон частот. Наш экземпляр удалось разогнать до 1278 МГц базовой частоты, а в динамике наблюдались частоты вплоть до 1467 МГц. Видеопамять без проблем прибавила 1 ГГц эффективной частоты.

Base Clock, МГц Макс. Boost Clock, МГц Base Clock, МГц (разгон) Макс. зарегистрированная Boost Clock, МГц (разгон)
GeForce GTX 980 1127 1253 (+126) 1387 1526 (+139)
GeForce GTX 970 1050 1213 (+163) 1278 1467 (+189)
GeForce GTX TITAN Black 889 1032 (+143) 1100 1262 (+162)
GeForce GTX TITAN 836 1006 (+145) 966 1150 (+184)
GeForce GTX 780 Ti 876 1020 (+144) 986 1130 (+144)
GeForce GTX 780 863 1006 (+143) 1053 1215 (+162)
GeForce GTX 770 1046 1176 (+130) 1190 1333 (+143)

На референсных частотах GeForce GTX 970 по мощности практически не отличается от своего флагманского собрата при нагрузке в играх. Новинка также немного более экономична по сравнению с GeForce GTX 780, хотя GTX 770 демонстрирует меньшую мощность. GTX 970 также несравненно выгоднее смотрится в сравнении с любыми видеокартами AMD — от R9 280X до R9 290X.

С помощью FurMark удалось уловить небольшую разницу между GTX 970 и GTX 980, а соотношение GTX 970 и GTX 770 сместилось в пользу новинки. Топовые видеоадаптеры AMD по-прежнему намного прожорливее, но Radeon R9 280X парадоксальным образом демонстрирует в FurMark более низкую мощность, чем в игровом тесте.

Плата GIGABYTE имеет запас мощности для разгона. После увеличения частот энергопотребление в обоих тестах возросло в где-то на 30 Вт по сравнению с результатами карты на референсных для GTX 970 частотах.

Система охлаждения карты GIGABYTE настолько эффективна, что плата с большим преимуществом перед остальными участниками теста заняла первое место с наиболее низкими температурами GPU под нагрузкой. Впрочем, не можем умолчать о досадном недостатке кулера: в простое вентиляторы постоянно то разгоняются до высоких оборотов, то затихают. По-видимому, это назойливое поведение - результат неудачной прошивки нашего тестового экземпляра. В конце концов, это один из первых образцов платы.

Производительность: синтетические тесты

  • Разрыв между флагманской картой, GTX 980, и GTX 970 весьма велик.
  • Однако новинка оставила позади как GeForce GTX 780, так и основного соперника - Radeon R9 290.

  • GTX 970 по-прежнему намного отстает от GTX 980, зато не так уж сильно отличается от GeForce GTX 780 Ti.
  • Топовые видеоадаптеры AMD остались позади GTX 970, хотя R9 290X побежден с минимальным преимуществом.

TessMark

  • Отключение трех SMM в GM204 вкупе со снижением тактовых частот GPU отразилось на производительности в преимущественно геометрической нагрузке. GTX 970 немного медленнее по сравнению с GeForce GTX 980 и GTX 780 Ti.
  • И все-таки даже в таком виде GTX 970 оставил позади все конкурирующие видеоадаптеры AMD вместе с GeForce GTX 770.

Unigine Heaven 4

Tomb Raider

  • Отставание GTX 970 от GTX 980 невозможно не заметить при обоих разрешениях.
  • GTX 970 и GTX 780 эквивалентны при разрешении Ultra HD, а вот при WQHD новинка существенно быстрее.
  • GTX 970 также на равных соперничает с R9 290X в Ultra HD и даже набрала чуть больше FPS при более низком разрешении.

Bioshock Infinite

  • GTX 970 опять-таки далеко отстоит от GTX 980.
  • Зато можно зафиксировать уверенную победу новинки над GTX 780 и Radeon R9 290X.

Crysis 3

  • В силу низкой частоты кадров разница между GTX 980 и GTX 970 не бросается в глаза.
  • Новинка также практически не отличается по производительности от GTX 780 и Radeon R9 290X.

Metro: Last Light

  • Как и в предыдущем тесте, разница между GTX 970 и GTX 980 имеется, но с практической точки зрения она невелика.
  • GTX 970 также с минимальным отрывом превосходит GTX 780 и наступает на пятки Radeon R9 290X.

Company of Heroes 2

  • GTX 980 заметно превосходит GTX 970 только при разрешении WHQD, в режиме Ultra HD расстояние уменьшается.
  • GTX 970 также немного быстрее по сравнению с GTX 780.
  • А вот две топовые видеокарты AMD ушли вперед, хотя зазор между GTX 970 и R9 290 минимален.

Batman: Arkham Origins

  • GeForce GTX 970 существенно отличается от своего старшего товарища.
  • GTX 780 имеет лишь минимальное преимущество перед GTX 970, и то только в режиме WQHD.
  • Флагману AMD новинка практически не уступает.

Battlefield 4

  • Налицо колоссальная разница между GTX 970 и GTX 980.
  • GTX 970 ненамного превосходит GTX 780, но примерно настолько же отстает от Radeon R9 290.

  • Преимущество флагмана NVIDIA перед GTX 970 более выражено при разрешении WQHD. В 4K разница не столь заметна по причине низкой частоты смены кадров.
  • Производительность GTX 780 меньше на 1-2 FPS.
  • Radeon R9 290 на доли FPS опережает новинку.


Gigabyte Geforce GTX 970 WindForce SuperOC 4096 МБ 256-битной GDDR5 PCI-E
Параметр Значение Номинальное значение (референс)
GPU Geforce GTX 970 (GM204)
Интерфейс PCI Express x16
Частота работы GPU (ROPs), МГц 1178-1380 1050-1178
Частота работы памяти (физическая (эффективная)), МГц 1750 (7000) 1750 (7000)
Ширина шины обмена с памятью, бит 256
Число вычислительных блоков в GPU/частота работы блоков, МГц 13/1178-1380 13/1050-1178
Число операций (ALU) в блоке 128
Суммарное число операций (ALU) 1664
Число блоков текстурирования (BLF/TLF/ANIS) 104
Число блоков растеризации (ROP) 64
Размеры, мм 300×105×35 270×100×36
Количество слотов в системном блоке, занимаемые видеокартой 2 2
Цвет текстолита черный черный
Энергопотребление (пиковое в 3D/в режиме 2D/в режиме «сна»), Вт 159/68/21 147/62/22
Выходные гнезда 1×DVI (Dual-Link/HDMI), 1×DVI (Single-Link/HDMI), 1×HDMI 2.0, 3×DisplayPort 1.2 1×DVI (Dual-Link/HDMI), 1×HDMI 2.0, 3×DisplayPort 1.2
Поддержка многопроцессорной работы SLI
Максимальное количество приемников/мониторов для одновременного вывода изображения 4 4
Дополнительное питание: количество 8-контактных разъемов 1 Нет
Дополнительное питание: количество 6-контактных разъемов 1 2
Максимальное разрешение 2D: DP/HDMI/Dual-Link DVI/Single-Link DVI
Максимальное разрешение 3D: DP/HDMI/Dual-Link DVI/Single-Link DVI 3840×2400/3840×2400/2560×1600/1920×1200

Комплектация локальной памятью

Картa имеeт 4096 МБ памяти GDDR5 SDRAM, размещенной в 8 микросхемах по 4 Гбит (по 4 на каждой стороне PCB).

В качестве синтетических тестов DirectX 11 мы использовали примеры из пакетов SDK компаний Microsoft и AMD, а также демонстрационную программу Nvidia. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010) . Мы взяли и приложения обоих производителей видеочипов: Nvidia и AMD. Из ATI Radeon SDK были взяты примеры и (они также есть и в DirectX SDK). Дополнительно использовалась демонстрационная программа компании Nvidia - , также известная, как Island11.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 970 GTX 970 )
  • Geforce GTX 980 со стандартными параметрами (сокращенно GTX 980 )
  • Geforce GTX 770 со стандартными параметрами (сокращенно GTX 770 )
  • Radeon R9 290X со стандартными параметрами (сокращенно R9 290X )
  • Radeon R9 290 со стандартными параметрами (сокращенно R9 290 )

Для анализа производительности новой модели видеокарты Geforce GTX 970 нами были выбраны эти решения по следующим причинам. Geforce GTX 980 также является новейшей моделью компании Nvidia на базе того же графического процессора GM204, но в полной конфигурации, и будет интересно оценить разницу между ними. А из предыдущего семейства для сравнения была взята модель Geforce GTX 770, которая является предшественницей рассматриваемой новинки в этом же сегменте, и основана на графическом процессоре GK104, схожем по позиционированию с GM204, но с предыдущей архитектурой Kepler.

От конкурирующей компании AMD для нашего сравнения мы выбрали две видеокарты, основанные на одинаковом графическом процессоре - Hawaii, но отличающиеся по скорости. Плата Radeon R9 290 является главным ценовым конкурентом для Geforce GTX 970, и мы сравним их с рыночной точки зрения, ну а Radeon R9 290X будет тем решением, к которому нужно стремиться новинке в идеале, хотя эта видеокарта AMD заметно дороже и потребляет куда больше энергии.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Мы отказались от устаревших тестов DirectX 9, так как все мощные решения отличаются в них не слишком показательными результатами, будучи серьёзно ограничены ПСП, филлрейтом или текстурированием. К тому же, некоторые из видеокарт некорректно работают в таких приложениях, а Nvidia и вовсе давно перестала заниматься оптимизацией D3D9-приложений.

Во вторую версию RightMark3D вошли два уже знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также еще два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail - «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсэмплинга - до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» - от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в тесте зависит от количества и эффективности блоков TMU, влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт и пропускная способность памяти. Результаты при детализации уровня «High» получаются до полутора раза ниже, чем при «Low».

В задачах процедурной визуализации меха с большим количеством текстурных выборок, с выпуском видеочипов на базе архитектуры GCN компания AMD вырвалась вперед по производительности, и сейчас платы Radeon являются лидерами в этих сравнениях, что говорит о значительно более высокой эффективности выполнения ими этих программ. Такой вывод подтверждается и сегодняшним сравнением - представленная недавно видеокарта Nvidia проиграла обоим конкурентам от AMD, в том числе своему главному сопернику в лице Radeon R9 290.

В первом нашем тесте новая видеоплата модели Geforce GTX 970 оказалась явно побыстрее своего ценового аналога из предыдущего поколения в виде GTX 770, но преимущество не очень большое. Результат объясним более эффективным исполнением данной задачи новым GPU и заметно большей скоростью заполнения, так как скорость текстурирования у GTX 970 не слишком высока. Отставание в 16% от GTX 980 говорит в пользу упора в производительность блоков TMU и ALU.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: возможно, в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

В изменившихся условиях новая видеокарта Geforce GTX 970 также опережает аналогичную модель из предыдущего поколения - GTX 770, оказываясь между последней и GTX 980. От своего более производительного собрата на GM204 она отстаёт на 15-18%, а отставание от главного ценового конкурента в виде Radeon R9 290 лишь увеличилось - в подобных вычислениях чипы компании AMD явно сильны, так как они предпочитают попиксельные вычисления.

Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:

Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза - такой режим называется «High».

Диаграмма очень похожа на предыдущую (также без включения суперсэмплинга), и в этот раз новая Geforce GTX 970 оказалась ближе к GTX 980, чем к GTX 770. Новинка продолжает заметно опережать модель предыдущего поколения от Nvidia, а старшей проигрывает уже чуть меньше - 14%. Похоже, что новый графический процессор Nvidia в пиксельных шейдерах справляется с работой лучше предыдущих решений.

Ну а если брать сравнение с видеокартами AMD, то в этом случае все примерно так же, как и было ранее в прошлом тесте. Новинка GTX 970 уступает и Radeon R9 290X и R9 290, хотя подобралась к своему ценовому конкуренту несколько ближе. Посмотрим, что изменит включение суперсэмплинга:

При включении суперсэмплинга и самозатенения задача получается еще более тяжелой и совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, включение суперсэмплинга сказывается меньше, чем в предыдущем случае.

Оба графических решения AMD Radeon и в этом D3D10-тесте пиксельных шейдеров работают явно эффективнее, по сравнению с конкурирующими платами Geforce, но новый чип GM204 слегка изменил ситуацию в лучшую сторону - представленная ранее вторая из топовых плат Geforce GTX 970 на втором чипе архитектуры Maxwell стала заметно быстрее предшествующей Geforce GTX 770 и в самых сложных условиях отстаёт от соперничающей с ней Radeon R9 290 лишь на 10%.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест - Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, так как на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, и даже упор в ПСП, особенно в случае быстрейших решений. В случае теста Mineral, новая модель Geforce GTX 970 оказалась заметно быстрее платы GTX 770 из предыдущего поколения, которую заменила в линейке компании Nvidia. А от старшей GTX 980 она отстаёт всего лишь на 12%.

Мало того, даже сравнение Geforce GTX 970 с конкурирующей с ней платой от компании AMD, оказывается в пользу первой! Обновление архитектуры Nvidia с Kepler до Maxwell привело к тому, что их новый чип в таких тестах даже имеет преимущество перед конкурирующими решениями от AMD. В этом математическом тесте конкурирующая с новинкой по цене видеокарта Radeon R9 290 оказалась чуть-чуть, но всё же позади, что можно назвать отличным результатом для второй платы на чипе GM204.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Да и во втором нашем математическом тесте из RigthMark мы видим примерно такие же результаты видеокарт относительно друг друга - разница между тестами получилась несущественной. Так, новая Geforce GTX 970 всё так же сильно опережает GTX 770, отставая от GTX 980 на те же 12%. Да и Radeon R9 290 всё так же, хоть и чуть-чуть, но всё же отстаёт от новинки производства Nvidia. В тестах пиковой математической производительности новый видеочип Nvidia показывает себя просто отлично!

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления - в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт очень простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.

Разница между результатами видеокарт на чипах Nvidia и AMD обусловлена отличиями в геометрических конвейерах чипов этих компаний, и она весьма заметна. Если в предыдущих тестах с пиксельными шейдерами платы AMD справлялись с работой не хуже, а то и лучше решений Nvidia, то первые же тесты геометрии показывают, что в таких задачах платы Nvidia весьма конкурентоспособны.

Свежая модель видеокарты Geforce GTX 970 опережает аналогичную GTX 770 из предыдущего поколения чуть ли не вдвое, а отставание от GTX 980 на таком же чипе составляет уже привычные 15-16%. Видеокарты Radeon в этот раз сильно отстают, и это можно объяснить тем, что геометрическая производительность у графических процессоров компании AMD хуже, чем у Nvidia. Особенно отличился новый GM204, который справляется с работой заметно быстрее чем даже GK110. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте цифры слегка улучшились и для плат AMD и для решений Nvidia, но разница невелика и ничего особенно не меняет. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и выводы остаются прежними.

Плата Nvidia на базе урезанного графического процессора архитектуры Maxwell более чем в полтора раза быстрее аналогичной модели предыдущего поколения, от GTX 980 отстаёт на 13-14%, ну а оба решения конкурента (Radeon R9 290X и R9 290) остаются далеко позади.

К сожалению, «Hyperlight» - второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 - stream output, на всех современных видеокартах компании AMD просто не работает. В какой-то момент очередное обновление драйверов Catalyst привело к тому, что данный тест перестал запускаться на платах этой компании, и эта ошибка не исправлена вот уже несколько лет. Так что рассматриваем в этом тесте только результаты видеокарт Nvidia:

Тут мы видим примерно то же самое, что и в тесте Galaxy - вторая видеоплата на чипе GM204 всё так же быстрее GTX 770, хотя разница между ними уже сократилась, а отставание от Geforce GTX 980 снизилось до 6-9%. Возможно, в тяжёлом режиме что-то изменится:

В таких условиях результаты разных видеокарт компании Nvidia изменились, и разница между GTX 980 и GTX 970 увеличилась до 10-13%. Новая Geforce GTX 970 хоть и быстрее подобной же платы из прошлого поколения в виде Geforce GTX 770, но отставание последней уже явно меньше. В любом случае, новинка показала себя очень неплохо, она весьма эффективно справляется с различными программами на основе геометрических шейдеров.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» - нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Наши предыдущие исследования показали, что на результаты этого теста может влиять и филлрейт и пропускная способность памяти, что особенно хорошо заметно в простом режиме. Новая топовая видеокарта компании Nvidia в нём показывает скорость выше, чем аналогичная по рыночному позиционированию плата GTX 770 из предыдущего поколения, а в лёгком режиме явно упирается в ПСП. Отставание от старшей GTX 980 составило 6-9%.

Главный ценовой конкурент новинки в виде Radeon R9 290 в этот раз немного опережает плату от Nvidia, особенно в лёгком режиме. Разница в остальных двух режимах не слишком велика, а в самом сложном она составляет лишь 4%. Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Ситуация на диаграмме заметно изменилась, решения компании AMD в тяжелых режимах потеряли явно больше, чем платы Geforce, и значительно. Новая видеоплата Geforce GTX 970 показала скорость выше, чем оба конкурента (за исключением самого лёгкого режима, где она упёрлась в пропускную способность памяти). Если же сравнивать новинку с решением этой же компании из предыдущего поколения, то GTX 970 опережает плату GTX 770 с хорошим запасом. Ну а отставание от GTX 980 составляет привычные 6-8%.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Результаты во втором тесте вершинного текстурирования «Waves» не слишком похожи на то, что мы видели на предыдущих диаграммах. Скоростные показатели всех Geforce в этом тесте сильно ухудшились, и хотя новая модель Nvidia Geforce GTX 970 чуть быстрее GTX 770, но разница мизерная, а старшей модели GTX 980 новинка проигрывает и вовсе до 19%. Если сравнивать её с конкурентами, то обе платы серии Radeon R9 290 смогли показать лучшую производительность в этом тесте. Рассмотрим второй вариант этой же задачи:

С усложнением задачи во втором тесте текстурных выборок скорость всех решений стала ниже, и больше всего пострадали видеокарты Nvidia. В выводах меняется не слишком многое, но новая модель Geforce GTX 970 отстаёт от GTX 980 уже целых 17-23%, да и в сравнении её с предшественницей из серии Geforce GTX 700, новинка проигрывает - дело явно в недостаточной скорости текстурирования. А уж стоящей те же деньги Radeon R9 290 новинка от Nvidia уступила в этом тесте и вовсе чуть ли не вдвое.

3DMark Vantage: тесты Feature

Синтетические тесты из пакета 3DMark Vantage покажут нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10 и интересны тем, что отличаются от наших и до сих пор актуальны. При анализе результатов видеокарты модели Geforce GTX 970 в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark. Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Увы, но разница в скорости между GTX 970 и GTX 770 в пользу решения предыдущего поколения, что легко объяснимо теоретически - у новинки меньше блоков TMU. Если сравнивать GTX 970 с GTX 980, то рассматриваемая сегодня модель на основе урезанного чипа GM204 в текстурировании уступает 16%, что меньше теоретической разницы.

Что же касается сравнения скорости текстурирования новой топовой видеоплаты Nvidia с аналогичным по цене решением конкурента, то тут новинка также уступает своему главному сопернику по ценовой нише - Radeon R9 290, причём очень сильно. Всё-таки сравнительно малое количество текстурных блоков в GM204 высокой частотой работы GPU не перекрыть. Feature Test 2: Color Fill

Вторая задача - тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Цифры второго подтеста 3DMark Vantage показывают производительность блоков ROP, иногда - с учетом величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), поэтому тест измеряет пропускную способность и/или производительность ROP, и в этот раз похоже на второе. Результат у рассматриваемой сегодня топовой платы Geforce GTX 970 намного (более чем в полтора раза) лучше, чем у GTX 770, а старшей GTX 980 новинка уступила тоже немало - 17%.

Если сравнивать скорость заполнения сцены новой видеокартой Geforce GTX 970 с видеокартами AMD, то рассматриваемая нами сегодня плата в этом тесте показывает скорость заполнения сцены, превышающую ту, на которую способны и идентичная по цене Radeon R9 290 и даже более дорогая Radeon R9 290X - всё-таки оптимизации по эффективности сжатия данных буфера кадра и большое количество блоков ROP сделали своё дело. Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника уже используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Этот тест из пакета 3DMark Vantage отличается от проведенных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен верный баланс GPU, а также эффективность выполнения сложных шейдеров.

В данном случае, важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая плата Geforce GTX 970 оказалась почти на 40% быстрее своего аналога на базе графического процессора архитектуры Kepler, хотя и уступила 17% плате GTX 980 на основе такого же чипа GM204, но в полноценной его версии.

Новинка немного (13%) проигрывает и своему сопернику по цене в виде AMD Radeon R9 290, что объясняется тем, что графические процессоры производства компании AMD в этой задаче работают весьма эффективно, ну а теперь и новые платы на базе графического процессора GM204 подобрались к Radeon на близкое расстояние. Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны бы являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны были проявиться именно тут, но нет - все платы Nvidia показали не слишком высокую (и одинаковую!) скорость. В результате, новая модель Geforce GTX 970 показала результат примерно на одном уровне с GTX 770 и GTX 980 - тут что-то явно не так.

Сравнение с платами Radeon в этом тесте приводит к понятным выводам - несмотря на меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности, по сравнению с конкурирующими решениями Nvidia, обе платы Radeon в этом тесте работают весьма эффективно и обгоняют все три платы Geforce, представленные в сравнении. Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.

Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором «геометрическом» тесте из 3DMark Vantage ситуация серьёзно изменилась, в этот раз новая модель Geforce GTX 970 работает заметно лучше - новинка на 23% быстрее своего предшественника в лице GTX 770, и на 14% отстаёт от старшего варианта GTX 980.

Сравнение новинки Nvidia с конкурирующими видеокартами компании AMD в этот раз куда более позитивное, ведь обе платы от компании-соперника показывают чуть худшие результаты, новинка опережает Radeon R9 290 на 5%, и даже более дорогая модель в виде Radeon R9 290X также совсем чуть-чуть отстала. В итоге: платы на чипах AMD лучше выполняют синтетический тест имитации тканей из тестового пакета 3DMark Vantage, а за Nvidia остаётся тест с расчётом частиц, хотя в обеих задачах используются геометрические шейдеры. Feature Test 6: Perlin Noise

Ну и последний feature-тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise - это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В этом случае производительность решений не полностью соответствует теории, но она близка к тому, что мы видели в других математических тестах. В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим отличающееся распределение результатов, по сравнению с аналогичными тестами из нашего тестового пакета. Главным отличием стало то, что результат новинки Geforce GTX 970 теперь ниже, чем у Radeon R9 290.

Видеочипы компании AMD с архитектурой GCN до сих пор справляются с подобными задачами лучше конкурента, особенно в тех случаях, когда выполняется интенсивная «математика». Вторая модель компании Nvidia из семейства Geforce GTX 900 в этом тесте показала неплохой результат, обогнав Geforce GTX 770 аж на 42% и отстав от GTX 980 лишь на 13% (при несколько большей теоретической разнице), но этого не хватило, чтобы догнать Radeon R9 290, являющийся главным соперником новинки по цене. Разница между ними оказалась порядка 10%, в пользу решения AMD.

Direct3D 11: Вычислительные шейдеры

Чтобы протестировать анонсированное сегодня решение компании Nvidia в задачах, использующих такие возможности DirectX 11, как тесселяция и вычислительные шейдеры, мы воспользовались примерами из пакетов для разработчиков (SDK) и демонстрационными программами компаний Microsoft, Nvidia и AMD.

Сначала мы рассмотрим тесты, использующие вычислительные (Compute) шейдеры. Их появление - одно из наиболее важных нововведений в последних версиях DX API, они уже используются в современных играх для выполнения различных задач: постобработки, симуляций и т. п. В первом тесте показан пример HDR-рендеринга с tone mapping из DirectX SDK, с постобработкой, использующей пиксельные и вычислительные шейдеры.

Скорость расчетов в вычислительном и пиксельном шейдерах для всех плат AMD и Nvidia давно уже приблизительно одинаковая, отличия наблюдались только у видеокарт на основе GPU предыдущих архитектур. Судя по нашим предыдущим тестам, результаты в задаче порой зависят не столько от математической мощи и эффективности вычислений, сколько от других факторов, вроде пропускной способности памяти и производительности блоков ROP.

В данном случае скорость видеокарт всё же зависит больше всего именно от математической производительности. Новая плата от компании Nvidia в этом тесте немного впереди своей предшественницы в лице Geforce GTX 770, и уступает GTX 980 лишь 12%, что объяснимо теорией. Если сравнивать Geforce GTX 970 с прямым ценовым конкурентом в лице Radeon R9 290, то рассматриваемая сегодня плата калифорнийской компании отстаёт от него ещё немного больше.

Второй тест вычислительных шейдеров также взят из Microsoft DirectX SDK, в нем показана расчетная задача гравитации N тел (N-body) - симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

В этом тесте чаще всего наблюдается упор в скорость исполнения сложных математических вычислений, обработки геометрии и эффективность выполнения кода с ветвлениями. И во втором DX11-тесте расклад сил между решениями двух разных компаний получился совершенно иной.

Решения компании Nvidia в этот раз явно сильнее, чем платы соперника, а Geforce GTX 970 удивила большим отставанием от старшей модели - она аж на 27% медленнее старшей сестры GTX 980. Похоже, что сказываются серьёзно урезанные возможности по геометрической и математической производительности.

Direct3D 11: Производительность тесселяции

Вычислительные шейдеры очень важны, но еще одним важным нововведением в Direct3D 11 считается аппаратная тесселяция. Мы очень подробно рассматривали ее в своей теоретической статье про Nvidia GF100. Тесселяцию уже довольно давно начали использовать в DX11-играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro Last Light, Civilization V, Crysis 3, Battlefield 3 и других. В некоторых из них тесселяция используется для моделей персонажей, в других - для имитации реалистичной водной поверхности или ландшафта.

Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision. Так, схема разбиения PN Triangles используется в STALKER: Зов Припяти, а в Metro 2033 - Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, поэтому и стали популярными.

Первым тестом тесселяции будет пример Detail Tessellation из ATI Radeon SDK. В нем реализована не только тесселяция, но и две разные техники попиксельной обработки: простое наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DX11-решения AMD и Nvidia в различных условиях:

В тесте простого бампмаппинга скорость плат не так уж важна, так как эта задача давно стала слишком легкой и производительность упирается в ПСП или филлрейт. Сегодняшний герой обзора незначительно превосходит предшествующую модель Geforce GTX 770, уступая GTX 980 более 20%, а схожее с новинкой по цене решение конкурента в виде Radeon R9 290 явно быстрее всех.

Во втором подтесте с более сложными попиксельными расчетами новинка всё так же быстрее модели Geforce GTX 770, уступает GTX 980 на полноценном GM204 около 17%, и снова заметно отстаёт от конкурирующей Radeon R9 290. Всё-таки эффективность выполнения математических вычислений в пиксельных шейдерах у чипов архитектуры GCN выше, чем у Kepler, хотя Maxwell и улучшил позиции решений Nvidia.

В подтесте с применением лёгкой степени тесселяции, новая плата Nvidia почти наравне с моделью предыдущего поколения Geforce GTX 770, а топовая GTX 980 на 18% быстрее. Если сравнивать новинку с единственной платой производства AMD, то она всё так же серьёзно уступает, так как в этом тесте тесселяции разбиение треугольников весьма умеренное и скорость не упирается в производительность блоков обработки геометрии.

Вторым тестом производительности тесселяции будет еще один пример для 3D-разработчиков из ATI Radeon SDK - PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что мы уверены, что на их основе создают свой код игровые разработчики. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом тесте в тяжелых режимах применяется более сложная геометрия, поэтому и сравнение геометрической мощи различных решений приносит совершенно другие выводы. Все представленные в материале современные решения достаточно хорошо справляются с легкой и средней геометрической нагрузкой, показывая высокую скорость. И хотя в лёгких условиях графический процессор AMD в составе Radeon R9 290 отлично работает, даже опережая калифорнийских конкурентов, которые явно во что-то уперлись, то в тяжёлых режимах платы Nvidia выходят вперёд с большим запасом. В самых сложных режимах представленная в прошлом месяце Geforce GTX 970 показывает скорость заметно лучше, чем единственная Radeon.

Что касается сравнения плат Nvidia различных поколений между собой, то рассматриваемая сегодня модель Geforce GTX 970 тоже наращивает преимущество с ростом геометрической нагрузки, как и должно быть по теории. В итоге она опережает предшествующую плату Geforce GTX 770 в самом сложном режиме почти вдвое! Да и старшая модель на топовом чипе Maxwell не так уж сильно обгоняет рассматриваемую новинку - разница между ними составляет лишь 7-10%.

Рассмотрим результаты еще одного теста - демонстрационной программы Nvidia Realistic Water Terrain, также известной как Island. В этой демке используется тесселяция и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта.

Тест Island не является чисто синтетическим тестом для измерения исключительно геометрической производительности GPU, так как он содержит и сложные пиксельные и вычислительные шейдеры в том числе, и такая нагрузка ближе к реальным играм, в которых используются все блоки GPU, а не только геометрические, как в предыдущих тестах геометрии. Хотя основной все равно остается именно нагрузка на блоки обработки геометрии.

Мы тестируем все видеоплаты при четырех разных коэффициентах тесселяции - в данном случае настройка называется Dynamic Tessellation LOD. При первом коэффициенте разбиения треугольников, скорость не ограничена производительностью геометрических блоков, и видеокарта Radeon R9 290 показывает высокий результат, даже превосходящий скорость анонсированной недавно платы Geforce GTX 970, но уже на следующих ступенях геометрической нагрузки производительность платы Radeon снижается весьма серьёзно, и новинка Nvidia выходит вперёд.

Преимущество новой платы Nvidia на видеочипе GM204 в таких тестах доходит до двух раз. Интересно, что если сравнить Geforce GTX 970 с GTX 770, то разница между их производительностью доходит до полутора раз, что трудно объяснить одной лишь возросшей скоростью обработки геометрии. Вполне возможно, что дело ещё и в том, что GM204 заметно эффективнее работает в режиме смешанной нагрузки, быстро переключаясь от исполнения графических задач к вычислительным и обратно. От старшей модели GTX 980 новинка отстаёт лишь на 11-16%, что близко к теории.

Проанализировав результаты синтетических тестов новой видеокарты Nvidia Geforce GTX 970, основанной на графическом процессоре GM204 с урезанными функциональными блоками, а также рассмотрев результаты других моделей видеокарт от обоих производителей дискретных видеочипов, можно сделать вывод о том, что рассматриваемая сегодня видеокарта вполне сможет составить конкуренцию не только сопернику по цене от компании AMD в виде Radeon R9 290, но и может стать одной из самых удачных видеокарт в своём ценовом сегменте. Она совсем немного (порядка 7-15%) уступает старшей модели GTX 980, а стоит намного дешевле её.

Новая видеокарта компании Nvidia показывает довольно высокие результаты в «синтетике», близкие к показателям Radeon R9 290. Вообще, у этих решений разные сильные стороны, в некоторых тестах сильнее более сложный графический процессор AMD, в том числе из-за большей пропускной способности памяти и эффективного исполнения пиксельных шейдеров, а в других быстрее уже графический процессор архитектуры Maxwell. Конечно, ситуация в реальных игровых приложениях может отличаться от итогов синтетических тестов, но Geforce GTX 970 в любом случае станет сильным конкурентом для Radeon R9 290 и в играх.

При этом, Geforce GTX 970 ещё и потребляет энергии меньше, чем даже Radeon R9 285, не говоря о Radeon R9 290. В смысле энергоэффективности обе новые модели компании (Geforce GTX 970 и GTX 980) выглядят потрясающе - инженеры Nvidia добились высочайшей эффективности нового GM204. С рыночной же точки зрения всё будет зависеть от цен в магазинах и сравнения производительности в игровых приложениях.

И как раз для того, чтобы сделать выводы по реальному положению дел, в следующей части нашего материала мы определим производительность новинки Nvidia в игровых проектах, сравнив её с конкурентами и оценив, в том числе и оправданность розничной цены решения с учётом скорости рендеринга Geforce GTX 970 и Radeon R9 290 в нашем наборе игровых приложений.

Наименование GeForce
GTX 770
GeForce
GTX 780
GeForce
GTX 780 Ti
GeForce
GTX 970
GeForce
GTX 980
Кодовое имя GK104 GK110 GK110 GM204 GM204
Версия Kepler Kepler Kepler Maxwell 2.x Maxwell 2.x
Техпроцесс, нм 28 28 28 28 28
Размер ядра/ядер, мм 2 294 521 521 398 398
Количество транзисторов, млн 3540 7100 7100 5200 5200
Частота ядра, МГц 1046 860 880 1050 1126
Частота ядра (Turbo), МГц 1085 900 930 1178 1216
Число шейдеров (PS), шт. 1536 2304 2880 1664 2048
Число текстурных блоков (TMU), шт. 128 192 240 104 128
Число блоков растеризации (ROP), шт. 32 48 48 64 64
Максимальная скорость закраски, Гпикс/с 33.5 41.4 42 65 72
Максимальная скорость выборки текстур, Гтекс/с 133.9 165.7 210.2 109.2 144.1
Тип памяти GDDR5 GDDR5 GDDR5 GDDR5 GDDR5
Эффективная частота памяти, МГц 7000 6000 7000 7000 7000
Объем памяти, Гбайт 4 3 3 4 4
Шина памяти, бит 256 384 384 256 256
Пропускная способность памяти, Гбайт/с 224.3 288.4 336 224.3 224.3
Питание, pin 6+8 6+8 6+8 6+6 6+6
Потребляемая мощность (2D / 3D), Ватт -/230 -/250 -/250 -/145 -/165
CrossFire/Sli V V V V V
Рекомендованная цена, $ 349 499 699 329 549
Заменяемая модель GTX 670 GTX 680 GTX 780 GTX 770/
GTX 780
GTX 780 Ti

Аппаратные и программные улучшения

Оба новых графических решения основаны на единственном ядре Maxwell GM204, но с небольшими отличиями. В случае с младшей видеокартой число исполнительных устройств CUDA Cores сократилось с 2048 до 1664 штук или с 16 блоков до 13, а поскольку «текстурники» располагаются в них же, то и их число уменьшилось с 128 до 104 штук. Для полной уверенности разработчики снизили пиковую частоту GPU Boost с 1216 до 1178 МГц.

Как следствие, даже по предварительным математическим расчетам разница в производительности между GTX 980 и GTX 970 не должна превышать 15-17%. Хватит ли этого, чтобы противостоять неплохим и достаточно шустрым видеокартам GTX 770/ GTX 780, мы скоро узнаем. А подробнее о технологиях, нашедших место в GM204, можно прочитать в обзоре GTX 980 .

Обзор NVIDIA GeForce GTX 970

Внешний вид и размеры

Модель A,
мм
B,
мм
C,
мм
D,
мм
A1,
мм
B1,
мм
C1,
мм
NVIDIA GeForce GTX 970/ GTX 980 267 98 36 64 267 98 40
NVIDIA GeForce GTX 770 267 98 36 64 267 98 40
NVIDIA GeForce GTX 780 / GTX 780 Ti / GTX Titan /
GTX Titan Black
267 98 36 64 267 98 40
AMD Radeon R9 290X / R9 290 267 98 34 71 275 98 39

А – длина печатной платы, без учета системы охлаждения и планки портов видеовыходов.
В – ширина печатной платы, без учета контактов PCI-E и системы охлаждения.
С – высота от горизонтальной плоскости печатной платы до уровня верхней поверхности системы охлаждения.
D – диаметр вентилятора/ов по внешнему радиусу.

А1 – длина печатной платы, с учетом системы охлаждения (если выходит за пределы печатной платы) до планки портов видеовыходов.
В1 – ширина печатной платы, без учета контактов PCI-E, но с замером системы охлаждения (если выходит за пределы печатной платы).
С1 – высота, с учетом задней пластины (если есть)/винтов крепления радиатора до уровня верхней поверхности системы охлаждения. Если она ниже высоты задней планки портов видеовыходов, то измеряется высота до верхней точки планки.

Референсная печатная плата как две капли воды похожа на плату GeForce GTX 980 . Очевидно, в NVIDIA не стали разрабатывать специальный дизайн, позволив своим партнерам как копировать GTX 980, так и выпускать собственные версии.

Впервые в истории компании пользователи получили щедрый подарок – пять видеопортов, четыре из которых полностью независимые. Увы, DisplayPort пока не поддерживает новейшую ревизию формата, а вот HDMI с легкостью выведет изображение в 4К разрешении с частотой 60 Гц.

Печатная плата

Поскольку обе попавшие на тест видеокарты основаны на едином дизайне печатной платы, то ранее рассмотренные аспекты относятся в полной мере и к GeForce GTX 970. Это схожее число микросхем памяти и количества используемых фаз питания, тот же GPU (на самом деле его индекс меньше, вместо 400 стоит 200) и система питания. Разрыв между двумя значениями может говорить лишь об одном – либо NVIDIA выпустит-таки при появлении конкурента разогнанную версию GTX 970 под названием GTX 970 Ti, либо оставит 300 ревизию про запас.

Разгон, вернее теоретический максимум TDP остался неизменным с момента анонса GeForce GTX 980 и составляет 125%. Только проценты процентам рознь, а все подробности будут приведены в разделе «Разгон».

Система охлаждения

Инженеры NVIDIA не стали кардинально перерабатывать конструкцию СО. Существующие системы охлаждения, оставшиеся со времен проектирования GeForce GTX 770/ GTX 780 (Ti), отлично подошли не только новому однопроцессорному флагману, но и GTX 970.

Для улучшения отвода воздуха во всех доступных и не занятых местах задней панели проделаны треугольные отверстия.

Под кожухом установлена пластина-радиатор, охлаждающая память и силовые цепи. Как и в случае со старшей моделью, основный радиатор уже не использует испарительную камеру. Хотя бы потому, что GM204 достаточно «прохладный» процессор.

Внутри радиатора расположены три тепловые трубки. Сверху по периметру наклеены специальные вставки, предотвращающие передачу вибраций и воздуха мимо радиатора.