Gtx 480 сравнение. Обзор и тестирование NVIDIA GTX480. Сводные диаграммы сравнения производительности

NVIDIA GeForce GTX 480M - топовая видеокарта, построенная на архитектуре Fermi. Она имеет полную поддержку DirectX 11 и производится по 40 нм технологии от TSMC. Имея 352 ядра, GTX480M можно сравнить с GTX 465 для настольных компьютеров, но с более низкой частотой. GeForce GTX 480M располагает 2 GB быстрой видеопамяти GDDR5 (дискретной), поэтому ее производительность должна находиться на уровне карты ATI Mobility Radeon HD 5870 .

Также известный под именем GF100 чип Fermi был преобразован и теперь имеет 3 миллиард транзисторов (со всеми 512 шейдерами). По сравнению с HD 5870 для настольных компьютеров, которая имеет 2.13 миллиардов транзисторов или Mobility Radeon HD 5870 (RV870) с 1.04 миллиардами транзисторов, GTX480M выглядит весьма впечатляюще.

Мобильный чип Fermi содержит до 352 шейдерных ядер (1-мерных) с 32 блоками растеризации (ROP) и 44 текстурными единицами (Texture Unit). Шина памяти - 256-битная, но из-за быстрой памяти GDDR5, она не должна быть проблемным местом. Силовое потребление составляет 100 Вт TDP, включая плату MXM и 2 GB GDDR5. AMD обычно определяет энергопотребление чипа отдельно, поэтому их нельзя непосредственно сравнивать. GTX 480M подходит только для большого ноутбука с хорошей системой охлаждения. Вначале только компания Clevo решилась установить эту карту в свои barebone-комплекты - 17" D901F и 18" X8100.

Производительность Nvidia GeForce GTX 480M должна быть лучше, чем у ATI Mobility Radeon HD 5870 , и на уровне с мобильной системой Geforce GTX 285M SLI и Radeon HD 4770 для настольных компьютеров. Это значит, что GTX480M - самая быстрая одиночная видеокарта в первом квартале 2010 года. Современные DirectX 10 игры должны работать на высоком разрешении бегло с хорошей прорисовкой и сглаживанием. Только для очень требовательных игр, подобных Crysis Warhead, возможно, нужно немного снизить детализацию. Из-за аппаратных средств поддержки DirectX 11 (например, хорошей тесселяции), видеокарты, построенные на архитектуре Fermi должны хорошо себя чувствовать в DirectX 11 играх, которых будет появляться все больше и больше.

Также как и серия видеокарт GeForce 300M, GeForce GTX 480M поддерживает PureVideo HD с видеопроцессором VP4. Это значит, что видеокарта может полностью декодировать HD видео в H.254, VC-1, MPEG-2 и MPEG-4 ASP. Используя Flash 10.1, графическая карта может также ускорить обработку Flash видео. Ядра Nvidia GeForce GTX 480M могут использоваться для общих вычислений, используя CUDA или DirectCompute. Например, кодирование видео HD может выполняться значительно быстрее, используя шейдерные ядра графического процессора, нежели это будет делать современный центральный процессор. PhysX, также поддерживаемый мобильным Fermi, позволяет вычислять физические эффекты в соответствующих играх (падение капель дождя, рассеивание тумана и т.д.).

По сравнению с видеокартами для настольных компьютеров, Geforce GTX 480M можно прировнять к разогнанной карте Nvidia GeForce GTX 465 (частота 607/1200) и Radeon HD 5770 .

Более полугода назад на рынке видеоадаптеров появились видеокарты ATI Radeon 5ххх Series. Они принесли с собой аппаратную поддержку DirectX 11 и Shader Model 5.0, тесселяцию, а так же много других "вкусностей" для любителей поиграть в видеоигры. К сожалению (или к счастью…), соперник в лице NVIDIA не смог вовремя предоставить конкурента, и посему, AMD (точнее, её подразделение ATI, занимающееся разработкой графических чипов) пожинала все плоды успеха, в буквальном смысле слова "наводнив" рынок видеокартами с поддержкой DirectX 11.

Компания NVIDIA, которая никогда не скупилась на PR своих продуктов, не подвела и в этот раз, намеренно прикармливая энтузиастов крошками с барского стола разработчиков NVIDIA GF100, основанном на микроархитектуре Fermi. Впервые мы услышали некие подробности о строении чипов GF100 немногим больше шести месяцев назад. С тех пор в глубине тайных лабораторий корпорации NVIDIA создавался конкурент пятитысячной серии видеокарт ATI Radeon, который воистину таки обязан просто был оправдать все данные ранее обещания. И вот, свершилось чудо! Месяц назад под салюты и фанфары аналитиков видеокарты GTX 480 и GTX 470 были пущены в свободное плавание по мировому рынку. Оправдали они свое «долгое ожидание» или нет?

реклама

Строение и архитектура NVIDIA GF100

На сегодняшний день на рынке присутствуют только два видеоадаптера от NVIDIA с поддержкой DirectX 11. Они и должны задавать ход всему движению новой линейки. Самой "старшей" картой на данный момент является GTX 480.

"Мечты сбываются..." Кажется, именно так пел Юрий Антонов. Но, как оказалось, «и не сбываются». Изначально предполагалось, что GTX 480 будет нести в себе 512 "высокопроизводительных ядер CUDA", но по каким-то причинам NVIDIA не смогла реализовать свой план на 100%. В итоге мы можем наблюдать у GTX 480 уменьшение их числа с 512 до 480 процессоров.

Спустя полгода после выхода графического процессора RV870 «Cypress» и линейки видеокарт ATI Radeon HD 5800 на его основе, компания NVIDIA наконец-то смогла порадовать своих поклонников выпуском новой архитектуры «Fermi» и первых двух видеокарт - GeForce GTX 480 и GTX 470, призванных стать ответом на Radeon HD 5800. Для многих томительное ожидание завершено и теперь уже можно, основываясь на массе всевозможных статей и обзоров, начать определяться, что же взять для современных игр с поддержкой DirectX 11? Благо, время до появления видеокарт в свободной продаже ещё есть, так как первые партии поступят в розничные сети не ранее 12 апреля. Несмотря на то, что карту мы получили за несколько дней до официального анонса, мы предпочли не торопиться с выпуском статьи, а провести максимально подробное и тщательное тестирование - поэтому мы и представляем статью вашему вниманию лишь спустя несколько дней после анонса новых видеокарт, но надеемся, что полнота материала позволит вам простить нам эту небольшую задержку.

Итак, встречаем - GeForce GTX 480!

Спецификации NVIDIA GeForce GTX 480 в сравнении с конкурентами

Технические характеристики NVIDIA GeForce GTX 480 представлены в таблице в сравнении с текущими ценовыми конкурентами и предшествующей ей видеокартой GeForce GTX 285:

Информации об архитектуре «Fermi» к настоящему времени в сети более чем достаточно, кроме того, вы можете самостоятельно ознакомиться с официальной документацией (2,74 Мбайта). Поэтому мы сразу же перейдём к обзору видеокарты.

Обзор видеокарты NVIDIA GeForce GTX 480 1,5 Гбайт

Эталонная видеокарта NVIDIA GeForce GTX 480 была предоставлена нам на тестирование в OEM-комплектации, то есть без упаковки и аксессуаров. Тем, кто хорошо знаком с внешним видом GeForce GTX 260-285, новинка не покажется оригинальной:


Разве что пять медных никелированных тепловых трубок, выходящие вверх от графического процессора, могут привлечь внимание:


В остальном эталонная GeForce GTX 480 внешне ничем особенным не выделяется. Длина печатной платы составляет 267 мм, что выгодно отличает новинку от конкурента в лице ATI Radeon HD 5870, длина которой равна 282 мм и которая помещается далеко не во все корпуса системных блоков.

Видеокарта оснащена PCI-E интерфейсом версии 2.0, двумя выходами Dual Link DVI-I и одним разъёмом HDMI, соседствующими с решёткой для частичного выброса нагретого графическим процессором воздуха за пределы корпуса:


С другого торца платы виден проём, который отнюдь не открывает путь воздушному потоку к турбине, как можно было бы предположить. Сверху видеокарты расположены шести- и восьмиконтактный разъемы для подключения питания, а также два разъёма MIO, для организации работы двух GeForce GTX 480 в SLI-режиме либо трёх - в 3-Way SLI:


Обратите внимание, что рядом с этими разъёмами находится ещё одна решётка, через которую из системы охлаждения выходит часть горячего воздуха, оставаясь, таким образом, внутри корпуса системного блока. Учитывая весьма высокое потребление GeForce GTX 480 (заявлено 250 Вт) и, как следствие, тепловыделение, это нелицеприятный факт. Но, по всей видимости, иного выхода у проектировавших эту систему охлаждения инженеров не было.

Пластиковый кожух системы охлаждения видеокарты держится на защёлках, отстегнуть которые не составляет никакого труда:


Использование на GeForce GTX 480 альтернативных кулеров совместно со штатной пластиной для охлаждения силовых элементов невозможно, так как в местах отверстий крепления около графического процессора находятся втулки, на которые и будут ложиться основания систем охлаждения, образовывая 3-4 мм щель между основанием кулеров и теплораспределителем GPU.

Несложно отвернуть и радиатор с пластиной охлаждения элементов печатной платы видеокарты, в результате чего с последней можно ознакомиться в полной мере:


Все микросхемы памяти видеокарты расположены на лицевой стороне печатной платы. Силовой тракт GeForce GTX 480 представляет собой шестифазную схему питания GPU, в основе которой контроллер CHL8266, и двухфазную - микросхем памяти:


Кристалл графического процессора, состоящего из неимоверных 3,2 млрд. транзисторов, закрыт крышкой-теплораспределителем с нанесённой маркировкой:


Судя по маркировке, GPU относится к третьей ревизии (GF100-375-A3) и выпущен на 4 неделе 2010 года. Графический процессор содержит 480 универсальных шейдерных процессоров, 60 текстурных блоков и 48 блоков растровых операций (ROP). Номинальная частота геометрического блока GPU составляет 700 МГц, а его шейдерного домена вдвое выше - 1401 МГц. В 2D-режиме частоты графического процессора снижаются до 51/101 МГц. Прочие характеристики вы уже могли видеть выше в таблице спецификаций.

Эталонная NVIDIA GeForce GTX 480 оснащается 12 микросхемами видеопамяти стандарта GDDR5 общим объёмом 1,5 Гбайт, расположенными на лицевой стороне печатной платы. Чипы выпущены компанией Samsung и имеют маркировку K4G10325FE-HC04 :


Исходя из спецификаций памяти, её номинальное время доступа составляет 0,4 нс, а теоретическая эффективная частота равна 5000 МГц. Несмотря на этот факт, частота памяти GeForce GTX 480 составляет всего лишь 3696 МГц, что позволяет надеяться на её успешный разгон. В целях снижения тепловыделения и экономии электроэнергии, при переходе видеокарты в 2D-режим эффективная частота памяти снижается до 270 МГц. Ширина шины обмена с памятью видеокарты равна 384 бит, что позволяет достичь внушительной пропускной способности 177,4 Гбайт/сек.

Новая версия утилиты GPU-Z уже может практически точно демонстрировать нам с вами характеристики GeForce GTX 480:


Перейдём к изучению системы охлаждения видеокарты и проверке её эффективности. Ключевым элементом штатного кулера GeForce GTX 480 является радиатор графического процессора:


Он состоит из пяти медных тепловых трубок диаметром 6 мм, являющихся частью основания (технология прямого контакта). Трубки пронизывают алюминиевые рёбра толщиной около 0,35 мм и с межрёберным расстоянием чуть более 1,5 мм. Нужно заметить, площадь радиатора кулера весьма скромная. Расстояние между трубками в основании также равно 1,5 мм. Вся конструкция радиатора никелирована.

Между графическим процессором и HDT-основанием радиатора кулера с избытком наложен густой термоинтерфейс серого цвета:


Для кулеров с технологией прямого контакта количество и качество термоинтерфейса имеет более высокое значение для достижения максимальной эффективности, нежели для кулеров с классическим основанием. Забегая вперёд, отметим, что удаление штатной термопасты и замена её на минимально возможный слой Arctic Cooling MX-3 позволила добиться снижения пиковой температуры GPU на 3 °С. В 2D-режиме температура не изменилась.

Вторым компонентом системы охлаждения GeForce GTX 480 является металлическая пластина с установленной на ней турбиной.


Пластина через термопрокладки контактирует с микросхемами видеопамяти и силовыми элементами печатной платы. Скорость вращения турбины (пиковой мощностью 21 ватт, кстати) регулируется видеокартой автоматически в зависимости от температуры. Интересной её особенностью является тот факт, что рост скорости происходит плавно, а вот её снижение после снятия нагрузки - очень резко. После шума, который генерирует кулер GeForce GTX 480 на скоростях, близких к максимальным, создаётся ощущение, что турбина отключается, хотя на самом деле это не так. В 2D-режиме, когда частоты видеокарты снижаются в разы, турбина функционирует на 44-46 % своей мощности. О её уровне шума мы вам расскажем в одном из следующих разделов сегодняшнего материала, а пока проверим, насколько эффективен окажется штатный кулер GeForce GTX 480.

Для создания нагрузки и прогрева видеокарты применялся очень ресурсоёмкий тест Firefly Forest из полусинтетического пакета 3DMark 2006 в разрешении 2560х1600 с анизотропной фильтрацией уровня 16x. Мониторинг температуры графического процессора видеокарты и мощности турбины (в %) осуществлялся с помощью программы MSI Afterburner версии 1.5.1, которая пока не в полной мере поддерживает GeForce GTX 480. Комнатная температура во время проверки составляла 25 °С. Тестирование проводилось в закрытом корпусе системного блока, конфигурацию которого вы найдете в разделе с методикой тестирования. Проверка была проведена до разбора видеокарты на штатном термоинтерфейсе.

Итак, посмотрим на температуры GeForce GTX 480 в автоматическом режиме работы турбины и на максимальной мощности:


Автоматическая регулировкаМаксимальная скорость


Очевидно, что видеокарта получилась очень горячей. Даже при нагрузке в виде теста из 3DMark 2006 температура графического процессора быстро достигла 95 °С, но затем, благодаря повышению скорости турбины до 70-78 % (~3600 об/мин), снизилась до 91..92 °С и далее не изменялась на протяжении всего теста. Если же вручную выставить турбину на максимальную мощность (~4780 об/мин), то температура графического процессора не превысит 68 °С. Налицо весьма высокая зависимость эффективности радиатора от скорости вращения турбины, что, прежде всего, говорит о его недостаточной площади рассеивания.

Не обойдена стороной и проверка эффективности эталонного кулера GeForce GTX 480 с помощью FurMark версии 1.8.0 (с переименованным exe-шником), который запускался в полноэкранном режиме в разрешении 2560х1600 с активированной в драйверах GeForce анизотропной фильтрацией уровня 16x. В автоматическом режиме работы мы могли наблюдать такую же картину, как и при тестировании в 3DMark 2006, с той лишь разницей, что пиковая температура сначала достигла 98 °С, а после автоматического повышения скорости турбины до 4150 об/мин снизилась до тех же 91-92 °С. Ну а на максимальной скорости вращения турбины были получены следующие результаты:


В результате температура графического процессора достигла 86 °С. Как видите, новая видеокарта получилась очень горячей, а система охлаждения шумной в 3D-режиме. Однако, потенциальным владельцам GeForce GTX 480 расстраиваться по этому поводу не стоит, так как топовые продукты NVIDIA и ATI никогда не отличались низкими температурами и уровнем шума. Кроме того, вскоре появятся альтернативные кулеры, которые «привозят» штатным кулерам вплоть до 30 °С и при этом функционируют несопоставимо тише (вспомним Arctic Cooling Accelero Xtreme GTX 280 или продукты Thermalright). Вопрос, скорее, в другом - насколько оправдано приобретать за 500 долларов США продукт, который требует замены штатной системы охлаждения и, скорее всего, потери гарантии при этом? Ну и ещё вариант - подождать появления GeForce GTX 480 с альтернативными кулерами.

Для проверки оверклокерского потенциала GeForce GTX 480 использовалась утилита EVGA Precision v1.9.2 :



Понятно, что с таким температурным режимом на фактически пока ещё «сыром» графическом процессоре ожидать каких-то впечатляющих результатов в разгоне не приходится. Так и вышло - частоту графического процессора без потери в стабильности и снижении качества картинки удалось поднять только на 45 МГц при итоговых 745 МГц (+6,4 %). Зато 0,4-нс чипы памяти откровенно порадовали, позволив ей стабильно функционировать на эффективных 4780 МГц (+29,3 %):


Не уверен на 100 %, что тест памяти из последней версии OCCT работает с GeForce GTX 480 корректно, но под проверку он забирает практически все доступные на видеокарте 1,5 Гбайт памяти:



Разгон видеопамяти не повлиял на температурный режим печатной платы видеокарты и графического процессора, что вполне логично.

В завершении обзора новой видеокарты напомним, что рекомендованная стоимость NVIDIA GeForce GTX 480 составляет 499 долларов США. Продажи видеокарт должны стартовать по всему миру с 12 апреля.

Тестовая конфигурация, инструментарий и методика тестирования

Все тесты были проведены внутри закрытого корпуса системного блока, конфигурация которого состояла из следующих комплектующих:

Системная плата: ASUS P6T Deluxe (Intel X58 Express, LGA 1366, BIOS 2101);
Центральный процессор: Intel Core i7-920, 2,67 ГГц (Bloomfield, C0, 1,2 В, 4x256 Kбайт L2, 8 Мбайт L3);
Система охлаждения: Хigmatek Balder SD1283 (с двумя Thermalright TR-FDB на 1100 об/мин);
Термоинтерфейс: Arctic Cooling MX-2;
Оперативная память: DDR3 3x2 Гбайт Wintec AMPX 3AXH1600C8WS6GT (1600 МГц / 8-8-8-24 / 1,65 В);
Системный диск: SSD OCZ Agility EX (SATA-II, 60 Гбайт, SLC, Indillinx, firmware v1.31);
Диск для игр и тестов: Western Digital VelociRaptor (SATA-II, 300 Гбайт, 10000 об/мин, 16 Мбайт, NCQ) в коробке Scythe Quiet Drive 3,5";
Архивный диск: Western Digital Caviar Green WD10EADS (SATA-II, 1000 Гбайт, 5400 об/мин, 32 Мбайт, NCQ);
Корпус: Antec Twelve Hundred (передняя стенка - три Noiseblocker NB-Multiframe S-Series MF12-S1 на 900 об/мин; задняя - два Scythe SlipStream 120 на 900 об/мин; верхняя - штатный 200-мм вентилятор на 400 об/мин);
Панель управления и мониторинга: Zalman ZM-MFC2;
Блок питания: Zalman ZM1000-HP 1000 Вт, 140-мм вентилятор.
Монитор: 30" Samsung 305T Plus.

В целях снижения процессорозависимости видеокарт в некоторых режимах отдельных игр, включённых в тестирование, 45-нм четырёхъядерный процессор был разогнан при множителе 21 и активированной функции «Load-Line Calibration» до 4,0 ГГц при повышении напряжения в BIOS материнской платы до 1,3725 В



Оперативная память функционировала с таймингами 7-7-7-14-1T при напряжении 1,64 В. Все прочие параметры в BIOS материнской платы, связанные с разгоном процессора или памяти, не изменялись (оставлены в положениях «Auto»).

Для сравнения с NVIDIA GeForce GTX 480 в тестирование добавлены видеокарты Leadtek WinFast GTX 285 и XFX GeForce GTX 295 2x896 Мбайт :




Из видеокарт на графических процессорах ATI в тестирование включены Radeon HD 5870 1 Гбайт и двухпроцессорная Radeon HD 5970 2x1 Гбайт:




Теперь перейдём к программной части и инструментарию. Тестирование, стартовавшее 23 марта 2010 года, было проведено под управлением операционной системыMicrosoft Windows 7 Ultimate x64 со всеми критическими обновлениями на указанную дату и со следующими драйверами:

чипсет материнской платы Intel Chipset Drivers - 9.1.1.1025 WHQL ;
библиотеки DirectX End-User Runtimes, дата выпуска - февраль 2010 года ;
драйверы видеокарт на графических процессорах ATI Catalyst 10.3 ;
драйверы видеокарт на графических процессорах NVIDIA: GeForce/ION Driver 197.17 beta для GeForce GTX 480 и GeForce/ION Driver 197.25 beta для других NVIDIA-видеокарт;
драйверы ускорения физических эффектов - NVIDIA PhysX System Software 9.10.0129 .

Тестирование видеокарт в играх было проведено в двух разрешениях: 1920х1080 и 2560х1600. На наш взгляд, проводить тесты столь мощных видеокарт в более низких разрешениях не имеет никакой практической пользы, и приведёт лишь к увеличению объёма тестирования и ограничению производительности видеокарт скоростью платформы.

Для тестов были использованы два режима качества графики: «High Quality + AF16x» - максимальное качество текстур в драйверах с включением анизотропной фильтрации уровня 16х, и «High Quality + AF16x + AA 4(8)x» с включением анизотропной фильтрации уровня 16х и полноэкранного сглаживания (MSAA) степени 4x, или же 8x, в случае, если средний фрейм-рейт оставался достаточно высоким для комфортной игры. Включение анизотропной фильтрации и полноэкранного сглаживания выполнялось непосредственно в настройках игр, либо их конфигурационных файлах. Если данные настройки в играх отсутствовали, то параметры изменялись в панели управления драйверов Catalyst и GeForce. Вертикальная синхронизация принудительно отключена в панелях управления драйверов.

Все игры были дополнены самыми свежими на начало подготовки статьи патчами. В конечном итоге тестовый список составили два полусинтетических пакета, одно техно-демо и 21 игра, включая последние новинки. Вот как выглядит тестовый список с кратким описанием методик (игры расположены в порядке их выхода):

3DMark 2006 (DirectX 9/10) - build 1.2.0, настройки по-умолчанию и 2560х1600 с AF16x и AA8x;
3DMark Vantage (DirectX 10) - версия 1.0.2.1, профили настроек «Performance» (проводились только основные тесты);
Unigine Heaven Demo (DirectX 11) - версия 2.0, максимальные настройки качества, тесселяция «extreme»;
World In Conflict (DirectX 10) - версия 1.0.1.0(b34), профиль качества графики «Very High», «Water Reflection Clouds» - On, встроенный в игру тест;
Crysis (DirectX 10) - версия 1.2.1, профиль настроек «Very High», двукратный цикл демо-записи «Assault Harbor» из Crysis Benchmark Tool версии 1.0.0.5;
Unreal Tournament 3 (DirectX 9) - версия 2.1, максимальные настройки графики в игре (5-й уровень), Motion Blur и Hardware Physics активированы, тестировалась FlyBy-сцена на уровне «vCTF-Corruption» (два последовательных цикла), использовался HardwareOC UT3 Bench v1.5.0.0;
Lost Planet Extreme Condition: Colonies Edition (DirectX 10) - версия 1.0, уровень графики «Maximum quality», HDR Rendering DX10, встроенный в игру тест, результаты приведены по первой сцене (ARENA1);
Far Cry 2 (DirectX 10) - версия 1.03, профиль настроек «Ultra High», двукратный цикл теста «Ranch Small» из Far Cry 2 Benchmark Tool v1.0.0.1;
Call of Duty 5: World at War (DirectX 9) - версия игры 1.6, настройки графики и текстур выставлены на уровень "Extra", демо-запись «Breach» на одноимённом уровне;
BattleForge: Lost Souls (DirectX 11) - версия 1.2 (19.03.2010), максимальные настройки качества графики, тени включены, технология SSAO включена, двойной прогон встроенного в игру теста;
Stormrise (DirectX 10.1) - версия 1.0.0.0, максимальные настройки качества эффектов и теней, «Ambient occlusion» отключена, двойной прогон демо-сцены на миссии «$mn_sp05»;
Tom Clancy"s H.A.W.X. (DirectX 10) - версия 1.03, максимальные настройки качества графики, методики HDR, DOF и Ambient occlusion активированы, встроенный тест (двойной прогон);
Call of Juarez: Bound in Blood (DirectX 10.1) - версия 1.0.1.0, максимальные настройки качества графики, Shadow map size = 1024, 110-секундная демо-запись в самом начале уровня «Miners Massacre»;
Wolfenstein MP (OpenGL 2.0) - версия 1.3, максимальные настройки графики, собственная демо-запись «d2» на уровне «Manor»;
Batman: Arkham Asylum (Direct3D 9) - версия 1.1, максимальная детализация, «физика» максимальная, двойной прогон встроенного в игру теста;
Resident Evil 5 (DirectX 10.1) - версия 1.0, тестирование переменного теста с максимальными настройками графики без размытия движения, за результат принималось среднее значение третьей сцены теста, как наиболее ресурсоёмкой;
S.T.A.L.K.E.R.: Call of Pripyat (DirectX 11) - версия 1.6.02, профиль настроек «Улучшенное динамическое освещение DX11» с дополнительным выставлением вручную всех параметров на максимум, тестировалась собственная демо-запись «cop03» на уровне «Затон»;
Borderlands (DirectX 9) - версия игры 1.2.1, тестирование «timedemo1_p» с максимальными настройками качества;
Left 4 Dead 2 (DirectX 9) - версия игры 2.0.1.1, максимальное качество, тестировалась демо-запись «d333» (два прохода) на карте «Болотная лихорадка», этапе «Болото»;
Colin McRae: DiRT 2 (DirectX 9/11) - версия игры 1.1, встроенный тест, состоящий из двух кругов по трассе «Лондон» с максимальными настройками качества графики;
Wings Of Prey (DirectX 9) - версия игры 1.0.2.1, качество текстур «Ультра сверхвысокое» и прочие максимальные настройки качества графики, тестировалась двухминутная демо-запись на уровне «Эскорт» из кампании «Битва за Британию»;
Warhammer 40 000: Dawn of War II - Chaos Rising (DirectX 10.1) - версия 2.1.0.4679, настройки графики в меню игры выставлены на уровень «Ультра», три-четыре прогона встроенного в игру теста;
Metro 2033 (DirectX 10/11) - версия 1.0, максимальные настройки качества, для теста использовалась заскриптованная сцена продолжительностью 160 сек. на уровне «Chaser», двойной последовательный проход;
Just Cause 2 (DirectX 11) - версия 1.0.0.1, максимальные настройки качества, методики «Размытие фона» и Симуляция воды GPU» выключены, двойной последовательный проход демо-записи «Тёмная башня».

Более подробное описание методик тестирования видеокарт и графических настроек в некоторых из перечисленных играх вы можете найти в специально для этого созданной ветке нашей конференции , а также поучаствовать в обсуждении и совершенствовании этих методик.

Если в играх реализована возможность фиксации минимального числа кадров в секунду, то оно также отражалось на диаграммах. Каждый тест проводился дважды, за окончательный результат принималось лучшее из двух полученных значений, но только в случае, если разница между ними не превышала 1 %. Если разница между прогонами тестов превышала 1 %, то тестирование повторялось ещё, как минимум, один раз, чтобы получить корректный результат.

Результаты тестов производительности видеокарт их анализ

На диаграммах результаты тестирования видеокарт ATI Radeon HD 5970 и Radeon HD 5870 выделены красным цветом, герой сегодняшней статьи GeForce GTX 480 традиционным для NVIDIA зелёным цветом, а видеокарты GeForce GTX 295 и GTX 285 отмечены сине-зелёной гаммой. Тестирование видеокарт в разгоне в рамках сегодняшней статьи не проводилось, так как заслуживает отдельного материала.

Посмотрим на результаты тестирования и проанализируем их.

3DMark 2006



В первом полусинтетическом тесте GeForce GTX 480 удаётся лишь на чуть-чуть опережать своего основного конкурента - Radeon HD 5870, но при этом обе видеокарты оказываются быстрее двухпроцессорной GeForce GTX 295. Radeon HD 5970 в качественном режиме и разрешении 2560х1600 далеко впереди всех других участников тестирования, включая GeForce GTX 480.

3DMark Vantage



Немного иначе складывается ситуация в 3DMark Vantage, но только в профиле настроек «Perfomance», где GeForce GTX 480 почти на 2000 3D-«попугаев» быстрее Radeon HD 5870. При увеличении нагрузки видеокарты демонстрируют одинаковую производительность.

Unigine Heaven Demo 2.0

Так как видеокарты GeForce GTX 285 и GTX 295 не поддерживают DirectX 11, то для корректного сравнения с GeForce GTX 480 все эти карты были предварительно протестированы в режиме DirectX 10 с отключенной тесселяцией:



Результаты GeForce GTX 480 в демо Heaven, как бальзам на душу потенциальным покупателям этой видеокарты. Действительно, новинка демонстрирует великолепную производительность и в самом тяжёлом режиме существенно превосходит двух конкурентов из своего же «стана».

Теперь проверим, насколько хороша GeForce GTX 480 в режиме DirectX 11 с активированной тесселяцией (курсивом отмечены результаты видеокарт в DirectX 10):


Как видим, GeForce GTX 480 без труда соперничает с двухпроцессорной Radeon HD 5970 и оставляет далеко позади своего прямого конкурента Radeon HD 5870. Если в недалеком будущем тесселяция будет преобладать в играх, то приобретение GeForce GTX 480 выглядит куда привлекательнее, чем ATI. Впрочем, это больше похоже на «гадания на кофейной гуще», поэтому оставим это дело фанатствующим любителям и перейдём к игровым тестам.

World in Conflict


В игре World in Conflict GeForce GTX 480 оказывается быстрее Radeon HD 5870 и даже успешно соперничает с двухпроцессорной GeForce GTX 295, превосходя последнюю по минимальному числу кадров в секунду. Производительность двухчиповой видеокарты Radeon HD 5970 вне досягаемости для всех остальных участников сегодняшнего тестирования, но, опять же, превосходства по столь важному для комфортной игры минимальному числу кадров в секунду у этой видеокарты нет.

Crysis


Многие ждали, что с выходом «Fermi» игра Crysis наконец-то окажется покорённой и однопроцессорной видеокартой тоже, однако это оказалось далеко не так. Более того, GeForce GTX 480 демонстрирует совсем небольшое преимущество над Radeon HD 5870, что также для многих ожидавших эту новинку является сюрпризом. Зато GTX 480 в самом тяжёлом режиме качества обеспечивает более высокий уровень минимального числа кадров в секунду и в дополнение без труда расправляется с GeForce GTX 295.

Unreal Tournament 3


Unreal Tournament 3 продолжает писать «картины маслом», располагая видеокарты по производительности практически так же, как они позиционируются по стоимости. GeForce GTX 480 быстрее Radeon HD 5870, но медленнее обеих двухпроцессорных видеокарт.

Lost Planet Extreme Condition: Colonies Edition


Максимум, что удаётся сделать GeForce GTX 480 в игре Lost Planet - опережать Radeon HD 5870 в трёх тестовых режимах из четырех и на равных бороться с GeForce GTX 295. Двухпроцессорная видеокарта Radeon HD 5970 по-прежнему является самой быстрой.

Far Cry 2


Нельзя не отметить довольно уверенное выступление новой видеокарты и в игре Far Cry 2, где GeForce GTX 480 не только везде удается оставить позади Radeon HD 5870, но и в качественном режиме графики с использованием полноэкранного сглаживания на равных конкурировать с «авианосцем» Radeon HD 5970.

Call of Duty 5: World at War


Для игры в совсем не требовательную по современным меркам Call of Duty 5: World at War достаточно любой из тестируемых сегодня видеокарт, включая разрешение 2560х1600 и MSAA8x. Тем не менее, если сравнивать GeForce GTX 480 и Radeon HD 5870 между собой, то можно говорить о равенстве производительности видеокарт в этой игре.

BattleForge: Lost Souls


Несмотря на тот факт, что BattleForge: Lost Souls является про-ATI игрой, видеокарта на графическом процессоре NVIDIA GF100 проигрывает Radeon HD 5870 только в режиме без методик улучшения качества графики. С включением сглаживания GeForce GTX 480 удаётся немного вырваться вперёд.

Stormrise


А вот в ещё одной игре, выпущенной под пристальной опекой ATI, у видеокарт GeForce GTX нет ни единого шанса, поэтому они соревнуются лишь между собой.

Tom Clancy"s H.A.W.X.


В авиасимуляторе Tom Clancy"s H.A.W.X., напротив, GeForce GTX 480 сокрушает не только Radeon HD 5870, но и двухпроцессорного флагмана Radeon HD 5970. Заметим, что в качественном режиме графики преимущество GTX 480 над GTX 285 превышает 2 раза.

Call of Juarez: Bound in Blood



Игра Call of Juarez: Bound in Blood, как и BatleForge и Stormrise, лучше подходит для видеокарт на графических процессорах ATI. Тем не менее, это не помешало GeForce GTX 480 опередить Radeon HD 5870. При этом нужно заметить, что Call of Juarez нельзя отнести к ресурсоёмким играм, так как даже в максимальном разрешении вполне достаточно одной GeForce GTX 285 или какой-нибудь Radeon HD 4870/HD 5770.

Wolfenstein MP


Победа видеокарт ATI в игре Wolfenstein в достаточной степени удивительна, ведь NVIDIA всегда лучше работала с OpenGL и, как правило, лидировала в таких играх. Тем не менее, GeForce GTX 480 нечего противопоставить Radeon HD 5870 в этой игре.

Batman: Arkham Asylum


Зато ей есть что противопоставить в игре Batman: Arkham Asylum, а именно - аппаратную поддержку ускорения физических эффектов PhysX. Для успешного выступления видеокарт на графических процессорах ATI в этой игре, необходимо либо установить GeForce в качестве второй видеокарты, либо отключить эти эффекты вовсе. Правда, игра при этом становится весьма ущербной в графическом плане, так что первый вариант куда более интересен, хотя и более затратен с точки зрения финансов и времени на организацию совместной работы драйверов Catalyst и GeForce. В дополнение нужно заметить, что GeForce GTX 480 демонстрирует в Batman: Arkham Asylum просто-таки блестящую производительность, превосходя двухпроцессорную GeForce GTX 295.

Resident Evil 5


GeForce GTX 480 не оставляет шансов конкуренту и в игре Resident Evil 5. Более того, как видим, видеокарта на новом графическом процессоре GF100 способна с успехом противостоять и обеим двухпроцессорным гигантам в лице GeForce GTX 295 и Radeon HD 5970.

S.T.A.L.K.E.R.: Call of Pripyat

И вновь нужно напомнить, что видеокарты GeForce GTX 285 и GTX 295 не поддерживают DirectX 11, поэтому прежде чем посмотреть на основную диаграмму, для корректного сравнения с GeForce GTX 480 последняя предварительно тестировалась в режиме DirectX 10:



Нельзя сказать, что производительность GeForce GTX 480 в игре S.T.A.L.K.E.R.: Call of Pripyat находится на высоком уровне. Нет ни существенного преимущества над GTX 285, ни хоть какого-то опережения GTX 295. Да и в DirectX 11 новой видеокарте похвастаться нечем:




Borderlands


В игре Borderlands борьба между Radeon HD 5870 и GeForce GTX 480 ведётся с переменным успехом. В режимах без сглаживания быстрее видеокарта на графическом процессоре NVIDIA, а при активации MSAA8x вперед выходит Radeon, но только в разрешении 1920х1080.

Left 4 Dead 2


Если нравится месить бесконечных зомби в игре Left 4 Dead 2, то свой выбор лучше остановить на видеокарте на графическом процессоре ATI, так как они демонстрируют более высокую производительность, нежели карты на NVIDIA. Игра нересурсоёмкая, поэтому будет вполне достаточно любой из протестированных сегодня видеокарт.

Colin McRae: DiRT 2

DirectX 11 не поддерживается видеокартами GeForce GTX 2xx, поэтому сначала сравним с ними GeForce GTX 480 в честном DirectX 9 режиме:



Далее обратимся к результатам в DirectX 11 где уже участвуют видеокарты Radeon (DX9-результаты GTX 2xx также присутствуют, но выделены курсивом):


Пусть и ненамного, но GeForce GTX 480 всё же быстрее Radeon HD 5870 в данной игре.

Wings Of Prey


Технология CrossFireX не работает в пока ещё новом авиасимуляторе Wings Of Prey, поэтому Radeon HD 5970 оказалась самой медленной видеокартой тестирования. В то же время технология SLI прекрасно себя чувствует, за счёт чего GeForce GTX 295 здесь недосягаем для других видеокарт. Ну а GeForce GTX 480 по сумме тестов во всех режимах немного опережает Radeon HD 5870.

Warhammer 40 000: Dawn of War II - Chaos Rising


Warhammer 40 000: Dawn of War II - одна из самых процессорозависимых игр, поэтому результаты можно сравнивать только в максимальном качественном режиме и разрешении 2560х1600, в котором GeForce GTX 480 чуть быстрее Radeon HD 5870 по среднему числу кадров в секунду, но медленнее по минимальному. Вообще, по данному показателю GeForce GTX 480 в Warhammer 40 000: Dawn of War II оказалась худшей видеокартой, что скорее говорит о недостаточной оптимизации драйверов GeForce, поэтому вполне может быть исправлено в скором времени.

Metro 2033

Тестирование видеокарт в новой игре Metro 2033 проводилось в самом начале на уровня «Chaser», в заскриптованной сцене, где герой с двумя помощниками едет на вагонетке и не может передвигаться, за счёт чего удаётся получить результаты с очень высокой степенью повторяемости. Тестирование проводилось с помощью FRAPS в течение 160 секунд с момента загрузки уровня. Так как при максимальных настройках качества графики под DirectX 11 Metro 2033 можно было тестировать только на одной видеокарте из пяти участвующих в статье, то для тестов использовался DirectX10–рендер:



GeForce GTX 480 немного быстрее Radeon HD 5870, и обе этих видеокарты прилично уступают двухпроцессорной Radeon HD 5970. Добавим, что в Wings Of Prey не работала технология CrossFireX, в Metro 2033 мы наткнулись на плохую работу технологии SLI, а в следующей игре, Just Cause 2, она и вовсе оказалась неработоспособной.

Уже после завершения всех тестов производительность GeForce GTX 480 была дополнительно проверена в игре Metro 2033 и в режиме DirectX 11. К сожалению, видеокарты Radeon HD 5870 и HD 5970 к тому времени нами уже были возвращены, поэтому в качестве конкурента выступала видеокарта ATI Radeon HD 5850 1 Гбайт, разогнанная с номинальных 725/4000 МГц . Для сравнения использовалась всё та же демо-сцена «Chaser» с максимальными настройками качества. Результаты получились очень интересными:



В разрешении 1920х1080 разогнанный Radeon HD 5850 не сильно отстаёт от GeForce GTX 480, а вот в 2560х1600 на Radeon начинается настоящее «слайд-шоу», в то время как GeForce GTX 480 показывает результат втрое более высокий. Но это всё-равно не позволяет новой видеокарте обеспечить игроку комфортное число кадров в секунду в данной игре. Более того, ещё при прогоне тестовой сцены я заметил некоторое «замыливание» картинки на GeForce, и решил проверить это скриншотами (правда, уже на другом уровне, так как в «Chaser» одинаковые снимки экрана не сделать). Разницу в качестве картинки вы можете оценить сами (разрешение 1920х1080):

ATI Radeon HD 5850NVIDIA GeForce GTX 480







Легко заметить, что на видеокарте Radeon качество изображения явно выше. Все текстуры прорисовываются очень чётко, без смазывания границ и размытия. Напомню, что настройки качества графики в игре были идентичными на обеих видеокартах: DirectX 11, «Very High», AF16x, AAA, «Advanced DOF» и «Tesselation» включены. Кроме того, в драйверах Catalyst и GeForce/ION был выставлен максимальный режим качества текстурной фильтрации «High Quality» (по-умолчанию выставляется «Quality»). Так, может быть, именно за счёт такого снижения качества на GeForce GTX 480 и достигается более высокая производительность в Metro 2033? На этот вопрос менее чем за сутки оперативно отреагировали разработчики игры Metro 2033, вот их ответ:

«Нет, замеченная разница в отображении никак не связана с производительностью видеокарт. Действительно, в некоторых режимах антиалиасинга видеокарты NVIDIA и ATI по-разному рендерят картинку. Сейчас мы пытаемся понять, как быстро это можно исправить. Еще раз повторюсь – к производительности это не имеет никакого отношения».

Олесь Шишковцов, 4A Games, Chief Technical Officer

Ну что же, поживём - увидим.

Just Cause 2


В новой игре Just Cause 2 GeForce GTX 480 уступает Radeon HD 5870 столько же, сколько и выигрывала в Metro 2033.

Далее перейдём к анализу результатов на сводных диаграммах, построенным только по игровым тестам.

Сводные диаграммы сравнения производительности

На первой паре сводных диаграмм мы предлагаем вам оценить прирост производительности GeForce GTX 480 в сравнении с самой быстрой однопроцессорной видеокартой предыдущего поколения GPU NVIDIA - GeForce GTX 285, производительность которой на диаграммах принята за 100 %, а результаты GeForce GTX 480 показаны приростом в процентном отношении (в играх S.T.A.L.K.E.R.: Call of Pripyat и Colin McRae: DiRT 2 сравнивались результаты в DX10- и DX9-рендерах, соответственно):



Ну здесь, в общем-то всё наглядно и понятно. В режимах без сглаживания GeForce GTX 480 в среднем по игровым тестам быстрее топовой видеокарты предыдущего поколения GeForce GTX 285 на 30-37 % в зависимости от разрешения, а в режимах со сглаживанием на 46-48 %. Здесь нужно заметить, что при выходе 5-й серии видеокарт Radeon прирост производительности в сравнении с видеокартой предыдущего поколения ATI был выше. Наиболее ярко выраженный прирост производительности зафиксирован в таких играх, как Tom Clancy"s H.A.W.X., Far Cry 2 и Metro 2033. А менее всего производительность этих двух видеокарт отличается в нересурсоемких играх - таких, как Call of Duty 5: World at War или Wolfenstein.

Следующие диаграммы отведены под схватку двухпроцессорной GeForce GTX 295 и нового однопроцессорного флагмана GeForce GTX 480. За нулевую ось приняты результаты GeForce GTX 295 (в играх S.T.A.L.K.E.R.: Call of Pripyat и Colin McRae: DiRT 2 вновь сравнивались результаты в DX10- и DX9-рендерах, соответственно):



Борьба GeForce GTX 480 с двухпроцессорной видеокартой предыдущего поколения GeForce GTX 295 ведётся с переменным успехом. В некоторых играх быстрее двухчиповая видеокарта, а где-то - GeForce GTX 480. Здесь мы также не можем не вспомнить прежнее противостояние Radeon HD 5870 и Radeon HD 4870 X2, когда видеокарта на новом графическом процессоре почти везде оказывалась быстрее двухчипового флагмана предыдущего поколения. Тем не менее, в самых новых играх Metro 2033 и Just Cause 2 превосходство GeForce GTX 480 весьма велико из-за пока ещё неработающей технологии SLI в этих новинках.

Теперь по сумме игровых тестов оценим противостояние новой GeForce GTX 480 и Radeon HD 5870. Результаты представлены на следующей паре диаграмм, где производительность Radeon HD 5870 принята за нулевую ось, а результаты GeForce GTX 480 отражены в виде отклонений от неё:



И здесь чаша весов склоняется то в одну, то в другую сторону с существенным изменением процентов прироста или снижения производительности. Так в двенадцати играх - World in Conflict, Crysis, Unreal Tournament 3, Lost Planet: Colonies, Far Cry 2, Tom Clancy"s H.A.W.X., Call of Juarez: Bound in Blood (!),Batman: Arkham Asylum (без «допинга» для Radeon), Resident Evil 5, Borderlands, Colin McRae: DiRT 2 и Metro 2033 впереди оказывается GeForce GTX 480, а в пяти играх - BattleForge, Stormrise, S.T.A.L.K.E.R.: Call of Pripyat, Left 4 Dead 2 и Just Cause 2 - быстрее уже Radeon HD 5870. В оставшихся четырёх играх либо паритет, либо мизерное преимущество одной из видеокарт. Совершенно определённо можно сказать, что подавляющего превосходства GeForce GTX 480, которого все ждали, над Radeon HD 5870 на сегодняшний день нет.

Наконец, последняя пара диаграмм, по которой можно посмотреть на отставание GeForce GTX 480 от самой быстрой видеокарты современности - Radeon HD 5970:



Неработающая в игре Wings Of Prey технология CrossFireX и отсутствие поддержки PhysX в игре Batman: Arkham Asylum позволяют GeForce GTX 480 превосходить двухпроцессорную Radeon HD 5970. В играх Tom Clancy"s H.A.W.X. и Resident Evil 5 скорость видеокарт примерно одинакова, а во всех остальных случаях Radeon HD 5970 быстрее GeForce GTX 480.

Энергопотребление, нагрев видеокарт и уровень шума

Энергопотребление систем с разными видеокартами проводилось с помощью специально доработанного для этих целей блока питания. Максимальная нагрузка создавалась посредством запуска одного FurMark 1.8.0 в режиме теста стабильности и разрешении 2560х1600 (с AF16x), а также FurMark совместно с Linpack x64 (LinX 0.6.4, 4096 Мбайт, 7 потоков). Учитывая, что обе указанные программы генерируют максимальную нагрузку на, соответственно, видеосистему и центральный процессор, таким образом мы сможем узнать пиковое энергопотребление всей системы и определить необходимый для неё блок питания (c учетом КПД).

Полученные результаты приведены на диаграмме:






Нетрудно заметить, что система с GeForce GTX 480 в пике нагрузки потребляет больше системы с Radeon HD 5870 примерно на 130 ватт как при нагрузке в виде FurMark, так и при совместной нагрузке из FurMark и Linpack x64. Более того, система с GeForce GTX 480 умудряется потреблять больше системы с двухпроцессорной Radeon HD 5970! Вот уж действительно «прожорливая» видеокарта. И всё же по энергопотреблению лидирует по-прежнему GeForce GTX 295. В 2D-режиме разница между потреблением систем с видеокартами GeForce GTX 480 и Radeon HD 5870 составляет 26 ватт с выгодой в пользу Radeon. Кстати, о выгоде.

Допустим, вы - «игровой маньяк», и играете по 8 часов каждый в день в течение всего месяца. И, сфантазируем, что в течение этого времени нагрузка на видеоподсистему всегда максимальная, то есть разница в энергопотреблении систем с NVIDIA GeForce GTX 480 и с ATI Radeon HD 5870 постоянно равна 130 ватт в час. Таким образом, в течение месяца система с новой видеокартой NVIDIA «сожрёт» электроэнергии больше, чем система с конкурирующей видеокартой ATI на 32,2 кВт! Среднюю действующую стоимость киловатт-часа в Российской Федерации мне найти не удалось (она утверждается субъектами РФ), поэтому в качестве примера возьмём Москву, где киловатт-час по однотарифному счётчику стоит 2 рубля 42 копеек . Таким образом, у владельцев систем с GeForce GTX 480 в сравнении с владельцами систем с Radeon HD 5870 получается «перерасход» аж 78 рублей в месяц! Приведённые условия, при которых получена данная сумма, как вы понимаете, нереальны. На самом деле сумма должна быть меньше раза в четыре, как минимум. Но даже если это и так, и 78 рублей в месяц окажутся правдой, то ответьте самому себе - это действительно те деньги, которые можно приводить в качестве аргумента при сравнении видеокарт стоимостью более 18 тысяч рублей?

Теперь сравним температурный режим всех протестированных видеокарт при автоматической работе турбины. Нагрузка создавалась 15 циклами теста Firefly Forest из полусинтетического пакета 3DMark 2006 в разрешении 2560х1600 с анизотропной фильтрацией уровня 16x. Тесты проведены в закрытом корпусе системного блока при комнатной температуре 25 °С. Посмотрим на результаты:



Налицо существенное превосходство Radeon HD 5870 над GeForce GTX 480 по температуре графического процессора как в режиме простоя, так и при нагрузке.

И последнее, что осталось сделать перед тем, как перейти к выводам, это оценить уровень шума видеокарт. Измерение уровня шума штатных систем охлаждения эталонных видеокарт осуществлялось с помощью электронного шумомера CENTER-321 после часа ночи в полностью закрытой комнате площадью около 20 кв. м со стеклопакетами. Уровень шума каждого кулера измерялся вне корпуса системного блока, когда источником шума в комнате являлся только сам кулер и его турбина. Шумомер, зафиксированный на штативе, всегда располагался строго в одной точке на расстоянии ровно 150 мм от ротора вентилятора кулера. Материнская плата, в которую была вставлена видеокарта с установленной на неё системой охлаждения, размещалась на самом углу стола на пенополиуретановой подложке:


Нижняя граница измерений шумомера составляет 29,8 дБА, а субъективно комфортный (не путать с низким) уровень шума кулеров при измерениях с такого расстояния находится около отметки 37 дБА. Скорость вращения турбин штатных кулеров изменялась во всём диапазоне их работы с помощью нашего контроллера путём изменения питающего напряжения с шагом 0,5 В.

Полученные данные по уровню шума Radeon HD 5970 и HD 5870 оказались различающимися в пределах 0,1 дБА в каждой точке измерений, поэтому на графике они объединены. Уровень шума GeForce GTX 295 измерить на стенде оказалось невозможно, так как у данной видеокарты, чтобы добраться до коннектора турбины пришлось бы её всю разобрать. Результаты измерений представлены на следующем графике (пунктирной линией показан весь диапазон скоростей турбин, сплошной - реальный диапазон скоростей при тестировании в 3DMark 2006, описанном нами чуть выше):



Первое, что нужно заметить по результатам измерений, этот тот факт, что ни одна из штатных систем охлаждения эталонных видеокарт не является тихой. Второе, на что можно обратить внимание - кривая уровня шума кулера GeForce GTX 480 проходит под кривой уровня шума конкурента, Radeon HD 5870. Можно сделать вывод, что кулер GeForce GTX 480 функционирует тише, чем штатный кулер Radeon HD 5870? Однако, это справедливо только для сравнения этих кулеров на одинаковых скоростях вращения турбин, но на практике этого не происходит, так как при автоматическом режиме работы турбины GeForce GTX 480 скорость её вращения изменяется в диапазоне от 2100 до 3600 об/мин, в то время как на Radeon HD 5870 скоростной диапазон лежит в пределах всего 1270-2040 об/мин (см. выше диаграмму температур). Ввиду очень высокого тепловыделения графического процессора GF100, инженерам NVIDIA пришлось повысить в BIOS видеокарты планку предельной температуры и задать для неё более высокую скорость вращения турбины. Как результат - высокий уровень шума при более высоких температурах. Увы, но и по этому параметру до появления новых менее горячих ревизий графических процессоров GeForce GTX 480 проигрывает Radeon HD 5870.

Заключение

Итак, что же мы получили спустя полгода после выхода Radeon HD 5870? Если брать все тесты скопом (что, скорее, неправильно), то новая видеокарта GeForce GTX 480 в среднем быстрее Radeon HD 5870 на 5-15 % в зависимости от теста, режима качества и разрешения. Однако, по отдельным тестам есть как и более впечатляющие победы, так и поражения. Поэтому правильнее, на наш взгляд, рассматривать каждую отдельно взятую игру, что мы и сделали выше в разделе с результатами тестирования производительности видеокарт. По большому счёту, нужно признать, что GeForce GTX 480 становится самой быстрой однопроцессорной видеокартой.

С другой стороны, эта победа далась NVIDIA слишком большой ценой. Прежде всего мы имеем ввиду вовсе не высокое энергопотребление, чрезмерный уровень шума или неприемлемое тепловыделение, а время. Время, которое прошло с момента выхода Radeon HD 5870 безвозвратно упущено. К сегодняшнему дню новые топовые видеокарты ATI/AMD не только массово продаются, но и имеют уже шесть официальных версий драйверов, в то время как у NVIDIA GeForce GTX 480 нет ни одной (!) официальной, и лишь одна в стадии бета-тестирования. Оправдать столь поздний выход новой видеокарты можно было бы только тотальным и подавляющим превосходством (+50 % и более) в производительности над конкурентом, но этого на сегодняшний день NVIDIA не удалось добиться.

Что же касается высокого энергопотребления, то для наших цен на киловатты электроэнергии аргументация в пользу каких-либо продуктов (ATI или NVIDIA) выглядит нелепой и даже смешной. Проблема высокого уровня шума и тепловыделения решается установкой альтернативных систем охлаждения, которые уже начали анонсироваться всем известными брендами. Есть у NVIDIA и такие козыри в рукаве, как PhysX и CUDA, а также прогнозируемое превосходство над конкурентом в играх с поддержкой DirectX 11 с использованием тесселяции. Вряд ли кто собирается отрицать и возможность дальнейшей оптимизации драйверов GeForce. Поэтому, заверяем вас, одним знакомством с новой видеокартой мы не ограничимся, и вскоре продолжим изучать все её возможности.

И последнее, о чём не стоит забывать всем нам - только здоровая конкуренция может способствовать снижению цен на видеокарты и прочие высокотехнологичные продукты, поэтому неоспоримое лидерство какого-то одного производителя на руку только ему одному, ну или нескольким, если они, к примеру, в сговоре, но уж точно не нам с вами:-)

Благодарим:
российское представительство компании NVIDIA и персонально Ирину Шеховцову,
российское представительство компании AMD и персонально Кирилла Кочеткова
за предоставленные на тестирование видеокарты.

Другие материалы по данной теме


Энергопотребление видеокарт: весна 2010
Нужен ли нам PhysX? Тестирование EVGA GeForce GTX 275 CO-OP PhysX Edition
Metro 2033 и современные видеокарты

Nvidia Geforce GTX 480:

описание видеокарты и результаты синтетических тестов

Есть смысл сказать, что карта требуют дополнительного питания, причем двумя разъемами, один из которых 8-пиновый, а второй 6-пиновый. Если насчет последнего — нет проблем, так как уже все современные БП имеют такие «хвосты», то для запитки через 8-пиновый разъем требуется специальный переходник, который должен поставляться с серийными видеокартами.

Чип был получен на четвертой неделе этого года, то есть в конце января.

О системе охлаждения.

Производитель: NVIDIA
Серия: GeForce GTX 400M
Код: Fermi
Потоки: 352 - unified
Тактовая частота: 425* МГц
Частота шейдеров: 850* МГц
Частота памяти: 1200* МГц
Разрядность шины памяти: 256 Бит
Тип памяти: GDDR5
Максимум памяти: 2048 Мб
Общая память: нет
DirectX: DirectX 11, Shader 5.0
Энергопотребление: 100 Вт
Транзисторов: 3000 млн
Технология: 40 нм
Размер ноутбука: большой
Дата выхода: 25.05.2010
Nvidia Geforce GTX 480 1536MB PCI-E

Принципиально кулер не отличается от предыдущих решений семейства GTX — цилиндрический вентилятор прогоняет воздух через радиатор и выводит тепло за пределы системного блока. Однако в виду чрезмерного энергопотребления нового продукта, а следовательно и нагрева, СО претерпела усовершенствования в части усиления теплоотвода с помощью тепловых трубок. Как мы видим, центральный радиатор с трубками охлаждает только ядро. Когда как микросхемы памяти охлаждаются прижимающейся к ним пластиной, находящейся под кожухом.

Вероятно уже исчерпаны возможности поиска СО такого типа, чтобы могли справиться с сильно греющимся ядром без шума. Поэтому должны сказать, что СО получилась шумная. Даже в 2D режиме кулер работает на 44% от максимума, хотя раньше такой показатель был где-то 20-25%. Шум начинается после 50%. Поэтому кулер работает на грани слышимости шума, и это в простое! Что говорить про нагрузку, когда СО начинает постепенно усиливать обороты вращения турбины, доводя в среднем до 70-80% при работе карты в трехмерном режиме.

Мы провели исследование температурного режима с помощью утилиты EVGA Precision (автор А. Николайчук AKA Unwinder) и получили следующие результаты:

Nvidia Geforce GTX 480 1536MB PCI-E

И это неудивительно, ведь нагрев ядра достигает 95 градусов, и даже такой высокий показатель достигается ценой очень шумной работы СО. Так что любителям самой передовой и быстрой трехмерной игровой графики придется забыть — что такое тишина, если гонять игры или какие-либо тесты. Даже в 2D при нагрузке карты всяким сложным контентом (типа флеша или видео) кулер уже весьма слышим.

Комплектация.

Это референсный продукт, поэтому комплектации и упаковки нет.

Теперь перейдем к тестам. Вначале покажем конфигурацию тестового стенда.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core I7 CPU 920 (Socket 1366 LGA)
    • процессор Intel Core I7 CPU 920 (2667 MHz);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 3 GB DDR3 SDRAM Corsair 1066MHz;
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA;
    • блок питания Tagan TG900-BZ 900W.
  • операционная система Windows 7 32bit; DirectX 11;
  • монитор Dell 3007WFP (30");
  • драйверы ATI версии CATALYST 10.3; Nvidia версии 197.17.

VSync отключен.

Синтетические тесты

Используемые нами пакеты синтетических тестов можно скачать здесь:

  • D3D RightMark Beta 4 (1050) с описанием на сайте http://3d.rightmark.org .
  • D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0 ссылка .
  • RightMark3D 2.0 с кратким описанием: , .

Так как у нас нет своих синтетических DirectX 11 тестов, то нам пришлось воспользоваться примерами из различных пакетов SDK и демонстрационными программами. Во-первых, это HDRToneMappingCS11.exe и NBodyGravityCS11.exe из комплекта DirectX SDK (February 2010) .

Также мы взяли по два примера от обоих производителей: Nvidia и AMD, чтобы ни от кого не было никаких претензий в предвзятости. Из ATI Radeon SDK были взяты примеры DetailTessellation11.exe и PNTriangles11.exe (они есть и в DX SDK, кстати). Ну а со стороны Nvidia были представлены две демонстрационные программы: Realistic Character Hair и Realistic Water Terrain, которые скоро должны стать доступными для скачивания на сайте компании.

Синтетические тесты проводились на следующих видеокартах:

  • Geforce GTX 480 GTX 480 )
  • Geforce GTX 295 со стандартными параметрами (далее GTX 295 )
  • Geforce GTX 285 со стандартными параметрами (далее GTX 285 )
  • Radeon HD 5970 со стандартными параметрами (далее HD 5970 )
  • Radeon HD 5870 со стандартными параметрами (далее HD 5870 )

Для сравнения результатов новой модели Geforce GTX 480 были выбраны именно эти видеокарты по следующим причинам: Radeon HD 5870 и HD 5970 являются наиболее производительными одночиповой и двухчиповой моделями от конкурирующей компании AMD, с наиболее близкими к GTX 480 ценами. С решениями Nvidia всё даже ещё проще: Geforce GTX 285 — наиболее производительная одночиповая карта на GPU прошлого поколения, по ней мы будем судить об архитектурных изменениях, а GTX 295 — самая мощная до выхода новых решений двухчиповая плата от Nvidia.

Direct3D 9: тесты Pixel Filling

В тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

Наш тест немного устарел, и видеокарты в нём не достигают теоретически возможных значений, но пиковую скорость текстурирования видеокарт относительно друг друга он всё же показывает верно. Как обычно, результаты синтетики не дотягивают до пиковых значений, по ней получается, что GTX 480 выбирает до 40 текселей за один такт из 32-битных текстур при билинейной фильтрации в этом тесте, что в полтора раза ниже теоретической цифры в 60 отфильтрованных текселей.

Этого не хватает, чтобы достать хотя бы до GTX 285, выбирающей текстурные данные на 5-7% быстрее. Не говоря уже о том, чтобы догнать конкурирующий HD 5870, более чем в полтора раза производительный, почти во всех режимах, если судить по нашей DX9 синтетике. Двухчиповая карта Nvidia явно пала жертвой программных проблем, а вот HD 5970 ещё более производительна, по сравнению с HD 5870.

Разница между GTX 480 и GTX 285 почти всегда одинаковая, кроме случаев с небольшим количеством текстур, где больше сказывается ограничение в ПСП. И HD 5870 в этих тестах не так уж далеко впереди. А вот при 4-8 текстурах разница становится большей, что намекает о недостатке скорости текстурирования GF100 для того, чтобы всегда быть впереди конкурента в устаревших игровых приложениях. Посмотрим на эти же результаты в тесте филлрейта:

Второй синтетический тест показывает скорость заполнения, и в нём мы видим ту же самую ситуацию, но уже с учетом количества записанных в буфер кадра пикселей. Максимальный результат остаётся за решениями AMD, имеющими большее количество TMU и более эффективными по достижению высокого КПД в нашем синтетическом тесте. В случаях с 0-3 накладываемыми текстурами разница между решениями значительно меньше, в таких режимах производительность ограничена ПСП, прежде всего.

Direct3D 9: тесты Pixel Shaders

Первая группа пиксельных шейдеров, которую мы рассматриваем, является очень простой для современных видеочипов, она включает в себя различные версии пиксельных программ сравнительно низкой сложности: 1.1, 1.4 и 2.0, встречающихся в старых играх.

Тесты очень и очень просты для современных архитектур и показывают не все возможности современных GPU, но интересны для оценки баланса между текстурными выборками и математическими вычислениями, особенно при смене архитектур, которая и произошла в этот раз у Nvidia.

В данных тестах производительность ограничена в основном скоростью текстурных модулей, но уже с учётом эффективности блоков и кэширования текстурных данных в реальных задачах. Посмотрим, как сказались изменения в архитектуре, по сравнению с GT200? Хорошо видно, что архитектура изменилась, и новая карта GTX 480 показывает результат выше, чем одночиповая карта на основе предыдущей архитектуры. Причём в большинстве тестов GTX 480 догоняет двухчиповую GTX 295, что уже неплохо само по себе.

Пропускная способность памяти в этих тестах лишь немного ограничивает новые решения, и скорость зависит от текстурирования, что не позволяет карте на базе GF100 показать результаты даже на уровне Radeon HD 5870, не говоря уже о двухчиповом решении AMD. Видеоплаты на чипах производства Nvidia в этом наборе тестов явно отстают, что является тревожным звоночком для других наших тестов, где важна скорость текстурирования. Посмотрим на результаты несколько более сложных пиксельных программ промежуточных версий:

В тестах пиксельных шейдеров версии 2.a всё даже ещё хуже, если сравнивать со скоростью конкурентов. В сильно зависящем от скорости текстурирования тесте процедурной визуализации воды «Water» используется зависимая выборка из текстур больших уровней вложенности, и карты всегда располагаются по скорости текстурирования, но с поправкой на разную эффективность использования TMU.

Карты на основе чипов RV870 показывают максимальные результаты, ну а скорость GTX 480 оказалась где-то между одночиповой и двухчиповой моделями на GPU предыдущей архитектуры. Слабовато, конечно, но хотя бы быстрее GTX 285, что говорит о более эффективном использовании имеющихся TMU.

Результаты второго теста почти такие же, хотя он более интенсивен вычислительно, и всегда лучше подходил для архитектуры AMD, обладающей большим количеством вычислительных блоков. Современные решения AMD тут далеко впереди, особенно двухчиповый вариант.

GTX 480 обгоняет GTX 285 лишь на 25%, да и отстаёт от двухчиповой модели почти на столько же. Это явно указывает на ограничение производительности GTX 480 из-за малого количества TMU, по сравнению с архитектурой нового поколения. Подтверждаются наши опасения в виде основного недостатка архитектуры GF100.

Direct3D 9: тесты пиксельных шейдеров Pixel Shaders 2.0

Эти тесты пиксельных шейдеров DirectX 9 сложнее предыдущих, они близки к тому, что мы сейчас видим в мультиплатформенных играх, и делятся на две категории. Начнем с более простых шейдеров версии 2.0:

  • Parallax Mapping — знакомый по большинству современных игр метод наложения текстур, подробно описанный в статье .
  • Frozen Glass — сложная процедурная текстура замороженного стекла с управляемыми параметрами.

Существует два варианта этих шейдеров: с ориентацией на математические вычисления, и с предпочтением выборки значений из текстур. Рассмотрим математически интенсивные варианты, более перспективные с точки зрения будущих приложений:

Это универсальные тесты, зависящие и от скорости блоков ALU и от скорости текстурирования, в них важен общий баланс чипа. Видно, что производительность видеокарт в тесте «Frozen Glass» ограничена не только математикой, но и скоростью текстурных выборок. Ситуация в нём схожа с той, что мы видели чуть выше в «Cook-Torrance», но новая GTX 480 в этот раз гораздо ближе к двухчиповому GTX 295 на основе GPU старой архитектуры Nvidia. С другой стороны, даже одночиповый HD 5870 всё равно далеко впереди.

Во втором тесте «Parallax Mapping» результаты снова очень похожи на предыдущие. Впрочем, в этот раз HD 5870 оторвался от карт Nvidia не так сильно, как в первом тесте. Посмотрим, что будет дальше, но игры обычно многограннее, чем синтетика, и не упираются так явно в одно лишь текстурирование. Но всё-таки для таких устаревших задач количество текстурных модулей в GF100 явно недостаточное. Рассмотрим эти же тесты в модификации с предпочтением выборок из текстур математическим вычислениям, чтобы убедиться в наших промежуточных выводах окончательно:

Картинка в чём-то схожая, но с текстурными выборками карты AMD справляются явно лучше, особенно двухчиповый HD 5970 тут хорош! Сегодняшний герой в виде GTX 480 снова показывает средний между GTX 285 и GTX 295 результат, так как тут ещё более явно виден упор производительности в скорость текстурных блоков, и их количество у GF100 для новой мощной графической архитектуры всё же явно недостаточное.

Но то были устаревшие задачи, с упором в текстурирование, да и не особенно сложные. А сейчас мы рассмотрим результаты ещё двух тестов пиксельных шейдеров — версии 3.0, самых сложных из наших тестов пиксельных шейдеров для Direct3D 9, которые намного показательнее с точки зрения современных эксклюзивных игр на ПК. Тесты отличаются тем, что сильнее нагружают и ALU, и текстурные модули, обе шейдерные программы сложные и длинные, включают большое количество ветвлений:

  • Steep Parallax Mapping — значительно более «тяжелая» разновидность техники parallax mapping, также описанная в статье .
  • Fur — процедурный шейдер, визуализирующий мех.

Ну наконец-то! Вот тут совсем другое дело. Оба PS 3.0 теста очень сложные, совсем не зависят от ПСП и текстурирования, они чисто математические, но с большим количеством переходов и ветвлений, с которыми, похоже, отлично справляется новая архитектура GF100.

В этих тестах GTX 480 показывает свою реальную силу и обгоняет все решения, кроме нового двухчипового от конкурента. Мало того, GTX 295 в этих сложнейших тестах чуть ли не вдвое медленнее, а GTX 285 вообще втрое! На результаты явно повлияли архитектурные изменения нового графического процессора, направленные на повышение эффективности вычислений.

Итак, с новой архитектурой GF100 мы отмечаем очень большой прирост производительности в сложнейших PS 3.0 тестах. В которых важнее всего не пиковая математическая мощь, которая имеется у решений AMD, а эффективность выполнения сложных шейдерных программ с переходами и ветвлениями. Ну и удвоенная математическая мощь, по сравнению с GT200, тоже сказалась. Очень хороший результат, ведь обогнать решение архитектуры AMD, имеющей большее количество исполнительных блоков ALU, это дорогого стоит.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсемплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40-80, включение «шейдерного» суперсемплинга — до 60-120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсемплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит и от количества и эффективности блоков TMU, и от филлрейта с ПСП в меньшей степени. Результаты в «High» получаются примерно в полтора раза ниже, чем в «Low», как и должно быть по теории. В Direct3D 10 тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia традиционно сильны, но последняя архитектура AMD уже подобралась к ним вплотную.

GTX 480 почти на треть быстрее GTX 285, но не дотягивает до GTX 295, что мы видели и в DX9 тестах. Это говорит скорее о влиянии филлрейта и ПСП, где новое решение Nvidia имеет преимущество над одночиповой картой предыдущей серии. Примерно так же расположен по скорости GF100 и относительно двух карт на основе RV870. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсемплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится, и ПСП с филлрейтом будут влиять меньше:

Включение суперсемплинга теоретически увеличивает нагрузку в четыре раза, и в этот раз Geforce GTX 480 сдаёт позиции, как ни странно. А обе Radeon становятся немного сильнее. Разница между GTX 480 и GTX 285 совсем небольшая, что говорит скорее всего об упоре всё же в текстурирование. Или ПСП, которая у GTX 480 увеличилась по отношению к GTX 285 не слишком сильно. Влияния производительности ALU и эффективного выполнения ветвлений в этом тесте явно не видать.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсемплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсемплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше, по сравнению с простым режимом. Проверяем сначала простые варианты без суперсемплинга:

Данный тест интереснее с практической точки зрения, так как разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются во многих проектах, например, в Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсемплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Диаграмма почти полностью повторяет предыдущую, показаны близкие результаты даже по абсолютным цифрам. В обновленном D3D10 варианте теста без суперсемплинга, GTX 480 чуть лучше справляется с поставленной задачей, чем одночиповый топ предыдущего поколения, но отстаёт от двухчиповой карты GTX 295. Также, новая видеокарта на GF100 немного обгоняет и своего соперника HD 5870, двухчиповый вариант которого становится победителем в абсолютном зачёте.

Посмотрим, что изменит включение суперсемплинга, он всегда вызывает несколько большее падение скорости на картах Nvidia.

При включении суперсемплинга и самозатенения задача получается более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями несколько видеокарт изменилась, включение суперсемплинга сказывается как и в предыдущем случае — карты производства AMD явно улучшили свои показатели относительно решения Nvidia.

Обе двухчиповые карты остаются впереди GTX 480, но в этот раз новое решение немного проигрывает и своему прямому конкуренту HD 5870. Похоже, что так оно и будет в игровых тестах — где-то GTX 480 окажется далеко впереди, а где-то — немного отстанет. Впрочем, карта на GF100 хотя бы обгоняет свою предшественницу, в лёгком режиме заметно, а в тяжёлом — совсем чуть-чуть. Архитектурные изменения в новом GPU компании Nvidia не дали особенного преимущества в этих тестах, к сожалению.

Direct3D 10: тесты пиксельных шейдеров PS 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

А вот в математических тестах мы должны увидеть большие изменения, так как графический процессор GF100 отличается удвоенной мощью ALU, по отношению к GT200. Впрочем, теоретически решения AMD в наших синтетических тестах должны быть ещё быстрее, так как в вычислительно сложных задачах современная архитектура AMD имеет явное преимущество перед конкурентами от Nvidia. Подтверждается положение и в этот раз, новая плата GTX 480 хотя и сократила разрыв между картами Nvidia и AMD, но он остался более чем полуторакратным.

А вот сравнение с GTX 285 и GTX 295 получилось интересное. Ни двукратной разницы с предыдущей одночиповой, ни обгона старой двухчиповой карты предыдущего поколения у Nvidia в этот раз не получилось. Подтверждается вывод о том, что данный тест не полностью зависит от скорости ALU, но и на разницу в ПСП результаты не списать. У GF100 получилось лишь 38% прироста по сравнению с GTX 285, что весьма странно и очень-очень мало, как нам кажется.

Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Во втором тесте скорость рендеринга ограничена почти исключительно производительностью шейдерных блоков, но всё же разница между GTX 285 и GTX 480 слишком мала — всего 58%, хотя теоретически должно быть ближе к двукратной разнице. Но новое решение хотя бы догнало двухчиповую GTX 295, в отличие от предыдущего теста. Впрочем, конкуренты в лице Radeon HD 5870 и уж тем более HD 5970 в этом тесте показывают скорость ещё значительно выше.

Подводим итог по математическим D3D10 тестам. Все видеокарты Nvidia далеко позади, даже новый GF100 медленнее конкурента в пиковых синтетических задачах почти вдвое! И всё это несмотря на то, что GTX 480 быстрее одночипового варианта GTX 285 теоретически почти вдвое. Реальность показывает гораздо меньшую цифру, и даже приблизиться к картам AMD по простым математическим тестам Nvidia не удалось.

В общем, итог по предельным математическим вычислениям остаётся неизменным и в этот раз — явное и неоспоримое преимущество решений компании AMD, которое не изменил выход линейки GTX 400. Посмотрим на результаты тестирования геометрических шейдеров — уж там-то новое решение должно быть сильно, как никакое другое.

Direct3D 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих DirectX 10 играх.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаковое у всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не особенно сложная, а производительность в целом ограничена скоростью обработки геометрии и не упирается в пропускную способность памяти.

И вот тут новый графический процессор показывает свою настоящую силу. Geforce GTX 480 во всех режимах показывает близкие к двухчиповому решению конкурента результаты, в полтора раза обгоняя и HD 5870 и двухчиповую карту на базе GT200. Отличный результат! Как и ожидалось, выполнение геометрических шейдеров у GF100 весьма и весьма эффективное, примерно в 2,5 раза быстрее, чем может GT200. Посмотрим, изменится ли ситуация при переносе части вычислений в геометрический шейдер:

Нет, цифры при изменении нагрузки в этом тесте почти не изменились. Все карты в этом тесте не замечают изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, и показывают аналогичные предыдущей диаграмме результаты. Смотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. То есть, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Обе двухчиповые конфигурации показали себя в этом тесте как обычно, что Geforce GTX 295, что Radeon HD 5970. Видимо, с методом многочипового рендеринга AFR этот тест несовместим вообще. В остальном относительные результаты в разных режимах соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть менее чем в два раза медленней.

В этом тесте производительность нового Geforce GTX 480 лишь немного превосходит скорость Radeon HD 5870 в сложном режиме, зато в лёгких разница заметна больше. Сравнивать GTX 480 с GTX 285 на основе GPU предыдущего поколения вообще смешно, новый видеочип оказывается быстрее примерно в два раза.

Цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в «Balanced» и «Heavy» режимах.

Настало время ещё раз удивиться возможностям GF100 по обработке геометрии и скорости исполнения геометрических шейдеров. Вот это — как раз тот результат, ради которого были сделаны глобальные изменения в графическом конвейере GF100. Хотя исполнение геометрических шейдеров было неплохо улучшено и в GT200 и в RV870, но GF100 просто рвёт их на куски в этой задаче.

Новое решение GTX 480 в этом тесте почти вдвое быстрее, чем Radeon HD 5870 и до 2,75 раз быстрее своей одночиповой предшественницы GTX 285. Инженеры компании Nvidia постарались повысить эффективность предыдущей архитектуры по обработке геометрии, и это им явно удалось. Все предыдущие решения просто не способны на столь же эффективное исполнение геометрических шейдеров. Что же будет в тестах тесселяции, которые должны показать ещё большую разницу, исходя из теории? Но не будем заглядывать слишком далеко вперёд.

Direct3D 10: скорость выборки текстур из вершинных шейдеров

В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи по сути и соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.

Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:

Предыдущие исследования показали, что на результаты этого теста влияет и скорость текстурирования и пропускная способность памяти. Но разница между решениями совсем небольшая. GTX 480 показывает схожий с двухчиповой GTX 295 результат, немного опережает HD 5870, но совсем немного уступает во всех режимах наиболее производительной в этом тесте карте Radeon HD 5970. Результаты явно странные... Посмотрим на производительность в этом же тесте с увеличенным количеством текстурных выборок:

Взаимное расположение карт на диаграмме немного изменилось, это видно по немного ухудшившимся показателям почти всех карт. Кроме рассматриваемой сегодня GTX 480. Она почти не потеряла в производительности относительно этого же теста в лёгких условиях. Вот что значит — увеличенная эффективность текстурных модулей и особенно подсистемы кэширования. Теперь новая карта на GF100 быстрее всех при среднем и большом количестве полигонов и наравне с двухчиповыми картами в наиболее простом режиме.

Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нём используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.

Интересно, что результаты в тесте «Waves» не похожи на те, что мы видели на предыдущих диаграммах. Преимущество продукции AMD несколько усилилось, и теперь GTX 480 показывает схожую с HD 5870 и Geforce GTX 295 производительность, немного проигрывая конкуренту в тяжёлом режиме. Предыдущее топовое решение Nvidia на одном чипе осталось позади, новая модель семейства Geforce GTX 400 опережает её, хоть и не в разы. Рассмотрим второй вариант этого же теста:

Изменений снова почти нет, хотя с ростом сложности условий результаты новейшего графического процессора Nvidia во втором тесте вершинных выборок стали чуть лучше, относительно скорости видеокарт AMD. Перевес над HD 5870 хоть и небольшой, но есть, да и с Geforce GTX 295 новая одночиповая карта справилась, за исключением самого лёгкого режима.

3DMark Vantage: Feature тесты

В данный обзор мы снова решили включить синтетические тесты из пакета 3DMark Vantage . Пакет хоть уже и не новый, но его feature тесты обладают поддержкой D3D10 и интересны уже тем, что отличаются от наших. При анализе результатов нового решения Nvidia в этом пакете мы сможем сделать какие-то новые и полезные выводы, ускользнувшие от нас в тестах семейства RightMark.

Feature Test 2: Color Fill

Тест скорости заполнения. Используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.

Показатели производительности в этом тесте не соответствуют тому, что мы видели в своих аналогичных тестах, даже с учетом разных форматов: у нас используется целочисленный буфер с 8-бит на компоненту, а в тесте Vantage — 16-бит с плавающей точкой. Цифры Vantage скорее показывают не производительность блоков ROP, а примерную величину пропускной способности памяти. Для двухчиповых карт всё несколько сложнее, GTX 295 показывает меньшую цифру, чем должна.

Результаты теста примерно соответствуют теоретическим цифрам, и зависят от ширины шины памяти, её типа и частоты. GTX 285 показывает неплохой результат из-за применения 512-битной памяти, а GTX 480 не слишком сильно её опережает из-за того, что GDDR5 память работает на не особенно высокой частоте, и ширина шины памяти соответствует 384-бит. Ну и Radeon HD 5870 тоже где-то там недалеко, хотя у неё лишь 256-битная шина памяти, зато GDDR5 довольно быстрая.

Несмотря на использование GDDR5 памяти с большей ПСП, новое решение Nvidia вместе с HD 5870 показывает результат лишь немного выше уровня GTX 285, имеющего 512-битную шину и GDDR3 память. Это может служить потенциальным ограничением производительности в случае использования буферов рендеринга в FP16 формате, что массово наблюдается в современных играх.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature тестов, так как подобная техника уже используется в играх. В нём рисуется один четырехугольник (точнее, два треугольника), с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоёмкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжёлого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчёты освещения по Strauss.

Тест отличается от других тем, что зависит не только от шейдерной мощности, эффективности исполнения ветвлений и скорости текстурных выборок по отдельности, а от всего понемногу. И для достижения высокой скорости важен грамотный баланс блоков GPU и ПСП видеопамяти. Сильно влияет на тест и эффективность выполнения ветвлений в шейдерах.

К сожалению, GTX 480 показывает посредственный результат в этом тесте, лишь на 23% быстрее, чем предыдущее решение на одном чипе — GTX 285. Представленная сегодня видеоплата Nvidia отстаёт и от двухчиповой GTX 295, и от главного конкурента Radeon HD 5870, а двухчиповый HD 5970 вообще остался недосягаемым.

Не очень понятно, что повлияло так негативно на результаты этого теста. Возможно, виновата низкая скорость текстурных выборок, которые активно используются в тесте, так как эффективность ветвлений у GF100 довольно высока, что доказали наши тесты пиксельных шейдеров третьей версии. Решения Nvidia всегда были эффективны в этом тесте, но HD 5870 обгоняет даже новую GTX 480. Может быть, в тестах физических симуляций GF100 покажет себя с лучшей стороны?

Feature Test 4: GPU Cloth

Тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Сразу можно отбросить показатели двухчиповых карт, они явно соответствуют скорости одночиповых аналогов (каждый чип в HD 5970 и GTX 295 работает на меньшей частоте, чем в HD 5870 и GTX 285). Скорость рендеринга тут зависит от производительности обработки геометрии и исполнения геометрических шейдеров. В этом тесте даже GTX 285 неплохо работает, лишь немного отставая от HD 5870, а уж новая карта GTX 480 вновь показала свои сильные стороны.

GF100 в этом тесте почти вдвое производительнее предыдущего решения, что неплохо соответствует двукратно усиленной шейдерной мощи нового чипа. Преимущество над конкурирующим решением Radeon HD 5870 столь же впечатляющее. В общем, за нашим сегодняшним героем можно закрепить статус лидера по выполнению геометрических шейдеров и скорости обработки геометрии в целом, как и должно быть по теории.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующих частицу. Но тест больше всего загружает шейдерные блоки вершинными расчётами, также тестируется stream out.

Налицо даже ещё более сильный результат. В синтетических тестах имитации тканей и частиц пакета Vantage, где используются геометрические шейдеры, новый чип GF100 просто оставляет в пыли всех своих соперников. В этот раз он опережает предыдущий графический процессор Nvidia почти втрое, а конкурирующий Radeon HD 5870 показывает в тесте имитации частиц примерно вдвое худший результат.

Результаты мультичипов снова такие же — и у карты AMD, и у Nvidia явно не работает метод мультичипового рендеринга, так как результаты расчётов текущего кадра используются в следующем, что не даёт начать его рассчитывать до того, как закончится рендеринг текущего. В этом — очевидная слабость двухчиповых карт, они не могут работать эффективно, когда в кадре используются данные из предыдущего.

Feature Test 6: Perlin Noise

Последний feature тест пакета Vantage является математически-интенсивным тестом видеочипа, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто используемый в процедурном текстурировании, он использует очень много математических расчётов.

Математический feature тест из пакета тестов компании Futuremark показывает чистую производительность видеочипов в предельных задачах. Показанная в нём производительность неплохо соответствует тому, что должно получаться по теории, и частично соответствует тому, что мы видели выше в собственных математических тестах из RightMark 2.0. Но в этом тесте разница между решениями ещё больше.

Так, в этом математическом тесте GTX 480 на базе нового GF100 наконец-то обогнал GTX 285 ровно вдвое, что соответствует теории. А вот от HD 5870 отставание нового решения оказалось слишком большим — 1,7 раза. Это мы ещё двухчиповый HD 5970 не рассматриваем...

В общем, видеокарты AMD закономерно всухую выигрывают у конкурентов от Nvidia этот тест, но новое решение на основе графического процессора Nvidia GF100 всё-таки смогло к нему приблизиться. Напомним, что этот математический тест довольно прямолинеен и призван показать производительность, близкую к пиковой теоретической. В более сложных вычислительных тестах, таких как физические расчёты, получается несколько иная картина. А вот простая, но интенсивная математика, выполняется на картах AMD значительно быстрее.

Direct3D 11: вычислительные и геометрические шейдеры

Чтобы протестировать новые решения компаний Nvidia и AMD в задачах, использующих возможности DirectX 11, мы воспользовались примерами из пакетов для разработчиков (SDK) от Microsoft, AMD и Nvidia, а также некоторыми демонстрационными программами этих компаний.

Сначала рассмотрим тесты, использующие новый тип шейдеров — вычислительные (Compute). Их появление — одно из наиболее важных нововведений в последних версиях DX API, они используются для различных задач: постобработки, симуляций и т.п. В первом тесте показан пример HDR рендеринга с tone mapping из DirectX SDK с постобработкой, использующей пиксельные или вычислительные шейдеры.

Нужно признать явную победу одночипового решения AMD над новой видеокартой Nvidia Geforce GTX 480 в этом тесте. Анонсированная сегодня плата на новом чипе GF100 отстаёт от конкурирующего Radeon HD 5870 в обоих режимах, и с использованием пиксельного, и с использованием вычислительного шейдеров. Причём отставание довольно ощутимое — до полутора раз. У двухчипового HD 5970 в этом тесте работает только один GPU, поэтому его результат даже ниже, чем у HD 5870.

Второй тест вычислительных шейдеров также взят из DirectX SDK от Microsoft, в нём показана расчётная задача гравитации N тел (N-body) — симуляция динамической системы частиц, на которую воздействуют физические силы, такие как гравитация.

И в этом вычислительном тесте новое решение Nvidia снова проигрывает ближайшему конкуренту в лице Radeon HD 5870. В данном случае — около 25%, что также довольно много. Двухчиповый HD 5970 в очередной раз не может показать свои возможности, и ограничивается работой одного из двух установленных на плате GPU.

Следующий тест — демонстрационная программа от Nvidia под названием Realistic Character Hair. В ней используется не чисто синтетический код вычислительных или геометрических шейдеров, а комплекс геометрических и вычислительных шейдеров и тесселяции, поэтому он несколько ближе к реальным задачам, чем чистая синтетика первых двух тестов.

А вот в этом тесте новый графический процессор Nvidia показывает отличный результат, значительно опережая одночиповый Radeon HD 5870 и двухчиповый HD 5970, второй GPU которого снова не сработал. При этом интересна не только сама по себе разница в производительности между одночиповыми картами до 1,5-1,8 раз, но и разное их поведение при включении аппаратной тесселяции.

Новая видеокарта Geforce GTX 480 на базе чипа GF100 в таком случае ускоряется при включении тесселяции на 15%, а решение AMD на основе RV870 замедляется почти на 5%. Иными словами, в данном случае тесселяция для решения Nvidia выгодна, а для AMD — нет. Видимо, сказывается различная организация геометрического конвейера, к рассмотрению производительности которого мы сейчас и переходим.

Direct3D 11: производительность тесселяции

Самым важным нововведением в Direct3D 11 по праву считается аппаратная тесселяция. Мы очень подробно рассматривали её в своей теоретической статье про Nvidia GF100. Существует несколько различных схем разбиения графических примитивов (тесселяции). Например, phong tessellation, PN triangles, Catmull-Clark subdivision.

Тесселяцию уже начали использовать в первых DirectX 11 играх, таких как STALKER: Зов Припяти, DiRT 2, Aliens vs Predator, Metro 2033. В некоторых из них тесселяция используется для моделей персонажей (все игры жанра FPS из перечисленных), в других — для имитации реалистичной водной поверхности (DiRT 2). Схема PN Triangles используется в STALKER: Зов Припяти, в Metro 2033 — Phong tessellation. Эти методы сравнительно быстро и просто внедряются в процесс разработки игр и существующие движки, что и было проделано.

Первым тестом тесселяции у нас будет пример Detail Tessellation из ATI Radeon SDK. Собственно, он показывает не только тесселяцию, но и две разные техники бампмаппинга: обычное наложение карт нормалей и parallax occlusion mapping. Что ж, сравним DirectX 11 решения от Nvidia и AMD в различных условиях:

Первым же выводом напрашивается следующий: попиксельная техника parallax occlusion mapping (средние столбики на диаграмме) и на Geforce GTX 480 и на RADEIN HD 5870 выполняется менее эффективно, чем тесселяция (нижние столбики). То есть, имитация геометрии при помощи пиксельных расчётов обеспечивает меньшую производительность, чем реальная геометрия, отрисованная при помощи тесселяции. Это к слову о перспективности тесселяции там, где сейчас используется parallax mapping.

Далее, что касается производительности GTX 480 и карт AMD относительно друг друга. Двухчиповый HD 5970 опережает одночиповые варианты, что вполне понятно. А вот GTX 480 впереди HD 5870 на 5-15%. Больше при включенной тесселяции, меньше при попиксельных расчётах. Что соответствует нашим ожиданиям — в играх с поддержкой только DX9 или DX10 разница между GTX 480 и HD 5870 тоже должна быть меньше, чем в DX11 играх с тесселяцией.

Вторым тестом на производительность тесселяции у нас будет ещё один пример для 3D-разработчиков из ATI Radeon SDK — PN Triangles. Собственно, оба примера входят также и в состав DX SDK, так что на их основе будут создавать свой код множество игровых разработчиков. Этот пример мы протестировали с различным коэффициентом разбиения (tessellation factor), чтобы понять, как сильно влияет его изменение на общую производительность.

В этом примере, пожалуй, мы впервые увидели настоящую геометрическую мощь графической архитектуры GF100. Да, это лишь синтетический тест и такие экстремальные коэффициенты разбиения вряд ли будут использоваться поначалу. Но синтетика для того и нужна, чтобы помочь оценить перспективность решений в будущих задачах.

И Geforce GTX 480 тут отлично показывает, на что способен GF100 в задачах тесселяции. Единственный чип в разы опережает двухчиповую карту конкурента. Преимущество над HD 5970 достигает четырёх раз, а одночиповая HD 5870 в этом тесте повержена с просто разгромным счётом. По сути, GF100 позволяет использовать коэффициент тесселяции на несколько ступеней больше, по сравнению с RV870. Вот что значит архитектура, специально разработанная с учётом возможностей нового API в виде тесселяции.

Но давайте рассмотрим ещё один тест — демонстрационную программу Nvidia Realistic Water Terrain, также известную как Island. Кстати, автор этой программы — известный 3D-энтузиастам Тимофей Чеблоков aka Smalltim. Его демка Island использует тесселяцию и карты смещения (displacement mapping) для рендеринга реалистично выглядящей поверхности океана и ландшафта. Смотрится она просто отлично:

Вообще, Island не является чистым синтетическим тестом для тесселяции, а содержит и довольно сложные пиксельные и вычислительные шейдеры, поэтому разница в производительности может быть меньше, чем в предыдущем случае, но зато это положение будет ближе к реальности.

В данном случае мы протестировали демо при четырёх разных коэффициентах тесселяции, здесь эта настройка названа Dynamic Tessellation LOD. Если при самом низком коэффициенте разбиения карта на GF100 лишь немного опережает одночиповый вариант от AMD, и даже уступает HD 5970, то при росте коэффициента разбиения и итоговой сложности сцены производительность GTX 480 снижается далеко не так сильно, как скорость рендеринга у конкурирующих решений.

В итоге мы снова получили ситуацию, когда чип GF100 новой графической архитектуры Nvidia обеспечивает схожую с RV870 производительность тесселяции при значительно отличающейся сложности сцены. Так, при максимальном коэффициенте LOD равном 100 в этой программе GTX 480 показывает такую же производительность, как и Radeon HD 5870, но при коэффициенте лишь 25 — то есть при в несколько раз большем количестве треугольников (28 млн. против 4 млн. в данном случае). Это просто огромная разница!

Выводы по синтетическим тестам

По результатам проведённых синтетических тестов новой модели Nvidia Geforce GTX 480, основанной на графическом процессоре GF100, а также результатам других моделей видеокарт основных производителей видеочипов, мы можем сделать вывод о том, что это — очень мощная графическая архитектура Nvidia, которая отличается значительно улучшенными производительностью и возможностями. Новые модели видеокарт на основе GF100 стали одними из самых быстрых среди всех одночиповых.

Увеличенное количество блоков обработки геометрии и их параллельная работа позволили значительно улучшить производительность тесселяции и геометрических шейдеров. В синтетических задачах тесселяции новому решению компании Nvidia просто нет равных. Конкуренту не помогает даже двухчиповое решение, а уж при сравнении видеоплат с одним GPU, решение на основе GF100 выигрывает в таких тестах у лучшей карты на основе RV870 до 4-6 раз. И до выхода архитектуры конкурента, специально усиленной для эффективной обработки геометрии, ситуация не изменится.

Если же судить о производительности в 3D-приложениях без тесселяции, то можно предположить, что в игровых тестах будет то же самое, что и в наших синтетических — где-то Geforce GTX 480 окажется впереди конкурента, а где-то — немного отстанет. Причём слишком больших проигрышей быть не должно, так как нет игр, которые были бы полностью ограничены математическими вычислениями или производительностью текстурных выборок — единственными параметрами, по которым к архитектуре GF100 у нас возникают некоторые вопросы.

В синтетических тестах тесселяции, геометрических шейдеров и физических расчётов (имитации тканей и частиц в пакете Vantage, где также используются геометрические шейдеры), новый чип Nvidia GF100 значительно сильнее других. Как и в других вычислительных тестах со сложными программами. А вот прямолинейная математика вроде чисто вычислительных тестов из RightMark или Vantage, как и ожидалось, была проиграна решениям AMD, и отставание у Nvidia до сих пор приличное. Получается, что GF100 приблизился к CPU по своим особенностям, стал ещё универсальнее (вспоминаем про C++ и кэширование как у CPU), но по сравнению с RV870 он обладает несколько меньшей «числодробильной» мощью, которой всегда отличались GPU от CPU.

Сравнительно невысокая пиковая вычислительная и текстурная производительность, которые мы отметили в нашей статье, приводит к отставанию от конкурента в некоторых искусственных тестах, но в целом GTX 480 показала весьма приличные результаты, которые должны подтвердиться в следующей части нашего материла. В ней вы ознакомитесь с тестами свежего решения компании Nvidia, основанного на новом GPU, в самых современных игровых приложениях.

Предполагаем, что игровые результаты будут примерно соответствовать нашим выводам, сделанным при анализе результатов синтетических тестов. Хотя разницы в разы не будет, потому что скорость рендеринга в играх зачастую зависит сразу от нескольких характеристик видеокарт, и гораздо сильнее зависит от филлрейта и пропускной способности памяти, чем синтетика. Думаем, что модель Geforce GTX 480 должна немного опережать своего одночипового конкурента Radeon HD 5870 в играх без тесселяции и уж точно будет впереди в тестах с её применением.

Интернет на Андроиде