BFG GeForce 7800GS OC 256Mb AGP: обзор и сравнительное тестирование.
Часть 2.


 

Павел Болотов (Walter S. Farrell)

1.12.2006
 
 
 

Оглавление

  1. Вступление. Первые впечатления. Система охлаждения.
  2. Основные составляющие. Тестовая конфигурация и разгон.
  3. Синтетические тесты.
  4. Игровые тесты.
  5. Сложные модели сглаживания. Заключение.

 

Основные составляющие

Как уже было замечено выше, в основе видеокарты лежит графпроцессор NVIDIA G70 (NV47) ревизии A2, работающий с тактовой частотой в 398,3МГц, состоящий из 302 млн. транзисторов и производимый по 110 нм техпроцессу. Как известно, рекомендованная NVIDIA тактовая частота G70 для видеокарт GeForce 7800GS составляет 375МГц, поэтому в название данной видеокарты от BFG и была добавлена приписка "OC" — "OverClocked". Эта тактовая частота немного ниже той, которая рекомендована для видеокарт GeForce 7800GTX (430МГц), но равна таковой для 7800GT. Однако же, если бы вся разница между GeForce 7800GS, 7800GT и 7800GTX заключалась только в этом, то ситуация была бы просто замечательной. Дело в том, что в основе G70 лежат 6 блоков пиксельных конвейеров, содержащих по 4 конвейера каждый, а также 8 независимых вершинных конвейеров. На этих конвейерах обрабатываются соответствующие шейдерные команды (поддерживается Shader Model 3.0 и все предыдущие), а на пиксельных — также операции текстурирования. В отличие от NV40/NV45, где каждый пиксельный конвейер обладал собственным растровым оператором (ROP), на который были возложены функции растеризации и сглаживания (anti-aliasing), в G70 имеется 16 растровых операторов, функционирующих независимо от пиксельных конвейеров и связанных с ними посредством скоростного маршрутизатора (crossbar). Впрочем, ещё в NV43, послужившем основой для видеокарт GeForce 6600 и 6600GT, на 8 пиксельных и 3 вершинных конвейера приходилось 4 растровых оператора, что не столь существенно отразилось на производительности этих видеокарт. Что касается G70, то графпроцессор с подобной конвейерной формулой, производимый согласно норм данного технологического процесса, неминуемо будет характеризоваться немалым процентом производственного брака. Если списать в отходы графпроцессоры с одним-двумя нефункционирующими конвейерами, то это существенно поднимет себестоимость полностью работоспособных графпроцессоров и, как следствие, видеокарт на их основе. Однако, нефункционирующие конвейеры можно отключать — либо аппаратно (на фабрике), либо программно (в BIOS видеокарты). Для G70 в NVIDIA выбрали первый подход, который исключает возможность активации отключенных конвейеров программным путём. Таким образом, если для видеокарт GeForce 7800GTX предназначались полностью работоспособные графпроцессоры, то для 7800GT шли таковые с отключенным 1 блоком пиксельных конвейеров и 1 вершинным конвейером, а для 7800GS — с отключенными 2 блоками пиксельных конвейеров и 2 вершинными конвейерами. Кроме того, 8 из 16 имеющихся растровых операторов были также отключены. Итого, в видеокартах GeForce 7800GS приблизительно 1/3 графпроцессора оказывается необратимо отключенной, что не может служить поводом для радости.
 

BFG 7800GS OC - G70
(кликнуть для увеличения, 82Кб)

Поскольку G70 разрабатывался под шинную инфраструктуру PCI Express (впрочем, как и NV43), то для работы с шинной инфраструктурой AGP требуется микросхема-переходник. Как и в случае с NV43, был использован всё тот же HSI, поддерживающий режим AGP 8x c SBA (SideBand Addressing) и FW (Fast Write).
 

BFG 7800GS OC - HSI
(кликнуть для увеличения, 111Кб)

256Мб видеопамяти было набрано на 8 256Мбит микросхемах Samsung GDDR3 SDRAM 1.4ns (K4J55323QG-BC14), каждая из которых состоит из 4 банков по 2097152 32-битных слова. Таким образом, речь идёт о 256-битной шине данных видеопамяти, что есть очень хорошо. К слову, видеокарты GeForce 7800GT и 7800GTX используют шину данных видеопамяти аналогичной ширины. Рекомендованная NVIDIA тактовая частота микросхем памяти для 7800GS составляет 300МГц (1200МГц эффективных), но на нашей карте она работает с частотой в 313,9МГц (1255,5МГц эффективных), что превышает рекомендованные тактовые частоты для видеокарт GeForce 7800GTX и 7800GT — 300МГц (1200МГц эффективных) и 250МГц (1000МГц эффективных) соответственно. Поскольку память маркирована как 1,4 нс, что приблизительно соответствует 350МГц (1400МГц эффективных), а в линейке K4J55323QG присутствуют модели от 2,0 нс до 1,2 нс, то это оставляет надежду на неплохой разгон, но об этом позже.

Стабилизатор питания графпроцессора основан на микросхеме 2-канального ШИМ-контроллера Intersil 6568 (ISL6568), расположенного на задней стороне видеокарты. Каждый канал состоит из 1 мощного N-канального полевого транзистора Infineon 59N03 (BSC59N03S — 30В, 73А при 25 °C, 46А при 100 °C), 2 ещё более мощных N-канальных полевых транзисторов Infineon 32N03 (BSC032N03S — 30В, 100А при 25 °C, 77А при 100 °C), 1 диода и 1 дросселя. В качестве основных сглаживающих конденсаторов на входе стабилизатора были установлены 2 твёрдоэлектролитических 330мкФ/16В от Nippon Chemi-Con серии PS, а на выходе — 3 твёрдоэлектролитических 1200мкФ/4В от Sanyo серии SVP. Использование твёрдоэлектролитических конденсаторов вместо гибридноэлектролитических или жидкостноэлектролитических, несомненно, радует. Если точнее, то эти конденсаторы характеризуются очень низким активным сопротивлением, также известным как ESR (Electrical Series Resistance, т. е. последовательное электрическое сопротивление), и большой [отдаваемой в нагрузку] силой тока (rated ripple current), что позволяет в реальных условиях достичь высоких показателей сглаживания напряжения (другими словами, низкой амплитуды пульсаций). Кроме того, эти конденсаторы не подвержены эффекту высыхания электролита, поэтому при средних рабочих температурах (скажем так, до 65 °C) их срок службы практически неограничен. По сравнению с гибридноэлектролитическими и жидкостноэлектролитическими конденсаторами у твёрдоэлектролитических есть только 2 существенных недостатка: более низкая ёмкость при тех же физических размерах и номинальном рабочем напряжении, а также значительно более высокая цена. Для полноты картины осталось уточнить, что гибридноэлектролитические конденсаторы являются переходным звеном между жидкостноэлектролитическими и твёрдоэлектролитическими, так как сочетают в себе твёрдый электролит с жидким, но они относительно редко применяются. В целом, 1 твёрдоэлектролитический конденсатор в стабилизаторах питания низковольтной электроники обычно в состоянии заменить 2-3 соответствующих по типоразмеру и рабочему напряжению гибридноэлектролитических или хороших жидкостноэлектролитических конденсатора. Ниже приводятся основные характеристики Nippon Chemi-Con PS 330мкФ/16В и представителя другой популярной серии конденсаторов от этого же производителя, жидкостноэлектролитического KZG 680мкФ/16В. Типоразмер обоих конденсаторов одинаков — 10х12,5 мм.
 
 

  ESR at 100kHz, mΩ Rated ripple current
at 100kHz, mA RMS
Estimated lifetime
at 65 °C, years
PS 330uF/16V 14 5050 22.83
KZG 680uF/16V 26 1540 3.65

 

С другой стороны, в решениях высокого уровня вместо электролитических конденсаторов с успехом используют большое количество многослойных металлокерамических конденсаторов ёмкостью от 10мкФ до 22мкФ, обладающих отличными рабочими характеристиками особенно в высокочастотном диапазоне. Надо сказать, что на них при производстве нашей видеокарты основательно сэкономили. Например, в том же стабилизаторе питания графпроцессора из 10 имеющихся посадочных мест ими было занято только 2. Безусловно, это не столь критично, но всё-таки. Стоит отметить, что на вход этого стабилизатора подаётся питание только с +12В контакта "молекса", поэтому если при включении системы он не будет подключен, видеокарта работать не будет. Более того, пронзительным писком из имеющегося пьезоэлектрического динамика она об этом незамедлительно напомнит. Приятно, что питание подаётся не напрямую, а через LC-фильтр из 1 дросселя и 1 конденсатора ELNA 47мкФ/16В, который отсекает значительную часть высокочастотных помех, в основном, происходящих от высоковольтных транзисторов блока питания.

На видеокарте также имеются ещё два стабилизатора питания. Каждый из них основан на микросхеме Intersil 6549 (ISL6549), которая объединяет в себе ШИМ-контроллер, способный непосредственно управлять 2 N-канальными полевыми транзисторами, и линейный контроллер для управления 1 N-канальным полевым транзистором. К слову, разводка видеокарты не предусматривает использование этих линейных контроллеров. Обе микросхемы находятся на задней сторойне видеокарты. Один из стабилизаторов используется для питания видеопамяти. Кроме управляющей микросхемы, он состоит из 2 N-канальных полевых транзисторов от Alpha & Omega Semiconductor, AO4410 (30В, 18А; находится между землёй и средней точкой) и AO4420 (30В, 13,7А; находится между входящим напряжением и средней точкой), а также 1 диода и 1 дросселя. В качестве основных сглаживающих конденсаторов на входе стабилизатора, как и в предыдущем случае, были установлены 2 твёрдоэлектролитических 330мкФ/16В от Nippon Chemi-Con серии PS, а на выходе — уже 1 твёрдоэлектролитический 1200мкФ/4В от Sanyo серии SVP. Учитывая, что энергопотребление оперативной памяти во несколько раз меньше, чем графпроцессора, этого должно быть вполне достаточно. Однако, имеется одно существенное отличие. На вход этого стабилизатора подаётся уже не +12В, а только +5В, хотя и с того же самого "молекса" и через LC-фильтр из 1 дросселя и 1 конденсатора ELNA 100мкФ/10В. Спрашивается, зачем было ставить в качестве основных сглаживающих конденсаторы на 16В? Тройной запас по рабочему напряжению практикуется обычно в системах повышенной надёжности (например, серверных и военных), а не в видеокартах среднего ценового диапазона. Ведь можно было поставить 10-вольтовые конденсаторы большей ёмкости, которые имели бы тот же самый типоразмер. Что касается второго стабилизатора, то он предназначен для обслуживания микросхемы HSI. Кроме управляющей микросхемы, он состоит из 2 N-канальных полевых транзисторов: 1 неизвестного с маркировкой RLA130 (находится между землёй и средней точкой) и 1 от Alpha & Omega Semiconductor, AO4022 (30В, 11А; находится между входящим напряжением и средней точкой), также имеются 1 диод и 1 дроссель. На вход этого стабилизатора подаётся +3,3В с разъёма AGP, но через фильтрующий дроссель, после которого стоит 1 твёрдоэлектролитический Sanyo SVP 180мкФ/16В; на сей раз запас по рабочему напряжению уже даже не тройной... На выходе расположен 1 твёрдоэлектролитический Sanyo SG 510мкФ/4В. Первый стабилизатор обошёлся 1 большим многослойным металлокерамиком из положенных по дизайну 5, аналогично и второй.
 

BFG 7800GS OC - Power supply
(кликнуть для увеличения, 213Кб)

Напряжения питания графпроцессора, видеопамяти и моста PCIe-AGP под нагрузкой (использовался тест Nature из 3DMark2001SE) составили 1,44В, 1,82В и 1,43В соответственно, так что тут всё оказалось в порядке. Для оценки качества питания ниже приводятся осциллограммы по переменной составляющей (использовался 1-канальный портативный 12МГц осциллограф Velleman HPS40).
 
 

G70 voltage
(напряжение питания графпроцессора)
 
Memory voltage
(напряжение питания видеопамяти)
 
Bridge voltage
(напряжение питания моста)

Как видим, микросхема HSI находится в самых лучших условиях — размер нежелательной переменной составляющей в её питании составляет менее 0,1%. Что касается графпроцессора и видеопамяти, то у них эта характеристика равна 1,0% и 0,7%, что можно считать хорошими показателями.
 

Тестовая конфигурация и разгон

Для тестовой части данной статьи использовался открытый стенд в следущей конфигурации:
 

  • процессор AMD Athlon 64 FX-51 (Sledgehammer, rev. C0, 130nm SOI) 2,44ГГц (11х222МГц)
     
  • материнская плата ASUS SK8V (VIA K8T800, Socket 940, BIOS rev. 1002)
     
  • оперативная память Mushkin High Performance 2х512Мб PC3200 DDR SDRAM ECC registered 222МГц
    (tCAS=2, tRCD=3, tRP=2, tRAS=6, tRC=8, tRFC=14, tWR=2, tR2W=1)
     
  • жёсткий диск Western Digital 800JB (IDE, 80ГБ, 8Мб кэш-памяти)
     
  • дисковод DVD-RW TEAC (фактически, Lite-On) DV-W516G (IDE, 2Мб кэш-памяти)
     
  • звуковая карта Turtle Beach Montego II PCI (Aureal Vortex 2)
     
  • блок питания InWin 430Вт (32А по +3,3В, 35А по +5В, 18А по +12В)
     

Штатная частота процессора — 2,20ГГц (11х200МГц) при напряжении питания в 1,50В. Все электролитические конденсаторы в стабилизаторе питания процессора на материнской плате были заменены (3 Nippon Chemi-Con KZE 1200мкФ/16В на 3 Sanyo WG 1800мкФ/16В, дополнительно установлен твёрдоэлектролитический 1 Fujitsu RE-SU 330мкФ/16В; 6 OST RLX 1500мкФ/6,3мкФ на 6 Rubycon MBZ 2200мкФ/6,3В, дополнительно установлены твёрдоэлектролитические 2 Sanyo SP 560мкФ/4В и 1 Sanyo SG 750мкФ/4В, танталовые 2 Epcos 220мкФ/10В и полимерный 1 Murata 100мкФ/2В). Кроме того, на линиях питания процессора и оперативной памяти было распаяно около 50 многослойных металлокерамических конденсаторов (в основном, по 10мкФ), которые окончательно решили проблему стабильности напряжений. Процессор вполне стабильно работал на частоте в 2,44ГГц при напряжении питания в 1,70В (выше поднимать BIOS материнской платы отказался, а на эксперименты по поднятию уровня земли микросхемы ШИМ-контроллера у автора всё руки не доходят). Использовалось воздушное охлаждение на основе Thermaltake BigTyphoon (медное основание с 6 теплотрубками, ведущими к 140 алюминиевым рёбрам, обдуваемым 120мм 1300 об./мин вентилятором c двойным шарикоподшипником). Поскольку воздухопоток от столь низкоскоростного вентилятора автору показался недостаточным, под ним через фторопластовые прокладки был установлен Titan TFD-12025H12B (120мм, 2200 об./мин, двойной шарикоподшипник), а получившаяся конструкция была скреплена обычными оцинкованными 70мм самонарезами. На материнской плате заменялись и другие конденсаторы, но описание этого процесса не столь существенно. Тем не менее, частоту шины HyperTransport в BIOS материнской платы пришлось понизить с 800МГц до 600МГц (666МГц с учётом разгона), иначе время от времени система намертво зависала. Режим коррекции ошибок в оперативной памяти для достижения максимальной производительности был отключен. Во всех случаях использовался 8х режим шины AGP с включенными SBA и FW; поскольку системная логика VIA K8T800 не поддерживает фиксирование частот шин AGP и PCI (в отличие от K8T800 Pro, хотя и у неё с этим есть проблемы), то после разгона их частоты составили 74МГц и 37МГц соответственно, но никаких проблем это не вызвало.

Использовалась нелокализованная 32-битная Windows XP Professional SP1 с DirectX 9.0c (4.09.0000.0904), драйвера NVIDIA ForceWare 91.31 и ATI Catalyst 6.9 со следующими настройками:
 
 

NVIDIA ForceWare 91.31
Anisotropic filteringApplication-controlled
Anisotropic optimisationOff 1
Anisotropic sample optimisationOff 1
Antialiasing settingsApplication-controlled
Conformant texture clampOn
Extension limitOff
Gamma corect antialiasingOff
Hardware accelerationSingle display performance mode
Image settingsBest quality
Negative LOD biasOff
Transparency antialiasingOff
Trilinear optimisationOff 1
Triple bufferingOff
Vertical syncForce off
1 При установке Image settings в Best quality эти оптимизации отключаются,
а включение их вручную не даёт ожидаемого результата.

 
ATI Catalyst 6.9
Anisotropic filteringApplication managed
High quality anisotropic filteringDisabled
Anti-aliasingApplication managed
Adaptive anti-aliasingDisabled
Mipmap detail levelHigh quality
Catalyst A.I.Disabled 2
Wait for vertical refreshAlways off
2 Этим пунктом отключаются внутренние оптимизации фильтрации.

 

Использовались исключительно возможности панелей управления обоих драйверов, никакие скрытые опции не изменялись при помощи ручной правки системного реестра или использования утилит от других разработчиков. Таким образом, видеокарты от NVIDIA и ATI были поставлены в максимально равные условия.

BFG GeForce 7800GS OC 256Мб AGP была успешно разогнана до 480,9МГц по графпроцессору и до 355,7МГц (1422,9МГц эффективных) по видеопамяти — как видим, она честно отработала заявленные 1,4 нс. В данном случае речь идёт о так называемом "простом" разгоне, который не предполагает никаких изменений в BIOS видеокарты, в том числе напряжения питания графпроцессора, геометрической дельты (которая равна нолю у данной видеокарты) или задержек видеопамяти. Естественно, до аппаратного повышения напряжений (так называемого вольтмода) дело также не доходит. Увеличению подверглась только скорость вращения вентилятора в режиме High Power 3D (с 80% до 100%). Штатная система охлаждения доказала свою эффективность: до разгона максимальная температура графпроцессора составила 58 °C, а после разгона — 60 °C (для разогрева использовался тест Nature из 3DMark2001SE, который запускался 10 раз подряд).

В качестве конкурирующих видеокарт были выбраны ASUS GeForce 6600GT Top 128Мб AGP и Sapphire Radeon X1600 Pro 256Мб AGP. Первая потому, что видеокарты семейства GeForce 6600 были самыми массовыми решениями на основе предыдущего поколения графпроцессоров GeForce, а вторая — поскольку это было одно из самых высокопроизводительных и широкодоступных решений от ATI для шины AGP на момент написания статьи, поддерживающее Shader Model 3.0. Тактовая частота графпроцессора в ASUS GeForce 6600GT Top составила 550МГц, а видеопамяти (DDR3 SGRAM) — 274,2МГц (1096,9МГц эффективных). Тем не менее, на сайте компании для этой видеокарты была заявлена частота графпроцессора в 520МГц. Поскольку именно в таком виде она пришла от производителя, было решено оставить частоты неизменными. Основой этой видеокарты послужил графпроцессор NV43, характеристики которого уже упоминались — 8 текстурных/пиксельных и 4 вершинных конвейера, 4 растровых оператора; физически состоит из 146 млн. транзисторов, производится по 110 нм техпроцессу. Sapphire Radeon X1600 Pro может похвалиться тактовой частотой графпроцессора RV530 в 499,5МГц, видеопамяти (DDR2 SDRAM) — в 202,5МГц (810,0МГц эффективных). Графпроцессор состоит из 4 текстурных конвейеров с 4 растровыми операторами, а также из 12 пиксельных конвейеров (3 блока по 4 конвейера в каждом) и 5 вершинных конвейеров; физически состоит из 157 млн. транзисторов, производится по 90 нм техпроцессу с низкоёмкостными диэлектриками. В отличие от BFG GeForce 7800GS OC, обе эти видеокарты используют 128-битную шину данных к видеопамяти. Ко всему прочему, эти видеокарты не разгонялись, поскольку повальный разгон не входит в цели данной статьи.
 
 

Страницы: 1 | 2 | 3 | 4 | 5


 

 

Обсудить в конференции
 
 
 

Редакция:
Павел Болотов (Walter S. Farrell)
Вёрстка:
Павел Болотов (Walter S. Farrell)
На главную страницу

Главная | Справочник | FAQ | Статьи | Загрузки | Контакты | Конференция

Логотипы, торговые марки и прочие зарегистрированные знаки принадлежат их правообладателям.
Copyright © 2001 - 2024, Radeon.ru Team.
Перепечатка материалов запрещена.

Top.Mail.Ru
Top.Mail.Ru