GeForce 6800 Ultra versus Radeon X800 XT Platinum

Hosszú várakozás után itt a GeForce 6800 Ultra. Cikkünk élőben közvetít az NVIDIA-újdonság és az ATI Radeon X800 sorozat mérkőzéséről.

Bevezető


A résztvevők: ATI R420 és NVIDIA NV40

2004. április 14: az ítélet napja, az NVIDIA bejelenti NV40 kódnevű grafikus processzorát. Az új GPU a különböző teszteket sorra nyeri az ATI – akkori – csúcskategóriás grafikus lapkája, a Radeon 9800 XT ellen. Az ATI eközben kivár. Az NV40-hez kiadott 60-as szériájú Forceware további teljesítménynövekedést ígér, a GeForce 6800 Ultra egyre csak gyorsul. Az ATI még mindig vár. Több gyártó is bejelenti, hogy az NVIDIA üdvöskéje köré építeni fog kártyát. Kósza híresztelések látnak napvilágot, melyek szerint lesz lassabb és persze olcsóbb GeForce 6800 is. Sok-sok bejelentés, de kártya még sehol. Az ATI nem vár tovább, május 4-én bejelenti legújabb grafikus processzorait, melyek X800 XT és X800 Pro néven kerülnek forgalomba. Az X800 Pro elvileg és jóindulattal gyakorlatilag is egy héten belül megvásárolható. A GeForce 6800 Ultra megtapogatása azonban még mindig csak a teszterek kiváltsága, az IBM megküzd a 222 millió tranzisztorból álló chip gyártásával. Időközben mindkét cég bejelenti csúcskártyái PCI Express x16 csatolóval rendelkező változatát is, az NV40 pedig szépen lassan megjelenik a boltok polcain. A hangsúly inkább a lassanon van, mint a szépen. Ideje hát, hogy mi is végre megcsodálhassuk mindkét óriáscég jelenleg leggyorsabb grafikus processzorát, és kielemezzük őket töviről hegyire.

Az NVIDIA NV40, alias GeForce 6800, egy merőben új és minden porcikájában erőteljes architektúra, mely szakítva a GeForce FX széria gyengeségeivel és megtartva annak erősségeit, végre azt sugallja, hogy az NVIDIA nem felejtett el fejleszteni. Az ATI a márkajelzésekben szintén szakított az előző generációval, de csak és kizárólag ebben, hiszen az X800-as széria a Radeon 9700, vagyis R300-as kódnevű grafikus processzor jelentősen felturbózott változata. Szándékosan nem a továbbfejlesztett szót használtuk, hiszen az ATI új és régi csúcskártyái között inkább teljesítménybeli különbség van, mint tudásbeli.

Mivel korábban már bemutattuk az új kártyák elméleti tudását, ezért most csak a gyakorlattal foglalkozunk.

 

R360 R420 NV38 NV40
Gyártástechnológia 0,15 (TSMC) 0,13µ low-k (TSMC) 0,13 (TSMC) 0,13 (IBM)
Tranzisztorok száma 107 millió 160 millió 135 millió 222 millió
GPU órajele 412 MHz XT: 525 MHz
Pro: 475 MHz
475 MHz 400 MHz
Pixel futószalagok száma 8 XT: 16
Pro: 12
4 16
Pixel fillrate 3296 MPixel/s XT: 8400 MPixel/s
Pro: 5700 MPixel/s
1900 MPixel/s 6400 MPixel/s
Futószalagonkénti textúrázó egységek száma 1 1 2 1
Textúra fillrate 3296 MTexel/s XT: 8400 MTexel/s
Pro: 5700 MTexel/s
3800 MTexel/s 6400 MTexel/s
Vertex shader egységek száma 4 6 3 6
Támogatott PS-verzió 2.0+ (24 bites precizitás) 2.0+ (24 bites precizitás) 2.0+ 3.0+
Támogatott VS-verzió 2.0+ (32 bites precizitás) 2.0+ (32 bites precizitás) 2.0+ 3.0+
Memória órajele 365 MHz XT: 575 MHz
Pro: 450 MHz
450 MHz 550 MHz
Memória órajele (effektív) 730 MHz XT: 1150 MHz
Pro: 900 MHz
900 MHz 1100 MHz
Memóriainterfész 256 bit 256 bit 256 bit 256 bit
Memória-sávszélesség 23360 MB/s XT: 36800 MB/s
Pro: 28800 MB/s
30400 MB/s 35200 MB/s
Memória mérete 256 MB 256-512 MB 256 MB 256-512 MB
Memóriatípus DDR GDDR3 DDR GDDR3
RAMDAC 2 x 400 MHz 2 x 400 MHz 2 x 400 MHz 2 x 400 MHz
AGP-busz 8x 8xAGP/PCI-E 8x 8xAGP/PCI-E
Támogatott DirectX-verzió 9.0 9.0b 9.0a 9.0c
Memória-optimalizáció HyperZ III+ HyperZ HD LMA III LMA III Color Compression
További optimalizációk SmartShader 2.1; SmoothVision 2.1 SmartShader HD; SmoothVision HD; 3Dc Compression; Temporal AA IntelliSample 2.0;
CineFX 2.0
IntelliSample 3.0;
CineFX 3.0;
UltraShadow 2.0;

A táblázatból egyértelműen kiderül, hogy mindkét gyártó az elérhető legnagyobb teljesítményt tartotta szem előtt – jó példa erre a 16 (!) futószalag –, ebből következően megdöbbentően magas elméleti fillrate- és nagyon magas maximális memóriasávszélesség-értékeket láthatunk. Utóbbi azért is fontos, mert bár a korábbi generációk is jeleskedtek ezen a téren (főleg a GeForce FX 59xx széria), a szűk keresztmetszet inkább a GPU teljesítménye volt, mint a memória-sávszélesség. A helyzet most fordulhat, hiszen a 16 futószalag már ténylegesen képes megizzasztani a memóriákat.

Következzenek hát maguk a vasak!

ATI Radeon X800 XT/Pro

Korábban már megismerkedhettünk egy végleges, a Sapphire által gyártott X800 Próval, ezúttal azonban a referenciakártyák kerülnek terítékre. Amint az alább látható, az X800 XT és az X800 Pro külsőre 99%-ban megegyezik.


Találós kérdés: melyik kártya az XT és melyik a Pro? (katt)

Sapphire X800 Pro (katt)

Az egyetlen különbség közöttük a memóriachipek maximális sebességében keresendő.

Az X800 XT kártyán 1,6 ns-os, míg az X800 Pro kártyán 2 ns-os Samsung-memóriachipeket találhatunk. A nyolc darab, 256 MBit (32 MB) kapacitású, 144 kivezetéssel rendelkező, Ball FBGA tokozású GDDR3-as memórialapkák a maximálisan elérhető órajelben különböznek. A K4J55323QF-GC16 jelölésű chip – amely az XT-n dolgozik – a gyártó specifikációi szerint maximálisan 600 MHz-es órajelen képes üzemelni, míg a K4J55323QF-GC20, amely a Prón található, maximum 500 MHz-es órajelet visel el, mindezt 2 voltos feszültség mellett.


Referencia X800 XT (katt)

Referencia X800 Pro (katt)

Sapphire X800 Pro (katt).

ASUS Radeon 9800 XT – referencianyák (katt).

A képeken jól látható, hogy az X800-as kártyák az utolsó kondenzátorig megegyeznek, tehát az X800 XT és az X800 Pro csak a memóriák közelebbi vizsgálatával különböztethető meg. Szembetűnő továbbá, hogy az X800-as kártyák nyákja kevesebb áramköri elemet tartalmaz, mint a Radeon 9800 XT, illetve a memóriák valamivel közelebb kerültek a GPU-hoz, ami az adatáramlásra jótékony hatással lehet, hiszen kisebb késleltetéseket érhetünk el így. A kártyák hátoldalán nincs semmi izgalmas látnivaló: a memórialapkák mellett jó néhány SIMD alkatrész található.

A referenciakártyákat és a végleges Sapphire változatot csupán a kis sárga csatlakozó és a Rage Theater chip megléte különbözteti meg, ami örvendetes tény, hiszen az ATI jól bevált módszerét lemásolni nem szégyen.


katt

Mindkét X800-as kártyán a szokásos DVI-, D-Sub- és S-Video tv-kimenetek találhatóak meg. A nyákot belepő rézbordázat bal oldalán egy nagy, lassan pörgő ventilátor található, amely az X800 XT kártyán a terhelés hatására felgyorsul, míg az X800 Prón állandó fordulatszámmal pörög. A képeken az is világosan látszik, hogy a Radeonok továbbra is egy kártyahelyet foglalnak el.


katt

A kártyák elméleti monstre tudásuk ellenére továbbra is egy tápcsatlakozóval hivalkodnak: az ATI 300 wattos tápot ajánl hozzájuk. A referenciakártyákon megtalálható egy citromsárga konnektor is, amely úgy néz ki, mint a hangkártyákon az audio port. Az ATI tájékoztatása szerint ez a csatlakozó egy kompozitvideó-bemenet, melyre egy speciális video-in kábelt kell csatlakoztatni. Ezt akár ki is vezethetjük a számítógépház előlapjára – nem egy standard megoldás (ilyet még nem láttunk sehol).

A kártyák órajeleit az ATIToollal ellenőriztük. A referencia X800 XT 526/573 MHz-en, míg a referencia X800 Pro 475/450 MHz-en jár. A két kártya közötti további egyetlen – és igazán lényeges – különbség a pipeline-ok száma: az XT 16-tal, a Pro pedig 12-vel rendelkezik.

NVIDIA GeForce 6800 Ultra

A GeForce 6800 Ultra ma még ritka, mint a fehér holló: két hónapba tellett, míg szerkesztőségünkbe megérkezett az első referenciakártya, melyet már igen izgatottan vártunk. Íme:


Referencia GeForce 6800 Ultra felfegyverkezve (katt)


Referencia (AOpen) GeForce FX 5950 Ultra (katt)

A kártya bizony méretes darab. A robosztus felépítésű nyákon a szemünk azonnal a molex tápcsatlakozókra irányul, melyből kettő van a kártyán. Nem újdonság ez, emlékezzünk csak vissza az XGI Volari Duo V8 Ultrára, melyen szintén két tápcsatlakozó volt. Az NVIDIA elhamarkodottan 480 wattos tápot ajánlott az NV40-hez, hiszen a 222 millió tranzisztorból álló GPU és a 256 MB memória a ventilátorral együtt már szép kis kakaót vehet fel. Később az ajánlást 350 wattra csökkentette: amint mondták, ennél nagyobb táp csak a túlhajtók számára kell. Természetesen ebben az estben márkás vagy legalábbis jó minőségű tápra kell gondolni. A hűtésről később még részletesen szólunk, ám az a képeken is jól látható, hogy a GeForce 6800 Ultra valóban méretes hűtése még mindig kisebb, mint a referencia GeForce FX 5950 Ultrán található cooler. Az FX-en a nyák túloldalán a memóriákra is kellett egy passzív hűtés – ezekre itt nincs szükség, hiszen a kártya ezen oldalán nincsenek memóriachipek. Az x-alakú támasztó a ventilátor rögzítéséhez kell.


Referencia GeForce 6800 Ultra csupaszon (katt)


Referencia (AOpen) GeForce FX 5950 Ultra (katt)

Miután a hűtéseket leszedtük, előbújtak rejtekhelyükről az igazán izgalmas alkatrészek. A nyák közepén terül el az óriási méretű GPU, amely most nem kapott védőkupakot. Ez valószínűleg azért van így, mert a 222 millió tranzisztorból felépülő GPU sokkal jobban melegszik az előző generáció képviselőjénél, és a megfelelő hűtés érdekében muszáj közvetlenül a hűtőbordával érintkeznie. A GPU körül ívesen helyezkednek el a memóriachipek – itt nincs változás az NV38-hoz képest. A nyák tápcsatlakozók felöli oldalán érdekes módon jóval kevesebb alkatrész tanyázik, mint az NV38-on, holott biztosak vagyunk benne, hogy ez a GPU és ezek a memóriák is megkövetelik a maximális feszültségstabilizálást.


katt

A nyák túloldalán szintén meglepően kevés alkatrész található. Amíg a GeForce FX 5950 Ultrán itt terpeszkedett a memórialapkák fele (+128 MB), addig az NV40-en ezeknek csak a hűlt helyét találjuk, köszönhetően a GDDR3 alkalmazásának: az új generációs megoldással 256 MB memória csupán 8 chipet igényel. A Silicon Image DVI-chipen kívül más komolyabb alkatrész nincs is ezen az oldalon.

A referenciakártyán két DVI-kimenet és egy S-video tv-kimenet található, D-Sub csatlakozó nincs. A kártya üzemszerű működtetéséhez két molex tápcsatlakozót kell használnunk. A hűtőborda magasságából adódóan a GeForce 6800 Ultra két kártyahelyet foglal el.


katt

A baloldali képen látható az NV40 GPU a maga tükörsima felületével. A jobb oldali képen a kártyán található memóriachipek egyikét mutatjuk be. Ez szintén Samsung gyártmány, a K4J55323QF-20-as felirat pedig megegyezik a Radeon X800 Prón látottal: 2 ns-os, maximálisan 500 MHz-et bír el 2 voltos feszültségen.

A hűtés

Szokásunkhoz híven nem bírtuk megállni, hogy a hűtőrendszert szét ne szedjük darabjaira, lássuk, hogy az NVIDIA tervezőmérnökei mire képesek!

Első lépésben leszedtük a külső alumíniumborítást a műanyag ventilátorágyról. Jól látható a GPU-n található óriás hűtőborda és a ventilátor egymáshoz való viszonyulása. A második képen már le van szedve a ventilátor is, így már csak a GPU-t hűtő borda és a memóriákat hűtő heatpipe-os hűtés van a kártyán.

A bal oldali képen a memóriák hűsön tartásáért felelős csöves hűtőborda látható. A memóriachipekkel való érintkezést a hűtőbordán látható fehér, vattaszerű, nyálkás anyag biztosítja. A második és harmadik képen már az összes leszedett alkatrész látható, melyek között ott van a molex csatlakozókhoz közeli FET-ek hűtésére szakosodott passzív hűtőborda is, és a kártya túloldalán látható x-alakú GPU-bordarögzítő. A szétszereléshez nem kevesebb, mint 18 csavartól kell megszabadítani a kártyát. A bal oldalon látható négy csavarral kell a GPU-hűtőbordát rögzíteni, a fekete rugós csavarokkal a memóriák hűtését kell rögzíteni, a három kisebb csavar a ventilátorhoz kell, míg a pici csavarokkal a ventilátorkeretre a borítást lehet rögzíteni.

Szépen ki lett ez találva, a kérdés már csak a melegedés és a hangerő. A későbbiekben ezekre is kitérünk.

A referenciakártya órajeleit a coolbits regpatch telepítése után a meghajtóprogramból ellenőriztük. A GeForce 6800 Ultra 400/550 MHz-en jár, ami némi gyári túlhajtást feltételez a referenciakártya esetében, hiszen a 2 ns-os memóriachipek elméletileg csak 500 MHz-ig használhatóak.

A tesztek előtt

Méretek


katt

"Nem a méret a lényeg" – szól a mondás, a videokártyák esetében azonban egy bizonyos pont után már ez is lényeges tulajdonság, emlékezzünk csak vissza a 3dfx Voodoo 5 6000-es kártyákra, amelyek egy mai átlagos számítógépházba be sem férnének. Az új kártyák esetében szerencsére nem beszélhetünk ilyen monstre méretekről, de azért nem árt tudni, mire is számíthatunk.


katt

A GeForce 6800 Ultra referenciakártya hosszúságra megegyezik a GeForce FX 5950 Ultráéval, amelyről egy korábbi bemutatónk nyomán már tudjuk, hogy igencsak nagyra nőtt. Az X800-as Radeonok szerencsére nem nyúltak egy fikarcnyit sem a Radeon 9800 Próhoz képest.

Hőmérsékletek

A korábbi GeForce-oknak sokszor felrótták, hogy nagyon melegednek, sőt, néhány gyártó hűtési megoldása a keletkező óriási hőt nemhogy kivezette volna a gépházon kívülre, hanem bent, a többi melegedő alkatrész által felmelegített levegővel együtt csak kevergette.

Nem szokványos tesztünkben egy infrás hőmérőt használtunk fel a cél érdekében: terhelt állapotban, negyedórányi Far Cry-nyúzás után a videokártyák különböző pontjain lemértük a hőmérsékleteket. A szobában körülbelül 25 fok volt.


ATI Radeon 9800 Pro

Az összehasonlíthatóság végett lemértük az igen elterjedt Radeon 9800 Pro hőmérsékleteit is – ez a modell szintén nagyon fel tud melegedni. A memóriachipek a terhelés hatására 70 fokig melegedtek, a feszstab áramkörön található kis hűtőbordácska pedig 75 fokig. A GPU-n található hűtőborda a szélén 55 fokos volt, a GPU közelében pedig már 65 fokos. Nem mondhatnánk, hogy hűvös kártyáról van szó.


ATI Radeon X800 Pro

Az ATI Radeon X800 Pro jóval nagyobb hűtőbordával rendelkezik, amely a kártya nagy részét befedi, de a memóriákra már nem jutott a jóból. A hűtőborda felületén, a GPU közelében 45 fokos hőmérsékletet mértünk, míg a hűtőborda felülete 55 fokra melegedett fel, ez az a terület, amit meg is tudunk tapizni. A hűtőborda belsejébe is sikerült bemérnünk, újabb 10 fokkal magasabb hőmérsékletet mértünk. A memória IC-k a 9800 Prón mért 70 foknál 5 fokkal jobban felmelegedtek. A hűtésről még annyit, hogy a ventilátor állandó fordulatszámon, nagyon csendesen végzi a dolgát, ám a konkrét számokról picit később. Az X800 Pro sem nevezhető hűvös kártyának.


ATI Radeon X800 XT

Az X800 XT-n a gyári hűtőrendszer megegyezik a Prón látottal. A különbség annyi, hogy ezen a kártyán a ventilátor komolyabb terhelés hatására már begyorsul. Érdekes eredményeket kaptunk: ha a Pro kártyán mért értékekhez hozzáadunk 10 fokot, megkapjuk az XT hőmérsékleteit. A memóriachipek 85 (!) fokig melegedtek fel, ami talán mégiscsak megkívánna valamiféle hűtést.


NVIDIA GeForce 6800 Ultra

A GeForce 6800 Ultra hőmérsékleti értékei a Radeon kártyákon mértekhez képest megdöbbentően alacsonyak. A kártya egyetlen igazán melegedő területe a FET-eket hűtő passzív hűtőborda, amely 65 fokig melegedett fel. A GPU-t befedő óriás hűtésben a ventilátor alatt, a GPU-hoz közel 33 fokos hőmérsékletet mértünk, ami nagyon alacsony. A memóriákon található hűtőborda a GPU fölött 35, míg mellette 41 fokos. Utóbbi azért melegebb, mert a ventilátor a GPU által már felmelegített levegőt ebbe az irányba fújja ki, tehát a számítógépház belsejébe. A heatpipe 35 fok körüli értékre melegedett, míg a hűtőborda alá csak nehezen sikerült bekukucskálnunk, hogy lemérjük a memóriachipek lázát. Az X800 Prón is látott Samsung-memóriák – a passzív hűtőbordának köszönhetően – nem 75, hanem csupán 50 fokig melegedtek fel.

Zajszint

A kártyákról készült körkép nem lenne teljes, ha a ventilátorok zajszintjét nem mértük volna le.

Itt az ATI új kártyái minden versenyzőt leköröznek. Az X800 XT még leterhelve is halkabb az összes GeForce-nál. Ugyanakkor a GeForce 6800 Ultra 31 decibeles hangossága sem tartozik az elviselhetetlen kategóriába, hiszen még a Radeon 9800 Pro hűtése is hangosabb – igaz, az NV40 esetében a kisebb lapátok miatt kissé élesebb hangot hallhatunk.

GPU-méretek

Az érdekesség kedvéért készítettünk egy képet a videokártyák GPU-járól.


katt

A kép közepén látható processzor egy Athlon XP 2600+ Thoroughbred-B maggal, amelyről tudvalevő, hogy 37,6 millió tranzisztorból épül fel, és 0,13 mikronos gyártástechnológiával gyártja az AMD. A kép ugyan kissé csalóka, mert a processzor közelebb van, mint a két GPU, de az arányok érzékeltetésére így is megfelel. Az NVIDIA szerint 222 millió tranzisztorból felépülő NV40-es chip a kép tanúsága szerint nagyobb, mint az ATI szerint 160 millió tranzisztorból felépülő R420-as mag. Ám az ATI ebbe a 160 millióba nem számol bele minden alkatrészt, ami a képen is látszik, ugyanis az NV40 magja aligha nagyobb 38%-kal (több mint 1/3-dal), mint az R420-é.

Tápom, tápom, mondd meg nékem, elég leszel-e te nékem

Az NVIDIA a GeForce 6800 Ultra bejelentésekor még azt ajánlotta, hogy kártyát használó rendszerek ellátásához 480 wattos tápot illik használni – ezzel nem lopta be magát az felhasználók szívébe, hiszen az új videokártyához gyakorlatilag új tápot is kellene így venni. Az ATI válaszul az X800-as kártyákat barebone PC-kben mutatta be. Az NVIDIA később a 480 wattos ajánlást 350 wattra csökkentette, de biztos, ami biztos alapon szerkesztőségünk utánajárt, hogy mennyi az annyi.

A tesztrendszer lelke egy Athlon 64 3400+ processzor, amely 2,2 GHz-en maximálisan 89 wattot fogyaszt. Az MSI K8T Neo-FIS2R alaplapban 2x256 MB PC3500-as memória foglalt helyet, továbbá egy DVD-író és egy winchester volt a gépre kötve. Ezt a konfigurációt kipróbáltuk egy 300 wattos Seasonic-táppal, amely 3,3V: 28A; 5V: 30A; 12V: 15A értékekkel rendelkezik. A rendszer tökéletesen stabilan működött órákon át. Mivel nem igazán értjük, hogy miért is kell két tápcsatlakozó a kártyára, hiszen a tápból szétágazó két ág egy helyre kapcsolódik vissza a táp nyákján, ezért kipróbáltuk a kártyát táp nélkül is.

Abban az esetben, ha a felső tápcsatlakozó nincs bedugva, a kártya elkezd csipogni, a rendszer nem indul el. Amennyiben a felső tápcsatlakozó csatlakoztatva van, az alsó viszont nem, a gép elindul, de a Windows betöltődése után a meghajtó figyelmeztet, hogy a rendszer így nem lesz stabil. Mi továbbmentünk, és a videokártyát így tuningoltuk – egészen 449/610 MHz-re. Íme:


katt

Ez a rendszer tehát vígan működött egy 300 wattos táppal úgy, hogy a videokártyára csak egy csatlakozó volt rádugva, ráadásul a videokártya még tuningolva is volt. Ezzel természetesen nem akarunk senkit sem arra buzdítani, hogy 250 wattos táp mellett használja NV40-es kártyáját, csak rámutatunk: a szaksajtó némileg túllihegte ezt a tápmizériát (amiért persze részben az NVIDIA is okolható).

GeForce 6800 Ultra méretek

Végül álljon itt két kép a GeForce 6800 Ultra méreteit szemléltetendő.


katt

katt

Tesztkonfiguráció

Tesztkonfiguráció:

 

  • Videokártyák:

    • Referencia ATI Radeon X800 XT 256 MB

    • Referencia ATI Radeon X800 Pro 256 MB

    • Sapphire Atlantis ATI Radeon 9800 XT 256 MB

    • Referencia NVIDIA GeForce 6800 Ultra 256 MB

    • Chaintech GeForce FX 5950 Ultra 256 MB

     

  • Processzor: AMD Athlon 64 3400+ (2,2 GHz)

  • Alaplap: MSI K8T Neo2-FIS2R

  • Memória: 2 x 256 MB PC3500 Corsair XMS CMX256A-3500C2PT - CL 2-2-2-5

  • Merevlemez: Hitachi Deskstar 7K250 160 GB (Parallel ATA; 7200 rpm; 8 MB cache)

  • OS és szoftverek

    • Windows XP Professional Service Pack 1

    • DirectX 9.0b SE

    • VIA Hyperion v4.51

    • ATI Catalyst 4.5

    • NVIDIA Forceware 61.34 - az NVIDIA ajánlásával!

    • NVIDIA Forceware 61.11 - a bugok miatt

  • Játékok

    • ID Software - Wolfenstein: Enemy Territory

    • Activision - Call of Duty

    • Disney Interactive - Tron 2.0

    • Microsoft/Bungee Studios - Halo Combat Evolved

    • EA Sports - Forma 1 Challenge '99-02

    • UBISoft - Lock On: Modern Air Combat

    • Eidos - Tomb Raider Angel of Darkness

    • Ubi Soft - Tom Clancy's Splinter Cell

    • Codemasters - Colin McRae Rally 04

    • EPIC Games - Unreal Tournament 2004

    • UBISoft - Far Cry

    • People Can Fly - Painkiller

Minden játék esetében a grafikai beállításokat maximumra állítottuk. A meghajtóprogramokban a képminőségi beállításokat a legszebbre kapcsoltuk, később csak az FSAA-val és az anizotropikus szűréssel foglalkoztunk. A Wolf ET, COD, F1 '99-02, LOMAC, TRAoD, Splinter Cell, Far Cry, UT2004 és Painkiller játékokban saját magunk által felvett demókat/replayeket használtunk fel a kártyák tudásának leméréséhez, így minimálisra csökkentve a meghajtóprogram-optimalizációk esetleges hatását. A többi játékban egy begyakorolt útvonalat jártunk be háromszor egymás után, miközben Frapsszel mértük az fps-eket. A három lefutott kör után az átlagot jegyeztük fel.

A grafikonokon az "IQ" beállítás a Far Cry kivételével minden játékban 4x-es élsimítást és 16x-os anizotropikus szűrést jelent. Far Cryban az anizotropikus szűrés 4x-es a játékból beállítva, míg az élsimítás "Medium" fokozatú, ami szintén 4x-est jelent.

Képminőség: FSAA

Az ATI R3x0 család és az NVIDIA NV3x széria összeütközései során mindig szó esett a két gyártó által preferált FSAA-megvalósításokról. Az ATI R3x0 csak a multisampling alapú élsimítást ismeri, abból is csak a rotated grid (elforgatott rács) technikát, míg az FX széria a multisampling megvalósítás mellett ismeri a supersamplinget is, és ezeket kombinálni is képes, de csak ordered grid (rendezett rács) elven tudja a subpixeleket elhelyezni. A rotated grid (ATI) megoldás szebb képet eredményez az ordered griddel (NV3x) szemben - megegyező teljesítménycsökkenés mellett.

A következőkben a teljesség igénye nélkül bemutatjuk az előző generáció FSAA-megvalósításának elméleti részleteit.


ATI R3x0 / NVIDIA NV3x

A baloldali képen az ATI-féle rotated grid élsimítás elvének rajza látható 4x-es élsimítás mellett, a jobb oldalon az NV3x-féle ordered grid. A geometriai mintavételezési pontok (rózsaszín négyzetek) elhelyezkedése meghatározza, hogy az élsimítás során a subpixeleknek milyen színe lesz. A subpixelek színe az eredeti pixel színének 75, 50, 25 vagy 0%-a (fehér) lehet attól függően, hogy hány subpixel alakul ki a megadott poligonon belül. A subpixel színe egy pixel shader művelettel kerül kiszámolásra.

A két megvalósítás a legtöbb esetben eltérő képminőséget eredményez, főleg amikor közel függőleges vagy vízszintes vonalakat kell simítani. Az ordered grid típusú élsimítás gyengébben mossa el az éleket, ami a működési elvéből adódóan rengeteg esetben csak 50 vagy 0%-os subpixelszíneket eredményez. Ez az oka annak, hogy a 4x-es ordered grid élsimítás képminősége inkább közelít a 2x-eshez, mint a 4x-eshez.

A rotated grid típusú élsimítás során az elforgatás miatt azonos valószínűséggel kapunk 75, 50, 25 és 0%-os színű subpixeleket a közel vízszintes és függőleges élek mentén, ami inkább megfelel az elvárható képminőségi szintnek, mint az ordered grid.


NVIDIA NV40

Az ATI R3x0 chipjei tehát a rotated grid féle élsimítást használják az NV3x ordered gridjével szemben, ami ráadásul ugyanakkora számítási teljesítményt is igényel. Itt jön képbe az NV40, amely szakítva az NV3x széria hiányos megvalósításával, és a 3dfx nyomdokaiba lépve az ATI-hoz hasonlóan rotated grid féle FSAA-t használ. Az NV40 négy FSAA-módot ismer (2x; 2xQ; 4x; 8x), az ATI R420 az R3x0 után továbbra is "csak" hármat (2x; 4x; 6x).

ATI R360ATI R420NVIDIA NV40NVIDIA NV38
Nincs FSAA
2x-es FSAA
4x-es FSAA
6x-os FSAA
8x-os FSAA

Első körben lássuk az új kártyák mintavételezési pontjait, melynek vizsgálatára a Colourless DirectX9 FSAA Testviewer 5.1-es programot használtuk. Minden képen három sárga négyzetet látunk. Az első négyzetben láthatjuk piros négyzetekkel jelölve a geometriai mintapontokat, a jobb oldaliban látjuk a textúra-mintapontokat és a középsőben a kettőt egyszerre, ami a végül is a képernyőre kikerülő képnek felel meg FSAA alatt.

Az első kép (felső sor) amolyan referenciaként szerepel, ezen az látható, hogy FSAA nélkül a pixel- és a textúra-mintapontok is megegyeznek. 2x-es FSAA mellett látható, hogy a textúra-mintapont továbbra is egy pont a középpontban (ezzel jelezve, hogy multisampling FSAA-ról beszélünk), de a pixel-mintapontok 45 fokkal el vannak forgatva, ami megfelel a 2x-es FSAA-nak. A 4x-es FSAA esetében már látható, hogy az NV40 is rotated grid féle elrendezést használ, a mintapontok el lettek forgatva – szemben az FX-nél látható rendezett módtól.

A 8x-os FSAA kissé furcsának tűnik. A képek alapján a GeForce FX két egymásba tolt ordered grid supersampling FSAA-t használ, mert a bal fölső és a jobb alsó sarokból kiindulva látható két 2x2-es pixelcsoport úgy, mint a dobókocka négyese, csak ezek egymásba vannak tolva. Ez gyenge képminőséget eredményez, mert ugyan sok a mintavételező pont, de csak vízszintes és függőleges irányítottságúak. Az NV40 ezzel szemben már szemre is tetszetősebb módon élsimít. Itt is megvan a két 2x2-es minta egymásra tolva, de el lett deformálva az egyik irányba, vagyis vízszintesen már megvan a jó FSAA-hoz szükséges rendezetlenség, de függőlegesben még mindig egymás alatt – rendezetten – vannak a mintavételezési pontok. A képeken egyértelműen látható, hogy az ATI semmit sem változtatott a már bevált technikán.

Most pedig lássuk, mindez a gyakorlatban hogyan is néz ki!

ATI R360ATI R420NVIDIA NV40NVIDIA NV38
Nincs FSAA
2x-es FSAA
4x-es FSAA
6x-os FSAA
8x-os FSAA

Az eddig látottak gyakorlati bemutatásához a ToMMTi-Systems által készített FSAA Testert használtuk fel. A program egy kört (vagy inkább nevezzük órának) rajzol ki. Ezzel lényegében az összes létező szögben letesztelhető, hogy a különböző FSAA-megvalósítások hogyan is hatnak a szemre. Számunkra három lényeges pont van, amelyet közelebbről is meg kell vizsgálni, ezek pedig a közel vízszintes, a közel függőleges és a körülbelül 45 fokos élek. Lássuk először tehát a közel vízszintes éleket!

ATI R360ATI R420NV40NV38
Nincs FSAA
2x-es FSAA
4x-es FSAA
6x-os FSAA
8x-os FSAA

A látottakat összefoglalva a következőket állapíthatjuk meg: 2x-es módnál mind a négy kártya azonos képminőséget produkál, mind a négy kártya ugyanazt a multisampling alapú eljárást használja két subpixellel átlósan a pixelre. 4x-es élsimítás esetén az NV38 kb. azonos képet produkál, mint 2x-es módban, hiszen a vonal dőlésszöge majdhogynem megegyezik az ordered grid szerkezetével, ezzel szemben az NV40 már az elforgatott rácsmódozat hatására ténylegesen, az ATI-hoz hasonlítható 4x-es élsimítást használ. 6x-os módban az ATI továbbra is igazi király, azonban most kihívóra talált az NV40 személyében, amely 8x-os FSAA alatt vízszintes módban nagyon szép, tényleg 8 subpixeles képet produkál, a kérdés már csak az ehhez társuló sebesség lesz. Az NV38 8x-os módban csúnya képet mutat be a korábban kitárgyalt 2x4-es ordered grid módszer miatt.

Következzenek a közel függőleges élek:

ATI R360ATI R420
nincs2x4x6xnincs2x4x6x
nincs2x4x8xnincs2x4x8x
NV40NV38

2x-es élsimítás esetén ismét minden kártya azonos képminőséget produkál. 4x-es FSAA esetében az FX ismét elvérzik, és az ATI-kártyák adják a legszebb képet. Az NV40 rotated grid AA-ja ugyan tényleg szebb, mint az FX-é, azonban itt és most úgy tűnik, hogy az ATI mégis szebb képet mutat, a subpixelek színei egyenletesebb/folyamatosabb hatást keltenek, de ez igazából már csak kukacoskodás. 6x-os FSAA esetében az ATI ismét nagyon szépen muzsikál, az NV38 harmatgyenge megvalósítása még a 8x-os FSAA-t is kétszeres hatásúvá degradálja, míg az NV40 8x-osa ebből a pózból is az ATI 6x-osához hasonlítható, bár a subpixelek színei itt is inkább az eredeti pixel színe felé hajaznak: nem egészen egyenletes a hatás, de ember legyen a talpán, aki ezt megállapítja játék közben.

Végül jöjjenek az átlós élek:

ATI R360ATI R420NV40NV38
Nincs FSAA
2x-es FSAA
2x-es FSAA
4x-es FSAA
6x-os FSAA
8x-os FSAA

2x-es FSAA esetén a kártyák dőlésszögtől és gyártótól függően nem élsimítanak a mintavételezési pontok elhelyezkedése miatt. Ahol van FSAA, ott úgy néz ki a kép, mintha az él széle elhalványulna. A 4x-es FSAA esetében az NV40 és az ATI-kártyák tökéletes képet produkálnak, és az NV38 is végre tesz valamit azért, hogy szebb legyen a kép, ami annak köszönhető, hogy az él átlósan helyezkedik el a mintavételi pontokhoz képest. 6x-os és 8x-os módban már nem változik jelentősen a kép a 4x-es élsimításhoz képest, bár az NV38 itt sem remekel igazán a többiekhez képest, ez azonban 8-szoros nagyításban látható csak igazán.

Teljesítménycsökkenése FSAA mellett

Mielőtt az FSAA-megoldások szemre gyakorolt hatására térnénk, lássuk, hogy az egyes élsimítási módok hogyan befolyásolják a teljesítményt.

Az FSAA egyértelműen egy sávszélességterhelő eljárás, hiszen a mintavételezéssel járó óriási mennyiségű adatot a kártyák a memóriában tárolják. A 2x-es FSAA az NVIDIA-kártyák számára nem túl megrázó teher, köszönhetően az NV40 óriási fillrate-jének (melyről később még szólunk) és a bőséges memória-sávszélességnek. Az ATI-kártyák – meglepetésre – generációtól függetlenül közel azonos mértékben lassulnak ebben a módban, igaz, a sávszélesség növekedésével az XT gyorsabb, mint az X800 Pro, amely pedig gyorsabb, a 9800 XT-nél. 4x-es módban az NVIDIA-kártyák még mindig alig vesztenek a sebességből, ami mindkét GPU esetében ismét az óriási fillrate-nek és memória-sávszélességnek köszönhető (hozzá kell tenni, hogy ugyanakkor az NV38 megoldása csúnyább). Az ATI-kártyák sebessége nagyon egyenletesen csökken, a csíkokon jól látható, hogy az architektúra nagyon kiegyensúlyozott. Az ATI-kártyákról ugyanez mondható el 6x-os módban is, melyben a Radeon 9800 XT sebessége elérte az eredeti felét, az X800-asok viszont még efölött maradnak. Az NVIDIA-kártyák teljesítménye a 8x-os élsimítás hatására, a négyszeres supersampling módnak köszönhetően sok esetben játszhatatlan szintre csökken, hiába az óriási memória-sávszélesség. A grafikonból egyértelműen kiderül, hogy az NVIDIA miért ajánlja a tesztelők számára a 4x-es élsimítást minden felbontásban...

Mit is láttunk tehát? Az ATI új kártyáit könnyedén kitárgyalhatjuk, hiszen az X800-asok semmiben sem változtak az előző generációhoz képest, már ami az FSAA-t illeti. Az NV40 végre felvette a rotated grid mintavételezési módszert. Ha szőrözni akarunk, azt mondhatjuk, hogy az ATI megvalósítása még mindig egy hajszálnyival szebb, de ez a játékokban észrevehetetlen. Probléma, hogy az NV40 8x-os élsimítása ugyan tényleg nagyon szép, de a teljesítmény ebben a módban az eredeti közel harmadára esik vissza – azaz ez a beállítás lényegében használhatatlan.

Szűrési "optimalizálás"...?

Bizonyára sokan hallottak már az ATI adaptív trilineáris filterezéséről és az NVIDIA korábbi szűrési trükkjeiről szóló hírekről. Ám nem biztos, hogy amit egyesek üldözendő kiszúrásnak tartanak, az tényleg a kárunkra van. A jelenség megértéséhez szükséges tisztázni, mit is jelent a MIP mapes varázsolás általában.

Tehát mik azok a MIP-szintek és miért van szükség rájuk? A MIP a multum in parvum (sokat kicsibe) latin kifejezés rövidítése. Ez a gyakorlatban azt jelenti, hogy egy textúrából kicsinyített változatokat készítenek, és ha az objektum, amelyre rá lesz húzva, messzebb van a kamerától (a szemlélőtől), akkor ezeket használják – hiszen fölösleges egy 1024×1024 pixeles textúrát ráfeszíteni egy 12×12 pixeles négyzetre. Ha kisebb textúrákat használunk, kevesebb memóriát emésztünk, nem pixelesednek be a távoli képrészletek. Azt, hogy éppen melyik részletességű textúravariációt használjuk, a LOD (leve of detail) faktor adja meg, melyet a kamerától mért távolságból lehet kiszámolni. Eddig minden szép és jó, de mi van az olyan objektumokkal, amelyeknek az egyik vége közel van, a másik pedig távolabb (például hosszú egyenes falak vagy út esetében)? Ha mindig csak egy MIP-szintet használunk szűréshez, akkor láthatóvá válnak azok a vonalak, amelyek éppen azon a határtávolságon vannak, ahol a LOD faktor MIP-szintet vált. Ilyen a bilineáris szűrés.

Mozgásban ezeket a határvonalakat – zavaró hatást keltve – "tolja" maga előtt a jelenet. A probléma adott: olyan eljárást kell kidolgozni, amely eltünteti ezeket a határvonalakat. A legkézenfekvőbb módszer a trilinear filtering. Használjuk mindig a két legközelebbi MIP-szintet, ne csak azt, amelyet a bilineáris szűrő, hanem még egyet, sőt ezeket a szinteket egy megfelelő faktor szerint még súlyozzuk is ki, annak függvényében, hogy milyen közel vagyunk az egyes MIP-szintváltó LOD-értékekhez. A könnyebb érthetőség kedvéért beszéljenek a képek!

A bal oldali oszlopban az eredeti képet, a MIP-szintek váltását, majd a két kép montázsát láthatjuk bilineáris szűrés, jobbra pedig ugyanezt trilineáris szűrés esetében. A jobb oldali MIP-es képeken látható, hogy ez egyes MIP-szintek folyamatosan folynak át egymásba, és nem ugrásszerűen váltanak, mint a bal oldalon, mégis a végeredményben minimális az eltérés, szinte alig látható. Miért? A felhasznált textúra sajátosságai miatt: nem túl élesek a vékonyabb vonalak.

Most nézzük, mi az eltérés az egyes kártyák trilineáris MIP-szintváltó algoritmusai között, amikor az ATI-nál minden a hagyományos módszerrel zajlik.

GeForce FX5950 Ultra/GeForce 6800 Ultra

Radeon 9800 XT/Radeon X800 XT

Amint látható, vannak eltérések. De ne feledjük: ezek nem a tényleges kép eltérései, hanem a MIP-szintek között történő váltások ütemének eltérései. Ha valaki megnézi az előző ábrákat, hogy mekkora eltérés volt a bilineáris és trilineáris szűrés között, akkor nagyjából el tudja képzelni, milyen vizuális eltérés lehet ezek között az ábrák között. Semmilyen. Természetesen ez így nem teljesen igaz, mert matematikai statisztikával vagy pixelenként összehasonlítva előjönnek a különbségek, de ezek a szemlélő számára az esetek többségében észrevehetetlenek.

A kevés kivétel kezelésére pedig adaptív eljárások léteznek, amelyek elemzik a textúra élességét, mintázatát, a MIP-szintek hasonlóságát. Ha nem túl nagy az eltérés (mint ahogy a korábbi példánkban), akkor nem lesz észrevehető az optimalizálás, ami jelentős sebességnövekedést hoz. Ha az algoritmus mégis túl nagy eltérést detektál a két MIP-szint között (például ha egyes MIP-szintek más-más színűek, ahogyan ez a MIP-tesztelőkben szokott lenni), akkor marad a hagyományos, lassú trilineáris szűrés. Hasonló eljárást használ az NVIDIA IntelliSample, amely az anizotropikus szűrés szintjét állítja alacsonyabbra abban az esetben, ha a textúra élessége nem indokolja a magasabbat.

Az ilyen és ehhez hasonló eljárások véleményünk szerint csak akkor zavaróak, ha valamilyen mellékhatásuk a játékokban szabad szemmel érzékelhető képminőségbeli változást okoz. Ebbe a kategóriába esik a szögfüggő anizometrikus szűrés is, amely elítélendő volt, amíg csak az ATI csinálta, de az új generációs kártyájában már az NVIDIA is ilyet használ.

Akit érdekelnek a technikai részletek, olvassa el a Digit-life írását az ATI és NVIDIA "optimalizált" szűrési eljárásaival kapcsolatban, és a Tech-Report interjúját az ATI egyik képviselőjével.

Anizo

A GeForce FX szériával egyetemben az NVIDIA egy úgynevezett optimalizált trilineáris szűrést vezetett be, amely végeredményben nem trilineáris szűrés, de amint arról szóltunk, nem is különbözik egetverően az eredetitől. Ez az opció az újabb driververziókban kikapcsolható a "Trilinear optimizations" menüpontban. Ezt azért fontos megjegyezni, mert a későbbi teszteket optimalizáció nélkül futtattuk le, hogy a kártyák közötti képminőségbeli kompromisszumokra ne lehessen hivatkozni egyik oldalon sem.

Folytassuk elemzésünket az anizotropikus szűréssel! A teszteket először a D3D AF-Tester szintetikus tesztprogrammal végeztük el. Ez a program az egyes MIP-szinteket különböző színekkel jelöli meg.

 

ATI R360 ATI R420 NVIDIA NV40 NVIDIA NV38 NVIDIA NV38 + Tri. Opt. Off
Trilinear filtering
2x-es aniso
4x-es aniso
8x-os aniso
16x-os aniso

Az ATI R420 az előző generációhoz képest ezen a téren sem változott semmit, az R420 az R3x0-hoz hasonlóan továbbra is szögfüggő anizotróp filterezést használ, amely a "szokásos" szögekben (0, 90, 180, 270) ténylegesen működik, azonban a szokásostól eltérő szögekben a szögfüggés hatására alacsonyabb szintű textúrafilterezést és textúraminőséget eredményez. 16x-os anizóval tehát csak 90 fokonként van tényleges 16x-os anizo, a 8x-os anizo esetében 45 fokonként van 8x-os anizo, majd 45 fokonként van tényleges 4x-es és 2x-es anizo is.

Amíg a GeForce FX kártyák csak 8x-os anizót ismertek, és ezt a szűrést is csak lassan voltak képesek elvégezni (köszönhetően a szebb képet produkáló, nem szögfüggő megoldásnak), addig az NV40 átvette az ATI-féle 16x-os szögfüggő megoldást. Ha összehasonlítjuk az NV38 és az NV40 anizós képeit, akkor látható, hogy az NV40 45 fokonként a LOD-ot "visszatolja". Annyit még meg kell jegyezni, hogy az AF-Testerrel készített képek azt tanúsítják, hogy az NV40 a 45, 135, 225, 315 fokos szögekben kissé (alig látható módon) visszább tolta a LOD-ot, mint az ATI, ami azt jelenti, hogy ezekben a szögekben az NV40 szebb filterezést mutat be, mint az ATI-kártyák.

A program az optimalizált trilineáris szűrést is képes kimutatni, ám ez – ahogyan az előző oldalon már írtuk – a végső képet nézve nem hoznak különösebb változást.

Most pedig Unreal Tournament 2004-ben vizsgáljuk meg, hogyan is néz ki mindez a gyakorlatban.

 

ATI R360 ATI R420 NVIDIA NV40 NVIDIA NV38
Trilinear filtering
"Brilinear" filtering
2x
4x
8x
16x

A képeket érdemes tanulmányozni, noha elárulható, hogy a fentebb leírtakon kívül semmi újdonsággal nem kell számolni. Az már bizonyos, hogy az ATI és az NVIDIA új vasai hasonló képminőséget produkálva oldják meg a textúraszűrést, most már csak az egyes kártyákon lemérhető teljesítményveszteség a kérdéses.

Korábbi tesztjeinkből már kiderült, hogy a különböző anizotropikus megvalósítások különböző teljesítményeséssel járnak attól függetlenül, hogy FSAA nélkül, vagy FSAA-val együtt kapcsoljuk be ezt az opciót. A grafikonból egyértelműen kiderül, hogy az ATI R420 az új anizo-király, és nem azért, mert az NV hasonló textúraszűrést végez, hanem azért, mert a teljesítményesés ezeken a kártyákon a legkisebb. Érdekes látni, hogy az X800 Pro és az X800 XT közel azonos arányban veszít a sebességből. Az NV40 – hála a szögfüggő anizónak – az NV38-nál sokkal gyorsabban végzi el feladatát.

Sebesség: fill rate

Az új kártyák specifikációiban óriási számok szerepelnek, és ez igaz a fill rate (egy másodperc alatt kiszámolt pixelek vagy texelek száma) adatokra is. Az X800 XT 8400, az X800 Pro 5700, az NV40 pedig 6400 MPixel és MTexel/s sebességre képes, legalábbis elméletben. Lássuk a gyakorlatot, elsőként a 3Dmark 2001 SE fill rate tesztjének segítségével!

 

ATI Radeon X800 XT ATI Radeon X800 Pro ATI Radeon 9800 XT NVIDIA GeForce 6800 Ultra NVIDIA GeForce 5950 Ultra
Pixel fill rate (MPixel/s) 3729,6 2738 2196,2 3551,8 1724,9
Texel fill rate (MTexel/s) 8163,8 5501,2 3251,2 6031,2 3446,1

A táblázatban szereplő eredmények alapján kijelenthető, hogy az új kártyák nagyon erősek lettek. Elég csak azt kiemelni, hogy az X800 XT a kipumpált pixelek számában majdnem kétszer, a texelek számában pedig két és félszer gyorsabb a 9800 XT-nél! A teszt szerint a GeForce 6800 Ultra kétszer gyorsabb mindkét esetben a GeForce FX 5950 Ultránál. Pixel fill rate-ben a kártyák nem igazán képesek kifutni magukat, ami arra enged következtetni, hogy ez a teszt memóriasávszélesség-limitált – ezt látszanak alátámasztani a texel fill rate eredmények is, amelyek az elméleti adatokhoz közel vannak. Azonban ha úgy gondolkodunk, hogy ezek a kártyák akár lehetnének például 6x2-es vagy 8x2-es felállásúak is, akkor azonnal zsákutcába futunk, hiszen tudvalevő, hogy ezeken a kártyákon a futószalagokat már négyes csoportokba rendezik, tehát nem lehet például 6 a pipeline-ok száma. A probléma feltárása végett a MDolenc's Fillrate Tester nevezetű programot használtuk fel.

 

ATI Radeon X800 XT ATI Radeon X800 Pro ATI Radeon 9800 XT NVIDIA GeForce 6800 Ultra NVIDIA GeForce 5950 Ultra
Pure fill rate (MPixel/s) 5884 3182,7 2840,9 6096,7 1884,8
Z pixel rate (MPixel/s) 7901,3 5354,2 2817,5 11756,6 3543,4
Single texture (MPixel/s) 4421,1 3043,3 2743,7 5311,4 1724,6
Dual texture (MPixel/s) 2462,4 1908,8 1462,9 2999,5 1497,4
Triple texture (MPixel/s) 1731,1 1124,4 987,8 2017,5 794,7
Quad texture (MPixel/s) 1353,3 889,4 753,8 1522,4 534,5

A pure fill rate számadatok egyértelműsítik, hogy az ATI-kártyák nem lehetnek 6x2-es vagy 8x2-es felépítésűek, hiszen a mért számok nagyobbak, mint amit 6 vagy 8 pipeline-nal el lehetne érni, viszont még mindig messzi járunk az elméleti számoktól. Az NV40 esetében más a helyzet, hiszen alacsonyabb órajelen jár, és az elméleti 6400 mpixel/s-os sebességet a kártya majdnem el is éri.

A Z fill rate esetében már megállapítható, hogy az ATI-kártyák közelítenek az elméleti sebességük végéhez, de még mindig csak a texel fill rate közelében járunk, ami egyértelműsíti, hogy az R420-as GPU-kban nincs optimalizált Z/stencil útvonal. Más a helyzet az NV40 esetében, melynek a Z pixel rate-je közel a duplája a pure fill rate-nek, ami azt mutatja, hogy ez egy ténylegesen 16x1/32x0 felállású chip (készüljünk a Doom III-ra!).

Shaderek

A kártyák elméleti sebességének leméréséhez az S3 DeltaChrome tesztünkben debütált D3D RightMark szintetikus tesztprogram egy újabb verzióját használtuk fel. Talán ez az egyetlen ma fellelhető tesztprogram, amellyel kimérhető a statikus folyamatvezérlés és a shader modell 2.x és 3.0.

A geometria rész nagyjából maradt a régi: 100 darab, egyenként 6542 vertexből álló fejmodellt látunk forogni, miközben három fényforrás világítja meg őket. Ez a jelenet a maga 654200 vertexével és 3 dinamikus fényforrásával összetettségben a mai játékok szintjén (vagy kicsit afölött) van.

Először nézzük a hagyományos DirectX 7-es Fixed Function változatot, amit már a GeForce256 T&L egysége is meg tudott jeleníteni. Itt az NVIDIA-termékek hagyományosan jobbak, mivel az ATI már a Radeon 8500-óta hanyagolja ezt az egységet, és feladatát a vertex és pixel shaderekkel oldja meg. A GeForce 6800 Ultra tarol, de még az 5950 Ultra is megveri a Radeon X800 XT-t.

DirectX 8-as Vertex Shader 1.1 tesztben már az X800 XT vezet – majdnem 10%-kal a 6800 Ultra előtt –, az X800 Pro pedig veszélyesen közel van az NVIDIA csúcskártyájához. Az 5950 Ultra még mindig maga mögé utasítja a Radeon 9800 XT-t, de az új generációtól már jelentősen elmarad.

A Pixel Shader 2.0 modellel fémjelzett DirectX 9-ben hasonló a helyzet, mint a DX8 esetében, de minden kártya gyorsult közel azonos arányban. A 6800 Ultra a két új Radeon X800 között van, közelebb a Próhoz.

Az érdekesebb és már a jövőbe mutató, folyamatvezérléssel kiegészített Pixel Shader 2.0 esetekben a következőképpen alakult a helyzet: statikus folyamatvezérlést alkalmazva érdekes eredményeket kaptunk. Ebben az esetben a három fényforrás kódja nem sorozatban egymás után van a vertex shader programban, hanem egy ciklusban ismétlődik meg háromszor. A 6800 Ultra háromszor olyan gyors, mint az X800 XT, a folyamatvezérlést nem alkalmazó VS2.0 esethez képest több mint kétszer gyorsabb! A többi kártya jelentősen lassult, az 5950 Ultra sebessége a harmadára esett vissza.

Akinek ez a csavar nem lenne elég, nézze meg a dinamikus folyamatvezérlést alkalmazó Vertex Shader 2.x kód használatával mért eredményeket! Ebben az esetben a ciklus mellet két feltétel (if utasítás) redukálja a számolás mennyiségét. Az ATI-kártyák feltámadnak hamvaikból, és visszaáll a régi „rend”: Az X800 XT vezet, az X800 Pro és a 6800 Ultra szoros versenyt vív, de még a Radeon 9800 XT is megközelíti őket. Sajnos az 5950 Ultra tovább gyengélkedik. Az ATI-kártyák jó szereplése nekünk fölöttébb gyanús, ugyanis Radeonok nem támogatják a VS2.x modellt. A helyzetre egyelőre – megfelelő tesztprogram hiányában – nem tudunk egyértelmű magyarázatot adni, két elképzelésünk van:

  1. Az ATI a vertex shader-fordítója segítségével saját kártyái számára is emészthetővé teszi a 2.x modellel gyártott kódot, ami nagyon jól kijött a sok számolást igénylő, ezáltal sok helyen egyszerűsítésre lehetőséget adó, spekuláris fénykomponenst alkalmazó esetben. Ezt az elképzelést támasztja alá, az a tény is, hogy a korábbi tesztek sebességarányát (X800XT vezet és 6800 Ultra közel van az X800 Próhoz) mértük.
  2. Az ATI "optimalizált". Mivel a tesztprogramunk, a VGA többi komponensét a sebességmérésből kizárandó, apró poligonokat használ, nem tudtuk eldönteni, hogy a Radeonok képe romlik-e valamit dinamikus folyamatvezérlés esetén. Szemre a képek rendben voltak ugyan, de már sokszor tapasztaltuk, hogy nem mindig hihetünk a szemünknek...

Mivel a D3D RightMark új verziója tartalmaz VertexShader 3.0-tesztet is, ezt is megmértük; értelemszerűen csak az új NVIDIA-kártyánál: a sebesség itt elmaradt az irányított 2.0 és 2.x modellek alatt mért értékektől.

Vertex shaderek beható tesztelése után érdemes előkapni a számológépet és összehasonlítani az egyes kártyagenerációk és vertex shader-verziók sebességét. A legelső, ami szembeötlik, az a különböző VS2-variációk sebességének viszonya. A folyamatvezérlés hatékonysága egyértelmű minden kártyánál, az 5950 Ultra kivételével. A dinamikus folyamatvezérlés nagy támogatója, a Geforce 6800 Ultra statikus esetben gyorsabb és a dinamikus folyamatvezérlést nem kedvelő Radeonok szárnyalnak. A GeForce 6800 Ultán a Vertex Shader 3.0-t használó kód egyáltalán nem gyorsabb, mint az irányított VS2-variációk.

Egy kis számolással tökéletesen bemutatható, hogy az ATI vertex árnyaló tekintetében minimálisan fejlesztett az új kártyákon. Vegyük ehhez a számoláshoz alapul az ismert tényeket:
Radeon 9800XT - 4 vertex egység és 412 MHz-es GPU-frekvencia
Radeon X800 Pro - 6 vertex egység 475 MHz-es GPU-frekvencia. Számszerűen ez 73% körüli sebességtöbbletet jelent abban az esetben, ha az ATI fejlesztői nem nyúltak a hardverhez, csak az egységek számát és az üzemfrekvenciát növelték. Pontosan ez az arány mutatkozik meg szinte minden geometriai modellnél, szóval a mérnökök nem kellett túl sok munkát fordítaniuk a vertex shaderekre, az R300-as hagyaték bevált még 2004-ben is. Ezzel szemben az NVIDIA egy teljesen új hardvert gyártott, amelynek geometriai teljesítményére nem lehetet következtetni az előző generáció ismeretében, mondhatjuk azt is, hogy a szuperrugalmas, jövőbe mutató FX architektúra mégsem bizonyult annyira időtállónak, mint a korlátozott R300.

Ha nem kellett a vertex shader csiszolásával foglalkozniuk, akkor mit csináltak az ATI mérnökei az elmúlt években? Nézzük a pixel shader egységek sebességét!

Ebben az esetben teljesen új, de nagyon sokrétű tesztcsomag állt rendelkezésünkre, mellyel a PS 1.1-től egészen 2.a-ig végezhetők mérések. A 3.0-s modell sebességének mérésére azonban még nincs sem szintetikus tesztprogram, sem játék. A teszteket két csoportra lehet osztani. Az egyik a procedural textúrás rész, a másik a fényezős.

A procedural textúrás megoldásokkal jelentős memória-sávszélesség (és terület) spórolható meg, ugyanis nincs tényleges textúra, hanem számolással alakul ki pixelenként, ezért kell hozzá pixel shader. Másik hatalmas előnye a számolós textúráknak az, hogy több helyen felhasználhatóak. Vegyük például a tesztünkben később Pixel Shader 1.4-tesztben szereplő procedural wood (fa textúra) hatást. Ez meghatároz két alap színt a fához (egy világosabbat és egy sötétebbet), és felhasznál egy lineáris átmenetet a fa színének folytonos változtatásához, valamint egy zajtextúrát a textúra szabályosságának szétoszlatásához. Ha váltóztatunk az fa alapszínén, vagy a lineáris átmenetet képző függvényen (esetleg egy periodikusra cseréljük), vagy a zajosságon, máris egy másik famintázatot kapunk. Még tovább lépve, a mintavételezőt és a zajosságot használva és több alapszínt választva létrehozható márvány, tűz vagy sokféle más alaptextúra tényleges textúrák használata nélkül, egy finoman irányított, nagyobb shader programmal.

A számolással előállított textúráknak megvan az az előnyük is, hogy megtalálhatóak a renderelő környezetekben (Render Monkey, XNA, RenderMan stb.) vagy a 3D-szerkesztőkben (Maya, 3ds max stb.), így nem is kell shader programot írni, elég a menüből kiválasztani, hogy fa textúrát szeretnénk, megadni az egy-két alapszínt és a mintavételező függvény néhány paraméterét, és máris elkészült a textúra, amely ráhúzható bármilyen 3D objektumra. Ha kész a jelenet, ahol a fát használni fogjuk és még mindig 1000 FPS-el fut a játékunk motorjával, akkor lehet finomítani a mintavételezőn, alkalmazni egy komplexebb, de élethűebb hatást adó függvényt; vagy fordított esetben visszavenni az összetettségből, hogy sebességet nyerjünk.

Nézzünk a teszteredményeket! Itt nem térünk ki az egyes hatások részletekbe menő magyarázatára, akit érdekel, tanulmányozhatja a D3D RightMark szabad forráskódját, mely nagyon részletesen kommentálva van. Alapvetően a nagyobb bitmélységgel elért eredményt vettük mérvadónak, az érdekesebb eltérésekre majd kitérünk.

A PS1.1-tesztben az X800 XT a befutó, a sebességek aránya követi a geometriai tesztekben megszokottakat: a csúcs Radeon vezet, a 6800 Ultra szoros küzdelmet vív az X800 Próval; az új generáció csúcsa rádupláz a korábbi győztesekre.

A PS1.4-tesztben az NVIDIA-kártyák a jobbak, pedig ezt a modellt az ATI találta ki a Radeon 8500-hoz. Mindenesetre a 6800 Ultra alaposan veri az X800 XT-t és rádupláz az X800 Próra, amit a 5950 Ultra is utolér. A 9800XT kullog a sor végén, az X800 XT kétszeresét, a 6800 Ultra a háromszorosát tudja a korábbi csúcskártyának. Fontos megjegyezni, hogy az 1.4-es modell nem igazán elterjedt a programozók között, mivel az NVIDIA kártyák közül korábban csak az FX sorozat támogatta, a GeForce 3-4 nem.

A PS 2.0-tesztekben Procedural Marble (márvány) textúrát számoltattunk a kártyákkal, kétféle módon. Az első esetben a mintavételezéshez használt szinuszfüggvényt a hardverrel számoltattuk ki, a másikban a jól bevett LUT (look up table) textúrát használtunk. Ezzel a módszerrel nem számolni, hanem csak kiolvasni kell egy előre legyártott textúrából. Esetünkben egy egydimenziós textúrából, ahol a textúra képpontjának pozíciója jelezte a kiszámolni kívánt paramétert és a képpont színe az értéket. Ha például a sin(128)-ra kíváncsi a hardver, akkor egyszerűen kiolvassa a 128-adik pixel értékét, amely 0,7880.

Tisztán számolós esetben az X800 XT vezet és a 6800 Ultra a két új Radeon között van, a kisebbikhez közelebb (ahogyan a legtöbb eddigi tesztben), a régi csúcskártyák pedig felét-harmadát tudják az új vasaknak. Ha LUT textúrát használtunk, akkor minden kártya gyorsul, de a GeForce-ok többet, így a 6800 Ultra átvette a vezetést, közel 10%-kal az X800 XT elé került. Érdemes megjegyezni, hogy a 6800 Ultra valóban natívan 32 bitre lett tervezve, ugyanis nagyobb bitmélységgel jobban teljesített ebben a tesztben.

Márványkészítésben a Geforce 6800 Ultrát tekinthetjük győztesnek, mert ez a kártya produkálta a legnagyobb sebességet, mégpedig a LUT textúrás esetben, amit gyakran alkalmaznak például szögfüggvényeknél, mert csak egy nagyon kis helyigényű egydimenziós textúrára van szükség, amely 32 biten kellően finom ahhoz, hogy pontos értékeket adjon vissza, olyanokat, amelyeket számolással sokkal nehezebb előállítani (sorfejtéssel). Ezt a tendenciát támasztja alá az is, hogy a korábbi generációs NV3x-ekben volt külön sin és cos függvény, de az új NV40-ben már nincs, talán éppen azért, mert tapasztalták, hogy a legtöbb programozó LUT textúrát használ és az NV-kártyák mindig jók voltak textúraolvasásban. Az ATI-nál fordított a helyzet. Az R3xx-ekben nem volt sin/cos, az R420-ban pedig van, és a textúraolvasójuk sem olyan gyors.

Következzen a megvilágítás! A Pixel Shader 2.0-tesztben három fényforrással Phong árnyékolást végeztünk a DeltaChrome S8 tesztből ismert egyszerű geometriára húzott rücskös felületen. A hatáshoz normalizálás kellett a felületen, ami kiszámolható tisztén pixel shader erőből vagy egy előre elkészített normalizáló textúrából, amely egy kétdimenziós LUT, olyan, mint egy szorzótábla: a két koordináta a két tényező, a textúra színe a szorzat (pl. a [4,3] koordinátapárossal megadott pixel színe 4×3=12). A Phong hatáshoz pedig kell egy hatványozás, amely ismét kiszámolható vagy használható hozzá egy LUT.

Minden esetben az X800 XT a győztes, a 6800 Ultra pedig ismét a két X800-as között van. Minél több textúraolvasást használunk számolás helyett, annál gyorsabb a GeForce, vagyis jobban olvas, mint számol. Az ATI-kártyák a számolós és vegyes eseteket kedvelik jobban. Az előző generáció csúcsára ismét rádupláznak az újabbak. Az 5950 Ultra ismét leszerepel: tisztán számolós esetben a 9800XT négyszer, az X800 XT tízszer gyorsabb nála!

Legutolsó pixel shader-tesztünkben 2.a-s "fícsört" mértünk, ez már a régi jó 9800XT-nek sok volt, de a 5950 Ultra sem tudott értékelhető eredményt felmutatni. Az új kártyák hozták a szokásos "X800 XT vezet, 6800 Ultra kicsivel X800 Pro előtt van" eredményt.

Összefoglalva a PS-eredményeket megállapítható, hogy az NVIDIA kiköszörülte azt a csorbát, ami a hírnevén esett az FX sorozat gyengécske Pixel Shader 2.0-teljesítménye kapcsán, de az új csúcsmodell talán még nem teljesen versenyképes a konkurens csúcskártyájával. A 6800 Ultra legtöbbször lemaradt az X800 XT mögött és csak a X800 Próval tudott megküzdeni. Mindenesetre ki kell hangsúlyozni, hogy a D3D RightMark PS-tesztjei nehezen hozhatóak össze a valós játékokban előkerülő éles helyzetekkel. Inkább az autók lóerő-adataihoz mérhetőek. Attól, hogy egy kocsi x lóerős, még lehet lomha egy rosszul áttételezett váltó miatt, vagy lehet stabil egy jó futómű miatt. Ugyanígy lehet gyors a 6800 Ultra, ha több textúramintavételezés van, de lassú is sok aritmetikával. Azt megállapítottuk, hogy az 6800 Ultra nagyjából annyi "lóerős" lehet mint az X800 Pro, azt hogy mit tud valós alkalmazásokban, majd meglátjuk a játékokkal végzett tesztek során. Az "útfekvéssel" kapcsolatban még azt is érdemes megemlíteni, hogy ez a tényező nagyban függ az "úttól" vagyis attól, hogy a programozók melyik hardvergyártó támogatását és segítségét élvezik a fejlesztés alatt, melyik kártyára optimalizálják jobban alkalmazásaikat.

Most pedig következzenek a játékok!

Wolf, COD, UT2K4, Tron és Halo

Az NVIDIA által ajánlott 61.34-es driverrel voltak problémáink, ezeket az aktuális játékoknál külön jelezzük.

Első körben lássuk az OpenGL API-ra épülő játékokat, melyek a multiplayer játékmódot kedvelők körében rendkívül nagy népszerűségnek örvendenek. Elsőként a felújított Quake3-motoron alapuló játékoké a főszerep. Az NVIDIA-kártyák a 61.34-es driverrel Wolfenstein Enemy Territory alatt olyannyira gyenge eredményeket produkáltak, hogy ezeket az fps-értékeket jobbnak láttuk nem feljegyezni. Így most elsőként csak az ATI-kártyák közötti teljesítménykülönbségeket fogjuk látni.

Az 1024x768-as felbontás eredményei alapján kijelenthető, hogy a Wolfenstein ilyen alacsony felbontásban processzorlimitált. A felbontás növelésével és az élsimítás/filterezés bekapcsolásának hatására megnő a kártyák közötti különbség, amit az 1600x1200-as felbontásban IQ alatt mért 89%-os különbség jól mutat.

A Call of Duty már az NVIDIA-driverhez adott dokumentáció szerint is egy processzorlimitált játék, ezért nem túl meglepőek az elért eredmények. A látványjavító effektek bekapcsolása után sem változik meg különösebben a helyzet egészen 1600x1200-as felbontásig (IQ), ahol is az X800 XT "kemény" 2 fps-t (3%) ver a GeForce 6800 Ultrára.

Következő problémás játékunk az UT2004 volt. Az új driverrel (61.34) jóval gyengébb eredményeket értünk el, mint a korábbival (61.11). Az eredményeket mindkét driverrel feljegyeztük. Az NVIDIA által ajánlott drivert eredményeit figyelembe véve azt kell látnunk, hogy az X800 XT 47-52%-kal gyorsabb a GeForce 6800 Ultránál, ami nagyon nagy különbség. A régi driverrel 13-21%-os az NVIDIA-kártya lemaradása.

Ismét egy problémás játék, amely az új driverrel egyszerűen nagyon ronda volt (lásd a képet). A Tron 2.0-val végre komolyabban megdolgoztattuk a kártyák shadereit, és bizony a grafikonról jól látható, hogy nem hiába. Tron 2.0 alatt az új GeForce az X800 Pro mögé kerül, az XT-vel szembeni lemaradása pedig 8-57%-os, ami bizony súlyos vereség.


Bugos NVIDIA-driver

És ismét egy játék (az utolsó), amellyel gondok voltak: az új driverrel egyszerűen el sem indult a Halo (nem találta a videokártyát). A problémát az NVIDIA is elismerte, a hibát javították, ám tőlünk addigra elkerült az NV-kártya, ezért csak a régi driverrel elért eredményeket tudtuk feljegyezni. Ez alapján a GeForce 12-18%-os lemaradásban van az X800 XT mögött. Vettük a fáradságot, és megnéztük a kártyákkal a képminőséget is 16x-os AF mellett (az FX kártyán 8x-os AF).

ATI R360 / ATI R420 / NV40 / NV38

Az ATI új és régi kártyájával készített képeken nincsenek különbségek, talán a távolban látható fénycsóva picit hosszabb a Radeon 9800 XT-n, de ez minimális, játék közben észrevehetetlen. Érdekes módon az NV40-nel készített kép az X800-as kártyával készített képre hasonlít a legjobban. Az FX-szel készített képről kijelenthető, hogy ebben az esetben a legcsúnyább (és leglassabb): lásd a talajt, a mennyezetet és a távolban a fényforrások alatt a falat, az AF mintha nem akarna rendesen működni. Érdemes megnézni a képek bal felső sarkában az fps-értékeket is.

Painkiller, Far Cry, TRAoD, Splinter Cell

A Painkiller szó szerint napjaink játéka, és köszönhetően annak, hogy számos 1.4-es illetve 1.1-es pixel és vertex shadert tartalmaz, a videokártyákat nem különösebben izzasztja meg a nagyon jól optimalizált engine. Az X800 XT ismét nyerő, az NV40 nagyjából az X800 Próval teljesít egy szinten, IQ beállításokkal picit lassabb nála. Érdemes látni azt is mindeközben, hogy az NV40 kétszer gyorsabb a csúcs FX-nél. Lássunk néhány screenshotot!

ATI R360 / ATI R420 / NV40 / NV38

A képek között semmilyen minőségbeli eltérést nem észleltünk.

Tesztünk egyik legfontosabb játéka, a Far Cry korábbi tesztünk szerint a két kártyagyártó figyelmének középpontjában áll, már ami a driverek optimalizálását illeti, ami nem is csoda, hiszen ez az első igazán DirectX 9-es játék. Élsimítás és textúraszűrés nélkül az NV40 szinte az X800 XT-vel teljesít egy szinten, ami nagyon szép eredmény, azonban az FSAA és AF bekapcsolása után már az X800 Pro is gyorsabbnak bizonyul az NV40-nél. Az X800 XT és a GeForce 6800 Ultra között a teljesítménykülönbség ekkor már 43-47%-os. Far Cry alatt az új GeForce 2-3-szor gyorsabb a régi FX-nél! Ebből a játékból is kiloptunk pár képet:

ATI R360 / ATI R420 / NV40 / NV38

Az első képen mindössze a fegyver csövénél látható árnyékok különbségét lehet felfedezni. A második képen az látható, amit korábbi tesztünkben már egyszer kiveséztünk, nevezetesen a GeForce-ok 32 bites precizitásról 16 bitesre váltanak át a sebesség javításának érdekében (a padló négyzetesedése), de ez egyértelműen a képminőség rovására megy. A sebességkülönbségeket ismét érdemes a képek bal felső sarkában látható fps-számlálóról leolvasni. A képminőségromlás azonban elvileg nem az NVIDIA hibája, ugyanis a jelenség csak a Far Cry 1.1-es patch installálása után következik be. A harmadik kép igencsak érdekes. Az ATI X800-as és 9800 XT kártyával készített képei is kicsit különböznek, a 9800XT kártyán a fák törzsét a nap fénye nem éri el. Ha ezeket a képeket az NVIDIA-kártyák képeivel hasonlítjuk össze (amelyek viszont tökéletesen megegyeznek), akkor azt lehet észrevenni, hogy az ATI-kártyákon további két árnyék egyszerűen hiányzik, az egyiket a nőalak fegyvere veti rá a testére, a másikat pedig a feje a vállára. Úgy tűnik, egyik gyártó sem különb a másiknál, csak a sebesség számít…

Következő DirectX 9-es referenciajátékunk a Tomb Raider AoD, amelyben ismét a shaderek játsszák a főszerepet. A GeForce 6800U az X800 Prónál egy picit gyorsabb, az FX-nél pedig majd' kétszer gyorsabb, ez azonban kevés az X800 XT utoléréséhez. A tesztek közben azért érdemes arra is odafigyelni, hogy az X800 XT szinte mindenhol kétszer, ha nem többször gyorsabb a korábbi csúcskártyának számító 9800 XT-nél.

ATI R360 / ATI R420 / NV40 / NV38

Már a kicsinyített képek közül is kitűnik a jobb oldali, azaz a GeForce FX által készített screenshot, amelyen a korábbi tesztünk során a Far Cryban látottakhoz hasonlóan PS2.0->PS1.4 fallback megy végbe egyes helyeken, mint például a ház oldalán, a háttérben látható csövön és Lara előtt a földön. Utóbbi egyértelműen csúnyább a többi kártyán látottakhoz képest, míg a ház oldaláról és a csőről a megvilágítás hiányzik.

Végül egy újabb, a pixel shaderektől erőteljesen függő játék, a Splinter Cell következik. A Caspian Oil Refinery pályán játszódó demóban a víz felszínének megjelenítése és az infrakamerás nézet pixel shader 1.1-es effekteket használ. Az új GeForce ismét nem tudja befogni az X800 XT-t, de az X800 Prónál gyorsabb, ezen kívül a GeForce FX 5950 Ultránál 2-3-szor gyorsabb. Az X800 XT ebben a tesztben is rádupláz a 9800 XT-re.

CMR4, F1 '99-02, LOMAC

A Colin McRae Rally 04-ről korábbi tesztjeinkből kiderült, hogy egy shaderintenzív játékról van szó. Az NV40 az X800 Próval küzd, míg az X800 XT ismét magányosan áll a csoport élén, nincs senki, aki megközelítené. Az új GeForce közel két és félszer gyorsabb az FX-nél, az X800 XT pedig kb. kétszer gyorsabb a Radeon 9800 XT-nél.

Utolsó előtti játékunk az F1 '99-02. Élsimítás és szűrők nélkül a játék egyértelműen processzorlimitált, bár az NVIDIA-kártyák 4 fps-sel többet érnek el az ATI-kártyáknál minden esetben. Az élsimítás és az AF bekapcsolásának hatására 1280x1024-es felbontásig kell elmennünk ahhoz, hogy a csúcskártyák veszítsenek sebességükből, ekkor a GeForce 6800 Ultra "mindössze" az X800 Pro szintjéig tudja felverekedni magát, az X800 XT áll a csúcson.

Végül lássuk a LOMAC alatt elért eredményeket, amit high beállításon teszteltünk – ez a beállítás a 9800 XT-n is éppen csak játszható 1024x768-ban. A csúcskártyákkal most csak az 1024x768-as felbontás processzorlimitált, továbbhaladva megmutatkozik a kártyák közötti különbség, a GeForce 6800 Ultra ismét az X800 Próval küzd (bár utóbbi a gyorsabb). Az X800 XT az IQ beállításokkal megdöbbentően magasan, 50-60 %-osan veri a GeForce-ot, és két és félszer gyorsabb a 9800 XT-nél. Az NV40 "csak" másfélszer tud gyorsabb lenni az FX-nél.

Tuning és konklúzió

Mielőtt a végszóra térnénk, lássuk, hogy az NV40 és az X800 XT milyen tuningpotenciállal rendelkezik. Első körben az X800 XT-t próbáltuk meg túlhajtani, ám minden próbálkozásunk kudarcba fulladt. A GPU órajelének akár 5 MHz-cel való megemelése a VPU Recovery közbelépését, és a kártya órajeleinek eredeti értékre való visszaállítását eredményezte. Az X800 XT referenciakártyával amúgy sem volt minden rendben, néhány játék alatt szintén előbukkant a VPU Recovery, és megpróbálta a GPU órajelét visszafogni, ami nem ment neki, hiszen az alapórajelek meg lettek határozva BIOS-ból. Az X800 XT, úgy tűnik, egy gyárilag túlhajtott kártya, ami azért jelent meg, hogy biztosan az ATI maradjon a leggyorsabb GPU kitüntető címének tulajdonosa.

A GeForce 6800 Ultra ennél már kezesebb báránynak tűnt, ugyanis a 400/550 MHz-es órajelekről sikerült 449/610 MHz-ig túlhajtani, ez az órajelek tekintetében 12,5/11%-os tuningot jelent. Lássuk, hogy a kártya mennyit gyorsul Far Cry alatt!

Nem túl meglepő módon 3-16 %-os sebességnövekedést értünk így el.

Konklúzió

Az ATI X800-as kártyáiról egyértelműen kiderült, hogy méltó utódai lehetnek az R3x0 szériának. Az élsimítás és a textúraszűrési eljárások nem változtak meg, vertex shaderben szintén nem fejlesztett a kanadai cég, csak az egységek számát és az órajeleket emelte meg, viszont pixel shaderben az esetek többségében az ATI-kártyák olyannyira erősek lettek, hogy a 9800 XT-re képesek ráduplázni. A játékokban sincs ez másképpen, az X800 XT a Radeon 9800 XT-nek mindenhol a dupláját, az X800 Pro pedig mindenhol a másfélszeresét nyújtja teljesítményben. Az X800 XT lényegében egy olyan kártya, amely csak nagyon szélsőséges esetben verhető, és mint ez tesztjeinkből kiderült, egyelőre nem igazán lehet kihasználni, hiszen rengeteg esetben processzorlimitáltak a játékok. Egyetlen negatívumaként az SM3.0 hiánya róható fel: ez azonban egyelőre nem egy nélkülözhetetlen feature. Emellett az X800-as kártyákról jó tudni, hogy halk hűtéssel rendelkeznek, viszont ennek következtében melegednek is rendesen.

A GeForce 6800 Ultra meggyőzött minket arról, hogy az NVIDIA nem malmozással töltötte az elmúlt másfél évet, hanem egy, az FX szériától merőben eltérő felépítésű architektúra fejlesztésén fáradozott. A GeForce 6800 (Ultra) az FX architektúra hiányosságait – mint például az élsimítási metódus, a lassú textúraszűrés, a gyenge shaderek – mind-mind kiküszöböli. Emellett az új NVIDIA-grafikus processzor elsőként támogatja a 3.0-as shader modellt – igaz, ennek áldásait a közeljövőben aligha élvezhetjük. Tesztünkből azonban az is kiderül, hogy az új NVIDIA-chip egyelőre – és a jelenlegi driverekkel – nem tudja beérni az ATI csúcskategóriás modelljét, az X800 XT-t, és a legtöbb esetben az X800 Próhoz közeli szinten teljesít.

Mindennek figyelembevételével drágálljuk a GeForce 6800 Ultrát, hiszen a mutatott teljesítmény alapján az ATI X800 Próhoz hasonló áron illene kínálni. Erre azonban kevés az esély, hiszen a nagy magmérettel rendelkező GPU biztosan nem gyártható (költség)hatékonyabban, mint az ATI új chipjei. A GeForce 6800 GT és a sima GeForce 6800 (melyeket még nem teszteltünk) népszerűsége alighanem szintén az árcédulán múlik majd.

fLeSs és rudi

Az NVIDIA GeForce 6800 Ultra videokártyát az NVIDIA-tól, az ATI Radeon X800 XT és Pro modelleket az ATI-tól kaptuk tesztelésre. A Chaintech GeForce FX 5950 Ultra az Expert Kft. jóvoltából vendégeskedett nálunk.

Azóta történt

Előzmények