DeltaChrome: az S3 visszatér

Bevezető

A Volarival egyelőre csalódást okozó XGI után újabb szereplő bukkant fel a 3D-gyorsító lapkák piacán: ezúttal a hajdan szebb napokat látott S3 Graphics igyekszik beleszólni az ATI és az NVIDIA által vívott kemény csatába.

A régi motorosok még biztosan emlékeznek azokra az időkre, amikor szinte minden asztali PC-ben S3-as chip felelt a grafika megjelenítéséért – ez még a 3D-korszak beköszönte előtt történt. Ám a vállalat a háromdimenziós versengésben iránymutató technikai megoldásokkal (egyik textúratömörítési eljárás még ma is az S3TC nevet viseli), de gyenge szoftvertámogatással szép lassan kiszorult a piacról. A Savage3D és Savage4 chipek már nem tudták tartani a lépést az NVIDIA hathónapos termékciklusával. Az S3 utolsó próbálkozása az 1999 augusztusában bejelentett Savage2000 volt, az első hardveres geometriai feldolgozást (T&L) támogató megoldás (amely egy nappal előzte meg a GeForce256-ot). Sajnos – minthogy kikapcsolt T&L egységgel került forgalomba – a chip nem lett sikeres, így tarolt az NVIDIA. 2000 tavaszán az S3 eladta GPU-fejlesztő divízióját a VIA Technologiesnek, így alakult meg az S3 Graphics, amely kezdetben a korábbi Savage4 és Savage2000 alapjaira épülő integrált és mobil grafikus lapkákat fejlesztett a VIA chipkészleteihez.

A helyzet változatlan maradt egészen 2003 elejéig, amikor, DeltaChrome néven egy teljes grafikuslapka-családot jelentett be az S3 Graphics . Kezdetben három chipváltozatot ígért a cég, de ma úgy tűnik, hogy az F1 jelölésű csúcsmodell – amely csak támogatott memória méretében és a magasabb órajelben tér el az S8 chiptől – nem jelenik meg. A belépő szintű GPU az S4 nevet kapta. Mindkét megoldásnak – amint az manapság divatos – létezik emelt órajelű változata Nitro jelzéssel (még szerencse, hogy nem az XT jelölést választotta a gyártó). A bejelentés óta eltelt egy év, és lassan – igen lassan – piacéretté vált a termék.

A kisebb S4-esről nem sokat hallani, csupán annyit tudni, hogy a nagytestvér futószalagjainak felét és 128 bites memóriavezérlőt kap, feltehetőleg olcsó, négyrétegű nyákon. Tesztlaborunkban az S3 DeltaChrome S8 járt.

Hirdetés

A chip főbb jellemzői:

 

VGA neve S3 Graphics DeltaChrome S8
Gyártástechnológia 0,13 (TSMC)
Tranzisztorok száma ~80 millió
GPU órajele 300 MHz
Pixel futószalagok száma 8
Futószalagonkénti textúrázó egységek száma 1
Vertex Shader egységek száma 4
Támogatott PS-verzió 2.0+ (24 bites precizitás)
Támogatott VS-verzió 2.0+ (32 bites precizitás)
Memória órajele 300 MHz
Memória órajele (effektív) 600 MHz
Memóriainterfész 128 bit (lehet 64 bites változat is)
Memória mérete 256MB
Memóriatípus DDR
RAMDAC 2 x 400 MHz, 10 bit
AGP busz 8X
Támogatott DirectX 9.0
Kimenetek VGA, DVI, S-Video (minipin 9)

DeltaChrome inside

Az S3 Graphics több mint egy év lemaradással indult a DirecX 9-es versenyben, ami azonban lehetővé tette a cég számára, hogy tanulmányozzák a "nagyok" megoldásait. Nem meglepő, hogy a DirectX 9-es grafikus processzorok fejlesztésében – jelenleg – élenjáró ATI 4 vertex egység és 8 pixel egység konfigurációját választották. Ugyanakkor – feltehetően a költségek alacsonyan tartása érdekében – nem alkalmazták az ATI és NVIDIA által egyaránt használt crossbar memóriaelérési megoldást, amely egy több-, általában négycsatornás memóriát és több kiszolgálásra váró egységet, valamint köztük egy csatornaelosztót takar. A DeltaChrome így teljes 128 bites blokkokat képes csak olvasni.


DeltaChrome belső felépítése

A GPU-tervezők a fölösleges memóriahasználat elkerülése érdekében többféle Z-buffer technikát alkalmaznak. Ezekkel a módszerekkel kiszűrhetőek azok a felületek, amelyeket nem kell lerenderelni, mert egy másik felület mögé kerülnek, így nem láthatóak. Ezek közül a DeltaChrome-ban megtalálható a hierarchikus Z-buffer-kezelés (melyet az ATI már évek óta alkalmaz), a gyors, nulla ciklust igénylő Z-buffer-törlés (ezt az ATI- és NVIDIA-chipek is tudják) és a kétciklusos deferred rendering. Utóbbi esetében az első körben csak "körülnéz" a rendszer, hogy mely pixelek láthatóak, és a második körben csak a "látható" pixeleket számolja ki.

A DeltaChrome S8 négy vertex egységgel és nyolc futószalaggal, futószalagonként egy-egy pixel egységgel van felszerelve. A vertex egység belső pontossága 128 bit (4×32 bit), ahogyan az NVIDIA N3x chipeknél, míg a pixel egysége 96 bites (4×24 bit) – ahogyan az ATI R3x0 chipeknél –, de támogatja a feles pontosságú 4×16 bites precizitást is. Ez talán fölösleges, bár biztosan gyorsabb a kisebb pontosságot igénylő számolás – majd meglátjuk. A shader egységek valamelyest túlmutatnak a 2.0-s specifikáción, így kiérdemelik a divatos 2.0+ jelölést. A specifikációk szerint van dinamikus flow control és floating point render target megvalósítás is.

Videós trükkök

A DeltaChrome-ot számos, a videomegjelenítést segítő tulajdonsággal vértezték fel. Kötelező gyakorlat a két megjelenítő kezelése – két 400 MHz-es, 10 bites RAMDAC van a lapkán. A chip hardveresen képes a kép elforgatására 90, 180 és 270 fokban, ami nagyon hasznos lehet tábla PC-knél, de sokkal kényelmesebb egy álló formátumú monitoron szörfözni a világhálón. A chip támogatja az összes HDTV-felbontást, ezzel jó alternatíva lehet videózásra használt PC-kben; szinte biztos, hogy viszontlátjuk majd VIA EPIA rendszerekben.


Sokkal kényelmesebb a szörfözés álló formátumban

A DeltaChrome természetesen gyorsítja az MPEG-2 videodekódolást (iDCT - inverz diszkrét cosinus-transzformáció), a dekódolás a pixel shaderekben történik. A lapka emellett képes a Widows Media Video 8 és 9 formátumok dekódolásának gyorsítására is.

A programozható pixel shaderek megjelenésével nagyon sok képminőséget javító eljárás kerülhet át a CPU-tól a GPU-hoz, ezért is szokás az újabb grafikus chipeket VPU-nak (visual processing unit - vizuális feldolgozóegység) nevezni. Ezek a hatások arra építenek, hogy egy kép pontjai nem függetlenek egymástól, a szomszédos pontok színei összefüggnek. A shaderek kis csoportokban (3×3, 5×5 vagy akár nagyobb blokkokban) összehasonlítgatják a képpontokat, majd különféle módszerekkel átlagolják, kiértékelik őket. Ilyen eszközökkel lehet élesíteni, elmosni, éleket kiemelni, zajmentesíteni és szinte minden, képszerkesztők által támogatott effektet megvalósítani. A DeltaChrome már driverből támogat néhány ilyen hatást, amelyek inkább érdekesek mintsem hasznosak.


A forráskép


Emboss szűrő


Soft focus, amely valójában Gauss-elmosás (blur)


Élesítés (sharpen)

Ezek a hatások állóképen jól mutatnak, de nekünk semmilyen hagyományos videón nem sikerült az eredetinél látványosan jobb minőségű mozgóképet előállítanunk. A soft focus (Gauss blur) javított a kockásságon, de elvesztek a részletek, míg az élesítéssel erősödtek a zajok is. Az Emboss érdekes filter, de gyakorlati haszna aligha van.


Előtte és utána – hiszi a piszi

A Programmable Kernel Filter, amely egy programozható 4 × 4-es pixelterületet (ablakot) használ a számoláshoz, a gyártó állítása szerint már-már hihetetlen eredményekre képes (lásd fent). Nekünk azonban ezzel sem sikerült jobb képminőséget elérni, bár csak hagyományosan tömörített MPEG-2 és AVI fájlokkal próbálkoztunk. Gyenge minőségű webes videoszolgáltatásnál tehet jó szolgálatot a funkció: ha már a tömörítéskor figyelembe veszik a később kitömörítéshez használt filtert, akkor talán elérhető lesz ez a hihetetlen javulás. A következő lépés akár a videók GPU-s tömörítése is lehet, csak "visszafelé" kell használni a pixel shadereket.

A kártya és a driver


Aprócska és csendes hűtőrendszer, meztelen RAM-ok és alaplapokról ismerős BIOS EEPROM

A kártyán egy kisméretű borda hűti a GPU-t, amely hangtalanul és hatékonyan működik: többórás játék után sem melegedett fel alatta a chip. A hűvös üzem alighanem az S3 mobil lapkák tervezése során szerzett tapasztalatainak köszönhető. A 3,3 ns-os Samsung-memóriák ugyanakkor elbírnának egy hűtőbordát, mert bizony melegedésre hajlamosak.


A 3,3 ns-os Samsung-RAM melegedésre hajlamos


Nem passzol a heat-pipe a rögzítőlyukakhoz

A nálunk járt kártyának van még néhány olyan nullszériás jellemzője, amelyen érdemes lenne változtatni. A hűtőborda felfogatását segítő lyukak például nem a szokásos helyen vannak, így nem lehet a kártyára szabványos hőcsöves (heat pipe) hűtőt rakni. A BIOS-t tároló EEPROM az alaplapoknál szokásos cserélhető foglalatban van, míg a nyák sarkain rögzítésre szolgáló lyukak vannak kihagyva. A kártya legnagyobb hátránya azonban az, hogy a hűtőrendszer nem közvetlenül a GPU-ra illeszkedik, hanem, ahogyan a konkurensek korábbi kártyáin, egy fém takarólapra. Alapos gyorsulást lehetne elérni ennek a tokozásnak az eltávolításával és alacsony k állandójú (low-k) gyártási technológia alkalmazásánál, hiszen mindkét módszer sikeresen bevált a vetélytársaknál. Feltehetőleg ez lesz az S3 következő lépése is.

A driver

A teszteléshez a 6.14.10.1616 verziójú WHQL-minősítésű meghajtót használtuk, melynek a marcona nevű NVIDIA ForceWare (korábban Detonator), az ATI Catalyst és az XGI Reactor mellett viccesen ható Screen Toys nevet adta az S3 Graphics. A tekerentyűk és kis képecskék még kissé csiszolatlanok, de az elrendezés logikus, jól használható.

Az "S3Info Plus" fülre kattintva részletes információt találunk az illesztőprogramokkal és DiretcX-szel kapcsolatban:

Az "S3Config D3D" fülön találhatóak a Direct3D-vel kapcsolatos beállítások, három szintre lebontva. Alapból csak a monitorszinkronizáció és a trilinear filtering kapcsolgatható. Közepes szinten már van Fast destination clear, Fast Z clear, Detail level adjust a MIP-szintek kapcsolgatásához (0-8 között), egyfajta LoD (Level of Detail) beállítás és a mélységi buffer precizitása. Haladó szintem már állítható az Anti-Aliasing is, igaz, csak kétszeres, de az Anisotropic Filtering akár 16-szoros is lehet. Az "S3Display" fülön kezelhetőek a csatlakoztatott megjelenítő eszközök (CRT, TV, HDTV(!), CRT 2, DVI2), állítható a kép mérete, pozíciója és a képfrissítés frekvenciája. Hasznos és eddig csak monitortesztelő alkalmazásokban megjelenő szolgáltatás a "Test pattern" kapcsolóval aktiválható, a szín- és képgeometria-helyesség ellenőrzésére szolgáló hatos képsorozat (vegyes színek, geometria, 3 alapszín, sűrű mintázat).

Ízelítő a pontos képbeállítást segítő, meghajtóba épített ábrákból:

"S3Rotate" fülön kapcsolható a képernyő hardveres forgatása, míg az "S3Gamma Plus" fülön a fényesség, a kontraszt és gamma értékei állíthatóak képernyőnként és színcsatornánként. A beállításokat el is lehet menteni – ez praktikus, ha valaki többféle fényviszonynál is használja a gépét, vagy többféle játékkal játszik, vagy esetleg digitális kamerákról vesz le képeket és szeretne színhelyes képet látni a monitoron. Szintén színbeállításra szolgál az "S3Color Plus" fül, de itt a videók színét szabályozhatjuk.

Az "S3RefreshLock" fülön a képernyő-frissítési frekvenciákat lehet beállítani. Végül érdemes szót ejteni az "S3Chromo" fülről, amelyen a videoszűrők konfigurálhatók. Ezek két csoportra vannak osztva: az elsőben a "semmire sem jó" művészi hatások vannak (domborműves, neonélek, rugalmas fókusz és élesítés), a második csoportban pedig a komplex képsimítás állítható 8 lépésben, ismét hihetetlen minőségi javulást mutató illusztrációval.


A tálcáról is elérhetőek az egyes fülek

Sajnos ezen a meghajtóverzión még nem volt OpenGL-tulajdonságokat állító fül, de ezt a gyártó a későbbieken pótolja. Tuningoláshoz csak egy fapados alkalmazást kaptunk, amely feltehetőleg még tesztelésre szolgált.

FSAA és AF

Korábbi tesztjeinkben már részletesen kielemeztük az ATI, NVIDIA (Világok harca: Radeon 9800 vs. FX 5900) és XGI (Nagyvas: Club3D Volari Duo V8 Ultra) élsimító és textúraszűrési eljárásait, most lássuk az S3 Graphics megoldásait! A DeltaChrome kétszeres, supersampling elven működő anti-aliasingot alkalmaz. Ez egy rendkívül erőforrásigényes eljárás: a chip a képet mindkét irányban kétszeres méretben számolja ki, majd visszaalakítja eredeti méretre. A megoldás azonban valamivel jobb képminőséget nyújt, mint az ATI négyszeres multisamplingje és az NVIDIA 6×S multi-supersampling keveréke.

Az anizotropikus szűrés terén ugyanakkor az S3 Graphics nagyot alkotott. A filter 2 és 16 között állítható, és jelentősen kisebb a teljesítményveszteséggel jár, mint a konkurens termékek esetében. Ezt jól illusztrálja az alábbi grafikon, amelyen nem a tényleges sebesség, hanem a sebességcsökkenés mértéke látható az egyes AF-szintek esetében.

A shaderek sebessége

Egy általunk korábban nem használt szintetikus tesztprogramot vetettünk be a DeltaChrome architektúrájának megismerésére és az ATI és NVIDIA chipjeivel történő összehasonlítására. A D3D Right Mark az iXBT.com fejlesztése, még béta állapotban van, de már most is jól használható. A szoftver olyan, mint az EKG masina, nem valami szép, átlagember számára szinte teljesen érthetetlen eredményeket produkál, de a szakavatottak hasznos következtetéseket tudnak levonni a segítségével. A program jelenlegi állapotában vertex- és pixelshader-teljesítményt, fill-rate-et és HSR- (hidden surface removal) hatékonyságot tud mérni, és használható a filterezési eljárások minőségének elemzésére. Nem produkál látványos képet, de úgy van összeállítva, hogy csak az éppen tesztelni kívánt egység legyen terhelés alatt, ezért szinte teljesen CPU-független. További nagy előnye, hogy nyílt forráskódra épül, ezért pontosan lehet tudni, mikor mi történik.

A következő tesztekben a közel azonos órajelen mértük össze az ATI, az NVIDIA és az S3 Graphics középkategóriás megoldásait, így össze tudjuk hasonlítani az egyes architektúrákat technikai oldalról. Az NVIDIA 5600-nak adtunk egy kis előnyt, durván annyit, amennyivel az újabb 5700 gyorsabb. A tesztalanyok az alábbi sebességeken futottak:

  • ATI Radeon 9600 300/300
  • S3 Graphics DeltaChrome S8 300/300
  • NVIDIA GeForce FX 5600 340/275

A geometriai feldolgozó egység tesztje


A felhasznált fejmodell 6542 vertexből áll


100 apró fej a képernyőn, izzadnak a vertex shaderek

Ez a teszt a maximális geometriai sebesség mérésére használható. A program egy 6542 vertexből álló fejmodellt jelenít meg 100-szor, így jelentős poligonszámot ér el. Ezen a képen aztán alkalmaz 3 diffúz és spekuláris fényforrást, ez ma általánosan használt, jó minőségű megvilágítást eredményez. A textúrázó egységet és a memória-sávszélesség beszűkülését azzal küszöböli ki, hogy nagyon aprók – megközelítőleg egy pixel nagyságúak – a poligonok, így alig kell textúrát számolni és nem kell komoly memória-sávszélesség sem. Lemértük a DirectX 7-teljesítményt fix hatáskészlettel (fixed function, továbbiakban FF), a DirectX 8-sebességet Vertex Shader 1.1 és Pixel Shader 1.4 beállítás mellett és a DirectX 9-sebességet VS2.0 és PS2.0 beállítással. A VS1.1 és VS2.0 programkód (shader assembler nyelvben) csak abban tér el egymástól, hogy az elsőben a fényforrások kódja háromszor van leírva, míg a másodikban egy hármas ciklusban kapott helyet.

A DeltaChrome a 4 geometriai egységnek köszönhetően jól teljesít DX7-ben, de a későbbiekben lemarad, az ATI kártyája mögött. Az FX 5600 jeleskedik DX7-ben, de ahogyan haladunk az újabb shaderek felé, egyre gyengébben teljesít. A Radeon 9600 teljesítménye közel egy szinten van mind a három DX-verzióban. Jó látni, hogy a DeltaChrome S8 DX8- és DX9-eredményei nem térnek el túlzottan, a különbség a cikluskezelésnek köszönhető. Az már kicsit kellemetlenebb, hogy a chip a négy vertex egységgel is alaposan lemarad az ATI két egységet tartalmazó GPU-ja mögött. Valószínűleg a kisebb DeltaChrome S4 ezeknek az eredményeknek a felét tudja majd felmutatni, ami nem túl kecsegtető.

Az eredmények igazolnak minden eddigi feltevést:

  • Az FX 5600 tartalmaz egy erős FF egységet, de gyengébb VS egységgel rendelkezik, külön-külön DX8-as és DX9-es útvonallal.
  • a Radeon 9600-nál ugyanazt az utat járják be az adatok mind a három DX-verzióban, nincs külön hagyományos FF egység, hanem a shaderek emulálják. DX8-as esetekben is a lefelé kompatibilis VS2.0 dolgozik.

Pixel Shader 2.0-tesztek

A geometriai egység kiküszöbölésére egy nagyon egyszerű alakzat jelenik meg, ennek a textúrázását valósítja meg a PS2.0. Beállítható teljes (32 bites) és feles (16 bites) precizitás.


Balra diffúz, jobbra diffúz + spekuláris fényhatás

Az első részben 3 diffúz fényforrás világít meg egy egyenetlen felületet. A felület rücskösségét és színét egy-egy textúra tartalmazza. Egyetlen változtatható tényező a felület rücskösségén visszaverődő fény kiszámolásának módszere, ami megoldható PS-számolással (aritmetikai) vagy a textúra mintavételező (sampler) által egy előre elkészített "normalizációs térképből", amely az előre kiszámított értékeket tartalmazza, ezáltal tehermentesíti a PS-t.

A számolást használó esetben a DeltaChrome S8 eredményei eltérnek 16 és 32 biten, ami azt mutatja, hogy valóban létezik a feles precizitású, de gyorsabb mód. Sebességben a chip a dupláját tudja az FX 5600-nak, és 16 biten még a Radeon 9600-at is legyőzi. Ezek az eredmények jónak számítanak, de megint meg kell jegyezni, hogy az S8 kétszer annyi feldolgozó egységgel gazdálkodik, mint a riválisok. Normalizációs térkép használatával tesztalanyunk 32 bites sebessége logikusan növekedett (tehermentesült a PS), de 16 biten lassult. A memória sebességének emelésével nem kaptunk jobb eredményt, de a 20 MHz-es GPU-tuning hozott további 5 FPS-t, ami arra utal, hogy a textúra mintavételező (sampler) fárad el.

A modul második részében a korábbi 3 diffúz fényforrás kiegészül spekuláris komponenssel. A spekuláris tényezőt egy hatványfüggvény (pow) segítségével tudja kiszámolni a PS, vagy mintavételezhető előre kiszámolt textúrából, a normalizáláshoz hasonlóan. Az ilyen textúrákat LUT (look up table) textúráknak nevezik; ezek esetében a koordináták a kiszámolni kívánt értékek, míg a művelet eredménye van a textúrában. Egyszerű LUT például a szorzótábla: 2×3=6, ahol a (2,3) koordinátán a szorzás eredménye (6-os) van tárolva. Itt a normalizálás és a pow függvény kiszámolásának módja is állítható.

A PS-ekre hagyatkozó számolás során a 8 futószalaggal rendelkező DeltaChrome kicsivel megelőzi a 9600-at, és háromszor gyorsabb, mint az FX 5600. Érdekes módon azonos a 32 és 16 bites eredmény. A normalizálást textúrából olvasva felére esik vissz az S8 eredménye 32 biten, míg 16 biten alig változik. A konkurensek sebessége ugyanakkor durván 10%-kal nő. Fordított esetben (számolt normalizálás és LUT textúrából) ismét megegyezik az S8 32 és 16 biten nyújtott teljesítménye. A Radeon 9600 kicsit gyorsul, az FX 5600 pedig kicsit lassul. Teljesen a mintavételezőre támaszkodva hozza a DeltaChrome a leggyengébb eredményt, nem fekszik neki ez a megközelítés.

A modul harmadik részében megismerkedhetünk a PS-ek egy izgalmas lehetőségével, a valós idejű textúralétrehozással (procedural texturing). Ebben az esetben nincs szükség a memóriában tárolt textúrára, így takarékoskodhatunk a memória-sávszélességgel. Elég megadni néhány alapszínt, egy mintavételező függvényt és némi rendezetlenséget (zajt). A PS a mintavételező függvény pillanatnyi értéke szerint keveri össze az alapszíneket, és hogy ne legyen túlzottan "műanyag" az eredmény, belekever egy kis zajt. Ez a hatás ismerős lehet a 3DMark03 PS-tesztjéből (fa mintázatú elefánt és orrszarvú).


Márvány és tűz: valós időben számolt textúra

A Rightmarkban egy márvány és egy tűz textúrával lehet tesztelni, ezek megközelítőleg azonos sebességgel futnak. Ezekben a tesztekben szinusz mintavételezési függvényt alkalmaz a PS, ezt lehet számolni, vagy ismét LUT textúrából elővenni (egy dimenziós textúra). Számolásos esetben ismét a DeltaChrome diadalmaskodik, méghozzá jelentős előnnyel, ám LUT-mintavételezős esetben az S8 lassul 5%-ot, míg a konkurensek gyorsulnak.

A shaderek minősége

A ShaderMark 2.0 tesztprogrammal alaposan ki lehet vizsgálni a shaderes hatások helyességét. A szoftver használható sebességtesztelésre is, de mi csak a minőségre összpontosítottunk. Már az induláskor jött az első nyakleves: a DeltaChrome az általunk használt meghajtóval nem támogatja a lebegőpontos precizitású renderelést DirectX-ben, pedig a szolgáltatás a "fícsörlistáján" rajta van. A képeket figyelve jellemzően élesebb és darabosabb képet kaptunk, mint a Radeon 9600-nál. Az ATI-kártyával a közeli részletek élesek, a távoliak homályosabbak voltak. A DeltaChrome képe azonban egyenletes élességet mutatott, ami a háttérnél már zavaró blokkosodást eredményezett. Sajnos ez a jelenség a programozható mélység (Programmable Depth-of-Field) hatás hiányát jelzi, amely elvileg szintén megtalálható a DeltaChrome arzenáljában.


Environment mapping


Environment bump mapping


Marble shader


Tile shader

Kellemetlen meglepetés ért a real-time márványrenderelő képénél, amely olyan mintha szét lenne turmixolva és utána ki lenne élesítve. A korábbi meghajtókkal is hibásak voltak a procedural textúrák, de érdekes, hogy a D3D RightMarkban a márvány és a tűz is hibátlan volt. További érdekesség, hogy a real-time tile textúra viszont sokkal szebb volt, mint az ATI-kártyán.

Az ShaderMark azt mutatja, hogy képminőség terén van még mit csiszolni a meghajtókon.

Tesztkonfiguráció

És akkor most térjünk vissza a valóságba, és nézzük meg, hogyan muzsikál a kártya játékokban. Lássuk hogyan alakul az Mad View ATI Radeon 9600 Pro, Inno3D NVIDIA GeForce FX 5600 Ultra és az S3 Graphics DeltaChrome S8 versengése.

Játékok:

  • ID Software - Quake III Arena
  • ID Software - Wolfenstein: Enemy Territory
  • Activision - Call of Duty
  • EPIC Games - Unreal Tournament 2003
  • Disney Interactive - Tron 2.0
  • Microsoft/Bungee Studios - Halo Combat Evolved
  • JoWooD Productions - Chaser
  • EA Sports - Forma 1 Challenge '99-02
  • THQ - Moto GP 2
  • Electronic Arts - Need for Speed Underground
  • UBISoft - Lock On: Modern Air Combat
  • Eidos - Tomb Raider Angel of Darkness
  • Ubi Soft - Tom Clancy's Splinter Cell
  • SIERRA - Homeworld 2
  • EPIC Games - Unreal Tournament 2004 Demo
  • Codemasters - Colin McRae Rally 04 Demo

A tesztkörnyezet:

Processzor: AMD Athlon 64 3400+ (2,2 GHz)

Alaplap: MSI K8T Neo-FIS2R

Memória: 2 x 256 MB PC3500 Corsair XMS CMX256A-3500C2 - CL 2-2-2-5

Merevlemez: Seagate Barracuda ATA IV 60 GB

Videokártyák: Mad View ATI Radeon 9600 Pro, Inno3D NVIDIA GeForce FX 5600 Ultra, S3 Graphics DeltaChrome S8

OS és szoftverek:

  • Windows XP Professional Service Pack 1
  • DirectX 9.0b SE
  • VIA Hyperion v4.51
  • S3 Graphics 6.14.10.1616
  • ATI Catalyst 4.3
  • NVIDIA Forceware 56.64

Tesztek I.

OpenGL: Quake III Arena, Wolfenstein: ET, Call of Duty

A DeltaChrome OpenGL alatt alaposan lemarad. Ahogy fent jeleztük, a meghajtóban még nincs OpenGL fül, ezért nem tudtunk AA-t és AF-et mérni. Egyelőre OpenGL 1.3-támogatást ígérnek a S3 Graphicsnál.

Képminőség (ATI, NVIDIA, S3)

Direct3D FPS: UT2003, Tron 2.0, Halo, Chaser

Az esetleges optimalizációkat elkerülendő UT2003-ban saját demókat futtattunk. A népszerű játékban is sereghajtó volt a DeltaChrome, de már nem olyan nagy a lemaradása. A SuperSampling AA bekapcsolása azonban ront a helyzeten.

Képminőség AA/AF nélkül (ATI, NVIDIA, S3)

Képminőség 4×AA/8×AF (ATI, NVIDIA, S3)


Nem látható jelentős eltérés a három kártya képminősége között

A Tron 2.0 már intenzívebben használ shadereket; e játékban a DeltaChrome beéri az FX 5600 Ultrát, de a képjavító eljárások bekapcsolásával ismét visszaesik a harmadik helyre, és ott is marad a Halo és Chaser tesztekben. A Chaserben hibás textúrákat találtunk a talajon.

>Képminőség AA/AF nélkül (ATI, NVIDIA, S3)

>Képminőség 4×AA/8×AF (ATI, NVIDIA, S3)

Tesztek II.

A következőkben Direct3D-s szimulátorok (és egyéb járműves játékok), a Forma 1 Challenge '99-02, a MotoGP 2, a Need for Speed Underground és a Lock On: Modern Air Combat alatt mért eredmények láthatók.

F1 Challenge és NFS tesztekben a DeltaChrome elmozdul a harmadik helyről, NFS-ben még AA/AF bekapcsolásával is. A MotoGP 2 nem indult el, míg a Lock Onban üres textúrákkal találkoztunk.

Képminőség AA/AF nélkül (ATI, NVIDIA, S3)

Képminőség 4×AA/8×AF (ATI, NVIDIA, S3)

Néhány további népszerű játékkal (Tomb Raider Angel of Darkness, Tom Clancy's Splinter Cell, Homeworld 2) mért eredmények:

TRAoD alatt DirectX 8 (PS 1.4) és DirectX 9 (PS 2.0) funkciók bekapcsolásával egyaránt mértünk. Mindkét esetben a Radeon volt a befutó, a DeltaChrome és az FX 5600 Ultra szoros csatát vívott, ám az utóbbi nyert. A Splinter Cellben két tesztet futtattunk: a Beyond3D demóját és egy sajátot. Mindkét esetben lemaradt a DeltaChrome, és a Homeworld 2-ben sem volt más a helyzet.

Leteszteltünk még két friss demót is (UT2004 és Colin McRae Rally 04). Mindkettőben lemaradt a DeltaChrome, míg Radeon 9600 Pro előnye látványos.

Konklúzió

A RightMark és a ShaderMark alatt kapott eredmények azt mutatják, hogy a 4 VS és 8 PS egység megteszi hatását, a DeltaChrome szinte minden tesztben jobbnak bizonyult a konkurenseknél. De nem szabad feledni, hogy ezek az eredményeket azonos órajelen futó grafikus chipekkel mértük. Ez az órajel a DeltaChrome S8-nál a hivatalos sebesség, míg a konkurensek ennél jóval gyorsabb sebességen üzemelnek! Sajnos a textúra-mintavételezéssel hadilábon áll a DeltaChrome, ami azért nagy gond, mert a LUT textúrás módszerek bevett teljesítményspóroló eljárások, gyakran úgy alkalmazzák őket, hogy nincs mellettük alternatív shaderes megoldás. A képminőséget vizsgálva láthattuk, hogy néhány, a fícsörlistán szereplő hatás még nincs támogatva, és nem tökéletes a megjelenített kép sem. Ezek a hiányosságok pótolhatóak egy jobb meghajtóval, ami remélhetőleg jobb OpenGL-támogatást is tartalmaz majd.

Sajnos a játéktesztekben nem szerepelt olyan jól a DeltaChrome, ahogyan a szintetikus mérések alapján várni lehetett. Ez annak köszönhető, hogy a mai DirectX 8-as és DirectX 9-es játékok túlnyomórészt DirectX 7-es megoldásokra épülnek, a jobb vizuális hatást nem shaderhasználattal érik el, hanem egyre több és egyre nagyobb textúra alkalmazásával. Ez nem gond az ATI és különösen az NVIDIA GPU számára, hiszen fejlett belső memóriarendszerrel (crossbar) és jó mintavételezővel rendelkeznek. A DeltaChrome memóriakezelője azonban kevésbé hatékony és – a szintetikus tesztek tanúsága szerint – a mintavételezőn is van még mit csiszolni (bár ez összefügg a belső memóriarendszerrel).

Összességében tehát vegyes kép alakult ki bennünk az új GPU-ról. Egyik oldalon ott a nagyon jó shaderes architektúra nagy számolási teljesítménnyel, a szinte veszteségmentes AF, a videokezelő tulajdonságok és a teljeskörű HDTV-támogatás. A másik oldalon áll azonban a játékokban nyújtott gyenge teljesítmény, a lassú AA, a kevésbé hatékony memóriavezérlő, valamint a gyenge OpenGL-támogatás.

Elméletileg a problémák egy része orvosolható jobb meghajtóval, magasabb órajelekkel, de jól tudjuk, hogy a konkurensek sem alszanak, és már ma a piacon van a Radeon 9600 XT, a GeForce FX 5700 Ultra és a GeForce FX 5900XT. Ezekkel a kártyákkal a mai állapotában az S3 DeltaChrome S8 nem tudja felvenni a versenyt. Piaci sikerre akkor van esélye, ha a Radeon 9600 és GeForce FX 5700 árszintjén tud megjelenni. A VIA-t ismerve persze ez nem elképzelhetetlen dolog.

Frissítés (2004-04-05):

Kaptunk egy frissebb, még nem WHQL drivert 6.14.10.1630 jelzéssel. Ebben már van OpenGL fül, de csak monitor szinkronizációt, detail levelt (MIP szintek használata) és anizotróp szűrést lehet állítani.

Megmértük a Direct3D alatti teljesítmény változását UT2004, 3DMark2001 és 3DMark03 alatt. A két meghajtó sebessége nem mutatott különbséget, minden egyes résztesztben maximum 3-5% eltérés volt, ami a tesztprogramok szórásának tudható be. Sajnos az OpenGL-t használó Quake3-ban sem volt számottevő gyorsulás. D3D RightMark teszteknél már érdekesebb volt a helyzet: geometriai részen itt sem volt változás, Pixel Shader tesztekben viszont vegyesen gyorsult és lassult a kártya. Általában 32 biten, teljes aritmetikai esetben lassult jelentősen a kártya, akár 50%-ot is. A számoláshoz textúrákat használó 16 bites esetekben viszont 10-25%-ot gyorsult.

A ShaderMark képminőséget tekintve helyreállt a rend, a renderelt kép minden esetben megegyezik az ATI kártyáéval, nincs blokkosodás a háttérben és a valós idejű márvány is teljesen rendben van. Ezekben a 32 bites tesztekben látványosan lassult a kártya, a RightMarkban mérteknek megfelelően.

A tesztben felhasznált Club3D DeltaChrome kártyát a Pulsar Hungary Kft.-től kaptuk.

rudi & fLeSs & Erasmus

Azóta történt

Előzmények

Hirdetés