Fill-rate és shaderek
A nagy kérdés, hogy a pixel egységek megháromszorozása milyen hatással van a teljesítményre? Szokás szerint először a szintetikus eredményeket vettük sorra, az összehasonlítást a Radeon X1800 XT és X1900 XTX között hajtottuk végre.
Hirdetés
ATI Radeon X1800 XT | ATI Radeon X1900 XTX | |
Pure fill-rate (Mpixel/s) | 9141 | 9353 |
Z pixel rate (Mpixel/s) | 9529 | 7502 |
Single texture (Mpixel/s) | 6158 | 6315 |
Dual texture (Mpixel/s) | 4442 | 4572 |
Triple texture (Mpixel/s) | 2481 | 3112 |
Quad texture (Mpixel/s) | 1916 | 2301 |
A puszta (pure) valamint az egy- és kéttextúrás esetben az X1900 XTX előnye a minimális órajelemelkedést tükrözi. A játékokra sokkal jobban hasonlító, három- és négytextúrás tesztben az új erőgép 20-25 %-kal elhúzott. Érdekes módon az X1900 XTX a Z tesztben jelentősen lemaradt. Ez minden bizonnyal a módosított Z-buffer miatt van, és (remélhetőleg) csak a szintetikus tesztre érvényes.
Nem meglepő, hogy a változatlanul hagyott vertex shader szakaszon csak a megemelt órajel minimális hatása látható. A geometriai rész egyetlen játéknál sem jelent szűk keresztmetszetet, koncentráljunk a pixelekre.
Pixel shaderes textúragenerálásnál az egyszerűbb, 1.1-es és 1.4-es kódokban természetesen nincs számottevő gyorsulás. Hasonló a helyzet a textúrázásra támaszkodó PS2.0 körben, ahol a számolást LUT (look-up table), vagyis egy olvasnivaló textúra támogatja. Teljesen számolós esetben már 35 % az újonc előnye. Ez még mindig kevesebb, mint amennyire számítanánk, de itt még közeli a számoló és textúrázó utasítások aránya.
A valódi, árnyékolós pixel shader tesztekben már meglátszott a számolók hadseregének hatása. Sajnos PS3.0-s tesztsorunk nem volt, de a hasonlóan összetett PS2.a menetek is hozták az ATI ígéretét: közel háromszoros gyorsulást. Látható, hogy a textúrát használó normalizálós menet is ugyanolyan mértékben gyorsult, mint a tisztán számolós. Ez azt jelenti, hogy az ATI-nál jól kalkuláltak. Az egyszerűbb PS2.0 tesztek tanúsítják, hogy a kártya nagy alakításához megfelelő shaderkód is kell. Az elmúlt néhány év játékaira emlékeztető kódokban ugyan szintén nagy volt a gyorsulás, de csak a teljesen számolásra hagyatkozóban közelítette meg a háromszorost. A textúrákat legintenzívebben alkalmazó normalization + LUT esetben volt a legkisebb a növekedés, itt még a kétszerest sem éri el.
A szintetikus eredmények alapján arra lehet következtetni, hogy a játékok többségében a fill-rate emelkedésének megfelelő, 20-25 százalékos gyorsulás jelentkezik majd. Kivételt képezhetnek ez alól a legfrissebb, shaderintenzív játékok, illetve a jövőben az egyre összetettebb kódokkal biztosan tovább nő majd az X1900 előnye elődjéhez képest.
A cikk még nem ért véget, kérlek, lapozz!