Sebesség: fill rate
Az új kártyák specifikációiban óriási számok szerepelnek, és ez igaz a fill rate (egy másodperc alatt kiszámolt pixelek vagy texelek száma) adatokra is. Az X800 XT 8400, az X800 Pro 5700, az NV40 pedig 6400 MPixel és MTexel/s sebességre képes, legalábbis elméletben. Lássuk a gyakorlatot, elsőként a 3Dmark 2001 SE fill rate tesztjének segítségével!
ATI Radeon X800 XT | ATI Radeon X800 Pro | ATI Radeon 9800 XT | NVIDIA GeForce 6800 Ultra | NVIDIA GeForce 5950 Ultra | |
Pixel fill rate (MPixel/s) | 3729,6 | 2738 | 2196,2 | 3551,8 | 1724,9 |
Texel fill rate (MTexel/s) | 8163,8 | 5501,2 | 3251,2 | 6031,2 | 3446,1 |
A táblázatban szereplő eredmények alapján kijelenthető, hogy az új kártyák nagyon erősek lettek. Elég csak azt kiemelni, hogy az X800 XT a kipumpált pixelek számában majdnem kétszer, a texelek számában pedig két és félszer gyorsabb a 9800 XT-nél! A teszt szerint a GeForce 6800 Ultra kétszer gyorsabb mindkét esetben a GeForce FX 5950 Ultránál. Pixel fill rate-ben a kártyák nem igazán képesek kifutni magukat, ami arra enged következtetni, hogy ez a teszt memóriasávszélesség-limitált – ezt látszanak alátámasztani a texel fill rate eredmények is, amelyek az elméleti adatokhoz közel vannak. Azonban ha úgy gondolkodunk, hogy ezek a kártyák akár lehetnének például 6x2-es vagy 8x2-es felállásúak is, akkor azonnal zsákutcába futunk, hiszen tudvalevő, hogy ezeken a kártyákon a futószalagokat már négyes csoportokba rendezik, tehát nem lehet például 6 a pipeline-ok száma. A probléma feltárása végett a MDolenc's Fillrate Tester nevezetű programot használtuk fel.
ATI Radeon X800 XT | ATI Radeon X800 Pro | ATI Radeon 9800 XT | NVIDIA GeForce 6800 Ultra | NVIDIA GeForce 5950 Ultra | |
Pure fill rate (MPixel/s) | 5884 | 3182,7 | 2840,9 | 6096,7 | 1884,8 |
Z pixel rate (MPixel/s) | 7901,3 | 5354,2 | 2817,5 | 11756,6 | 3543,4 |
Single texture (MPixel/s) | 4421,1 | 3043,3 | 2743,7 | 5311,4 | 1724,6 |
Dual texture (MPixel/s) | 2462,4 | 1908,8 | 1462,9 | 2999,5 | 1497,4 |
Triple texture (MPixel/s) | 1731,1 | 1124,4 | 987,8 | 2017,5 | 794,7 |
Quad texture (MPixel/s) | 1353,3 | 889,4 | 753,8 | 1522,4 | 534,5 |
A pure fill rate számadatok egyértelműsítik, hogy az ATI-kártyák nem lehetnek 6x2-es vagy 8x2-es felépítésűek, hiszen a mért számok nagyobbak, mint amit 6 vagy 8 pipeline-nal el lehetne érni, viszont még mindig messzi járunk az elméleti számoktól. Az NV40 esetében más a helyzet, hiszen alacsonyabb órajelen jár, és az elméleti 6400 mpixel/s-os sebességet a kártya majdnem el is éri.
A Z fill rate esetében már megállapítható, hogy az ATI-kártyák közelítenek az elméleti sebességük végéhez, de még mindig csak a texel fill rate közelében járunk, ami egyértelműsíti, hogy az R420-as GPU-kban nincs optimalizált Z/stencil útvonal. Más a helyzet az NV40 esetében, melynek a Z pixel rate-je közel a duplája a pure fill rate-nek, ami azt mutatja, hogy ez egy ténylegesen 16x1/32x0 felállású chip (készüljünk a Doom III-ra!).
A cikk még nem ért véget, kérlek, lapozz!