nVidia GeForce4 Ti/MX!

3. LMA II, nFiniteFX II, DirectX 8.1
1. GeForce, immár negyedszer... 2. A kártyák: Ti és MX 3. LMA II, nFiniteFX II, DirectX 8.1 4. Accuview AA, nView 5. Mit vehetünk? 6. Konklúzió
Írta: Parci
2002-02-06 00:00

LMA II, nFiniteFX II, DirectX 8.1

NV25, azaz a GeForce4 Ti felépítése

NV17, azaz a GeForce4 MX felépítése

Shaderek

Hirdetés

A GeForce4 Ti-ben már két Vertex végrehajtó egység (pipeline) kapott helyet, szemben a GeForce3 egyetlen pipeline-jával. Ennyiben az NV25 és az XBoxban található XGPU, kódnevén NV2A chip rokonok (sőt, az NV25 alapvetően az NV2A asztali PC-s "implementációja"). A pipeline-okat is finomították, így az egyes utasítások késleltetése csökkent. Összességében ez annyit jelent, hogy a dupla pipeline, a magasabb órajel és a finomhangolás durván háromszoros Vertex-számítási kapacitást tesz lehetővé a GeForce3-hoz képest. Hogy mire lehet mindezt kihasználni? Az nVidia szerint FarkasEmberek tökéletes animálásához... mi azért reméljük, hogy ennél kevésbé öncélúbb, kreatívabb felhasználási területek is felbukkannak majd... :)).

Drótváz, 100.000 poligon - Skeleton

A végeredmény

A GeForce4 Pixel shaderei is fejlődtek, és immáron a ps1.1 (Pixel Shaders 1.1) specifikáció mellett a ps1.2 és ps1.3 specifikációknak is megfelelnek. Az ATi itt egyébként még mindig egy lépéssel előrébb tart, hiszen a Radeon 8500-as ps1.4 kompatibilis. Akit a konkrét új utasítások érdekelnek, a Tom's Hardware-en megtalálják listát, bár feltesszük, hogy ők amúgy sem a prohardverről értesülnek a programozási részletekről...

Már a diagramokból is láthattuk, hogy a GeForce4 Ti és MX itt igencsak különbözik. Nemes egyszerűséggel úgy is mondhatjuk, hogy míg a GeForce4 Ti előrelépés a GeForce3-hoz képest a programozható T&L (Pixel és Vertex shaderek) tekintetében, addig a GeForce4 MX egyértelműen hátralépés, ugyanis nem rendelkezik teljeskörű DirectX 8.0-ás (még csak nem is DirectX 8.1-es!!) funkciókkal! Beigazolódott tehát a jóslat, miszerint a GeForce3 Ti200-as kártyák sok szempontból "jobbak" lesznek az őket potenciálisan leváltó GeForce4 MX-eknél.

Lightspeed Memory Architecture II

A Lightspeed Memory Architecture II (LMA II) a GeForce3-ban is megismert LMA továbbfejlesztett változata (Mostanra már biztos unalmas, de tény, hogy a GeForce4 Ti alapvetően nem más, mint a GeForce3 továbbfejlesztett változata, így kézenfekvő, hogy az architektúrát képező alegységek is külön-külön javultak, és ezek összessége az, ami megkülönbözteti a GeForce4-et a GeForce3-tól). A négyszegmensű crossbar vezérlő maradt, ami annyit jelent, hogy a 256 bit széles adatbusszal illesztett memóriát 64, 128 és 256 bites blokkokban tudja elérni a chip, attól függően, hogy az adat, amit írni/olvasni akar, milyen nagy (a teljességhez hozzátartozik, hogy a videokártyák 256 bitje igazából 2 x 128 bitként áll elő, és így a crossbar vezérlő is igazából a 2 x 32, 2 x 64 és a 2 x 128 méretű blokkokra vonatkozik). A crossbar megoldás egyben persze azt is jelenti, hogy ha például csak 64 bit blokknagyságú adatokkal dolgozik a chip, akkor a 256 bit széles memóriabusz maradék 192 bitjét még fel tudja használni további műveletekre, így még egy 64 bites és egy 128 bites "adatfolyam" is befér az előbbi mellé. Ez kimondottan intelligens megoldás egy grafikus vezérlőnél, mégpedig azért, mert az adatok nagysága változó, és a sávszélességet így lehet a legjobban kihasználni.

A GeForce4 Ti és a GeForce4 MX crossbar memóriavezérlője

A GeForce4 MX esetében az LMA II sajnos nem pont ugyanazt jelenti, mint a Ti-nél, ugyanis a négyszegmenses vezérlőt az MX-nél kétszegmensesre redukálták, tehát az adatokat 256, vagy 128 bites blokkokban tudja "csak" elérni. A GeForce2 MX-hez képest ez még így is jelentős előrelépés, ott ugyanis semmiféle LMA és crossbar vezérlés nem szerepelt.

Az LMA II vezérlő ugyanazokat az elemeket tartalmazza, amiket már a GeForce3-nál megszokhattunk, de az egyes elemek több/gyorsabb/nagyobb cache-sel vannak ellátva, jobban vannak szervezve, mint elődjük és persze összességében ez magasabb teljesítményt eredményez. Az egyes LMA (II) építőelemek, a teljesség igénye nélkül:

Z-Occlusion Culling (népszerűbb, ám nem teljesen helyes nevén HSR, azaz Hidden Surface Removal)

Lossless Z-Buffer Compression

Vertex Cache

Primitive Cache

Dual Texture Caches

Pixel Cache

Auto Pre-charge

Fast Z-Clear

Z-Correct Bump Mapping

A Z-Correct Bump Mapping egy olyan eljárás, aminek segítségével a különböző felületekre alkalmazott "bump map"-ek találkozásánál megszűnik a korábban megszokott textúrahiba.

A cikk még nem ért véget, kérlek, lapozz!

Kapcsolódó cégek:
NVIDIA

Azóta történt

3DLabs P10 -- megreng a grafikus piac!

A felkiáltójel helyett akár kérdőjel is állhatna. Kérdés, hogy a GeForce4 Ti memória-sávszélességének duplája, és egyéb rendkívül elegáns megoldások mire lesznek elegek.
GeForce GeNerációk! -- ki a nyerő?

Három generáció, négy kártya, egy cikk, egyetlen kérdés: Mi mire elég..? GeForce 2Ti-3-4Ti-4MX meccs, rengeteg menetben.
Matrox Parhelia-512 -- grafikus K.O.!

A második pofont a 3DLabs P10 után meglepő módon a régóta szunnyadó Matrox méri a grafikus piacra... 512 bit, 256 bit, 20 GB/s, három képernyős megjelenítés... tovább nem is soroljuk, elképesztő!
4x4 -- Négy GeForce4 Ti4200 tesztje

Variációk egy témára, avagy ASUS, Chaintech, Leadtek és MSI GeForce4 Ti4200-as kártyák csörtéje. A GeForce4 Ti4200 talán az egyik legjobb vétel manapság, így nem mindegy, ki a nyerő.

Előzmények

BIKAVIADAL: Athlon XP 1700+, Leadtek GeForce3 Ti 500

Athlon XP, Detonator XP, Leadtek Ti... a legbikább vasak a legbikább driverekkel vajon mennyit bírnak? SOKAT!
Leadtek GeForce3 - 1.5/2

Újabb nekifutás, avagy másfeledik (nya)fogás egyazon vason.. Két gigás proci a test bed, a Ge3 most ezekben tesped..
Leadtek GeForce3 - 1/2

A ''nagy'' GeForce3 és egy DDR konfiguráció - vajon mihez kezdtek egymással?