Az NVIDIA válasza: GeForce GTX 680

3. Tesszelláció és egyéb újdonságok
1. Átgondolt vagy újragondolt stratégia? 2. A Kepler architektúra mélylélektana 3. Tesszelláció és egyéb újdonságok 4. Extrák a Keplerben 5. A GeForce GTX 680 6. Tesztkonfig, fogyasztás, tuning, specifikációk 7. Crysis Warhead, DiRT 3, Shogun 2 8. Metro 2033, AVP, Deus Ex 9. Batman, Battlefield 3, F1 2011 10. ComputeMark, LuxMark, konvertálás 11. Összegzés, értékelés
Írta: Oliverda
2012-03-22 14:00

Tesszelláció és egyéb újdonságok

A tesszelláció az a terület, ahol az AMD és az NVIDIA gyökeresen eltérő megvalósításra épít. Ezt a GCN architektúrát elemző cikkünkben nagyon részletesen kiveséztük, így nem írnánk le újra mindent. A linkelt oldalra építve elmondhatjuk, hogy a Kepler esetében a vállalat továbbra is a brute force megvalósítás híve, ugyanakkor a zöldek is belátták, hogy a GF100 és GF110 esetében túlzásba vitték az egészet, nem kevés tranzisztort elpocsékolva. A tesszelláció ugyanis a DirectX 11-ben alkalmazott NoSplit megvalósítással számtalan gyermekbetegségben szenved, és borzalmasan pazarló is.

A GK104 esetében az NVIDIA továbbra is egy raszteres és egy úgynevezett PolyMorph részre vágja a hagyományos értelemben vett setup motort. Az előbbi egységből négy található a lapkában, azaz egy raszter motor két-két streaming multiprocesszor ellátásáról gondoskodik. Ezt a felállást a vállalat Graphics Processing Clusternek (GPC) keresztelte el a Ferminél, és nincs ez másképp a Kepler esetében sem. A raszter motor működése semmit sem változott. Az egység órajelenként továbbra is 8 pixelt képes feldolgozni, ami a teljes lapkára nézve 32 pixelt jelent. Ez egyensúlyban van a 32 blending egységgel is, azaz a GK104 végre ezen a ponton is kiegyensúlyozottá vált.

A streaming multiprocesszorokban található PolyMorph motor a geometriával kapcsolatos munkálatokat végzi. Mivel csökkent a SMX-ek száma a GF100 és GF110-hez képest, így a PolyMorph motorok száma is felére esett, azaz összesen 8 található a GK104-es lapkában. Az NVIDIA elmondta, hogy ezek fejlettebb PolyMorph motorok, így megkapták a 2.0-s jelzőt. Az erősen szeletelt, párhuzamosításra építő elgondolás azonban tipikusan gátat szab a komolyabb trükközéseknek, amelyekre az AMD például a GCN architektúrában bőszen épít. Valószínű, hogy csak a vertex re-use képességek fejlődtek, ahol a Fermi eleve nem volt túl acélos.

Összességében tehát nem várható előrelépés a GF100-hoz és GF110-hez viszonyítva a tesszellációs teljesítményben, de ahogy azt korábban már sokszor elemeztük, a korábbi két generáció csúcs GPU-i egyszerűen képtelenek voltak kamatoztatni a játékokban ezt a rendkívül tranzisztorpazarló brute force megvalósítást. Ebből a szempontból az NVIDIA jól döntött. Amíg az API-n belül nem kerülnek kigyomlálásra a tesszelláció problémái, addig felesleges a szükségesnél jobban erőltetni ezt a részt. Az egész tesszellálást ráadásul durván korlátozza, hogy a raszterizálás négyes pixelblokkokon zajlik, és ebből a szempontból a Kepler sem kivétel. Ezt a problémát semmivel nem lehet elkerülni, hacsak nem vesszük számításba a rejtett geometriák rajzoltatását, de eleve nincs értelme olyan dolgokat számolni, ami a végső képkockán nem jelenik meg, hiszen az a rendelkezésre álló erőforrás nagyfokú pazarlása, mindenféle képminőségbeli előny nélkül.

A GK104 dióhéjban

A DirectX 11.1-es és OpenGL 4.2-es grafikus API-t támogató GK104 először a GeForce GTX 680 névre keresztelt kártyán kap helyet. Az NVIDIA az új versenyzőnél egyetlen streaming multiprocesszort sem tilt le, így a termék 1536 darab CUDA maggal és 128 textúrázó csatornával rendelkezik. A 256 bites memóriabuszhoz 2 GB kapacitású, GDDR5 szabványú memória kapcsolódik. Itt érhető tetten az első meglepetés, ugyanis a memórialapkák 6 GHz-es effektív órajelen üzemelnek. A Fermi egyik nagy problémája a memóriavezérlő volt, mely egyszerűen instabilitáshoz vezetett 4,5 GHz környékén vagy fölötte. Az NVIDIA rálelt a probléma forrására, és mostantól magasabb órajelű lapkákra is képesek építeni, így innentől kezdve már csak a fogyasztás szempontjából kell mérlegelni a tervezőknek a beállítható órajelet.

A változások azonban az órajel szempontjából nem érnek véget. Az NVIDIA több év után úgy döntött, hogy a GK104 esetében eldobja a különálló mag- és shader órajelet. Ezzel a GK104 egységesen 1006 MHz-es magórajelen üzemel, melyhez tartozik egy GPU Boost szolgáltatás is, ami 1058 MHz-es úgynevezett átlagórajelet eredményez. A változás nagyon előnyös, ugyanis a magas shaderórajel elérése egyre nehézkesebbé vált, és a fogyasztásra sincs jó hatással, emellett a tranzisztorok szintjén is nagyon fontos az úgynevezett órajelcsúszások minimalizálása, ami magas órajel és több milliárd tranzisztor mellett borzalmasan nehezen kivitelezhető. A GPU Boost azonban egy érdekes képesség, ami magával vonja a fogyasztás limitálását is, vagyis végre az NVIDIA is stabil hardveres védelmet épített a rendszerbe a túlterhelés ellen.

A GPU Boost lényegében az AMD Radeon HD 6900-as sorozatban bemutatkozott PowerTune fordítottja. A GeForce GTX 680 TDP limitje lényegében maximálisra van állítva, ami a két darab hattűs PCI Express tápcsatlakozó következtében 225 wattot jelent. A rendszer mindig az alap magórajelen kezdi meg a működést, de ha a terhelés nem komoly mértékű és a GPU Boost belefér a fogyasztási keretbe, akkor a magórajel a terheléssel dinamikusan változik. Ez maximálisan +100 MHz-es emelést jelenthet az alapórajelhez képest. Az órajelváltás minimum 1 MHz-es mértékben valósulhat meg, azaz a GPU Boost mindig a terheléshez igazíthatja a magórajelet.

Érdekes, hogy az AMD PowerTune pont fordítva működik, vagyis van egy alapórajel, ami nem növekedhet, hanem csak csökkenhet a fogyasztás minimalizálása érdekében. Éppen ezért -20 és +20 százalék között változtatható a Radeonok TDP limitje, ami az egyes termékeken más értékeket jelent, de az eddigi gyakorlat azt mutatja, hogy az AMD a 0%-os beállítást igyekszik úgy megadni, hogy a magórajel a játékok alatt stabil legyen, és sose ugráljon. Ezt elsősorban azért alkalmazza így a vállalat, mert az órajelváltás az egyes képkockák számítása között túl nagy is lehet, ami esetleg egy apró akadáshoz vezethet. Ebből a szempontból az AMD szerint a legbiztosabb, ha alapértelmezésben stabil a magórajel, és ha a felhasználó inkább a fogyasztást részesítené előnyben, akkor nyugodtan eljátszhat a PowerTune csúszkájával. Az NVIDIA ezzel szemben a teljesítményt helyezi előtérbe. Érdemes azonban megjegyezni, hogy a GPU Boost órajelváltása nem túl nagy határok között mozog, így valószínű, hogy az egymás utáni képkockák számításában csak minimális különbségek lesznek.

Többmonitoros móka egyetlen GeForce GPU-val [+]

Fogyasztásra az NVIDIA 195 wattos értéket ad meg, ami egy átlagos terhelés melletti paraméter. Persze GPU Boosttal megtámogatva a rendszer meglehetősen tág határok között fogyaszthat, de a limit 225 wattban lett megszabva. Az új GPU egyébként a PCI Express 3.0-t is támogatja, ami nagyon jó, de ahogy a Radeonok esetében is megjegyeztük, játékok alatt ennek kvázi nincs jelentősége – mindenesetre a dobozra rá lehet írni. Sokkal érdekesebb újítás, hogy a referenciamodell hátlapján két darab dual-link DVI, egy 3 GHz-es HDMI 1.4a, illetve egy DisplayPort 1.2 HBR2 interfész kapott helyet. Ebből ugyan még nem következik semmi, de eláruljuk, hogy ez az első olyan egy GPU-t használó GeForce kártya, amelyik támogatja a Surround technológiát. Utóbbihoz eddig SLI konfiguráció kellett, de a GK104 már egymaga elbánik négy kijelzővel.

A cikk még nem ért véget, kérlek, lapozz!

Kapcsolódó cégek:
NVIDIA

Azóta történt

Mobil VGA-k inváziója az NVIDIA jóvoltából

A GeForce 600M sorozat tartalmaz átnevezést, új termékeket és némi érdekességet is.

Hír 2012-03-22 31
Csúcsra törő barkácskártya a GeForce GTX 680 alapjain

Máris kapott egy kis extrém tuningot az NVIDIA új jövevénye.

Hír 2012-03-23 42
AquagraFX GTX 680: az első vizesblokk az NVIDIA új csúcskártyájához

A német gyártó elsőként kínál kombinált vízhűtő blokkot az újdonsághoz.

Hír 2012-03-23 25
Különleges GeForce GTX 680 kártyák a küszöbön?

Übertuningos és hibrid hűtéssel felszeret kártyákról is hallani pletykákat.

Hír 2012-03-23 24

Előzmények

A Radeon HD 7870 és HD 7850 tesztje

Tíz VGA-val eresztettük össze a játékosok keménymagjának szánt két HD 7800-as kártyát.

Teszt 2012-03-19 583
Színre lép a Radeon HD 7970 videokártya

Korábbi, részletes elemzésünk után megnéztük, hogy a gyakorlatban mire képes az AMD vadonatúj cGPU-ja.

Teszt 2012-01-16 558
A reformok útjára lép az új, Radeon 7900 sorozat

Az AMD GCN névre keresztelt architektúrája újradefiniálja a grafikus processzor fogalmát.

Elemzés 2011-12-22 722
Fermi újratöltve: GeForce GTX 570 és 580 tesztje

Az abszolút csúcskategóriás videokártyákkal az NVIDIA újra az élre tör!

Elemzés 2010-12-07 331

Percről percre

Lunar Lander Beyond teszt

gp Nagyon sok évtizeddel az eredeti Lunar Lander megjelenése óta ismét ezen a címen jelent meg Atari logóval egy játék. Vajon mennyit javult a játékdesign a hetvenes évek óta?

Sokat fogyaszt az AI, egyre több az adatközpont, kell az atomenergia

it Az AI-t kiszolgáló adatközpontok olyan nagy energiaigénnyel bírnak, hogy egyre több atomenergiára van szükség.

Letartóztatták a bitcoin-Jézust

it Amerikai adókerülés vádjával, Spanyolországban tartóztatták le a bitcoin-Jézusként ismert Roger Vert.

Állásajánlatok

Full stack Laravel fejlesztő

Cég: Promenade Publishing House Kft.

Város: Budapest

Részletek

Diákmunka junior fejlesztő

Cég: Ozeki Kft.

Város: Debrecen

Részletek

Az NVIDIA válasza: GeForce GTX 680