Az NVIDIA válasza: GeForce GTX 680

Tesszelláció és egyéb újdonságok

A tesszelláció az a terület, ahol az AMD és az NVIDIA gyökeresen eltérő megvalósításra épít. Ezt a GCN architektúrát elemző cikkünkben nagyon részletesen kiveséztük, így nem írnánk le újra mindent. A linkelt oldalra építve elmondhatjuk, hogy a Kepler esetében a vállalat továbbra is a brute force megvalósítás híve, ugyanakkor a zöldek is belátták, hogy a GF100 és GF110 esetében túlzásba vitték az egészet, nem kevés tranzisztort elpocsékolva. A tesszelláció ugyanis a DirectX 11-ben alkalmazott NoSplit megvalósítással számtalan gyermekbetegségben szenved, és borzalmasan pazarló is.

A GK104 esetében az NVIDIA továbbra is egy raszteres és egy úgynevezett PolyMorph részre vágja a hagyományos értelemben vett setup motort. Az előbbi egységből négy található a lapkában, azaz egy raszter motor két-két streaming multiprocesszor ellátásáról gondoskodik. Ezt a felállást a vállalat Graphics Processing Clusternek (GPC) keresztelte el a Ferminél, és nincs ez másképp a Kepler esetében sem. A raszter motor működése semmit sem változott. Az egység órajelenként továbbra is 8 pixelt képes feldolgozni, ami a teljes lapkára nézve 32 pixelt jelent. Ez egyensúlyban van a 32 blending egységgel is, azaz a GK104 végre ezen a ponton is kiegyensúlyozottá vált.

A streaming multiprocesszorokban található PolyMorph motor a geometriával kapcsolatos munkálatokat végzi. Mivel csökkent a SMX-ek száma a GF100 és GF110-hez képest, így a PolyMorph motorok száma is felére esett, azaz összesen 8 található a GK104-es lapkában. Az NVIDIA elmondta, hogy ezek fejlettebb PolyMorph motorok, így megkapták a 2.0-s jelzőt. Az erősen szeletelt, párhuzamosításra építő elgondolás azonban tipikusan gátat szab a komolyabb trükközéseknek, amelyekre az AMD például a GCN architektúrában bőszen épít. Valószínű, hogy csak a vertex re-use képességek fejlődtek, ahol a Fermi eleve nem volt túl acélos.

Összességében tehát nem várható előrelépés a GF100-hoz és GF110-hez viszonyítva a tesszellációs teljesítményben, de ahogy azt korábban már sokszor elemeztük, a korábbi két generáció csúcs GPU-i egyszerűen képtelenek voltak kamatoztatni a játékokban ezt a rendkívül tranzisztorpazarló brute force megvalósítást. Ebből a szempontból az NVIDIA jól döntött. Amíg az API-n belül nem kerülnek kigyomlálásra a tesszelláció problémái, addig felesleges a szükségesnél jobban erőltetni ezt a részt. Az egész tesszellálást ráadásul durván korlátozza, hogy a raszterizálás négyes pixelblokkokon zajlik, és ebből a szempontból a Kepler sem kivétel. Ezt a problémát semmivel nem lehet elkerülni, hacsak nem vesszük számításba a rejtett geometriák rajzoltatását, de eleve nincs értelme olyan dolgokat számolni, ami a végső képkockán nem jelenik meg, hiszen az a rendelkezésre álló erőforrás nagyfokú pazarlása, mindenféle képminőségbeli előny nélkül.

A GK104 dióhéjban

A DirectX 11.1-es és OpenGL 4.2-es grafikus API-t támogató GK104 először a GeForce GTX 680 névre keresztelt kártyán kap helyet. Az NVIDIA az új versenyzőnél egyetlen streaming multiprocesszort sem tilt le, így a termék 1536 darab CUDA maggal és 128 textúrázó csatornával rendelkezik. A 256 bites memóriabuszhoz 2 GB kapacitású, GDDR5 szabványú memória kapcsolódik. Itt érhető tetten az első meglepetés, ugyanis a memórialapkák 6 GHz-es effektív órajelen üzemelnek. A Fermi egyik nagy problémája a memóriavezérlő volt, mely egyszerűen instabilitáshoz vezetett 4,5 GHz környékén vagy fölötte. Az NVIDIA rálelt a probléma forrására, és mostantól magasabb órajelű lapkákra is képesek építeni, így innentől kezdve már csak a fogyasztás szempontjából kell mérlegelni a tervezőknek a beállítható órajelet.

A változások azonban az órajel szempontjából nem érnek véget. Az NVIDIA több év után úgy döntött, hogy a GK104 esetében eldobja a különálló mag- és shader órajelet. Ezzel a GK104 egységesen 1006 MHz-es magórajelen üzemel, melyhez tartozik egy GPU Boost szolgáltatás is, ami 1058 MHz-es úgynevezett átlagórajelet eredményez. A változás nagyon előnyös, ugyanis a magas shaderórajel elérése egyre nehézkesebbé vált, és a fogyasztásra sincs jó hatással, emellett a tranzisztorok szintjén is nagyon fontos az úgynevezett órajelcsúszások minimalizálása, ami magas órajel és több milliárd tranzisztor mellett borzalmasan nehezen kivitelezhető. A GPU Boost azonban egy érdekes képesség, ami magával vonja a fogyasztás limitálását is, vagyis végre az NVIDIA is stabil hardveres védelmet épített a rendszerbe a túlterhelés ellen.

A GPU Boost lényegében az AMD Radeon HD 6900-as sorozatban bemutatkozott PowerTune fordítottja. A GeForce GTX 680 TDP limitje lényegében maximálisra van állítva, ami a két darab hattűs PCI Express tápcsatlakozó következtében 225 wattot jelent. A rendszer mindig az alap magórajelen kezdi meg a működést, de ha a terhelés nem komoly mértékű és a GPU Boost belefér a fogyasztási keretbe, akkor a magórajel a terheléssel dinamikusan változik. Ez maximálisan +100 MHz-es emelést jelenthet az alapórajelhez képest. Az órajelváltás minimum 1 MHz-es mértékben valósulhat meg, azaz a GPU Boost mindig a terheléshez igazíthatja a magórajelet.

Érdekes, hogy az AMD PowerTune pont fordítva működik, vagyis van egy alapórajel, ami nem növekedhet, hanem csak csökkenhet a fogyasztás minimalizálása érdekében. Éppen ezért -20 és +20 százalék között változtatható a Radeonok TDP limitje, ami az egyes termékeken más értékeket jelent, de az eddigi gyakorlat azt mutatja, hogy az AMD a 0%-os beállítást igyekszik úgy megadni, hogy a magórajel a játékok alatt stabil legyen, és sose ugráljon. Ezt elsősorban azért alkalmazza így a vállalat, mert az órajelváltás az egyes képkockák számítása között túl nagy is lehet, ami esetleg egy apró akadáshoz vezethet. Ebből a szempontból az AMD szerint a legbiztosabb, ha alapértelmezésben stabil a magórajel, és ha a felhasználó inkább a fogyasztást részesítené előnyben, akkor nyugodtan eljátszhat a PowerTune csúszkájával. Az NVIDIA ezzel szemben a teljesítményt helyezi előtérbe. Érdemes azonban megjegyezni, hogy a GPU Boost órajelváltása nem túl nagy határok között mozog, így valószínű, hogy az egymás utáni képkockák számításában csak minimális különbségek lesznek.


Többmonitoros móka egyetlen GeForce GPU-val [+]

Fogyasztásra az NVIDIA 195 wattos értéket ad meg, ami egy átlagos terhelés melletti paraméter. Persze GPU Boosttal megtámogatva a rendszer meglehetősen tág határok között fogyaszthat, de a limit 225 wattban lett megszabva. Az új GPU egyébként a PCI Express 3.0-t is támogatja, ami nagyon jó, de ahogy a Radeonok esetében is megjegyeztük, játékok alatt ennek kvázi nincs jelentősége – mindenesetre a dobozra rá lehet írni. Sokkal érdekesebb újítás, hogy a referenciamodell hátlapján két darab dual-link DVI, egy 3 GHz-es HDMI 1.4a, illetve egy DisplayPort 1.2 HBR2 interfész kapott helyet. Ebből ugyan még nem következik semmi, de eláruljuk, hogy ez az első olyan egy GPU-t használó GeForce kártya, amelyik támogatja a Surround technológiát. Utóbbihoz eddig SLI konfiguráció kellett, de a GK104 már egymaga elbánik négy kijelzővel.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

Előzmények

Hirdetés