Hirdetés

Az NVIDIA válasza: GeForce GTX 680

Átgondolt vagy újragondolt stratégia?

Sokan várták már az NVIDIA Kepler architektúrájára épülő termékeket. Nos, a várakozás a mai napon véget ér, már ami a GK104-es kódnevű cGPU-t illeti, mely a GeForce GTX 680-as kártya alapja lett. A zöldek az új generáció startjával kicsit elcsúsztak, hiszen az AMD már mindhárom új generációs cGPU-ját bemutatta, de igazából még nincs veszve semmi, hiszen a TSMC 28 nm-es gyártókapacitása nem túl nagy, és alapvetően a gyártástechnológia is problémás, amit az NVIDIA is elismert.

A GK104-es lapka megjelenése több szempontból is történelmi pillanat az NVIDIA számára. Egyrészt a vállalat első 28 nm-es gyártástechnológián készülő termékéről van szó, másrészt a régóta várt Kepler architektúra is bevetésre került. Az új generáció azonban stratégiailag is tartalmaz meglepetéseket. A vállalat az elmúlt pár generáció során a méretes chipek híve volt, de összességében ez inkább nehézségnek bizonyult, mint előnynek, ami azt eredményezte, hogy közben az AMD a Sweet Spot stratégiával az elmúlt két generációban megépítette a leggyorsabb VGA-kat a Radeon HD 5970 és a Radeon HD 6990 személyében.

Hirdetés

A fő gond nem is a nagy lapkák elvével van, sokkal inkább a kivitelezhetőséggel. A gyártástechnológia fejlődik, így a csíkszélesség csökkenésével jelentősen több tranzisztor építhető egy adott kiterjedésű lapkába. A probléma ott keletkezik, hogy a tranzisztorok bekapcsolásához szükséges energia már közel sem csökken a méretekkel egyenes arányban, ami egységnyi kiterjedés mellett a fogyasztás növekedéséhez vezet. Az óriási lapkák jövője tehát erősen kérdéses, ráadásul egy új gyártástechnológia bevezetésénél ez irtózatos kockázat is egyben. Felhozhatjuk példaként a két éve megjelent GF100-as lapkát, melyben az NVIDIA eleinte nem is aktiválta az összes beépített részegységet, mivel csak így fért bele a termék a megcélzott piacokon elfogadott fogyasztási határokba. Ez a PC-s VGA-k piacán 300 wattot, míg a HPC szerverekbe szánt termékek esetében 225 wattot jelent.

Az NVIDIA a felmerülő problémákat látva stratégiai döntést hozott. Egy 400-500 mm2 közé eső lapkával nyitni túlzottan kockázatos, így a biztonság kedvéért most a Sweet Spot stratégiával megegyező elvekre alapozott a vállalat. Ezt tökéletesen szemlélteti a GK104-es cGPU, mely 294 mm2-es kiterjedésű, vagyis tökéletesen megfelel a célnak. Ebből kettőt összekötve csúcs-VGA is építhető a későbbiekben, ami ráadásul nagy eséllyel veheti fel a versenyt az AMD-s konkurens ellen. Korábban az NVIDIA számtalan kompromisszummal szülte meg a GeForce GTX 590-et, mely végül nem is sikerült olyan jóra, hogy egyértelműen megverje a Radeon HD 6990-et.

A későbbiekben egy nagyobb GPU nem zárható ki, de először érdemes tapasztalatot gyűjteni az új gyártástechnológiáról. Az NVIDIA valószínűleg mérlegelte a helyzetet, és arra juthattak, hogy semmi szükség egy újabb, GF100-hoz hasonló szenvedésre, hiszen ebből a lapkából a javított verziónak felfogható GF110-es variáns lett értékelhető alternatíva, mely nagyjából háromnegyed évvel az előd után került piacra. A nagy GPU stratégiáját tehát nem feltétlen kell elvetni, de egy gyártástechnológiai váltás során nagyon magas a kockázata annak, hogy a termék nem lesz jó. Ez rosszabb esetben a fejlesztés törlését is jelentheti az útitervben. Abban biztosak vagyunk, hogy készül egy nagyobb, Kepler architektúrára épülő lapka, csak kérdéses a megjelenés ideje, illetve az is, hogy a fejlesztés során mennyire számított a játékokban való jó szereplés.


GK104 [+]

Fermi újratöltve?

A Kepler architektúrától sokan gyökeres változásokat vártak, látva, hogy az AMD teljesen új architektúrát fejlesztett. A rendszerről általánosan elmondhatjuk, hogy sokat fejlődött a Fermihez képest, de az alapokhoz az NVIDIA nem nyúlt. Ez a GPGPU-s számításokban érdekes lehet, hiszen a GCN architektúra gyorsítótár- és memóriahierarchiáját ennek rendelte alá az AMD. Ez a bonyolult általános számítások során a hatékony működés alapja lehet.

A Kepler ezen a ponton szinte változatlan, ami például ray-tracing vagy hasonló bonyolult számítások mellett nem biztos, hogy előnyös. Az általános felépítés alapján elmondható, hogy az AMD GCN architektúrája sokkal hatékonyabb komplex számítások esetén, ahol az algoritmus erősen épít az adatok megosztására, emellett a multiprecíziós SIMD motorokhoz rendelt, rendkívül méretes dedikált regiszterterületekkel a kontextusváltás is jóval gyorsabb. Ezt a részt a Fermi és lényegében a Kepler architektúra továbbra is mostohán kezeli, ugyanakkor mindez az egyszerűbb számításokban, amelyeket manapság a játékok zömében használnak, nem jelent hátrányt. Rövidtávon ennek a játékokban valószínűleg nem, vagy csak nagyon kicsi lesz a jelentősége, de az általános számításra kihegyezett, GPU erejét kamatoztató programokban már problémás lehet.

Jó hír, hogy változott a Fermihez képest az ütemezés. Ez korábban a rendszer legfájóbb pontja volt, ugyanis jelentősen rontotta az architektúra skálázhatóságát. Az előző generációk alapján általánosan elmondható, hogy a GF104 és a GF114 kódnevű lapkák képezték a termékskála optimális részét. A Fermi ütemezése azonban bonyolult volt, és ezzel rendkívül sok tranzisztort kellett rá elhasználni, ami a kisebb lapkák versenyképességét lerontotta. A GF106, GF116, GF108, GF118 és GF119 legyőzése abszolút nem volt nehéz ügy a rendkívül jól skálázható Radeonok számára, így logikus volt, hogy az NVIDIA ezen a ponton felülvizsgálja a rendszert. A Kepler esetében az utasítások dekódolása szoftveres rásegítést kap. Erről a driver valós idejű shader fordítója gondoskodik, mely ellátja a hardvert a szükséges információkkal, amellyel rengeteg tranzisztor spórolható meg. Az NVIDIA ezzel elmozdult a statikus ütemezés irányába, ami az Echelon projekt tanulmányából kiindulva nem mondható váratlan lépésnek.

A cikk még nem ért véget, kérlek, lapozz!

Hirdetés

Azóta történt

Előzmények

Hirdetés