NVIDIA GeForce GTX TITAN: egy GPU-s góliát

Erődemonstráció NVIDIA-módra

A majdnem pont egy éve megjelent GeForce GTX 680 debütálása abszolút sikeres volt, hiszen piacra kerülése pillanatában képes volt maga mögé utasítani az addigi leggyorsabb VGA-t, a Radeon HD 7970-et. Ezen felül alacsonyabb fogyasztásának köszönhetően a teljesítmény/fogyasztás mutató tekintetében is az élre ugrott, ami egy újabb fegyvertény volt az NVIDIA számára.


GTX 680 – jól sikerült [+]

Természetesen mindezt – ahogy az általában lenni szokott – a konkurencia sem nézte ölbe tett kézzel. Az AMD tavaly év elején debütált GCN mikroarchitektúrájához folyamatosan érkeztek az újabb meghajtóprogramok, melyekkel a vállalat megpróbált minél többet kihozni az újabb termékekből. Ezzel párhuzamosan megpróbáltak minél több nagy címet megszerezni, ami több esetben sikerült is, így ma már olyan, korábban az NVIDIA által szponzorált játékok is az AMD támogatását élvezik, mint a Far Cry, a Crysis, a Hitman, a Tomb Raider vagy éppen a Bioshock. Mindez szintén nem volt túl jó hatással a GeForce-ok újabb játékok alatti teljesítményére, hisz a szponzorált címek rendszerint éppen az őket támogató vállalat termékein futnak jobban.

Végül az "i"-re a pontot a Radeon HD 7970 GHz Editon tette fel, mely tulajdonképpen a korábbi megoldás magasabb órajelekkel, illetve turbóval megspékelt kiegészítése volt. Ezzel gyakorlatilag az AMD egyértelműen visszavette a leggyorsabb egyetlen GPU-s videokártya címet, de mint tudjuk, a két vállalat ezt a labdát szinte folyamatosan egymásnak dobálgatja, így sejthető volt, hogy az ellentámadás csupán idő kérdése lesz.


[+]

Manapság már nem készülnek kifejezetten az asztali szegmensbe szánt, csúcskategóriás szilíciumlapkák. Ennek fő oka, hogy ez egy meglehetősen szűk réteg, így egészen egyszerűen nem éri meg egy kifejezetten ide irányuló fejlesztéssel előrukkolni. Ennek ellenére néhány vállalat, ha elsősorban csupán a presztízs értékért is, de még lát fantáziát a csúcskategóriában. Például az Intel nemes egyszerűséggel a nyolcmagos szerver Sandy Birdge-E lapkát ültette át asztali környezetre, mely némi kozmetikázás után jól helytállt ezen a területen is. A legújabb GeForce megalkotásakor az NVIDIA pontosan ezt a jól kitaposott ösvényt követte, hisz a GTX TITAN alapjául is szolgáló GK110 lapka a szuperszámítógépekbe szánt újabb generációs, több ezer dolláros árcédulával megáldott Tesla kártyák kedvéért született meg.


[+]

Sokáig bizonytalan volt, hogy az NVIDIA meglépi-e a GK110 asztali bemutatását, hisz ahogy utaltunk rá, a lapka nem a játékok grafikájának gyorsítására hivatott, minek okán sok kérdés merült fel a megoldás ezen a területen várható teljesítményével kapcsolatban.

A megreformált Kepler

A GK110 esetében fontos változás, hogy bár a rendszer a Kepler architektúrára épül, azért az NVIDIA némi reformmal is élt a működés szempontjából, amellett, hogy jóval több feldolgozót kapott a lapka. A 28 nm-es gyártástechnológia használata természetesen megmaradt, de a 7,1 milliárd tranzisztorból felépülő, 551 mm²-es chipbe 15 darab streaming multiprocesszort sikerült beépíteni, amit az NVIDIA egy ideje SMX-nek hív. A TITAN-ban egy ilyen egység le van tiltva, így összesen 14 SMX található benne.

A streaming multiprocesszorok felépítését a szokásos komplexitás jellemzi: mindegyik ilyen egység 192 darab, úgynevezett CUDA magot tartalmaz két nagyobb csoportba rendezve, így az utasításszavak csoportonként 3 darab, 32 utas feldolgozón hajtódnak végre párhuzamosan. Mindegyik CUDA mag rendelkezik egy IEEE754-2008-as szabványnak megfelelő, 32 bites lebegőpontos végrehajtóval, melyek támogatják a MAD (Multiply-Add) és az FMA (Fused Multiply-Add) instrukciókat. A regiszterek szempontjából a GK104-hez képest nem változott semmi, így közös regiszterterület található egy streaming multiprocesszoron belül, melynek kapacitása 256 kB. Emellett a feladatirányító egységek (dispatch) száma sem nőtt, vagyis továbbra is nyolc található egy-egy SMX modulban a négy darab warp ütemező mellett.


A GK110 logikai felépítése [+]

Első olvasására totálisan a GK104 SMX-e köszön vissza, de a reformot jelentő részletekkel együtt már látható lesz a fejlődés. Először is a GK110 dedikált feldolgozókat kapott a dupla pontosságú számításokra. Egy streaming multiprocesszoron belül 64 darab, úgynevezett speciális CUDA mag található. Ezek szimpla pontosságú feladatot nem végezhetnek, és alapvetően két csoportba rendeződnek, így az utasításszavak összesen két darab 32 utas feldolgozón lesznek párhuzamosan végrehajtva. Ez alapvetően eltér a többi Kepler GPU működésétől, mivel azok a lapkák nem kaptak dupla pontosságú számításokra felkészített, dedikált CUDA magokat, így minden SMX egy 32 utas feldolgozót tudott úgy összefűzni, hogy képes legyen a dupla pontosságú számítások elvégzésére.

Hirdetés

Ebben az esetben négy CUDA mag csoportosult, hogy megoldjanak egy feladatot. A különbség tehát jól érezhető, de a miértekre is érdemes választ adni. A GK110-et az NVIDIA professzionális szintre tervezte, a Tesla sorozatba, ahol számottevő követelmény a dupla pontosságú feldolgozás. Ezt a játékokban nincs értelme hasznosítani, mivel szükségtelen az extrém pontosság melletti számítás, így oda a többi Kepler GPU képességei illenek.

Ez arra is választ ad, hogy az NVIDIA miért korlátozza alapértelmezett módban a GeForce GTX TITAN dupla pontosság melletti számítási kapacitását. A lapkában ugyanis hiába van komoly számítási teljesítmény, a driver a feldolgozást lekorlátozza, ami annyit jelent, hogy a TITAN minden nyolcadik órajel során végezhet dupla pontosságú számítást. Kerülőút lehet a meghajtó vezérlőpultjába épített opció, amit bekapcsolva feloldható az előbbi limit, ám a magórajelet a rendszer fixen 725 MHz-re csökkenti. Korlátozás tehát mindenképp lesz, de igazából ennek tényleg nincs komoly jelentősége. A PC-n mindenképp az alapértelmezett mód a reálisan használható alternatíva, mivel a játékokban és az átlagos felhasználásra készített programokban nincs szükség a speciális CUDA magokra.


A GK110 SMX logikai felépítése [+]

A GK110 a textúrázás szempontjából is lemásolja a többi Kepler architektúrára épülő GPU-t, így az egyes streaming multiprocesszorok négy darab textúrázó blokkot tartalmaznak, melyekben egyenként négy textúracímző és textúraszűrő található, és ezekhez csatornánként négy mintavételező tartozik. Ezek az egységek a képességek szempontjából is megegyeznek, így itt újításról nem lehet beszámolni. Sokkal érdekesebb azonban a memóriahierarchia vizsgálata. A GK110 1,5 MB kapacitású, megosztott L2 gyorsítótárat alkalmaz, mely minden streaming multiprocesszor számára elérhető, és a CUDA magok írhatnak is bele. A felújított SMX modulok 64 kB-os L1 gyorsítótárral rendelkeznek, mely a feladatnak megfelelően dinamikusan szétosztható egy 16 és egy 48 kB-os részre, vagy 32-32 kB-os szeletelés is lehetséges, attól függően, hogy mekkora megosztott memóriát igényelnek a CUDA magok. Természetesen a grafikus feldolgozás során a DirectX 11 specifikációinak megfelelően kötelező minimum 32 kB-os helyi adatmegosztást (Local Data Share) alkalmazni. A textúrázó csatornák természetesen most is külön gyorsítótárat kaptak.

Újítás a többi Kepler GPU-hoz képest a 48 kB-os csak olvasható memória az SMX-eken belül. Ez a CUDA felületen kihasználható, de a szabványos API-kon keresztül már nem, vagyis a hétköznapi felhasználók számára nem lényeges paraméter. Ami viszont már valóban előnnyel jár, az a CUDA magok megduplázott sávszélessége az L1 gyorsítótár felé. Ez lényegi változást eredményez majd a helyi adatmegosztást használó compute shaderek esetében, hiszen az adatok megosztása és elérése dupla olyan gyorsan történhet, mint a korábbi Kepler architektúrára épülő GPU-kon. Erre nagy szükség volt, mivel ezen a ponton az összes DirectX 11-es architektúrát vizsgálva a Kepler a valaha készült leggyengébb megoldás. Hogy ezt jobban meg lehessen érteni, egy táblázatban felvázoltuk az aktuális architektúrák multiprocesszorainak különbségeit szimpla pontosság mellett:

Az aktuális architektúrák különbségei a helyi adatmegosztás sebessége szempontjából
Architektúra NVIDIA Kepler (GK10x) SMX NVIDIA Kepler (GK110) SMX AMD GCN CU
Ciklusonkénti operáció 384 FLOP/ciklus 384 FLOP/ciklus 128 FLOP/ciklus
L1 gyorsítótár és LDS 64 kB (megosztható) 64 kB (megosztható) 16 + 64 kB
Sávszélesség 128 bájt/ciklus 256 bájt/ciklus 64 + 128 bájt/ciklus
Egységnyi op. sávszélessége 0,33 bájt/FLOP 0,66 bájt/FLOP 1,5 bájt/FLOP

Régóta ismert tény, hogy az NVIDIA a Fermihez képest az egységnyi operációra lebontott sávszélességet jelentősen visszavette a Kepler esetében. A döntés ma is nehezen érthető, főleg azt figyelembe véve, hogy az új DirectX 11-es játékokban ez a paraméter mennyire fontos, de a lényeg, hogy a Kepler jó irányba tart a tempó növelésével. Ez a már kiadott hardvereken ugyan nem segít, de egy új generáció mindenképp jobban teljesíthet. Persze ez csak egy tényező a számítási hatékonyság palettáján, ám nagyon fontos jó értékre belőni, mivel nagymértékben kihat a hardver működésére.

A memóriavezérlő tekintetében az NVIDIA továbbra is maradt a crossbarnál. A GK110 384 bites szélességű buszt használ, mely 64 bites csatornákra van szétosztva. Egy-egy csatornához két ROP-blokk tartozik. Utóbbiból összesen 12 darab van, ami 48 blending és 384 Z mintavételező egységet eredményez.

A GK110 további extrái

A többi paraméter szempontjából a GK110 a kisebb Kepler GPU-kat másolja, csak éppen több feldolgozóval. Ennek megfelelően az NVIDIA továbbra is egy raszteres és egy úgynevezett PolyMorph részre vágja a hagyományos értelemben vett setup motort. Az előbbi egységből öt található a lapkában, azaz egy raszter motor három-három streaming multiprocesszor ellátásáról gondoskodik. Ezt a felállást a vállalat Graphics Processing Clusternek (GPC) nevezi. A raszter motor működése semmit sem változott: az egység órajelenként továbbra is 8 pixelt képes feldolgozni, ami a teljes lapkára nézve 40 pixelt jelent. Ez nincs összhangban a 48 darab blending egységgel, így utóbbiak enyhén limitálva lesznek az új GPU-n belül.

A streaming multiprocesszorokban található 2.0-s PolyMorph motor továbbra is a geometriával kapcsolatos munkálatokat végzi, így az architektúra ebből a szempontból is változatlanul működik a többi Kepler GPU-hoz képest.

A GK110 dióhéjban

Az új lapkára épülő GeForce GTX TITAN a DirectX 11-es és OpenGL 4.3-as grafikus API-t támogatja. Néhány gyártó ráírja a dobozra a DirectX 11.1-es támogatást, de ez nem szakszerű. Ezzel egy korábbi hírünkben részletesen foglalkoztunk, az ott leírtak a TITAN-ra is érvényesek.

Paraméterek szempontjából a GDDR5 szabványú memórialapkák effektív órajele 6 GHz, ami tekintélyes érték annak fényében, hogy 6 GB memória van a fedélzeten. Az NVIDIA a lapkának 837 MHz-es működési frekvenciát adott meg, az átlagos GPU Boost pedig 876 MHz. Itt a vállalat bevezeti a GPU Boost 2.0-t, ami az eredeti rendszer továbbfejlesztése. A cég megvizsgálta az 1.0-s megoldást, és rájöttek, hogy sokszor nem a feszültség, hanem a hőmérséklet korlátozza a lehetséges órajelemelés mértékét. A 2.0-s verzió már ezt is figyelembe veszi, így a különböző helyzetekben nagyobb Boost órajelet képes beállítani, mint a többi Kepler architektúrára épülő megoldás.

A hőmérséklet számításba vétele azt is jelenti, hogy a GPU Boost mértéke már nem csak az adott GPU gyártás utáni specifikációjától, hanem a környezeti hőmérséklettől is függ, így egy nem jól szellőző házban nem biztos, hogy ugyanolyan gyors lesz a TITAN, mint hűvösebb környezetben. Ez a változás a tesztelést is rendkívül bonyolítja, hiszen a kártya teljesítménye függ a környezettől, illetve a működési hőmérséklet az első mérés során nem lesz olyan magas, mint folyamatos terhelés mellett, és a GeForce GTX TITAN ilyenkor jobban teljesíthet. Ez nagyjából 3-7% eltérést hozhat majd.


A GPU Boost 1.0 és 2.0 összehasonlítása; 80 °C környékén utóbbi nagyobb órajelemeléseket ér el
[+]

Érdekes újítás még a TITAN-nál a tuning túlvezérlése. Fontos, hogy ez nem általános dolog, mert minden gyártó egy egyénileg meghatározott szintre állítja be a GPU maximális feszültségét. Természetesen az NVIDIA megteszi az ajánlásait, de a cégeknek ezt nem kötelező betartani. Utóbbi esetében lehetőség van a BIOS-t úgy paraméterezni, hogy a különböző tuningprogramok a feszültségemelést ne korlátozzák, így lényegében a kártyát tényleg agyon lehet tuningolni. Erre a beállításra természetesen semmilyen garancia nem vonatkozik, éppen ezért érdemes megfontolni a használatát, mivel az adott termék gyártója egy esetleges meghibásodás során visszautasíthatja a cserét. A kockázatra a tuningprogram természetesen figyelmezteti a felhasználót.

Egy másik említésre méltó képessége a GeForce GTX TITAN kártyáknak a frissítési frekvencia túlvezérlése, ami szintén a harmadik féltől származó tuningprogramokban lehet elérhető. Alapvetően arról van szó, hogy a legtöbb mai monitor 60 Hz-es frissítési frekvenciát használ, de a TITAN esetleg 90 képkockát is kiszámol másodpercenként. Ilyenkor természetesen csak 60 képkocka jelenik meg a kijelzőn, de beállítható a rendszer úgy, hogy a 60 Hz-es frissítést a 80 Hz váltsa, így több kép jeleníthető meg. Erre a megoldásra szintén nincs garancia, hiszen az aktiválás lehetősége függ a kijelzőbe szerelt paneltől, illetve maga az opció károsíthatja az adott megjelenítőt is. Egy esetleges meghibásodásért értelemszerűen nem vállalják a cégek a felelősséget. Természetesen a frissítési frekvencia túlvezérlése sztereó 3D-s módban nem elérhető.

Fogyasztásra az NVIDIA 250 wattos értéket ad meg, ami egy átlagos terhelés során várható érték. Persze GPU Boosttal megtámogatva a rendszer meglehetősen tág határok között fogyaszthat, de a limit 300 watt. Az új GPU a PCI Express 3.0-t is támogatja, ami nagyon jó, de játékok alatt ennek kvázi nincs jelentősége – mindenesetre a dobozra rá lehet írni.

Az ASUS GeForce GTX TITAN

Szerkesztőségünkbe az ASUS által csomagolt GeForce GTX TITAN érkezett, mely a közelmúltban megszokott formájú és színvilágú dobozban landolt az asztalunkon.


[+]

Az ASUS csomagolása most sem rejtett túl sok mindent a kártyán kívül, így a szokásos driverlemezen és leíráson túl csak egy tápátalakító kábelt és egy DVI->VGA adaptert találtunk.


[+]

A GTX TITAN külsőre a GTX 690-re hajaz, de az egyetlen GPU okán a légkavaró visszakerült a szokásos helyre, a kártya hátuljába. A kártya minden részletében minőségi hatást kelt, ami a jó anyagválasztásnak és a remek összeszerelésnek köszönhető. A burkolat nagy része fémből készült, amiből még a ventilátor közepére is jutott egy szelettel. A bordát egy kis plexiablakon keresztül szemlélhetjük, ami már csak a porosodás ellenőrzése miatt is hasznos lehet. A TITAN teljes hossza körülbelül 27 centiméter, ami ugyan alapvetően már hosszúnak számít, de ebben a kategóriában még inkább csak átlagosnak nevezhető.


[+]

A kártya oldala szintén a GTX 690-re hajaz, ugyanis itt is feltűnik a világító, zöld színben pompázó GEFORCE GTX felirat, melyet egy kis segédprogrammal akár ki is kapcsolhatunk. A felirattól jobbra húzódik a két PCI Express szabványú tápcsatlakozó, melyek közül az egyik 8, míg a másik 6 tűs, így a PCI Express slot segítségével összesen 300 watt maximális áramfelvétel biztosítható a TITAN-nak.


[+]

A burkolat eltávolítása után elénk tárul a hűtés, amely egy PWM-es légkavaróból és egy méretes alumíniumbordából áll. A bevett gyakorlat szerint egy fekete fémlap fedi le a NYÁK nagyobb részét, ami a memóriák és a tápellátás hűtéséért felel. A borda két részből áll össze: a sok függőleges lamellákat tartalmazó felső szekció alatt egy rézbetétes rész kapott helyet, melyben hőkamra lapul.


[+]

A különböző fémek eltávolítása után megpillanthatjuk a csupasz NYÁK-ot, ahol elsőként, mint mindig, most is a GPU felé vettük az irányt.

Ahogy az előző oldalakon már leírtuk, a GK110 kódjelű egység 551 mm² területű, ami meglehetősen nagynak számít még a GPU-k között is. Viszonyításképpen a GF110 520 mm², míg a konkurens AMD Tahiti csupán 365 mm². Mindezen tulajdonságok a fogyasztás mellett a gyártási költségekre is hatással vannak. Ahogy már említettük, a grafikus processzor alapórajele 837 MHz, melyet a GPU Boost 876 MHz-ig képes feltolni.

A GPU körül szokás szerint a memóriák kaptak helyet, melyek 384 bites buszon keresztül csatlakoznak a központi egységhez. A GDDR5-ös chipek immáron a Samsung műhelyéből származnak. A K4G20325F0-FC03 típusjelzésű chipek papíron 6 GHz-es effektív sebességre képesek. Az egyenként 2 gigabit (256 MB) kapacitású egységekből huszonnégy darab került a NYÁK-ra, amely így összesen nem kevesebb mint 6 GB memóriát jelent az egyetlen szál GPU-ra.

A GPU tápellátása összesen 6 fázisból áll, melyek meglehetősen minőségi komponensekből épülnek fel. Ez a szekció az MSI felsőkategóriás alaplapjain manapság előszeretettel használt, tantálmagos kondenzátorokból és DrMOS FET-ekből épül fel. A rendszer vezérléséről OnSemi NCP4206 chip gondoskodik.

A GTX TITAN egy normál méretű DisplayPort 1.2 HBR2 csatolóval nyit, mellé került a 3 GHz-es HDMI 1.4a. Ezután a dual-link DVI-I port jön, mely felett egy szintén dual-link DVI-D helyezkedik el. Ezen négy kimenet segítségével hajthatunk meg akár négy megjelenítőt is (Surround technológia) egyazon időben. A bordáról leváló meleg levegő nagy része az itt található rácson keresztül távozik.

Tesztkonfig, fogyasztás, tuning, specifikációk

A mérések alatt a GTX TITAN társaságából természetesen nem hiányozhatott a két GPU-s GTX 690, valamint a korábbi leggyorsabb egy GPU-s GTX 680 sem. A konkurencia oldaláról jobb híján most csak a Radeon HD 7970, valamint a Radeon HD 7970 GHz Edition került be ebbe a meccsbe.

Tesztkörnyezet
Videokártyák ASUS GeForce GTX TITAN 6144 MB (Geforce driver 314.09)
NVIDIA GeForce GTX 690 4096 MB (Geforce driver 313.96)
NVIDIA GeForce GTX 680 2048 MB (Geforce driver 313.96)
AMD Radeon HD 7970 GHz Edition 3072 MB (Catalyst 13.2 beta 5)
AMD Radeon HD 7970 3072 MB (Catalyst 13.2 beta 5)
Processzor Core i7-3770K (3,60 GHz) – túlhajtva 4,3 GHz-en
EIST / C1E / C-state kikapcsolva; Turbo Boost kikapcsolva
Alaplap MSI Z77 MPOWER (BIOS: V17.5) – Intel Z77 chipset
AHCI driver: Intel 11.5.0.1207
Memória

G.Skill RipjawsX 16 GB (4 x 4 GB) DDR3-1866 F3-14900CL9Q-16GBXL

Háttértárak Intel SSD 320 160 GB SSDSA2CW160G310 (SATA 3 Gbps)
Seagate Barracuda 7200.12 500 GB (SATA, 7200 rpm, 16 MB cache)
Tápegység Cooler Master Silent Pro M600 – 600 watt
Monitor Samsung Syncmaster 305T Plus (30")
Operációs rendszer Windows 7 Ultimate 64 bit

Csúcskategóriás kártyákról lévén szó úgy döntöttünk, hogy a Core i7-3770K processzorunk órajelét egy egészséges tuning keretein belül 4,3 GHz-re emeljük, ami mellé 16 GB G.Skill márkájú memóriánk üzemi órajelét 1866 MHz-re srófoltuk fel.

A játékokat a tesztben szereplő kártyákban lapuló számítási teljesítmény miatt 1920x1200-as és 2560x1600-as felbontásban teszteltük. A képminőséget maximális vagy ahhoz nagyon közelire állítottuk. Az AMD és az NVIDIA meghajtóprogramjaiban mindent alapértelmezett beállításokon hagytunk, az anizotropikus szűrést, illetve az élsimítást pedig mindig az adott játékban aktiváltuk.

Játékok

  • Anno 2070 (DirectX 11) – motor: InitEngine / műfaj: stratégia
  • Batman: Arkham City (DirectX 11) – motor: Unreal Engine 3 / műfaj: TPS
  • Battlefield 3 (DirectX 11) – motor: Frostbite 2.0 / műfaj: FPS
  • DiRT Showdown (DirectX 11) – motor: EGO Engine / műfaj: autóverseny
  • Hitman: Absolution (DirectX 11) – motor: Glacier 2 / műfaj: TPS
  • Metro 2033 (DirectX 11) – motor: 4A Engine / műfaj: FPS
  • Sleeping Dogs (DirectX 11) – motor: United Front Engine / műfaj: TPS/akció
  • Sniper Elite V2 (DirectX 11) – motor: Asura Engine / műfaj: FPS

Ezen tesztünkhöz a mérésekhez eddig használt játékok palettáját némileg megváltoztattuk. Fontosnak tartjuk, hogy viszonylag naprakész és/vagy népszerű címeket alkalmazzunk, így most néhány korábbi játékot menesztve újabbak kerültek be a csomagba. Végül a Deus Exet a Hitman: Absolution váltotta, míg a Crysis Warhead helyét a Sleeping Dogs vette át.

A könnyebb és pontosabb mérés, valamint összevetés érdekében a Sleeping Dogsnál a benchmark toolt használtuk, ahogyan a Sniper Elite V2, Metro 2033, Batman: Arkham City, DiRT Showdown, valamint Hitman: Absolution esetében is. A Battlefield 3-nál a Going Hunting című küldetés első perceit mértük le FRAPS-szel, míg az Anno 2070 esetében az első pálya elején található demót vizsgáltuk hasonló módon. Korábban észrevettük, hogy a Metro 2033 rendszerint hibásan méri a minimum fps-t, ezért itt is a FRAPS-et alkalmaztuk a lehető legpontosabb eredmények érdekében.

A fogyasztást egy konnektorba dugható, digitális VOLTCRAFT Energy Check 3000 készülékkel vizsgáltuk. A grafikonon az egyes videokártyákkal kiegészített rendszerek fogyasztása látható alaplappal, processzorral, táppal és a többi alkatrésszel együtt, de természetesen a monitor nélkül. A méréseket a Metro 2033 benchmarkja alatt mértük, mely 1920x1200-as felbontásban került lefuttatásra. Játékkal terhelt mérés közben meglehetősen sűrűn és gyorsan ingadoznak az értékek, ezért ide egy olyan értéket próbáltunk regisztrálni, melyet a legtöbbször villant fel az eszköz kijelzőjén, vagyis nem a csúcsértéket jegyeztük fel.

Terheletlen állapotban a TITAN pontosan a GTX 680 fogyasztását produkálja. Ahogy arra számítani lehetett, terhelés mellett már változik a kép, amivel az új GeForce a két HD 7970 közé kerül, nem sokkal lemaradva a GHZ Editiontől. Az AMD GCN mikroarchitektúrás kártyák egyik újítása volt a ZeroCore Power nevű szolgáltatás, amely hosszú üresjárat esetén képes az adott kártya fogyasztását minimálisra csökkenteni. Mindez akkor következik be, ha a számítógépen az operációs rendszer készenlétbe (stand-by) helyezi a megjelenítőt, ilyenkor a kártyán található ventilátor(ok) leáll(nak), és a termék fogyasztása 2-3 watt körüli értékre csökken. A fenti grafikonon látható, hogy ennek megfelelően az NVIDIA kártyái jóval kisebb arányban korlátozzák fogyasztásukat, ha a megjelenítő készenlétbe kerül.

Végül természetesen a kártya túlhajtási lehetőségeire is vetettünk egy pillantást. Ahogy korábbi cikkeinkben már említettük, a Keplerrel némiképp változott a tuning, hisz az NVIDIA turbója, a GPU Boost megjelent a színen. Azt már tudjuk, hogy a Boostot nem lehet kikapcsolni, így az a túlhajtás során is jelen van.

Első körben a fogyasztási limitet kellett kitolnunk, amit az EVGA PrecisionX által engedett maximális 106%-ra állítottunk be. E mellé a GPU célhőmérsékletét is a maximumra emeltük, ami számszerűen 94 Celsius-fokot jelentett. Ezen módosítások segítségével végül 160 MHz-nyi pluszt tudtunk a GPU órajelére rápakolni, amivel az alapórajel 997 MHz lett, míg a Boost 1036 MHz. Végül a GDDR5-ös Samsung chipekre került a sor, melyek üzemi frekvenciáját 250 MHz-el sikerült túlhúzni, ami a GPU esetében elérthez hasonlóan szintén jó eredménynek számít.

VGA megnevezése GeForce
GTX TITAN
GeForce
GTX 680
GeForce
GTX 690
Radeon
HD 7970
Radeon HD 7970
GHz Edition
Kódnév GK110 GK104 2 x GK104 Tahiti XT
Gyártástechnológia 28 nm (TSMC)
Mikroarchitektúra Kepler GCN
Tranzisztorok száma 7,1 milliárd 3,54 milliárd 2 x 3,54 milliárd 4,31 milliárd
GPU lapka mérete 551 mm2 294 mm2 365 mm2
GPU/Turbo órajele 837/876 MHz 1006/1058 MHz 915/1019 MHz 925 MHz 1000/1050 MHz
GPU/shader órajele üresjáratban 324 MHz 300 MHz
Shader processzorok típusa stream multiprecíziós vektor
Számolóegységek száma 2688 1536 2 x 1536 2048
Textúrázók száma 224 textúracímző
és -szűrő
128 textúracímző
és -szűrő
2 x 128 textúracímző
és -szűrő
128 textúracímző
és -szűrő
ROP egységek száma 12 blokk (48) 8 blokk (32) 2 x 8 blokk (32) 8 blokk (32)
Memória mérete 6144 MB 2048 MB 2 x 2048 MB 3072 MB
Memóriavezérlő 384 bites crossbar 256 bites crossbar 2 x 256 bites crossbar 384 bites hubvezérelt
Memória órajele terhelve 1502 MHz (GDDR5) 1375 MHz (GDDR5) 1500 MHz (GDDR5)
Üresjáratban 162 MHz 150 MHz
Max. memória-sávszélesség 288 384 MB/s 192 260 MB/s 2 x 192 260 MB/s 264 000 MB/s 288 000 MB/s
Támogatott DirectX 11.1
Dedikált HD transzkódoló NVENC VCE
HD képi anyagok lejátszásának hardveres támogatása Purevideo HD (VP4) AVIVO HD (UVD 3)
Hivatalos TDP ~250 watt 195 watt 300 watt ~250 watt ~250 watt

Sleeping Dogs, DiRT: Showdown, Anno 2070

A meglehetősen erőforrásfalánk Sleeping Dogs alatt nagyjából a HD 7970 GHZ Edition szintjén mozgott a TITAN. A DiRT: Showdownban a GCN mikroarchitektúrával rendelkező csúcs Radeon még tartja magát. Ennek oka, hogy a GCN remekül muzsikál a komplex számításoknál, míg a Kepler ezen a területen inkább egy kisebb visszalépés a Fermihez képest. Mindemellett épp ez első olyan játékprogram, amely az eddigiekhez képest erősebben épít a compute shader alkalmazására, emellett elsőként alkalmaz olyan forward render eljárást, amivel hatékonyan jeleníthető meg ezernyi pontfényforrás. A forward+ lighting technika nagyon épít a hardver általános számítási hatékonyságára, és ez az a terep, ahova az AMD a GCN architektúrát tervezte.

Metro 2033, Sniper Elite V2, Hitman: Absolution

A Metro 2033 amellett, hogy nem jól optimalizált, még olyan komplex post-process számításokat is végez, mint a diffuse DOF (Depth of Field), ami szépen vissza is tükröződik az eredményeken. A Sniper Elite V2 benchmarkja többszöri próbálkozásunk ellenére sem volt hajlandó lefutni a TITAN-on, a mérés a felénél fekete képernyőbe torkollott. A teszt futtatását a legújabb béta meghajtóprogrammal is megkíséreltük, de mindhiába, így ezen játék eredményei most az összesítésből is kimaradtak.

Batman, Battlefield 3

Ahogy korábbi tesztünkben már elmondtuk, a Battlefield 3 nagyon fekszik a Keplernek, ami az eredmények alapján továbbra is helytálló, de ugyanez elmondható a Batmanről is.

Összegzés

Az összesítés alapján az új GeForce GTX TITAN egyértelműen a leggyorsabb egyetlen GPU-val szerelt kártyának kiáltható ki. A GTX 680-ra nagyjából 45%-ot ver, míg a HD 7970 GHz Edition-re durván 22%-ot. Ez már kétségkívül tetemes előnynek nevezhető, amit az AMD szerintünk már csak egy generációváltással lesz képes behozni.

A teljesítmény/fogyasztás értékeket szemlélve elmondhatjuk, hogy az NVIDIA ismét remekelt, mivel ebben a kimutatásban is az élen végzett az új jövevény.

A GeForce GTX TITAN minden kétséget kizáróan egy újabb remekül sikerült termék az NVIDIA-tól. Ugyan a GTX 690-et nem tudta letaszítani a leggyorsabb grafikus kártya trónjáról, de az egyetlen GPU okán annál mégis kiegyensúlyozottabb teljesítményt nyújt, ami sokaknak döntő szempont lehet. A kártya abszolút igényes kialakítást kapott, látszik, hogy az NVIDA ebben az esetben nem sokat spórolt a dizájnon. További pozitívum, hogy a gyári beállítások mellett a kártya nagyon csendben teszi a dolgát, azaz a hűtésre sem lehet különösebb panaszunk.

Szerintünk az nem kérdés, hogy ár/érték arányt tekintve az alacsonyabb kategóriákban húzódó VGA kártyák sokkal jobban megérik az pénzüket, de jelen tesztünk főszereplője egy luxusmodell, aminek nem az ára a meghatározó, értékelésünk is ennek fényében született.

Az NVIDIA egyértelműen a komoly, vérbeli játékosoknak szánja legújabb kártyáját. Ezek tükrében a GeForce GTX TITAN-t kizárólag azoknak tudjuk ajánlani, akik nem szeretnek kompromisszumot kötni, de ezért cserébe hajlandóak akár 310 000 forintot is valamelyik üzlet pultján hagyni, ugyanis a jelenleg ilyen árcédulával vihető haza az NVIDIA legújabb szörnyetege.


NVIDIA GeForce GTX TITAN videokártya
(ha nem számít a pénz)

Oliverda és Abu85

Az ASUS GeForce GTX TITAN videokártyát az Asus magyar képviselete biztosította.

Hirdetés

Azóta történt

Előzmények

Hirdetés