NVIDIA GeForce GTX 750 Ti: itt a Maxwell!

Kepler helyett Maxwell

A Kepler a GTX 680-nal kézenfogva lassan két éve került piacra, egészen pontosan 2012 márciusának végén. Az utóbbi években kialakult trend szerint egy GPU mikroarchitektúra legalább két évet húz ki, és rendszerint két grafikuskártya-generáció épül rá. Ez történt a Kepler esetében is, hisz a GTX 600-as jelzésű termékek után tavaly egy frissített, 700-as sorozat is piacra került, mely a korábbi lapkák újrapozicionálásából született. Az így megjelent modellek elsődleges célja a Maxwellig húzódó űr kitöltése volt, ami a látottak alapján sikerült is.


[+]

Manapság egyáltalán nem ritka, hogy bizonyos nagyobb fejlesztések hónapokat, vagy szélsőségesebb esetben akár egy évet vagy éveket késnek. Végül a Maxwell is elcsúszott kissé, így a korábbi 2013-as céldátumot 2014-re módosított az NVIDIA. Ennek oka ebben az esetben is valószínűleg a gyártástechnológia háza táján keresendő, hisz a TSMC 20 nm-es gyártósorai csak a közelmúltban kezdték meg a tömegtermelést. Erről már több hónappal ezelőtt tudhatott az NVIDIA, ezért a Maxwell debütálását végül a már két éve alkalmazott 28 nm-es csíkszélességre bízták. A döntés teljesen logikus, hisz az utóbbi gyártástechnológiával már rengeteg tapasztalatot szereztek a mérnökök, így ebben az esetben "csak" az új mikroarchitektúra esetleges problémáit kellett megoldaniuk. Ezen felül azonos csíkszélességen könnyebb összevetni a két rendszert, ami a fejlesztőknek is egy jobb támpontot adhat.


[+]

Ennek fényében már érhető is, hogy a vállalat tavaly miért csak a GTX 760-tól felfelé frissítette a palettáját, ugyanis ezzel a lépéssel helyet hagytak a Maxwell-alapú kártyáknak. Az NVIDIA sajtóanyagaiban fellelhető információk alapján jelenleg az első generációs Maxwell-lel barátkozhatunk. A második generáció valószínűleg az év második felében érkező 20 nm-es modelleket fogja jelenteni, hisz hosszabb távon elengedhetetlen a csíkszélességváltás, még ha ez a korábbiakhoz képest már kevesebb előnnyel is kecsegtet.


[+]

A vállalat különösen hangsúlyozza a hatékonyságot. Azt már a cég elnök-vezérigazgatója is elárulta nekünk, hogy meglátásuk szerint ennek jelentősége hamarosan egyenrangú lesz a számítási teljesítménnyel, így nem csoda, hogy több helyen is kiemelik. A Kepler pályájából kiindulva csak idő kérdése, hogy a Maxwell is egy Tegra chipben kössön ki, ahol rendkívül fontos a fogyasztás, illetve az ahhoz társuló számítási teljesítmény. Mindez természetesen nem jelenti azt, hogy ez a tulajdonság más területeken elhanyagolható lenne, sőt, hisz a szervereknél is sarkalatos pont a hatékony energiafelhasználás, de említhetnénk még akár a notebookokba szánt GPU-kat is.


[+]

Az első, GM107 kódjelű Maxwell lapka egy középkategóriás megoldás lett. Az erre épülő két asztali grafikus kártya a GTX 650 és a GTX 660 közé csúszik be, ami talán épp a leginkább keresett megoldások vadászmezeje, hisz ebben az árkategóriában rengeteg kártya talál gazdára.


[+]

A vállalat tehát első körben két kártyával dobja be a Maxwellt, amiből mi most a nagyobbik, GTX 750 Ti jelzésű modellel foglalkozunk, míg a "Ti" jelölés nélküli modellt valamikor a közeljövőben fogjuk megvizsgálni.


[+]

A GeForce GTX 750 Ti grafikus kártya 640, úgynevezett CUDA magot vonultat fel. Ezek alapórajele 1020 MHz, ami a GPU Boost 2.0-nak köszönhetően egészen 1085 MHz-ig szaladhat fel. A memória típusa GDDR5, kapacitása 1 vagy 2 GB lehet, míg órajele effektív 5400 MHz. Az első kisebb meglepetés a TDP értéke, ami mindössze 60 watt, így a (referencia) kártya nem igényel extra tápcsatlakozót.

Maxwell, a hatékony maximalista

Az NVIDIA évek óta fejleszti a Maxwell architektúrát, melynek kapcsán abszolút a hatékony energiafelhasználást helyezték előtérbe. Ez tökéletesen látszik a GM107-es kódnevű lapkán, mely méretéhez képest lényegében alig fogyaszt, illetve kiterjedése sem túl nagy, tehát a Maxwell minden korábbinál hatékonyabban vethető be majd ultramobil szinten is a jövőben érkező Parker rendszerchipben. Addig azonban még rengeteg hónap telik el, így egyelőre az aktuális rendszert vizsgáljuk meg, mely 28 nm-es gyártástechnológiával készül. Az 1,87 milliárd tranzisztorból felépülő, 148 mm²-es chipbe 5 darab újszerű streaming multiprocesszort sikerült beépíteni, amit az NVIDIA mostantól SMM-nek, azaz Maxwell streaming multiprocesszornak hív.


[+]

A streaming multiprocesszorok felépítése a Keplerhez képest jelentősen megváltozott. Egy ilyen egységen belül négy nagyobb compute blokk került kialakításra, amelyek közös utasítás gyorsítótárat használnak. Mindegyik compute blokk rendelkezik egy utasítás pufferrel, ami nyilvánvalóan az utasítás gyorsítótárból szerzi be az aktuális munkához szükséges információkat. Az egész rendszer komplex ütemezést használ, ami részben a hardverben és részben a szoftverben valósul meg. A hardveres részért a már megszokott GigaThread motor felel, míg az ütemezés szoftveres oldala természetesen a driver fordítójának reszortja. Ebből a szempontból nincs sok változás a Keplerhez képest, de a Maxwell esetében az NVIDIA némileg több feladatott bíz a szoftveres oldalra, amivel természetesen energiát lehet spórolni.

Egy compute blokk két feladatirányító egységet (dispatch) és egy darab warp ütemezőt használ, amelyek 32 darab, úgynevezett CUDA magot etetnek, így az utasításszavak 2 darab, 16 utas feldolgozón hajtódnak végre párhuzamosan. Mindegyik CUDA mag rendelkezik egy IEEE754-2008-as szabványnak megfelelő, 32 bites lebegőpontos végrehajtóval, melyek támogatják a MAD (Multiply-Add) és az FMA (Fused Multiply-Add) instrukciókat. Mindegyik compute blokkban közös regiszterterület található, melynek kapacitása 64 kB. Utóbbi nagyon fontos változás, mert egy CUDA magra levetítve nőtt a regiszterterület. Ezzel a Maxwell megoldja a Keplernek azt a problémáját, amikor a korábbi SMX blokk egyszerűen képtelen volt hatékonyan dolgozni, mivel regiszterhiány miatt a 192 feldolgozóból egyszerre csak 128 működhetett. A Maxwell felépítésével ilyen eset már semmilyen kódnál nem fordulhat elő.


Az SMM [+]

A compute blokkonon belül található még 8 darab, a speciális funkciókért felelő egység (SFU), melyek a trigonometrikus és transzcendens utasítások mellett az interpoláció feladatát is elvégzik. Ez önmagában a Keplerhez képest nem változott, de az NVIDIA a Fermi óta küzd az interpoláció megfelelő kiegyensúlyozásán. A Fermi esetében a fixfunkciós interpolátorok száma egyszerűen kevés volt, amire a Kepler architektúra során a tervezők úgy válaszoltak, hogy technikailag sokszorosára növelték ezek számát. Ez viszont már sok volt, ami végtére is a tranzisztorok pazarlását eredményezte. A Maxwell esetében az NVIDIA belőtte a Fermi és a Kepler közötti értéket, azaz technikailag az arany középutat. Mindezek mellett az NVIDIA bármikor bevethetné az interpoláció emulálását. Ez ugyan elvesz némi nyers számítási kapacitást a rendszerből, de ugyanakkor maximálisan igazodhat a feldolgozás a különböző programok igényeihez.

A GM107 a textúrázási képességek területén is sokat változtatott. Az egyes streaming multiprocesszorok mostantól két darab textúrázó blokkot tartalmaznak, melyekben egyenként négy textúracímző és textúraszűrő található, és ezekhez csatornánként négy mintavételező tartozik. Egy textúrázó blokkot két compute blokk használ egyszerre. Ez hardveres szinten van bedrótozva, így mondható az, hogy az SMM két nagy feldolgozó tömbre oszlik, amelyek két compute és egy textúrázó blokkot tartalmaznak. Ehhez kapcsolódó változás, hogy a Maxwell esetében a textúrázáshoz való 12 kB-os gyorsítótár technikai értelemben már egy adat gyorsítótár. Ez természetesen tárolhat textúrainformációkat is, de számoláshoz szükséges adatok tárolására is használható. Ennek hozománya, hogy ez a gyorsítótár nem csak olvasható, hanem írható is.

Memóriahierarchia szempontjából a Maxwell architektúra strukturális meglepetéssel ugyan nem szolgál, de a 2 MB kapacitású, megosztott L2 gyorsítótár mérete a GPU-k eddigi történelmében kiemelkedő, ráadásul ezt továbbra is elérheti mindegyik streaming multiprocesszor, és a CUDA magok írhatnak is bele. Maguk az SMM modulok 64 kB-os helyi adatmegosztással (Local Data Share) rendelkeznek, melyen a négy darab compute blokk osztozik. Itt az NVIDIA jelentős energiát takaríthat meg, hiszen technikai értelemben nem rendel direkt LDS-t az egyes compute blokkokhoz, tehát kevesebb tranzisztort is kell erre költeniük. Viszont a DirectCompute 5.0-s szabvány ezt a megoldást direkten nem támogatja, mivel a helyi adatmegosztáson egyszerre nem osztozhat több compute blokk, pontosabban fogalmazva több szálcsoport. A Maxwell ennek áthidalására egy trükköt használ, amivel a 64 kB-os helyi adatmegosztás többféleképpen működtethető. Alapértelmezett módban egy blokk maximum 48 kB-os részt kaphat, de ekkor maga a tár egy időegységben mindig csak az egyik compute blokkhoz tartozhat, míg a másik három compute blokknak olyan feladatot kell futtatni, ami nem igényli a helyi adatmegosztást, viszont a fennmaradt 16 kB-ot az említett három compute blokk feldolgozói közösen hasznosíthatják. Emellett amint a tárkapacitás nagy részét birtokló compute blokkhoz tartozó feladat véget ért, a helyi adatmegosztást rögtön igénybe veheti egy másik compute blokk. Alternatív lehetőség a 32-32 kB-ra való felosztás, ami lényegében a DirectCompute 5.0 által előírt minimális kapacitás egy szálcsoporthoz. Ilyenkor már két compute blokk írhat a saját területébe, de a másik két compute blokk elől ez az erőforrás teljesen el lesz zárva.


A GM107 [+]

Az előbbi koncepció bizonyos feladatoknál rendkívül hatékony feldolgozást jelent, míg elfordulhatnak olyan szituációk is, amikor a lapkában található feldolgozók negyede használható csak ki az adott pillanatban. Itt válik lényeges szemponttá az előző előtti bekezdésben említett adat gyorsítótár, illetve a méretes L2 gyorsítótár, ami segít a Maxwell koncepciójának korlátait kevésbé érzékelhetővé tenni. Annak ellenére, hogy az NVIDIA mindent a fogyasztásnak rendelt alá, a Maxwell compute hatékonysága a legtöbb esetben megközelítheti, illetve le is körözheti a Kepler szintjét. Mindemellett a 64 kB-os helyi adatmegosztást a DirectCompute 5.0-tól eltérő platformok – mint például a CUDA – hatékonyabban is kihasználhatják.

A memóriavezérlő tekintetében az NVIDIA továbbra is maradt a crossbarnál. A GM107 128 bites szélességű buszt használ, mely 64 bites csatornákra van szétosztva. Egy-egy csatornához egy ROP-blokk tartozik. Utóbbiból összesen 2 darab van, ami 16 blending és 64 Z mintavételező egységet eredményez.

Az NVIDIA a dupla pontosságot a GM107 esetében nagyjából úgy oldja meg, ahogy ezt teszi a GK110-es lapkában. Jelen esetben minden compute blokkhoz egy-egy darab speciális CUDA mag tartozik. Technikai értelemben ezek az SMM részei, viszont két-két speciális CUDA magon osztozik két-két compute blokk. Ennek következtében egy SMM-ben összesen négy dupla pontosságra tervezett mag található, ami a teljes lapkára nézve 20 feldolgozót eredményez, és ez a GeForce GTX 750 Ti esetében lényegében 40,8 GFLOPS-os tempót jelent.

A GM107 és a DirectX

A Maxwell architektúra túlságosan nem változik a setup területén. A GM107 esetében az NVIDIA továbbra is egy raszteres és egy úgynevezett PolyMorph részre vágja a hagyományos értelemben vett setup motort. Az előbbi egységből egy található a lapkában, azaz egy raszter motor 5 darab streaming multiprocesszor ellátásáról gondoskodik. Ezt a felállást a vállalat Graphics Processing Clusternek (GPC) szokta nevezni, és ez most sincs másképp. A raszter motor órajelenként 16 pixelt képes feldolgozni, ami természetesen a teljes lapkára nézve is 16 pixelt jelent, és ez tökéletesen egyensúlyban van a 16 blending egységgel is, azaz a friss lapka ezen a ponton kiegyensúlyozott. Mindemellett a GM107 órajelenként egy háromszöget képes feldolgozni.

A streaming multiprocesszorokban található PolyMorph motor továbbra is a geometriával kapcsolatos munkálatokat végzi, és a Keplerben használt rendszerhez képest semmit sem változott a működése. Mivel 5 darab SMM található a GM107-ben, így értelemszerűen ez ugyanennyi PolyMorph motort eredményez.

Extraként említhető, hogy megújul az NVENC nevű hardveres blokk, amit a Kepler vezetett be. Az új rendszer funkcionális szempontból ugyanazt kínálja, azaz a H.264-es videók transzkódolását, illetve kódolását gyorsítja, viszont sokszorosan gyorsabban dolgozik, mint a Keplerben, emellett kevesebb energiát is igényel a működése. Szintén újítás még a Maxwell CG5-ös energiatakarékossági módja, ami enyhe terhelés mellett csökkenti a GPU fogyasztását.

A Maxwell architektúra kapcsán kissé kellemetlen hír, hogy az NVIDIA továbbra is ugyanazokat az API-kat támogatja, amiket a Kepler sorozatú megoldások. Ennek megfelelően az OpenGL 4.4, az OpenCL 1.1, a legújabb CUDA és a C++ AMP kezelése megoldott, ám a DirectX esetében a D3D_FEATURE_LEVEL_11_1 szint támogatása még mindig hiányzik, illetve marad a Tiled Resources funkció TIER_1 szintje. Utóbbi nem akkora gond, hiszen a Tiled Resources eleve csak egy opcionálisan támogatható rendszer, tehát nem része a DirectX fő funkcionalitásának, a D3D_FEATURE_LEVEL_11_1 szint hiánya viszont nehezebben értelmezhető. Ezzel a Maxwell lényegében továbbra is egy DirectX 11-es hardver tudását kínálja.

A fentiek értelmében a Maxwell architektúra mellett, a 2D-s grafika esetén nem működik a Windows 8 Target Independent Rasterization (TIR) funkciója, illetve nincs 16x-os MSAA a 2D-s objektumokra. A 3D-s grafika szempontjából az UAV-k (Unordered Access View) kezelése nem oldható meg a futószalag összes programozható lépcsőjén, valamint elérhetetlen az úgynevezett ortogonális vonal renderelési mód. Annyit megtudtunk, hogy az NVIDIA tervezi, hogy az NVAPI-ban elérhetővé teszik az UAV-k elérhetőségét a futószalag összes programozható lépcsőjén, ami nyilván jó hír, és ez a változtatás a Kepler generációra is érvényes lesz, viszont a felhasználható UAV-k maximális száma marad 8, szemben a D3D_FEATURE_LEVEL_11_1 szint által megkövetelt 64-gyel.

Az előbbi a hiányosságot még nem teljesen értjük, mivel a több használható UAV a modern DirectX API egyik legfontosabb funkciója, főleg annak tudatában, hogy a két új generációs konzol gyakorlatilag végtelen mennyiségű UAV-t kínál a fejlesztők számára. Sajnos minél kevesebb UAV-t támogat az adott hardver, annál kevesebb compute shader effekt futtatható rajta. Jelenleg maximum három-négy compute shaderig mennek el a fejlesztők egy játék PC-s portja esetében, elsősorban azért, mert ezzel be is telik a rendelkezésre álló 8 UAV, tehát az sem lehet mondani, hogy kihasználatlan lenne ez a része az API-nak. A jövőben majd kiderül, hogy ennek hiánya az NVIDIA oldaláról esetlegesen jelent-e problémát a fejlesztőknek, és ha igen, mekkorát.

A referencia GeForce GTX 750 Ti

A GeForce GTX 750 Ti-t első körben az NVIDIA referenciakártyáján keresztül vehettük szemügyre.


[+]

A kártya egészen apró, hosszúsága szinte pontosan megegyezik az x16-os PCI Express aljzatéval. Ahogy az első oldalon említettük, extra tápcsatlakozó nem került fel rá, bár a helye jól láthatóan megvan a NYÁK-on.


A GM107 [+]

A GM107-es kódjelű Maxwell GPU a kártya teljes méretéhez hasonlóan kicsike. Összehasonlítás gyanánt, a GK107 118 mm²-es, míg a GK106 221 mm²-es, így az új GM107 a maga 148 mm²-es területével épp a kettő közé ült be, közelebb a GK107-hez. A konkurencia oldaláról a Bonaire (HD 7790, R7 260X) áll hozzá a legközelebb, mely lapka 160 mm² alapterületű, míg az eggyel nagyobb Pitcairn (HD 7850, R7 265) már 212 mm².


[+]

Memóriából az SK Hynix termékei kerültek fel a NYÁK-ra. Az összesen 2 GB kapacitású, H5GC4H24MFR-T2C jelölésű GDDR5 chipek legfeljebb 6000 MHz-re képesek 1,5 voltos feszültség mellett.


[+]

A kártya hűtése rendkívül egyszerű, bár ennek valószínűleg nincs túl sok jelentősége, hisz az egyes gyártók várhatóan saját megoldásaikat fogják alkalmazni.


[+]

A hátlap sem lett túlbonyolítva, hisz a dual-link DVI-I és dual-link DVI-D port mellett egy mini HDMI található. Ezen három kimenet segítségével legfeljebb három megjelenítőt hajthatunk meg egyazon időben.

ASUS GeForce GTX 750 Ti OC

A GTX 750 Ti-t néhány gyártó tálalásában is megnéztük, melyek közül elsőként az ASUS-t vettük górcső alá.


[+]

A GTX750TI-OC-2GD5 modellszámozású kártya doboza a megszokott dizájnt kapta, melyen az "OC" jelölés árulkodik arról, hogy túlhajtott modellel állunk szemben. A kártyán és a leíráson, illetve a driver lemezen felül semmi egyebet nem találtunk a csomagolásban.


[+]

Az ASUS megoldásáról elsőre a korábban tesztelt 2 GB-os HD 7770 jutott az eszünkbe, már ami a hűtőt illeti.


[+]

A körülbelül 2,5 centiméter magas alumíniumbordán egy műanyagkeretben kapott helyet a két légkavaró. A két Everflow márkájú ventilátor 8 centiméteres átmérővel rendelkezik.


[+]

A csupasz NYÁK-nak nem sok köze van az előző oldalon bemutatott referenciához. Ami először feltűnhet, az a 6 tűs tápcsatlakozó, mely ráadásul elég rendhagyó helyre, a kártya elejébe került. Ez valószínűleg a gyári tuning miatt kapott helyet, mely a GPU-t érinti. Az alapórajelre 52 MHz-et pakoltak (1020->1072) a mérnökök, míg a turbóra 65-öt (1085->1150).


[+]

A 2 GB GDDR5-ös memória ebben az esetben a Samsung műhelyéből származik. A K4G41325FC-HC03 típusjelölésű egységek a gyári specifikáció alapján effektív 6000 MHz-re képesek, de ezt az ASUS nem használta ki, így ebben az esetben maradt az 5400 MHz-es NVIDIA referencia.


[+]

A kártya hátlapjára összesen négy kimenet került: a dual-link DVI-I és DVI-D port mellett egy HDMI és egy analóg D-Sub is helyet kapott.

EVGA GeForce GTX 750 Ti FTW

A második modell az EVGA műheléyből landolt szerkesztőségünkben.


[+]

A GTX 750 Ti FTW dobozában a kártya mellett egy DVI->D-Sub fordítót és egy MOLEX->PCIe tápátalakítót találtunk, melyek mellett még leírásokat, matricát, és driver lemezt is láthattunk.


[+]

Az EVGA megoldása is két légkavaróval operál; ezt a rendszert ACX-nek (Active Cooling Xtreme) hívják házon belül.


[+]

A kártya hűtésének bordázata sűrűn lamellált, amihez két réz hőcső vezeti a hőt. A hűtés aljából kilógó fekete, csupán két tűs csatlakozóból kiindulva a ventilátorok fordulatszáma nem monitorozható.


[+]

Az EVGA is teljesen egyedi NYÁK-ot tervezett, melyre az ASUS-éhoz hasonlóan felkerült az extra tápcsatlakozó is. Az "FTW" jelölésből fakadóan a tuning sem maradt el. A GPU egy viszonylag nagymértékű túlhajtásban részesült, ugyanis az alapórajelen 169 MHZ-et (1020-1189), míg a turbón 183 MHz-et (1085->1268) emelt az EVGA, ami gyári tuninghoz mérten igencsak megsüvegelendő ugrás.


[+]

A memória megegyezik az ASUS kártyáján látottal. A K4G41325FC-HC03 típusjelölésű egységek a gyári specifikáció alapján ebben az esetben is 6000 MHz-re lennének képesek, de ennek ellenére itt is maradt az 5400 MHz-es NVIDIA referencia órajel.


[+]

A különféle hátlapi kimeneteket tekintve az EVGA jó egyensúlyt lőtt be, hisz a dual-link DVI mellé még egy HDMI és egy DisplayPort került, így a vásárló mindhárom, napjainkban népszerű csatolóból kap egyet.

MSI GTX 750 Ti Twin Frozr Gaming

Végül, de nem utolsósorban az MSI megoldása következik. Az MSI GTX 750 Ti a tavaly tavasszal elrajtolt, kifejezetten játékosoknak szánt új "GAMING" sorozat tagjai közé sorakozik be.


[+]

A dobozról már látszik, hogy ez a kártya is a Twin Frozr hűtést alkalmazza, illetve hogy itt is egy gyárilag tuningolt, "OC" kiadásról van szó. A kártya mellé nem túl sok tartozékot mellékelt az MSI, így itt is be kell érnünk a szokásos leírással és driver lemezzel.


[+]

Az MSI GTX 750 Ti GAMING a negyedik generációs Twin Frozr hűtést kapta a nyakába, melynek két légkavarója darabonként 9,5 centiméter átmérőjű.


[+]

A sűrűn lamellált borda két darab, a GPU felületével közvetlenül érintkező réz hőcső közreműködésével próbálja segíteni a GPU-ról érkező hőmennyiség minél gyorsabb és egyenletesebb elosztását.


[+]

A matt NYÁK meglehetősen hosszúra sikerült, és az előző két gyártói megoldással ellentétben csak a 6 tűs PCIe tápcsatlakozó helyét tartalmazza, így itt a referenciához hasonlóan nincs szükségünk extra áramellátásra. Ennek ellenére nem maradt el a tuning, hisz a GPU alapórajelére 65 MHz-et (1020->1085) pakolt az MSI, míg a turbóra 78 MHz-et (1085->1163), ami kicsivel több, mint az ASUS kártyájánál látott emelés.


[+]

A memória teljesen megegyezik az előző két megoldáséval. A Samsung K4G41325FC-HC03 típusjelölésű egységei az NVIDIA gyári specifikációinak megfelelően 5400 MHz-en ketyegnek.


[+]

A kártya végében egy kapcsoló található, mellyel két BIOS chip között válthatunk. Az egyik állás a klasszikus BIOS-t aktiválja, míg a másik az úgynevezett Hybrid BIOS-t, mely UEFI-kompatibilitást biztosít. Hátlapi csatolókból három került fel az MSI megoldására: dual-link DVI-D, D-Sub és HDMI.

Tesztkonfig, fogyasztás, tuning, specifikációk

Tesztkörnyezet
Videokártyák NVIDIA GeForce GTX 750 Ti 2048 MB (Geforce driver 334.69)
ASUS GeForce GTX 750 Ti OC 2048 MB (Geforce driver 334.69)
EVGA GeForce GTX 750 Ti FTW 2048 MB (Geforce driver 334.69)
MSI GTX 750 Ti Twin Gaming 2048 MB (Geforce driver 334.69)
NVIDIA GeForce GTX 760 2048 MB (Geforce driver 334.69)
ASUS GeForce GTX 660 2048 MB (Geforce driver 334.69)
NVIDIA GeForce GTX 650 Ti BOOST 2048 MB (Geforce driver 334.69)
ASUS GeForce GTX 650 1024 MB (Geforce driver 334.69)
Sapphire Radeon R7 270 2048 MB (Catalyst 14.1 Beta)
Sapphire Radeon HD 7850 2048 MB (Catalyst 14.1 Beta)
AMD Radeon R7 260X 2048 MB (Catalyst 14.1 Beta)
Processzor Core i7-3770K (3,60 GHz) – túlhajtva 4,3 GHz-en
EIST / C1E / C-state kikapcsolva; Turbo Boost kikapcsolva
Alaplap MSI Z77 MPOWER (BIOS: V17.5) – Intel Z77 chipset
AHCI driver: Intel 11.5.0.1207
Memória

G.Skill RipjawsX 16 GB (4 x 4 GB) DDR3-1866 F3-14900CL9Q-16GBXL

Háttértárak Intel SSD 320 160 GB SSDSA2CW160G310 (SATA 3 Gbps)
Seagate Barracuda 7200.12 500 GB (SATA, 7200 rpm, 16 MB cache)
Tápegység Seasonic Platinum Fanless 520 – 520 watt
Monitor Samsung Syncmaster 305T Plus (30")
Operációs rendszer Windows 8.1 64 bit

Tesztünkhöz Intel Core i7-3770K processzorunk órajelét egy egészséges tuning keretein belül 4,3 GHz-re emeltük, ami mellé a 16 GB G.Skill márkájú memóriánk üzemi órajelét 1866 MHz-re srófoltuk fel. Ami a meghajtóprogramokat illeti, a Radeon kártyákat az AMD-től kapott 13.11-es beta driverrel teszteltük, míg a GeForce kártyák a 331.40-es beta driverrel zakatoltak tesztjeink alatt.

A játékokat a tesztben szereplő kártyákban lapuló számítási teljesítmény miatt 1680x1050-es és 1920x1200-as felbontásban teszteltük. A képminőséget játéktól függően közepes vagy maximálishoz közelire állítottuk. Az AMD és az NVIDIA meghajtóprogramjaiban mindent alapértelmezett beállításokon hagytunk, az anizotropikus szűrést, illetve az élsimítást pedig mindig az adott játékban aktiváltuk.

Játékok

  • Battlefield 4 (DirectX 11) – motor: Frostbite 3 / műfaj: FPS
  • Batman: Arkham Origins (DirectX 11) – motor: Unreal Engine 3 / műfaj: TPS
  • Company of Heroes 2 (DirectX 11) – motor: Essence Engine 3.0 / műfaj: stratégia
  • Crysis 3 (DirectX 11) – motor: CryEngine 3 / műfaj: FPS
  • GRID 2 (DirectX 11) – motor: EGO Engine 3.0 / műfaj: autóverseny
  • Hitman: Absolution (DirectX 11) – motor: Glacier 2 / műfaj: TPS
  • Metro: Last Light (DirectX 11) – motor: 4A Engine / műfaj: FPS
  • Sleeping Dogs (DirectX 11) – motor: United Front Engine / műfaj: TPS/akció
  • Tomb Raider (DirectX 11) – motor: Crystal Engine / műfaj: TPS/kaland

A mérésekhez használt játékok palettáját az új kártyák tiszteletére most is megváltoztattuk kissé. Továbbra is fontosnak tartjuk, hogy viszonylag naprakész és/vagy népszerű címeket alkalmazzunk, ezért az elődőt a Battlefield 4 váltotta, a Bioshock helyét a Batman: Arkham Origins vette át, míg a DiRT Showdown-t a GRID 2-re cseréltük le, illetve már a Metro-ból is az újabb rész került a pakkba.

A könnyebb és pontosabb mérés, valamint összevetés érdekében a Sleeping Dogsnál a benchmark toolt használtuk, ahogyan a Batman, Metro, GRID 2, Hitman: Absolution, valamint Company of Heroes 2 és Tomb Raider esetében is. A Battlefield 4-nél az első küldetés víz alatti perceit mértük le FRAPS-szel, míg a Crysis 3-nál a Canyon nevű pálya elején található demó jellegű részt mértük.

A grafikonokat a minimum képkockák értékei alapján rendeztük csökkenő sorrendbe, ahol a mindenkori nagyobbik felbontás az elsődeleges szempont.

A fogyasztást konnektorba dugható, digitális VOLTCRAFT Energy Logger 4000 készülékkel vizsgáltuk. A grafikonon az egyes videokártyákkal kiegészített rendszerek fogyasztása látható alaplappal, processzorral, táppal és a többi alkatrésszel együtt, de természetesen a monitor nélkül. A méréseket a Metro 2033 benchmarkja alatt végeztük, mely 1920x1200-as felbontásban került lefuttatásra. Játékkal terhelt mérés közben meglehetősen sűrűn és gyorsan ingadozik a fogyasztás, ezért ide egy olyan értéket próbáltunk regisztrálni, mely a legtöbbször villant fel az eszköz kijelzőjén, vagyis nem a csúcsértéket jegyeztük fel. Az újabb játékok bekerülése mellett még egy kisebb változás, hogy mostantól a hardveres DXVA dekódolás alatti fogyasztást is regisztráljuk, és az így összegyűjtött eredmények bekerülnek a szokásos grafikonba.

Mérésünk alapján referencia GTX 750 Ti terhelés alatt 12 wattal fogyaszt többet a GTX 650-nél, míg a gyártók egyes modelljei ezt 6-11 wattal múlják felül. A többi kártya eredményét elnézve ez egy igen kedvező eredmény. Érdekes még megfigyelni, hogy a GeForce kártyák mennyivel kevesebbet fogyasztanak a Radeonoknál DXVA gyorsítás mellett.


ref. – ASUS – EVGA – MSI [+]

A hűtés teljesítményének vizsgálatát egy nagyjából 20 °C hőmérsékletű helyiségben végeztük, miközben a konfiguráció az asztalon volt összeállítva. Az NVIDIA referencia megoldása a kis méretű hűtő ellenére meglepően hűvösen tudta tartani a GPU-t, miközben a hangzavar elmaradt. Az ASUS megoldása nagyon csendes volt üresjáratban, és terhelés mellett is csak kismértékben emelkedett a zaj. Az EVGA kártyája ugyan hűvös volt, de cserébe mind ürasjáratban, mind pedig terhelve hangos volt. A grafikonon jól látható, hogy semmiféle ventilátorvezérlést nem alkalmaz a kártya, ami így 2014 elején kissé érthetetlen. A négy modell közül az MSI volt a legcsendesebb, miközben a hőmérséklet is egy egészséges szinten mozgott, így hűtés szempontjából ez a kártya volt a nyerő.

Végül természetesen a GM107 túlhajtási lehetőségeire is vetettünk egy pillantást, amit a rendelkezésünkre álló idő szűkössége miatt a referencia kártyával tudunk szemléltetni. Ahogy korábbi cikkeinkben már említettük, a Kepler bevezetésével némiképp változott a tuning, hisz az NVIDIA turbója, a GPU Boost megjelent a színen. Azt már tudjuk, hogy a Boostot nem lehet kikapcsolni, így az a túlhajtás során is jelen van. Első körben a fogyasztási limitet próbáltuk kitolni, amit az EVGA PrecisionX nem engedett, így maradtunk 100%-on. A GPU célhőmérsékletét maximumra emeltük, ami számszerűen 95 Celsius-fokot jelentett. Ezen módosítások segítségével végül a szoftverrel kihozható maximális, 135 MHz-nyi pluszt tudtunk a GPU órajelére rápakolni, amivel az alapórajel 1155 MHz lett, míg a Boost 1220 MHz. Végül a GDDR5-ös chipekre került a sor, melyek üzemi frekvenciáját 300 MHz-cel sikerült túlhúzni.

VGA megnevezése GeForce
GTX 750 Ti
GeForce
GTX 650 Ti BOOST
GeForce
GTX 650 Ti
GeForce
GTX 660
Radeon
R7 260X
Radeon
HD 7850
Kódnév GM107 GK106 Bonaire XT Pitcairn Pro
Gyártástechnológia 28 nm (TSMC)
Mikroarchitektúra Maxwell Kepler GCN
Tranzisztorok száma 1,87 milliárd 2,54 milliárd 2,08 milliárd 2,8 milliárd
GPU lapka mérete 148 mm2 221 mm2 160 mm2 212 mm2
GPU/Shader v. Turbo órajele 1020 MHz
T: 1085 MHz
980 MHz
T: 1033 MHz
925 MHz 980 MHz
T: 1033 MHz
1100 MHz 860 MHz
GPU/shader órajele üresjáratban 324 MHz 300 MHz
Shader processzorok típusa stream multiprecíziós vektor
Számolóegységek száma 640 768 960 896 1024
Textúrázók száma 40 textúracímző
és -szűrő
64 textúracímző
és -szűrő
80 textúracímző
és -szűrő
56 textúracímző
és -szűrő
64 textúracímző
és -szűrő
ROP egységek száma 4 blokk (16) 6 blokk (24) 4 blokk (16) 6 blokk (24) 4 blokk (16) 8 blokk (32)
Memória mérete 2048 MB 1024 MB 2048 MB 2048 MB 2048/1024 MB
Memóriavezérlő 128 bites crossbar 192 bites crossbar 128 bites crossbar 192 bites crossbar 128 bites hubvezérelt 256 bites hubvezérelt
Memória órajele terhelve 1350 MHz (GDDR5) 1502 MHz (GDDR5) 1350 MHz (GDDR5) 1502 MHz (GDDR5) 1625 MHz (GDDR5) 1200 MHz (GDDR5)
Üresjáratban 162 MHz 150 MHz
Max. memória-sávszélesség 86 400 MB/s 144 200 MB/s 86 400 MB/s 144 200 MB/s 104 000 MB/s 153 600 MB/s
Támogatott DirectX 11 11.2
Dedikált HD transzkódoló NVENC VCE
HD képi anyagok lejátszásának hardveres támogatása Purevideo HD (VP4) AVIVO HD (UVD 3)
Hivatalos TDP 60 watt 140 watt 110 watt 140 watt 115 watt 130 watt

Sleeping Dogs, GRID 2, Company of Heroes 2

Sleeping Dogs alatt a referencia GTX 750 Ti nem sokkal maradt le a GTX 650 Ti BOOST-tól, ami a gyárilag túlhajtott modellek már túl is tudtak szárnyalni. A GRID 2 esetében az R7 260X eredményét hozta az NVIDIA kártyája, míg a gyári tunigosok már a HD 7850-et is átlépték. A Company of Heroes 2 alatt a 2 MB-os L2 gyorsítótár sokat segített, ugyanis itt már a referencia megoldás is lenyomja a GTX 650 Ti BOOST-ot, míg az EVGA megoldása már a GTX 660-at ostromolja.

Metro: Last Light, Crysis 3, Hitman: Absolution

Metro alatt jól muzsikált az új GeForce, hisz a GTX 650 Ti BOOST eredménye meglett, az EVGA erősen húzott modellje pedig ismét a GTX 660 szintjén mozgott. Crysis 3 alatt ugyan elhúzott a 650 Ti BOOST, viszont jó hír, hogy a HD 7850-et beérte az NVIDIA referencia kártyája. Hitman alatt fordult a kocka, hisz a BOOST-ot sikerült legyűrni, de a HD 7850 kissé ellépett, amit csak a tuningolt EVGA tudott befogni.

Batman, Battlefield 4, Tomb Raider

A Batman alatt nem tündökölt kifejezetten a GTX 750 Ti. Az R7 260X-et sikerült megelőznie, viszont a HD 7850-től már egy kicsit lemaradt. A Battlefield 4 esetében az utóbbihoz hasonló képet láthattunk, akárcsak a Tomb Raidernél.

ComputeMark, LuxMark

Az GPU-k általános számítási feladatokra való használatának népszerűsödésével két, ezen képességet vizsgáló benchmark is bekerült méréseink közé. Mivel félig-meddig szintetikus tesztekről van szó, így messzemenő következtetéseket nem érdemes levonni ezek eredményeiből.

A ComputeMark egyszerűbb DirectCompute shaderekkel operál, melyekkel főleg a játékok alatt lehet találkozni. A Luxmark az egyik legelterjedtebb benchmark a ray-tracing tesztelésére. A Maxwell ezen a ponton viszonylag sokat lépett előre a Keplerhez képest, így a GTX 750 Ti már a GTX 660 eredményét is felül tudta múlni.

Összegzés

Az összesítés alapján a referencia GeForce GTX 750 Ti körülbelül 3-5%-kal gyorsabb a Radeon R7 260X-nél, és nagyjából 9%-kal marad le a HD 7850-től. Utóbbit az EVGA gyárilag alaposan tuningolt modellje csak éppen hogy nem éri utol.

Ahogy cikkünk elején elmondtuk, az NVIDIA kiemelt szempontként kezeli a teljesítmény/fogyasztás mutatót, ami szépen vissza is tükröződik a számokon. Jelen állás szerint a GM107 kódjelű GPU rendelkezik a legjobb eredménnyel ezen a téren, ráadásul mindezt úgy képes elérni, hogy a többiekhez hasonló gyártástechnológiát alkalmaz.

A Maxwell első, középkategóriás tagja tehát megérkezett, ami egy megújult architektúrát hozott el egy már lassan 2 éve alkalmazott, 28 nm-es gyártástechnológián. Az NVIDIA a hatékonyságra gyúrt, amit az eredmények alá is támasztanak, hisz a kis lapka mellé igen alacsony fogyasztás társul, és ezt figyelembe véve a számítási teljesítményre sem lehet panasz, sőt. Ugyan forradalmi újításokat egyelőre nem láthattunk, de ezek nem is feltétlenül szükségesek egy jó termékhez, illetve a nagyobb, 20 nm-es lapkák még hátra vannak.


[+]

Ebben az árkategóriában kiemelten fontos az árazás. Az NVIDIA a 2 GB-os GeForce GTX 750 Ti-re 44 000 forintos kezdőárat szabott meg. Természetesen ez csak egy ajánlott ár, amit a partnerek kiszereléstől és konfigurálástól függően változtathatnak. Ennek megfelelően az általunk tesztelt ASUS kártya 48 490 forintos ajánlott árral kerül fel a boltok polcaira, melyet figyelembe véve mi most a tetszett kategóriába soroljuk. Az EVGA kártyája tisztességes gyári tuiningot kapott, amivel már alig marad le a HD 7850-től, de az összképet rontja a hiányzó ventilátorvezérlés, illetve az 50 000 forint körüli ár, így ez a megoldás is a tetszett kalapba kerül. Az MSI hűtése remek, a gyári tuning mértéke is kellemes, extra tápcsatlakozó sem szükséges hozzá, ám ennek ellenére ára nem múlja sokkal felül az NVIDIA ajánlását, így a 46 750 forintos GTX 750 Ti Twin Frozr Gaming részünkről egy ajánlott termék.

NVIDIA GeForce GTX 750 Ti
MSI GTX 750 Ti Twin Frozr Gaming VGA
ASUS GeForce GTX 750 Ti OC VGA
EVGA GeForce GTX 750 Ti FTW VGA

Oliverda és Abu85

A NVIDIA GeForce GTX 750 Ti-t az NVIDIA biztosította, az ASUS GeForce GTX 750 Ti videokártyát az ASUS-tól, az EVGA GeForce GTX 750 Ti FTW videokártyát az EVGA-tól, az MSI GTX 750 Ti Gaming videokártyát pedig az MSI-től kaptuk kölcsön.

Azóta történt

Előzmények

Hirdetés