Az NVIDIA GeForce GTX 960 tesztje

GM204 / 2 = GM206?

Ahogy az várható volt, eljött a Maxwell architektúra harmadik nekifutása, amikor is az NVIDIA a játékosok többsége szempontjából a legfontosabbnak tartott felső-középkategóriát célozta meg. Ehhez a vállalat egy új lapkát is tervezett, amely a GM206 névre hallgat. Ha nagyon le akarjuk egyszerűsíteni a történteket, akkor azt is írhatnánk, hogy a korábban megjelent GM204 megfelezéséről beszélünk, de ez nem vallana ránk, így részletesen kifejtjük, hogy mi is található az új fejlesztésben.

Nem meglepetés, hogy megmaradt a 28 nm-es gyártástechnológia, így a 2,94 milliárd tranzisztorból felépülő, 227 mm2 kiterjedésű chipbe 8 darab streaming multiprocesszort sikerült beépíteni, amit az NVIDIA a Maxwell esetében SMM-nek, azaz Maxwell streaming multiprocesszornak hív.


A GM206 [+]

A streaming multiprocesszorok felépítése semmit sem változott a GM204-ben ismert megoldáshoz képest. Ennek köszönhetően az SMM esetében megismételhetnénk mindazt, amit a GM204-ről leírtunk az alábbi oldalon. Ezt nem tesszük meg újból, hiszen a linkelt cikk elolvasása után egyértelművé válik az architektúra működése, így inkább a változásokra koncentrálunk.

Bár memóriahierarchia szempontjából a GM206 nem módosult, de a lapka már csak 1 MB kapacitású megosztott L2 gyorsítótárat tartalmaz, amit mindegyik streaming multiprocesszor elérhet, és a CUDA magok írhatnak is bele. Ennek egy része most is a mozaikos optimalizálást segíti, amolyan lapkán belüli dedikált memóriaként. A változás itt a GM107 és a GM204 lapkákhoz viszonyítva jelentős, hiszen mindkét korábbi megoldás 2 MB-os L2 gyorsítótárral rendelkezett. Igazából a GPU-knál a nagy L2 gyorsítótár nem számít annyit, és az NVIDIA a gyakorlatban is kipróbálta, vagyis a GM206 tervezésénél inkább a spórolásra helyezték a hangsúlyt, hogy minél olcsóbban gyártható lapka születhessen.

Memóriavezérlő tekintetében az NVIDIA továbbra is maradt a crossbarnál. Itt jön azonban az első érdekesség, hiszen a GM206 128 bites szélességű buszt használ, ami két, 64 bites csatornára van szétosztva. Egy-egy csatornához egy ROP-blokk tartozik, ami 32 blending és 128 Z mintavételező egységet eredményez. Igazából ez a termék gyenge pontja, hiszen ebben a kategóriában már általános volt régebben is a 200 GB/s-hoz körüli memória-sávszélesség, de a GM206-os lapkára épülő GeForce GTX 960 számára 112 GB/s áll rendelkezésre. Ugyanakkor az NVIDIA a terméket hivatalosan maximum Full HD-s felbontásra ajánlja, tehát itt is inkább a spórolást helyezték előtérbe a mérnökök, mivel a 128 bites busszal a nyomtatott áramköri lap és a tokozás jóval olcsóbb lehet.


Az SMM teljes vázlata [+]

A GM206 a dupla pontosság tekintetében lemásolja a GM204 dedikált egységeket bevető megoldását. Ez azt jelenti, hogy a dupla pontossággal elérhető elméleti számítási tempó a szimpla pontosság mellett felmutatott elméleti sebesség 32-ed része lesz.

A setup területén sem módosult a GM206, így az NVIDIA továbbra is egy raszteres és egy úgynevezett PolyMorph részre vágja a hagyományos értelemben vett setup motort. Az előbbi egységből négy található a lapkában, azaz egy raszter motor négy darab streaming multiprocesszor ellátásáról gondoskodik. Ezt a felállást a vállalat Graphics Processing Clusternek (GPC) szokta nevezni, és ez most sincs másképp. A raszter motor órajelenként 16 pixelt képes feldolgozni, ami természetesen a teljes lapkára nézve 32 pixelt jelent, és ez tökéletesen egyensúlyban van a 32 blending egységgel is, azaz a friss lapka ezen a ponton kiegyensúlyozott. Mindemellett a GM206 órajelenként két háromszöget képes feldolgozni.

Multimédiás szempontból azonban van előrelépés. A GM206 természetesen megkapja a GM204 által használt NVENC nevű hardveres blokkot, amely a H.264-es videók transzkódolása mellett a HEVC-vel is megbirkózik. Utóbbi formátumot ugyanakkor a GM204 még GPGPU-s alapokon dekódolta, de a GM206 már kapott erre a feladatra is egy fixfunkciós hardvert. Persze a GPGPU-s opció továbbra is elérhető a GeForce GTX 960-hoz is, mivel ezzel a feladattal a GM204-hez hasonlóan a GM206-os lapka is megbirkózik, de a dedikált hardveres blokk kisebb fogyasztás mellett elvégzi a munkát.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

Előzmények

Hirdetés