GeForce GTX TITAN X: benne megvan az X!

A Maxwell nagyon nagyban

A Titan X természetesen a Maxwell architektúra második generációs dizájnját használja, amely tartalmaz érdekességeket, bár ezt a Titan termékcsalád iránt érdeklődő réteg jellemzően negatívan fogja fel – de ne rohanjunk ennyire előre. Az új GM200-as kódnevű lapka megmaradt a 28 nm-es gyártástechnológián, és a 8 milliárd tranzisztorból felépülő, 601 mm²-es chipbe 24 darab streaming multiprocesszort sikerült beépíteni, amit az NVIDIA a Maxwell esetében már SMM-nek, azaz Maxwell streaming multiprocesszornak hív.


[+]

A streaming multiprocesszorok felépítése semmit sem változott a GM204-ben és a GM206-ban megismert megoldáshoz képest, ennek köszönhetően az SMM esetében megismételhetnénk mindazt, amit a GM204-ről leírtunk az alábbi oldalon. A linkelt cikkben részleteztük az architektúra működését, így most inkább a változásokra koncentrálunk.

Bár memóriahierarchia szempontjából a GM200 nem módosult, de a lapka már 3 MB kapacitású megosztott L2 gyorsítótárat tartalmaz, amit mindegyik streaming multiprocesszor elérhet, és a CUDA magok írhatnak is bele. Ennek egy része most is a mozaikos optimalizálást segíti, amolyan lapkán belüli dedikált memóriaként. Memóriavezérlő tekintetében az NVIDIA továbbra is maradt a crossbarnál. A GM200 384 bites szélességű buszt használ, ami három, 64 bites csatornára van szétosztva. Egy-egy csatornához egy ROP-blokk tartozik, ami összesen 96 blending és 384 Z mintavételező egységet eredményez.


[+]

A GM200 dupla pontosság tekintetében másolja a GM204 és a GM206 dedikált egységeket bevető megoldását. Ez a Titan X egyik érdekessége, ugyanis az NVIDIA ezt a kategóriát azért hozta létre, hogy megfizethető áron (a professzionális megoldásokhoz viszonyítva a kicsivel 1000 dollár feletti árcédula annak számít) is lehessen dupla pontosságra tervezett GeForce VGA-kat vásárolni, de a GM200 esetében a dupla pontossággal elérhető elméleti számítási tempó a szimpla pontosság mellett felmutatott elméleti sebesség 32-ed része lesz, ami jóval gyengébb eredmény bármelyik korábbi Titan VGA-nál.

A setup területén sem módosult a GM200, így az NVIDIA továbbra is egy raszteres és egy úgynevezett PolyMorph részre vágja a hagyományos értelemben vett setup motort. Az előbbi egységből hat található a lapkában, azaz egy raszter motor négy darab streaming multiprocesszor ellátásáról gondoskodik. Ezt a felállást a vállalat Graphics Processing Clusternek (GPC) szokta nevezni, és ez most sincs másképp. A raszter motor órajelenként 16 pixelt képes feldolgozni, ami természetesen a teljes lapkára nézve 96 pixelt jelent, és ez tökéletesen egyensúlyban van a 96 blending egységgel is, azaz a friss lapka ezen a ponton kiegyensúlyozott. Mindemellett a GM200 órajelenként hat háromszöget képes feldolgozni.

Multimédiás szempontból a GM200 a GM206-zal egyezik, így megkapja a frissített NVENC nevű hardveres blokkot, amely a H.264-es videók transzkódolása mellett a HEVC-vel is megbirkózik.


[+]

A GM200 esetében érdemes megjegyezni, hogy az NVIDIA ezeket az óriási lapkákat jellemzően a Tesla termékcsaládhoz tervezte a múltban, de a Maxwell architektúrára esetében ez megváltozott, mivel az ultramobil piac került a fókuszba. A GM200 a HPC szerverek területén sok esetben versenyképtelen is lenne, éppen ezért a GeForce GTX Titan X egy olyan fejlesztés, amelyet az NVIDIA bizonyos HPC munkafolyamatokhoz is ajánl, mivel GM200-as Tesla VGA előreláthatólag úgy sem lesz. Persze a fókuszt itt a gépi tanulás kapja, ahol a rendkívül gyenge dupla pontosság melletti teljesítmény nem számít, mivel más területre sokkal jobb hardvereket is lehet vásárolni, akár házon belül is.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

Előzmények

Hirdetés