Hirdetés
A multiprocesszorokon túli felépítés
A Turing architektúra a strukturális felépítést tekintve túlságosan nem változott a setup területén, így az NVIDIA továbbra is egy raszteres és egy úgynevezett PolyMorph részre vágja a hagyományos értelemben vett setup motort. Az előbbi egységből három található a TU106-ban, és hat-hat a TU104-ben és TU102-ben. Egy raszter motor egyébként maximum hat darab Texture Processor Cluster (TPC) ellátásáról gondoskodik. Ezt a felállást a vállalat Graphics Processing Clusternek (GPC) szokta nevezni, és ez most sincs másképp. A raszter motor órajelenként 16 pixelt képes feldolgozni, ami a TU102 esetében a teljes lapkára nézve 96 pixelt jelent, amely adat egyensúlyban vannak a 96 blending egységgel is, azaz a friss fejlesztés ezen a ponton kiegyensúlyozott. A TU104 esetében is 96 pixellel kell számolni, de ehhez csak 64 blending egység tartozik, vagyis a rendszer ezeket túleteti. Mondjuk ez még mindig jobb opció a TU106-hoz képest, ahol viszont már 48 pixel jut 64 blendingre, azaz ez a konfiguráció kvázi éhezni fog. Mindezek mellett a TU102, a TU104 és a TU106 órajelenként rendre hat, hat és három háromszöget képes feldolgozni.
A TPC-kben található PolyMorph motor továbbra is a geometriával kapcsolatos munkálatokat végzi, és a korábbi rendszerekhez képest semmit sem változott a működése. Mivel a TU102-ben, a TU104-ben és a TU106-ban rendre 36, 24 és 18 TPC található, így értelemszerűen ez ugyanennyi PolyMorph motort eredményez.
A megosztott L2 gyorsítótár szempontjából a TU102 6, míg a TU104 és TU106 4-4 MB-nyi kapacitást kap. Emellett a GDDR6-os szabványú memóriákat támogató memóriavezérlő szempontjából az NVIDIA maradt a crossbarnál. A TU102 384, míg a TU104 és a TU106 256 bites szélességű buszt használ, ami 32 bites csatornákra van szétosztva. Egy ilyenhez egy ROP-blokk tartozik, amelyen belül 8 bleding és 32 Z mintavételező egység található.
Ezek így leírva bonyolultnak tűnhetnek, így az új lapkák elméleti kiépítését az alábbi táblázatban vázoljuk fel:
Típus | TU102 |
TU104 | TU106 |
---|---|---|---|
GPC-k száma |
6 |
6 |
3 |
TPC-k száma |
36 |
24 | 18 |
PolyMorph motorok száma |
36 | 24 | 18 |
Rasztermotorok száma |
6 | 6 | 3 |
Blending egységek száma |
96 | 64 | 64 |
Z mintavételező egységek száma |
384 | 256 | 256 |
FP32 magok száma |
4608 | 3072 | 2304 |
INT32 magok száma |
4608 | 3072 | 2304 |
Tensor magok száma |
576 |
384 | 288 |
Textúrázók száma | 288 | 192 | 144 |
RT részelemek száma |
72 | 48 | 36 |
Memóriabusz szélessége |
384 bit |
256 bit |
256 bit |
A friss lapkák közül a TU102 és a TU104 rendelkezik még NVLINK interfésszel is, míg a TU106-ból ez kimaradt. Mivel a korábbi SLI csatlakozót az NVIDIA kivégezte, így két TU106 már nem is köthető össze SLI-be. Ettől még lehet használni két ilyen GPU-t, de ahhoz DirectX 12 és Vulkan API-n futó alkalmazás kell, amelyeknél a több GPU-s támogatása alkalmazásfüggő, így nincs igény a gyártók zárt interfészeinek alkalmazására, hiszen a kommunikáció aszinkron DMA-n keresztül valósulhat meg.
Az NVLINK-et egyébként az NVIDIA nem használja olyan formában, amilyenre egyébként eredetileg fejlesztették, szimplán a korábbi, SLI-hez írt szoftverkörnyezetet portolták rá, vagyis effektíve ez az összeköttetés nem igazán több a korábbi megoldásnál. Lehetőség amúgy lenne benne, elvégre memóriakoherens interfészről beszélünk, de valószínűleg az NVIDIA nem különösebben akar erre pénzt áldozni, hiszen a DirectX 12 és Vulkan API-n belül az aszinkron DMA-n keresztüli kommunikáció van definiálva, ami úgyis a PCI Express interfészen keresztül zajlik.
A cikk még nem ért véget, kérlek, lapozz!