2019. július 21., vasárnap

Útvonal

Tesztek » Videokártya rovat

AMD RX 5700 és 5700 XT: navigáció felfelé

Vajon mire elég az új architektúra és a korábban már bizonyított, 7 nm-es gyártástechnológia?

Segítség hardverből?

Az AMD-nek az elmúlt években volt ideje elgondolkodni azon, hogy mit kellene módosítani a GPU-k dizájnjain, hogy a fejlesztők munkája egyszerűbb legyen. Tulajdonképpen a nehézséget az okozza, hogy minden grafikus vezérlő egy tipikus működési módra van felkészítve. Például az AMD Vega és az NVIDIA Turing is csak egyféle méretű wave-et támogat, ezeknél ráadásul az egy munkaelemre levetített IPC nem is éri el az 1-et, konkrétan eléggé messze vannak tőle, holott például a GCN előtti legutolsó TeraScale dizájn ilyen paraméterrel rendelkezett, csak ezt a rendszert ugye nehéz volt programozni.

Felmerülhet a kérdés, hogy miért nem állít be az AMD és az NVIDIA inkább 16 lane-ből álló wave-et a Vega és a Turing esetében, amivel elérnék az 1-es értéket az egy munkaelemre levetített IPC tekintetében. Erre igen egyszerű a válasz. Az érintett architektúrákban a multiprocesszorok dizájnja úgy van kialakítva, hogy rendre 64 és 32 lane-nel tudják igazán jól átlapolni a memóriaelérés késleltetését, tehát még ha módosítanák is a hardverek működését, amit valószínűleg meg lehetne tenni, inkább teljesítményt (méghozzá jelentőset) vesztenének a wave méretének csökkentésével, vagyis az egésznek nem lenne semmi értelme.

Az AMD viszont az RDNA architektúrával új alapokra tudta helyezni a magának a multiprocesszornak a kialakítását, vagyis volt lehetőségük arra, hogy a szükséges módosítást elvégezzék a hatékonyság növelése érdekében. Ezt meg is tették, és az új Navi generációban be is mutatkozott az úgynevezett variálható wavefrontméret (vagy wave-méret). Maga a dizájn maradt SIMT, ez a része nem változott, viszont kétféle módon képes mostantól működni. Az egyik az egyszálú teljesítményre és a jobb adatlokalitásra, míg a másik továbbra is a késleltetés átlapolására van optimalizálva. Utóbbi talán nem annyira izgalmas, mert lényegében ugyanazok a hátrányai, amiket nemrég taglaltunk, de az egyszálú teljesítmény és a jobb adatlokalitás furán hangzik egy GPU esetében, viszont van benne ráció.


[+]

Az egyszálú sebességre kitérve ezt nem úgy kell elképzelni, ahogy egy processzornál. Továbbra is adatpárhuzamos a feldolgozás, csak ha mondjuk veszünk a wave-en belül egy lane-t, akkor az operáció időigénye maghatározható. Az AMD Vega és az NVIDIA Turing esetében egy wave rendre négy és kettő ciklusig fut, vagyis egy lane ugyanennyi időn belül ad eredményt. Az AMD Navi azonban képes arra, hogy egy wave-et egy ciklus alatt lefuttasson, vagyis a Vegához képest négyszeres, a Turinghoz képest pedig kétszeres az egy szálra, vagyis egy lane-re levetített teljesítménye. Emellett ez a működési mód azt is lehetővé teszi a Navi esetében, hogy egy wave csak feleannyi erőforrást igényeljen, vagyis a jobb adatlokalitás miatt anélkül nő a találati ablak, hogy erre külön optimalizálni kellene. Mindezek mellett a Navi a legtöbb shadert a Vega architektúrához viszonyítva akár feleannyi órajelciklus alatt végre tudja hajtani, de még a késleltetés átlapolására vonatkozó módban is legalább 40% az előnye, ami eléggé toleránssá teszi a rendszert a divergens kódokkal szemben. Nyilván ezek általános hátrányát az RDNA dizájnja mellett is el kell tűrni, de egyáltalán nem mindegy, hogy mennyi a kötelezően lenyelendő teljesítményveszteség.

Az AMD elmondása szerint az RDNA architektúra esetében kifejezetten figyeltek arra, hogy a modern SIMT dizájnok problémáit levetkőzzék, ezekre ugyanis a cég véleménye alapján tényleg könnyű programozni, de teljesítményt már nehézkes nyerni rajtuk. A Navi felépítése viszont lehetővé teszi, hogy mostantól teljesítményt is könnyebben lehessen szerezni a shader kódok optimalizálása által.


[+]

A variálható wavefrontmérethez kapcsolódó két működési módról egyébként nem a hardver dönt, hanem a grafikus meghajtó fordítója, méghozzá az adott shadert megvizsgálva. Ez az AMD elmondása alapján új technikákat tesz lehetővé a fordító szempontjából. Az elméleti lehetőségek viszont további vizsgálatokat igényelnek, hogy a jövőben esetleg a gyakorlatban is kihasználhatók legyenek.

Az RDNA-ben bevezetett változások egyébként nem azt jelentik, hogy mostantól nem kell majd annyit optimalizálni. A régebbi hardverek továbbra is igénylik a figyelmet, mivel azok abszolút a késleltetés átlapolására vannak kialakítva, tehát amit mondjuk a Navi jobban megold hardverből, az egy korábbi tervezésű grafikus architektúrának nehéz falat lehet.

A cikk még nem ért véget, kérlek, lapozz!

Hirdetés

Előzmények

Gyártók, szolgáltatók

Hirdetés

Copyright © 2000-2019 PROHARDVER Informatikai Kft.