Radeon RX 6800: másodjára fényesebb a Navi

Sokadjára fut neki az AMD a GPU-piac visszahódításának, vajon a „Big Navi” lesz az, amivel ez tényleg sikerül?

A gigantikus gyorsítótár

Az RDNA 2 architektúra vitathatatlanul legnagyobb újítása az első oldalon már említett Infinity Cache. A vállalat elmondta, hogy nagyon régóta vizsgálják annak a lehetőségét, hogy a GPU-k esetében miképpen lehetne a nagyobb kiterjedésű gyorsítótárakat hasznosítani. Ennek a legfőbb oka, hogy a gyártástechnológia továbbra is gyorsabban fejlődik majd, mint a reálisan alkalmazható memóriatechnológiák.

A memória szempontjából az a legnagyobb probléma, hogy ugyan bevethetők különböző szabványok, de mindig kialakul egy uralkodó irány, amire a megrendelések nagyon magasak lesznek, és tulajdonképpen a megnövekedő igények leviszik ezeknek a memóriáknak az árait. Jelen pillanatban a GDDR6 számít itt a legjobb alternatívának, amellett persze, hogy reális opció lehetne a GDDR6X vagy a HBM2 is, de mindkettővel az a gond, hogy relatíve kis mennyiségben gyártják az egyes típusokat, és ez sajnos hatással van az árukra.

Alternatív megközelítés lehet a memóriabusz szélességének a növelése, de ez egyáltalán nem kedvező, mert több memóriát kell használni, és a nyomtatott áramköri lap is bonyolultabb lesz, ezek pedig szintén rossz irányba tolják az előállítási költséget. Kis túlzással semmi sem jó, de a modern gyártástechnológiák már megadják a lehetőséget arra, hogy egységnyi területre igen nagy SRAM kapacitást lehessen tervezni. Itt jön képbe az, hogy mikortól működik optimálisan egy GPU. Ezekben a lapkákban az L2 cache kapacitása átlagosan 4-5 MB, vagyis nem sok, de az adatelérések jellegzetességei miatt így is el lehet érni 10-30% közötti találati arányt, tehát megéri ekkora kapacitást beépíteni. Az AMD ugyanakkor arra a kérdésre kereste a választ, hogy 50% fölötti találati arányhoz mekkora kapacitás kell.


[+]

A cég erre rengeteg szimulációt futtatott az elmúlt években, és a 128 MB-os Infinity Cache tulajdonképpen ezek eredménye. A célt pedig alapvetően teljesítették, hiszen 4K felbontáson, a mai játékokban 58% is lehet a találati arány, vagyis ennyiszer van a kért adat a gyorsítótárban. A felbontás csökkentésével persze a hatásfok nő, de ez megfelel a várt működésnek. A vállalat által megosztott grafikonból látszik, hogy 64 MB-os gyorsítótárral még nagyon jók az eredmények, különösen 4K-nál kisebb felbontáson, és a kisebb GPU-k számára jó hír, hogy Full HD-ben még a 32-48 MB-os kapacitás is jól alkalmazható. Ezek alatt azonban olyan mértékben visszaesik a hatásfok, hogy inkább szélesebb memóriabuszra érdemes költeni.


[+]

Az Infinity Cache gyártástechnológia alapja egyébként a processzorokból származik, a rendszer a Zen CPU chipleteken alkalmazott L3 gyorsítótár módosítása. Itt konkrétan a processzorokon dolgozó mérnökök tervezték meg az RDNA 2 dizájnnak ezt a részét.


[+]

Magának a fejlesztésnek számos célja volt. A legfőbb szempontnak az számított, hogy 256 bites buszszélesség mellett lehessen hozni a 384 bites memóriabusz teljesítményét, ráadásul úgy, hogy a fogyasztás csökkenjen. Ez teljesült is, aminek igazán majd mobil szinten lesz jelentősége, de persze asztali piacon is fontos az egyes termékek energiaigénye. Járulékos előny, hogy átlagosan 34%-kal csökken a memóriaelérések késleltetése, ami utat nyithat a komplexebb shaderek felé, hiszen mostantól nagyon kevés konkurens wave mellett is jól kihasználható marad egy multiprocesszor.


[+]

Mindezek mellett nagyon fontos volt a gyorsítótár elérhetőségének skálázása is. Az Infinity Cache alapértelmezett memória-sávszélessége 1664 GB/s, de ha igény van rá, akkor ez egészen 2214 GB/s-ig felkúszhat. A hardver így kevésbé megterhelő időszakokban energiát spórol, míg ha igazán szükség van a gyorsítótárra, akkor begyújtja a rakétákat.


[+]

Végül két további szempontból is hasznos a hatalmas gyorsítótár. Az RDNA 2 architektúra támogatni fogja a DirectX 12 Ultimate API a sampler feedback és a DXR (DirectX Raytracing) képességeit.

[+]

A sugárkövetésnél az Infinity Cache képes a BVH gyorsítóstruktúrával kapcsolatos munkafolyamatok nagy részét úgy kiszolgálni, hogy a metszésvizsgálatnál nem szükséges a fedélzeti tárig menni az adatért, jelentősen csökkentve ezzel az ebből eredő késleltetési értékeket. Sampler feedback során pedig a rendszer optimalizálása kifejezetten a memória terhelését csökkenti, ami alapvetően kedvez egy nagy gyorsítótárnak.

A cikk még nem ért véget, kérlek, lapozz!

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés