"Végtelen gyorsítótárra" alapoz az új generációs Radeon

Az AMD erő helyett több ésszel tervezte az RDNA 2-t, így elkezdték kezelni a memória-sávszélesség problémáját.

Az AMD hivatalosan is bejelentette az új generációs Radeon sorozatot, mely a 6000-es számot viseli majd az RX jelölés mögött. Ez a fejlesztés már a korábban sokat emlegetett, új konzolok által is használt RDNA 2 architektúrát használja, amely főleg az energiahatékonyság területén próbál előrelépni az elődhöz képest. Annak ellenére, hogy a gyártástechnológia tekintetében maradt a TSMC 7 nm-es node-ja, a vállalat az RDNA 2-re újabb 50%-os előrelépést ígért, amiből végül 54% lett. Bár ez nem tűnik logikusnak, hiszen sokan a kisebb csíkszélességhez kötik az ekkora ugrások bekövetkezését, valójában ez egy sokkal bonyolultabb kérdés, és legalább annyit lehet nyerni az adott gyártástechnológia megértéséből, illetve optimális kihasználásából, mint amennyit a bevezetése hozhat az előző gyártási eljáráshoz viszonyítva.


[+]

A vállalat az új generációnál arra a tapasztalatra épített, amit az előző 7 nm-es lapkák fejlesztése és gyártása során felhalmozott. Gyakorlatilag mára kiismerték a TSMC eljárását, és egyre hatékonyabban tudják azt használni, ami az energiahatékonyság szempontjából újabb nagy előrelépést hozott. Ebben persze architektúrára vonatkozó tényezők is vannak, de ezek a fejlesztések általánosak a generációváltásoknál.

Az AMD új csúcs-GPU-ja a Navi 21-es kódnevet viseli, és 26,8 milliárd tranzisztorra épít. Mindegyik érkező VGA erre épül, az alábbi táblázat pedig részletezi az ismert paramétereiket is:

AMD Radeon RX 6000 sorozat (RDNA 2 architektúrával)
Típus 6800 6800 XT
6900 XT
GPU kódneve Navi 21
Architektúra RDNA 2
GPU Game/Boost órajel
1815/2105 MHz 2015/2250 MHz 2015/2250 MHz
CU-k száma (WGP-k száma) 60 (30)
72 (36)
80 (40)
Shader részelemek száma 3840 4608 5120
Textúrázó csatornák száma 240
288
320
Blending egységek száma 96 128 128
Pixel kitöltési sebesség 202,1 GPixel/s
288 GPixel/s 288 GPixel/s
Texel kitöltési sebesség 505,2 GTexel/s
648 GTexel/s 720 GTexel/s
Elméleti számítási teljesítmény (FP32) 16,2 TFLOPS 20,7 TFLOPS 23 TFLOPS
Infinity Cache 128 MB
128 MB 128 MB
Infinity Cache sávszélesség 1664 GB/s
1664 GB/s 1664 GB/s
Memóriabusz 256 bit
256 bit 256 bit
Effektív memória-órajel 16 GHz
16 GHz 16 GHz
Memória típusa GDDR6
Memória-sávszélesség 512 GB/s
512 GB/s 512 GB/s
TBP fogyasztás 250 W
300 W
300 W
PCI Express tápcsatlakozók 8+8 tűs 8+8 tűs 8+8 tűs
PCI Express csatoló
x16-os PCI Express 4.0

A kimenetek tekintetében az AMD referenciamodelljein HDMI 2.1, DisplayPort 1.4 és VirtualLink interfészt támogató USB Type-C lesz található. Utóbbi esetében meg kell jegyezni, hogy lényeges hatása van az elméleti maximális fogyasztásra, mivel energiát is közvetíthet a csatlakoztatott eszköz felé. Ez a megadott TBP értékbe bele van számolva, hiszen a VGA szempontjából teljesítményfelvétellel jár.


[+]

Multimédiás szinten újítás lesz az AV1-es formátum támogatása a dekódolás oldalán, illetve az AMD kiemelte, hogy az új VGA-k támogatják a DirectX 12 Ultimate, illetve a DirectStorage API-kat is. Főleg utóbbi miatt van 16 GB VRAM egységesen a termékeken, ugyanis az utóbbi fejlesztés megnöveli a GPU fedélzeti memóriájának terhelését. Amíg eddig a CPU dolgozott ezen, addig a kódolt tartalom a rendszermemóriában volt, mostantól viszont közvetlenül a VRAM-ba kerül, vagyis a kikódolt adatok mellett már ezt is tárolni kell.

Az AMD a bemutatót inkább az egyéb újításoknak szentelte. Ezek közül az egyik az úgynevezett Rage mód. Ezt a meghajtóban lehet bekapcsolni, és ilyenkor a hardver egy alternatív órajelskálázási profilra vált. Ez azért lényeges, mert az érkező VGA-k úgy vannak beállítva, hogy egyensúly legyen a fogyasztás és a leadott teljesítmény között: nincsenek nagyon meghajtva, de nagyon visszafogva sem. Ez ugyan jó energiahatékonyságot kínál, de némi teljesítményt fel kell áldozni érte. A Rage mód aktiválásával az egyensúlyt a teljesítmény felé tolhatja el a felhasználó. Ilyenkor alkalmazástól és a környezettől függően 3-8%-nyi extra tempó nyerhető ki a VGA-kból, de ez az előrelépés százalékosan nagyobb fogyasztástöbblettel jár. Alapvetően tehát a vállalat a felhasználó kezébe adja a választást, így a játékos szabadon eldöntheti, hogy optimális energiahatékonyságot vagy abszolút teljesítményt akar. Technikailag ez nem kifejezetten tuning, bár az AMD így utal rá, viszont maguk az órajelemelési funkciók, köztük az automatikus paraméterezés, továbbra is elérhetőek maradnak, sőt, ezek működnek normál és Rage móddal is, tehát lehet játszani a beállításokkal a megmaradt tartalékokért.

Nagy hangsúlyt kapott az úgynevezett Smart Access Memory funkció, ami bekerül az 500-as sorozatú alaplapok érkező BIOS-ába. Amennyiben a felhasználó Ryzen 5000-es CPU-t, illetve Radeon RX 6000-es VGA-t használ, akkor elérhetővé válik az újítás. Ez a rendszer nem igazán a jelennek készült, ugyanis az AMD a technológiával biztosítja a CPU számára a VRAM teljes elérését. Erre eddig igen limitált formában volt lehetőség a modernebb grafikus API-kon, az AMD meghajtója például a 256 MB-os partíciót tart fenn erre a célra a Radeon VGA-k VRAM-ján belül, és ez a host processzor számára látható, koherens memóriaterület. A Smart Access Memory mellett viszont ez a működési modell megváltozik, és a GPU teljes fedélzeti memóriája látható, koherens memóriaterületté válik a CPU oldaláról. Logikai szinten a CPU és a GPU tehát kvázi úgy fog működni, mint egy APU.

Smart Access Memory kikapcsolva és bekapcsolvaSmart Access Memory kikapcsolva és bekapcsolva Smart Access Memory kikapcsolva és bekapcsolva [+]

Ennek van némi haszna a mai játékokban is, hiszen bizonyos adatokat mindenképpen el kell érnie a CPU-nak, de az alkalmazások többségét azért erősen optimalizálják arra, hogy a 256 MB-ot ne nagyon lépjék át, és emiatt ez a funkció jelenleg 5-6%-nál nagyobb előnyt nem kínál. Persze lehetnek kivételek, ahol 10%-nyi extra is összejöhet, viszont ehhez olyan játék kell, ami viszonylag sok host koherens adattal dolgozik, ilyen például a Forza Horizon 4 vagy a Horizon Zero Dawn, de ez amúgy most még nem jellemző. Hosszabb távon ugyanakkor érkeznek az új generációs konzolokra fejlesztett tartalmak, ahol már biztosan nem lesz elég a 256 MB. Ez egyszerűen túlságosan kevés ahhoz az adatmennyiséghez, amivel a friss rendszerek dolgozhatnak, így pedig muszáj lesz majd a rendszermemóriát használni az egyre több host koherens adat tárolására. Ennek előnye, hogy ott el lehet ezért férni, a mai gépekben 8-16 GB, vagy akár több RAM is lehet, tehát a 256 MB-os limittől megszabadultunk, de előkerül egy új probléma: amint a rendszermemóriából kell elérnie az adatokat a GPU-nak, a memória-sávszélesség lecsökken a PCI Express interfész sebességére.

A fentiek alapján csöbörből vödörbe estünk, és ez azért kellemetlen, mert a GPU-nak a tárolt adatokra sokkal többször van szüksége, mint a CPU-nak, és ilyenkor a PCI Express interfész erősen limitáló lehet. Az AMD ezt a problémát kezeli a Smart Access Memory funkcióval. Jobb az, ha a CPU megy a VRAM-ba a host koherens adatokért a PCI Express kapcsolaton keresztül, mert egyrészt az adatelérés a CPU oldaláról jóval ritkább, másrészt a GPU-nak nem kell a relatíve lassú rendszermemóriát használnia.


[+]

Végül érdemes elemezni az új generáció egyik legnagyobb újítását, ami az Infinity Cache lesz. Ez lényegében egy elég nagy, konkrétan 128 MB-os gyorsítótár a lapkán belül. Működését valószínűleg azért nem fejtette ki az AMD, mert alkalmazásfüggő. A vállalat gyakorlatilag játékról-játékra módosíthatja, hogy miképp használja. Alapértelmezett formában egyszerűen csak gyorsítótár, ami hasznos, de nem mindig ez a leghatékonyabb forma. Például sokszor hasznosabb, ha sűrűn használt puffereket tárol. Itt kezd érdekes lenni a dolog, mert jellemző a mai, akár komplexebb leképezőkre is, hogy az adatolvasások és -írások döntő többsége a sok gigabájtnyi tárolt tartalomnak pusztán 100-300 MB-nyi részét érinti. Ha ezzel nem kell elhagyni a GPU-t, akkor az elég sok előnyt ad a teljesítmény és a fogyasztás tekintetében is. Emiatt az AMD majd profilozni fogja az egyes játékokat, bizonyos sűrűn használt puffereket direkten az Infinity Cache-be helyeznek el, a maradék rész pedig nyilván használható általános gyorsítótárként.

Mindezeken túl a sugárkövetést használó játékok speciális elbánást kapnak majd, mivel itt is jelentős haszna van annak, ha a számítások egy részét a GPU-n belül tartják. Ez a gyorsítóstruktúrára vonatkozóan még reális is lehet, látva a gyorsítótár kapacitását, viszont a meghajtó oldaláról hatékonyan be kell állítani a működést, mert az Infinity Cache optimális használata igen nagy teljesítményelőnyt tud adni. A komolyabb részletekbe az AMD később fog belemenni, így ezekről majd csak a megjelenéskor lehet bővebben írni.


[+]

A bejelentett termékek közül a Radeon RX 6800 és 6800 XT november 18-án érkezik rendre 579 és 649 dollárért, míg a Radeon RX 6900 XT december 8-án lesz megvásárolható, 999 dollár ellenében.

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés