AMD Radeon RX 480 8 GB – az új népkártya?

199-239 dollárért kínál fejlett architektúrát, problémamentes játékot és VR-élményt az AMD Polaris 10.

Bevetésen a negyedik generációs GCN

Az AMD az új lapkákat most nem szigetekről, hanem csillagokról nevezi el, az egyes fejlesztések között pedig számok tesznek majd különbséget. Az eligazodást ez nem könnyíti majd meg, de általában épp ez is a cél, ugyanis így pusztán a kódnév kiszivárgásából kevésbé lehet következtetni, hogy hova is érkezik az adott fejlesztés.

Az új Polaris családba két lapka jön Polaris 10 és 11 jelzéssel. Előbbi lesz a nagyobbik, egészen pontosan 5,7 milliárd tranzisztorból álló, 232 mm²-es modell, amiről jelen cikkünk is szól, így ennek az elemzésére koncentrálunk. Az új rendszer továbbra is a GCN architektúrára alapoz, de ennek már a negyedik generációs verzióját használja, amit az AMD szimplán GCN4-nek nevez.

Polaris 10 blokkdiagramm
Polaris 10 blokkdiagramm [+]

A Polaris 10-es grafikus vezérlőben 36 darab CU van, és ezek egyenként tartalmaznak egy skalár feldolgozót, illetve négy darab, egymástól teljesen független, 16 utas, azaz 512 bites, multiprecíziós SIMD motort. Egy CU-n belül 64 kB-os Local Data Share (LDS) található, melyen a négy darab, egyenként 64 kB-os regiszterterülettel rendelkező SIMD motor osztozik. Az LDS-sel az AMD – szokásához híven – túlteljesíti a DirectCompute 32 kB-os követelményét, aminek az a magyarázata, hogy az architektúrát általános számításokra tervezték, illetve a manuális interpoláció számára is szükséges némi gyorsan elérhető memóriaterület. Az AMD az LDS-t szokás szerint virtualizálja, tehát a különböző feladatok egymás adatait nem bánthatják, ezzel egyetemben a rendszer megörökölte a korábbi lapkáktól azt a tulajdonságot, amelynek hála a CU-kon belüli LDS-t a geometry shaderek adatainak mentésére is lehet használni. Az LDS mellett természetesen egy 16 kB-os adat gyorsítótár is elérhető, melyet a CU írhat és olvashat is.

A fentebb már említett skalár feldolgozó némileg különc a CU-n belül. Ez lényegében egy integer ALU, mely 4 kB-os dedikált regiszterterületet kapott. A textúrázást CU-nként egy blokk oldja meg, mely négy darab, csak szűrt mintákkal visszatérő Gather4-kompatibilis textúrázó csatornát rejt. A lapkán belül három CU egy tömbbe rendeződik, és ehhez tartozik egy 16 kB-os skalár és egy 32 kB-os utasítás gyorsítótár. Előbbit csak a skalár feldolgozó éri el, míg utóbbit a CU összes feldolgozója hasznosíthatja, de természetesen mindkét gyorsítótár írható és olvasható is.

A Polaris 10 órajelenként négy háromszöggel dolgozó setup motort használ. A négy darab tesszellátor tizenkettedik generációs megoldás, ezen belül új index gyorsítótárat kapott, míg a szintén négy darab raszter motor egyenként, órajelenként 8 képpontot dolgoz fel, vagyis összesen 32 képpontot. A memóriavezérlőhöz egy 2 MB kapacitású, írható és olvasható másodlagos gyorsítótár és 8 darab ROP-blokk kapcsolódik, ami így összesen 32 blending és 128 Z mintavételező egységet eredményez. Látható az is, hogy a blending egységek száma, illetve a raszter motorok teljesítménye szinkronban van. Némileg változott a memóriavezérlő is, amely az új lapka esetében 256 bites. Utóbbit felkészítették a magas órajelű GDDR5 memóriák fogadására.

A dupla pontossággal kapcsolatban az AMD nem volt túl bőbeszédű, de kiderítettük, hogy a hardver képes az elméleti számítási teljesítmény tizenhatod részével elvégezni a feladatokat, vagyis ebből a szempontból elég korlátozott megoldásnak számít, de a Radeonok által megcélzott piacon ez amúgy sem lényeges szempont. Sokkal érdekesebb a 16 bites lebegőpontos utasítások támogatása, amely már natívan van kezelve, ezen belül is energiát és regiszterterületet lehet spórolni a 16 bites precizitás használatával, de nem lehet megduplázni a 32 bites precizitás melletti elméleti számítási teljesítményt.


[+]

Megújult a Tonga cGPU-ban bemutatkozott Delta Color Compression technika is, amely jóval hatékonyabb lett, mivel teljes mértékben támogatja a 2:1, a 4:1 és a 8:1 arányú, veszteségmentes tömörítést, amivel jelentősen lehet csökkenteni a memóriabuszra vonatkozó terhelést. A korábbi generációs Delta Color Compression technikához képest a hatékonyság nagyjából megduplázódott.

A cikk még nem ért véget, kérlek, lapozz!

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés