Mindent átfestett a Rembrandttal az AMD

A vállalat új SoC APU-ja az összes részegységből a legmodernebbet kapta, de az igazán erős oldalát csak most mutatta meg.

Az RDNA 2 kicsiben

Ahogy az előző oldalon ecseteltük, az egyik legnagyobb változás az IGP teljes megújítása, ugyanis a Rembrandt SoC APU megkapta az RDNA 2 architektúrát, pontosabban ennek 6 nm-es node-ra portolt változatát, ami leginkább optimalizálásnak számít a hatékonyabb működés érdekében.

Hirdetés

Az RDNA 2 architektúra alapvető működéséről korábbi cikkünkben már bővebben írtunk, és az alapdizájnt tekintve nagy különbség nincs is. A multiprocesszorok felépítése például nem változott, de számuk igen, így a friss IGP-ben 6 darab úgynevezett WGP (Workgroup Processor) található, amelyek két darab CU-t, azaz Compute Unitot tartalmaznak, és ezekben belül van két darab, egymástól teljesen független, saját skalár egységekkel dolgozó, 32 utas, azaz 1024 bites, multiprecíziós SIMD motor. Egy WGP-ben 128 kB-os Local Data Share (LDS) található, amelyen a négy darab, egyenként 128 kB-os regiszterterülettel rendelkező SIMD motor osztozik. A helyi adatmegosztás mellett CU-nként egy darab 16 kB-os L0 adat gyorsítótár is fellelhető.


[+]

A WGP-n belül a saját regiszterterülettel és wave pufferrel rendelkező skalár egységekhez tartozik egy közös 16 kB-os skalár és egy 32 kB-os utasítás gyorsítótár. Előbbit csak a skalár feldolgozó éri el, míg utóbbit az összes feldolgozó hasznosíthatja, és természetesen mindkét gyorsítótár írható és olvasható is. Ezek mellett a textúrázást CU-nként egy blokk oldja meg, amely négy darab, csak szűrt mintákkal visszatérő, Gather4-kompatibilis textúrázó csatornát rejt. Az SFU-k, vagyis a speciális funkciókért felelős egységek összesített száma sem változott, azaz SIMD-enként nyolc feldolgozóról beszélünk.

A dedikált GPU-k által alkalmazott RDNA 2-höz viszonyítva nagy különbség, hogy a Rembrandt SoC APU nem alkalmaz Infinity Cache-t. Egyszerűen be kell érni egy 2 MB-os írható és olvasható másodlagos gyorsítótárral, és ehhez van hozzákötve a négy ROP blokk. Ezek a részegységek továbbra is a másodlagos gyorsítótár kliensei, vagyis a pixel- és textúraadatokra vonatkozó memóriaelérések koherensek, továbbá minden ROP blokk saját RB gyorsítótára egy olyan 128 kB-os L1 gyorsítótárhoz kapcsolódik, amelyet még 6 darab WGP is elér, és ezek az egységek a raszterizálóval együtt ezen osztoznak. Mindemellett az L1 gyorsítótárhoz kapcsolódik a CU-khoz tartozó L0 is.


[+]

A ROP blokkok továbbra is úgynevezett pixelmotorokat tartalmaznak, egészen pontosan kettőt, és egy pixelmotor négy blending, illetve nyolc Z mintavételező egységből áll, ami a Rembrandt IGP-je esetében összesen 32 blending és 64 Z mintavételezőt jelent. Természetesen a VRS (variable rate shading) támogatása adott, ahogy megmaradt a Delta Color Compression technika is.

A cikk még nem ért véget, kérlek, lapozz!

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés