IGP-ben csúcsra modernizálva
Ahogy az előző oldalon ecseteltük, az IGP megkapta a legújabb dizájnt, amit az AMD RDNA 3.5-nek nevez. Ez alapjaiban a Navi 31-ben prezentált RDNA 3-ra épít, de kapott pár újítást, amit a cég extra tizedesjeggyel emel ki – ezekre hamarosan kitérünk.
A multiprocesszorok felépítése alig változott, így az új IGP-ben 8 darab úgynevezett CUP (Compute Unit Pair) található, amelyek két darab CU-t, azaz Compute Unitot tartalmaznak, és ezeken belül van két darab, egymástól teljesen független, saját skalár egységekkel dolgozó, 64 utas, azaz 2048 bites, multiprecíziós SIMD motor. Egy ilyen blokkon belül 128 kB-os Local Data Share (LDS) található, amelyen a négy darab, egyenként 128 kB-os regiszterterülettel rendelkező SIMD motor osztozik. A helyi adatmegosztás mellett CU-nként egy darab 32 kB-os L0 adat gyorsítótár is fellelhető.
Megmaradt az RDNA 3-ból ismert dual-issue konstrukció, illetve az összes extra képesség, amit az említett dizájn vezetett be. A CUP-ken belül a saját regiszterterülettel és wave pufferrel rendelkező skalár egységekhez tartozik egy közös 16 kB-os skalár és egy 32 kB-os utasítás gyorsítótár. Előbbit csak a skalár feldolgozó éri el, míg utóbbit az összes feldolgozó hasznosíthatja, és természetesen mindkét gyorsítótár írható és olvasható is. Ezek mellett a textúrázást CU-nként egy blokk oldja meg, amely négy darab, csak szűrt mintákkal visszatérő, Gather4-kompatibilis textúrázó csatornát rejt, és a rendszernek ezen a részén egy sugárkövetéshez használható, metszésvizsgálatokat gyorsító blokkal is lehet számolni. Az SFU-k, vagyis a speciális funkciókért felelős egységek összesített száma nem változott, azaz vektormotoronként nyolc feldolgozóról beszélhetünk.
Az Infinity Cache ilyen kis méretben nincs jelen, viszont 2 MB-os, írható és olvasható másodlagos gyorsítótárat kötöttek a ROP blokkokhoz, amelyek a másodlagos gyorsítótár kliensei, vagyis a pixel- és textúraadatokra vonatkozó memóriaelérések koherensek. Ezen túlmenően a ROP blokkok saját RB gyorsítótára egy olyan 256 kB-os L1 gyorsítótárhoz kapcsolódik, amelyet az összes CUP is elér, és ezek az egységek a raszterizálóval együtt ezen osztoznak. Mindemellett az L1 gyorsítótárhoz van bekötve a CU-khoz tartozó L0 is. A logikai felépítést tekintve a ROP blokkok egyébként továbbra is úgynevezett pixelmotorokat tartalmaznak, jelen dizájnban kettőt, amely pixelmotor 4 blending, illetve 8 Z mintavételező egységből áll. Ez a Strix Point SoC APU IGP-je esetében összesen 16 blending és 32 Z mintavételezőt jelent. Természetesen a VRS (variable rate shading) támogatása adott, ahogy megmaradt a Delta Color Compression technika is.
Ez így kísértetiesen hasonlít az RDNA 3-hoz, így felmerül a kérdés, hogy mi az RDNA 3.5 extrája? Alapvetően optimalizálások, többek között kétszeresére nőtt a textúra-mintavételezés sebessége, bizonyos feladatokat jobban kezel a shader és a raszter alrendszer, illetve a dizájn működése jobban illeszkedik az LPDDR5 memóriákhoz. Ezek összességében az IGP szintjén hasznosak, de kiugróan nagy változást nem fognak hozni, maximum a hatákonyságot növelik, ami egyébként mobil szinten nem elhanyagolható szempont.
A cikk még nem ért véget, kérlek, lapozz!