Célkeresztben a középkategória: itt a Navi 32

Az AMD új RX 7800 XT és 7700 XT GPU-i kifejezetten az RTX 4070 és 4060 Ti kártyákat veszik célba.

Navi 32: chiplet kicsiben

Belső felépítését tekintve a Navi 32 az RDNA 3 architektúrára épül, ahogy például a nagyobb rokonának számító Navi 31. Ezért a rendszer működésének mélységeibe nem mennénk bele, hiszen ezt a linkelt oldalon korábban már kiveséztük.

A kialakítást elemezve az új fejlesztés chiplet dizájnt alkalmaz. Ezen belül is az 5 nm-es node-on készülő, 200 mm²-es kiterjedésű, 19,9 milliárd tranzisztorból álló GCD, azaz Graphics Compute Die chiplet teljesen új, míg az ehhez csatlakozó, Infinity Cache-t, memóriavezérlőt és memóriabuszt tartalmazó 6 nm-es MCD-k, azaz Memory Cache Die chipletek megegyeznek a Navi 31-en használt megoldásokkal, vagyis egyenként 37,5 mm²-es kierjedésűek és 2,05 milliárd tranzisztort tartalmaznak. A különbség annyi, hogy amíg a Navi 31 hat darab MCD-t használ, addig a Navi 32 csak négyet.

Navi 32
Navi 32 [+]

A multiprocesszorok felépítése nem változott a Navi 31-hez viszonyítva, így a Navi 32-ben 16 darab úgynevezett CUP (Compute Unit Pair) található, amelyek két darab CU-t, azaz Compute Unitot tartalmaznak, és ezeken belül van két darab, egymástól teljesen független, saját skalár egységekkel dolgozó, 64 utas, azaz 2048 bites, multiprecíziós SIMD motor. Egy ilyen blokkon belül 128 kB-os Local Data Share (LDS) található, amelyen a négy darab, egyenként 192 kB-os regiszterterülettel rendelkező SIMD motor osztozik. A helyi adatmegosztás mellett CU-nként egy darab 32 kB-os L0 adat gyorsítótár is fellelhető.

Megmarad az RDNA 3 nagy újításának számító dual-issue konstrukció, illetve az összes extra képesség, amit a friss dizájn vezetett be. A CUP-ken belül a saját regiszterterülettel és wave pufferrel rendelkező skalár egységekhez tartozik egy közös 16 kB-os skalár és egy 32 kB-os utasítás gyorsítótár. Előbbit csak a skalár feldolgozó éri el, míg utóbbit az összes feldolgozó hasznosíthatja, és természetesen mindkét gyorsítótár írható és olvasható is. Ezek mellett a textúrázást CU-nként egy blokk oldja meg, amely négy darab, csak szűrt mintákkal visszatérő, Gather4-kompatibilis textúrázó csatornát rejt, és a rendszernek ezen a részén egy sugárkövetéshez használható, metszésvizsgálatokat gyorsító blokkal is lehet számolni. Az SFU-k, vagyis a speciális funkciókért felelős egységek összesített száma nem változott, azaz vektormotoronként nyolc feldolgozóról beszélünk.

Az Infinity Cache most is jelen van, így a gyorsítótárak szervezése a Navi 31 mintáját idézi, ugyanakkor a Navi 32-ben a memóriavezérlőhöz 64 MB kapacitású írható és olvasható gyorsítótár kapcsolódik, és a 2 MB-os, szintén írható és olvasható másodlagos gyorsítótár ehhez van hozzákötve a ROP blokkal egyetemben. Ezek a részegységek továbbra is a másodlagos gyorsítótár kliensei, vagyis a pixel- és textúraadatokra vonatkozó memóriaelérések koherensek, továbbá minden ROP blokk saját RB gyorsítótára egy olyan 256 kB-os L1 gyorsítótárhoz kapcsolódik, amelyet még nyolc darab CUP is elér, és ezek az egységek a raszterizálóval együtt ezen osztoznak. Mindemellett az L1 gyorsítótárhoz van hozzákötve a CU-khoz tartozó L0 is.

A ROP blokkok továbbra is úgynevezett pixelmotorokat tartalmaznak, egészen pontosan kettőt, és egy pixelmotor 4 blending, illetve 8 Z mintavételező egységből áll, ami a Navi 32 esetében összesen 96 blending és 192 Z mintavételezőt jelent. Természetesen a VRS (variable rate shading) támogatása adott, ahogy megmaradt a Delta Color Compression technika is. Érdemes szót ejteni a memóriavezérlőről, amely 256 bites, így nyolc darab 32 bites buszon köthető rá egy-egy darab GDDR6 szabványú memórialapka.

A cikk még nem ért véget, kérlek, lapozz!

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények