Radeon R9 285: egyikkel ad, másikkal elvesz

Mit rejt a Tonga cGPU

Az architektúra módosítása a lapka egészére is hatással lesz. Többek között alapvető, hogy megjelenik a nyolc darab ACE egység a grafikus parancsprocesszor mellett, ahol előbbi csak compute, míg utóbbi compute és grafikus feladatokat képes feldolgozni. Eközben továbbra is a rendszer része a 64 kB-os globális adatmegosztás, vagy más néven Global Data Share (GDS), emellett megmaradt a két DMA motor. A nyolc darab ACE egységre egyébként számítani lehetett, hiszen az AMD az összes újonnan tervezett Radeon grafikus vezérlőbe ennyit tesz. Ez nagyon kiszámítható irány, mivel a PlayStation 4 APU-jának IGP-jében is ennyi van, és mivel az új generációban ez a konzol lesz a játékfejlesztők vezérplatformja, így ennek paramétereit kell másolni.

A rendszer belső szervezése szempontjából a Hawaii cGPU köszön vissza, ennek megfelelően a Tonga cGPU is úgynevezett shader motorokra van felosztva. Ezeken belül számos CU tömb lehet számos ROP-blokkal, viszont mindegyik motor alapvető eleme egy tesszellátor és egy raszter motor. Az új, tizenegyedik generációs tesszellátor a Hawaii cGPU-ban bemutatott tizedik generációs egységhez képest furcsa fejlesztésnek tűnik – maga a fixfunkciós motor nem sokat változott, de a körítést teljesen lecserélte az AMD. Jelentősen fejlődött a vertex újrahasznosítás, illetve módosult a paraméter gyorsítótár működése is. Utóbbi megmarad a tesszellátoron belül, de ha túl kis háromszögeket kell előállítani, akkor a hardver igényelhet egy nagyobb paraméter gyorsítótárat, amit a rendszer az L2 gyorsítótárból fog biztosítani. Ezzel a módosítással az extrém tesszellálási feladatoknál megsokszorozódik a teljesítmény anélkül, hogy több tesszellátort kellene alkalmazni.

A shader motorokon belül négy CU rendeződhet egy tömbbe, és ezekhez tartozik egy 16 kB-os skalár és egy 32 kB-os utasítás gyorsítótár. Előbbit csak a skalárfeldolgozó éri el, viszont a korábbi architektúrákhoz képest ez már nem csak olvasható, hanem írható is. Az utóbbi tárat természetesen a CU összes feldolgozója hasznosíthatja.

A Tonga cGPU

Az architektúrára vonatkozó adatok részletezése után ideje rátérni a számokra, és ezzel a lapka teljesítményére. A Tonga kódnevű cGPU-ban összesen négy darab shader motor található, melyekben egy-egy tesszellátor és raszter motor dolgozik két ROP-blokk és két CU-tömb mellett. Utóbbi tömbökben 4 darab CU található. Ezt összesítve a lapkába 4 tesszellátor és 4 raszter motor került 32 darab CU-val egyetemben, melyek felfoghatók 2048 darab shader részelemként is. Ebből már az is kitalálható, hogy összesen 128 darab textúrázó csatornával kell számolni.

Egy shader motor setup része órajelenként egy háromszöget dolgoz fel, ami a teljes lapkára nézve már négy háromszöget jelent, emellett a raszter motorok összesített teljesítménye órajelenként 32 pixel. Ehhez jól igazodik a cGPU-ban található 8 darab ROP-blokk, ami összesen 32 blending és 128 Z mintavételező egységet eredményez. A lapkában található 0,5 MB-os L2 gyorsítótár írható és olvasható is egyben, emellett koherens is, vagyis mindegyik CU azonos memóriaképet lát.

Az L2 gyorsítótár 8 darab 64 kB-os partícióra van felosztva. A négy darab 64 bites memóriacsatorna két-két darab 64 kB-os L2 partícióhoz kapcsolódik. A memóriabusz szélessége összesen 256 bites, és az AMD által ajánlott 5,5 GHz-es effektív órajelű GDDR5 memóriákkal társítva 176 GB/s lehet a memória-sávszélesség.

A Tonga cGPU-ra több modell készül, tehát a lapka bizonyos részei esetleg le lesznek tiltva, ahogy az látható majd a Radeon R9 285 esetében is.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

Előzmények

Hirdetés