Bemutatkozott az AMD Carrizo APU

A Tonga cGPU öröksége

A Carrizo SoC APU processzorrésze mellé egy igen vaskos IGP került. Wani kódnéven fut, és a legmodernebb, harmadik generációs GCN architektúrára épül, ami a Tonga kódnevű cGPU-ban is megtalálható.

Az IGP-ben nyolc darab CU lesz, és ezek egyenként tartalmaznak egy skalár feldolgozót, illetve négy darab, egymástól teljesen független, 16 utas, azaz 512 bites, multiprecíziós SIMD motort. Egy CU-n belül 64 kB-os Local Data Share (LDS) található, melyen a négy darab, egyenként 64 kB-os regiszterterülettel rendelkező SIMD motor osztozik. Az LDS-sel az AMD – szokásához híven – túlteljesíti a DirectCompute 32 kB-os követelményét, aminek az a magyarázata, hogy az architektúrát általános számításokra tervezték. Az LDS mellett egy 16 kB-os adat gyorsítótár is elérhető, melyet a CU írhat és olvashat is.


[+]

A fentebb már említett skalár feldolgozó némileg különc a CU-n belül. Ez lényegében egy integer ALU, mely 8 kB-os dedikált regiszterterületet kapott. A textúrázást CU-nként egy blokk oldja meg, mely négy darab, csak szűrt mintákkal visszatérő Gather4-kompatibilis textúrázó csatornát rejt. A lapkán belül négy CU egy tömbbe rendeződik, és ehhez tartozik egy 16 kB-os skalár és egy 32 kB-os utasítás gyorsítótár. Előbbit csak a skalár feldolgozó éri el, míg a CU összes feldolgozója hasznosíthatja, de természetesen mindkét gyorsítótár írható és olvasható is. Ezek mellett a CU-k közötti adatmegosztást egy rendkívül gyors, 64 kB-os (Global Data Share) tárterület biztosítja. A CU-k extrája a Tonga cGPU-hoz képest, hogy a Carrizo SoC APU esetében nincs letiltva az ATC, vagyis az Address Translation Cache, amely a megosztott virtuális memória kezelésében fontos, és javítja a címfordítás teljesítményét. Erre nyilván egy dedikált GPU-nak nincs szüksége, de egy IGP-nek igen.


[+]

A két DMA motorral rendelkező IGP az órajelenként egy háromszöggel dolgozó setup motort is a legújabb GCN-es cGPU-tól örökölte, annak minden előnyével együtt. A tesszellátor tizenegyedik generációs megoldás lesz, míg a raszter motor órajelenként 8 képpontot dolgoz fel. A memóriavezérlőhöz egy 512 kB-os kapacitású, írható és olvasható másodlagos gyorsítótár és két ROP-blokk kapcsolódik, ami így összesen 8 blending és 32 Z mintavételező egységet eredményez.

A dupla pontossággal kapcsolatban az AMD elárulta, hogy a hardver képes az elméleti számítási teljesítmény felével elvégezni a feladatokat, vagyis ebből a szempontból teljes értékű megoldásnak számít, de arról még nem döntöttek, hogy ezt a mobil termékek esetében lekorlátozzák-e szoftveresen vagy sem. Viszont biztos, hogy a Carrizo SoC APU IGP-je teljes értékű feldolgozás mellett támogatja a 16 bites lebegőpontos utasításokat, ami lényeges szempont, hiszen számos feladat nem igényel 32 bites precizitást, így energiát lehet spórolni, miközben gyorsul is a hardver.

Összesítve a Carrizo IGP-je 512 darab shader részelemet kínál 32 darab textúrázó csatorna mellett, és mindehhez 8 blending egység társul. Az új integrált grafikus vezérlő, amely egyébként egy nagy shader motornak tekinthető, a Kaveri megoldásához hasonlóan leginkább az újabb, komplex játékokban érzi nagyon jól magát, hiszen igen jó a compute hatékonysága.

A cikk még nem ért véget, kérlek, lapozz!

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés