AMD Radeon R9 290X: Titán és Góliát

Mi van a Hawaii cGPU-ban?

Az újítások részletezése után ideje rátérni a számokra, és ezzel a lapka teljesítményére. A Hawaii kódnevű cGPU-ban összesen négy darab shader motor található, melyekben egy-egy tesszellátor és raszter motor dolgozik négy-négy ROP blokk és három-három CU tömb mellett. Utóbbi tömbök szempontjából kettőben 4 darab, míg egyben 3 CU található. Ezt összesítve a lapkába 4 tesszellátor és 4 raszter motor került 44 darab CU-val egyetemben, melyek felfoghatók 2816 darab shader részelemként is.


[+]

Egy shader motor setup része órajelenként egy háromszöget dolgoz fel, ami a teljes chipre nézve már négy háromszöget jelent, emellett a raszter motorok összesített teljesítménye órajelenként 64 pixel. Ehhez jól igazodik a cGPU-ban található 16 darab ROP blokk, ami összesen 64 blending és 256 Z mintavételező egységet eredményez. Mindegyik ROP blokk kapott egy 16 kB-os color és egy 4 kB-os depth gyorsítótárat, emellett a teljes lapkában található egy 1 MB-os L2 gyorsítótár, mely írható és olvasható is egyben, emellett koherens is, vagyis mindegyik CU azonos memóriaképet lát.

Hirdetés

Az L2 gyorsítótár 16 darab 64 kB-os partícióra van felosztva, amelyek órajelenként 64 bájt adatot mozgatnak, vagyis a belső sávszélesség 1 TB/s. A nyolc darab 64 bites memóriacsatorna két-két darab 64 kB-os L2 partícióhoz kapcsolódik. A memóriabusz szélessége összesen 512 bites, és az AMD által ajánlott 5 GHz-es effektív órajelű GDDR5 memóriákkal társítva 320 GB/s lehet a memória-sávszélesség.

A Hawaii cGPU magórajelének meghatározása már sokkal nehezebb. Az AMD egy új PowerTune rendszerrel állt elő, melynek célja teljesen a hardverre bízni az órajel és a feszültség vezérlését. A szoftver azonban mostantól csak alapvető direktívákat adhat, mivel a vezérlést az SMU firmware végzi. A korábban bemutatott Bonaire cGPU már egy ilyen irány felé menetelt, amikor nyolcra növelte a DPM állapotok számát, de az új PowerTune már 255 különböző DPM állapotot ismer, melyek között 10 mikromásodpercenként képes váltani, ami rendkívül gyorsnak számít. Ez az egész radikális előrelépés a működés terültén, mivel 1,55 V-ig 255 különböző állapot van, és egy váltással 6,25 mV-os lépést tehet a hardver. Gyakorlatilag az üzemfeszültség, mint fogalom eltűnik, mivel a rendszer mindig a megfelelő feszültséget állítja be az adott órajelhez.


[+]

A magórajelet tekintve az alapvető érték 1 GHz. Ez azonban nem állandó paraméter, hanem sokkal inkább egy cél, amit a hardver mindig tartani szeretne. A meghatározott fogyasztási keret azonban nem biztos, hogy minden esetben elég ehhez, így a Hawaii cGPU terhelés mellett 800 MHz-ig visszaveheti a működési órajelet. A váltás az előbb felvázolt PowerTune szabályai szerint zajlik, vagyis a hardver csak egyenletesen válthat órajelet, amire a rendkívül gyors reakcióidő bőven lehetőséget ad. Mivel a PowerTune nagyon gyorsan működik, így a rendszer rendelkezik egy belső pufferrel, mely a váltásokat folyamatosan feljegyzi, az órajelet kiolvasó szenzor pedig egy átlagolt paramétert jelez vissza a felhasználónak.


[+]

A felújított PowerTune hatására a rendszer mindig a maximumot nyújtja. A Hawaii cGPU átlagosan mindössze 1 wattos hibahatárral dolgozik terhelés mellett, vagyis tökéletesen képes alkalmazkodni az adott számításigényhez. Ezzel a rendszer hűtése is sokkal kiszámíthatóbb, így minimalizálni lehet a ventilátor fordulatszámát, emellett az átlagosnál magasabb hőmérséklet célozható meg.


[+]

A Hawaii cGPU PowerTune funkciója a Catalyst vezérlőpult Overdrive menüjében paraméterezhető. A tuning mostantól százalékos szinten állítható be mind a memória, mind pedig a GPU órajelére vonatkozóan, emellett százalékosan megváltoztatható az áramfelvételi korlát is. Fontos, hogy a beállított paraméterek közül a magórajel a maximumot jelzi, vagyis ha a hardver úgy gondolja, hogy a grafikus processzor nem fogja bírni a terhelést, akkor saját magának beállít egy alacsonyabb órajelet. Ennek megfelelően nem feltétlenül a legmagasabb beállított százalék adja a legjobb eredményt, ezt tehát ki kell tapasztalni.

A hőmérséklet szintén megváltoztatható. Alapértelmezetten a VGA 95°C-ra van kalibrálva, de ez igény szerint 50°C-ig csökkenthető; ilyenkor a hardver a megcélzott értékhez állítja a fogyasztást és a hűtést. A ventilátor fordulatszáma nem állítható be fixen, de megadható egy maximális érték, aminél jobban nem pöröghet fel. Alapértelmezetten 40% a maximális fordulatszám. Az előbbi beállításokkal bárki teljesen személyre szabhatja a Radeon R9 290X jelzésű VGA-t, attól függően, hogy éppen milyen igényekkel rendelkezik. Ehhez azonban a kártyát úgynevezett "Uber" módba kell állítani a NYÁK-ra épített kapcsoló segítségével. A másik opció a csendes (Quiet) üzemmód, amit az AMD előre paraméterezett. Ez bizonyos mértékben lassabb működést eredményez az "Uber" módhoz képest, és aktiválásával nem használható a Catalyst Overdrive menüje sem, így nem tuningolható a termék. A PCI Express 3.0-s csatolóba illeszthető AMD Radeon R9 290X TDP limitje 250 watt, de terhelés nélkül nagyjából 20 wattal is beéri, ami a ZeroCore Power szolgáltatás aktiválódása mellet körülbelül 3 wattra csökken.

A Hawaii funkcionalitásban a többi GCN architektúrára épülő megoldást másolja, így támogatja a DirectX 11.2-es, az OpenGL 4.3-es és az OpenGL ES 3.0-s API-t, emellett kezeli a C++ AMP-t és az OpenCL 1.2-es felületet, valamint a Partially Resident Textures kiterjesztést, aminek hála elérhető a DirectX Tiled Resources funkciójának TIER_2 szintje. Később támogatni fogja az OpenGL 4.4 és a Mantle API-t, de ez igaz mindegyik GCN architektúrát használó hardverre. A Hawaii sajátja azonban, hogy az OpenCL 2.0 összes, VGA-ra vonatkozó tervezett funkciójának eleget tesz.

Az AMD Radeon R9 290X részletes ismeretében elmondható, hogy egyszeres pontosság mellett 5,6 TFLOPS-os számítási teljesítményre képes, emellett 4 milliárd háromszöget dolgoz fel másodpercenként. A pixel és texel kitöltési sebesség rendre 64 MPixel/s és 176 GTexel/s. Előbbi érték messze kimagaslik az aktuális mezőnyből, ami komolyabb felbontás alatt jöhet jól.

Új CrossFire

Az AMD a CrossFire technológiát is felújította, így a korábbi CrossFire hidas összeköttetést a PCI Express kapcsolaton keresztüli kommunikáció váltja fel. Ez főleg komolyabb felbontás mellett segít a skálázódás maximalizálásában.


[+]

A rendszer alapja mostantól a CrossFire XDMA blokk a lapkákon belül, ami feloldja a korábbi megoldás adatátviteli korlátját, így a fejlesztők több adat megosztásával operálhatnak az egymást követő képkockák esetében.

A cikk még nem ért véget, kérlek, lapozz!

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények