A reformok útjára lép az új, Radeon 7900 sorozat

Gyorsítótárak, ROP blokkok, memória és az új VGA

Lévén, hogy az AMD cGPU-ban gondolkodott, a gyorsítótárak tekintetében is komoly előrelépésre volt szükség. A rendszer hierarchiája nem éppen egyszerű, de a hatékony működés alapja ez. Két oldallal korábban már részleteztük a CU-khoz kapcsolódó adat gyorsítótárat (L1), a négyes CU tömbökhöz használt, megosztott skalár (K$) és utasítás (I$) gyorsítótár, valamint a Global Data Share (GDS) memóriát. Ezek mindegyike kapcsolódik az összesen 768 kB-os L2 gyorsítótárhoz, mely olvasható és írható is. Az L2 gyorsítótárat hat partícióra osztotta az AMD, így a 384 bites memóriabusz egy-egy csatornája kap egy-egy 128 kB-os szeletet. Az L1 tárak és az L2 cache partíciói magórajelen üzemelnek és órajelenként 64 bájt adatot mozgatnak, vagyis elég tempós lett ebből a szempontból a rendszer. Emellett fontos újítás még, hogy az L2 cache koherens, vagyis mindegyik CU azonos memóriaképet lát.


[+]

A memóriavezérlő alapjait nem érte sok változás, így az AMD továbbra is az RV770-ben megismert Control Hub mellett tette le a voksát, ami a Tahiti cGPU-ban hat darab 64 bites csatornát üzemeltet. Túl nagy meglepetést nem okozott, hogy a mérnökök nem változtattak ezen az elvi felépítésen, hiszen a Control Hub rendkívül hatékonyan bánik a lapkához kapcsolt fedélzeti memóriával, így itt nincs lehetőség sok újításra. Változás érte azonban a ROP blokkok szervezését. Az előző generációs termékekben a blokkok a memóriacsatornákhoz kapcsolódtak. Ez alapvetően nem rossz megvalósítás, de az egyes ROP blokkok csak a hozzájuk kapcsolt memóriapartíciót használhatják, ami limitálja a hatékonyságot. A GCN architektúrában az AMD ezt a modellt megelégelte, így a ROP blokkok mostantól teljesen függetlenek a memóriacsatornáktól. Ez azt jelenti, hogy a méretes L2 gyorsítótárhoz csatlakozik az összes blokk, és így elérik a teljes fedélzeti memóriát, vagyis bármelyik partíciót használhatják.

A ROP blokkok száma egyébként nem változott az előző generációs Caymanhez viszonyítva, így továbbra is nyolc darab van belőlük, ami összesen 32 blending és 128 Z mintavételező egységet eredményez. A ROP blokkokon belül csak apróbb finomításokkal élt az AMD, így lényegében közel ugyanolyan teljesítményre képesek az egységek, mint amilyenre a Cayman megoldási.

Szintén újítás, hogy a Tahiti a fedélzeti memóriák esetében bevezeti az ECC támogatást. Az AMD ugyanazt az elgondolást használja, amit az NVIDIA a Fermi architektúránál, így az ECC működése sebességvesztést okoz, éppen ezért az asztali piacra szánt VGA-knál ez a funkció nem működik. Arról az AMD még nem nyilatkozott, hogy később aktiválható lesz-e a driverben. Technikailag megoldható, de valószínűbb, hogy a vállalat – a konkurenshez hasonlóan – inkább mellőzi az ECC-t, hiszen ennek a funkciónak nincs jelentősége a Radeon által megcélzott piacokon.

De milyen is lesz a Radeon HD 7970?

Az új GCN architektúra és a Tahiti cGPU felületes ismertetése után elegendő információ áll rendelkezésre, hogy szemügyre vegyük a Radeon HD 7970 konkrét paramétereit. Az új VGA x16-os PCI Express 3.0-s interfészbe illeszthető. Ez a csatoló elméletben kétszer nagyobb adatátviteli teljesítményt jelent az x16-os PCI Express 2.0-s porthoz viszonyítva, de a programokban ennek nem biztos, hogy azonnal látni lehet az eredményét, mivel a fejlesztők manapság arra törekszenek, hogy a PCI Express busz csak minimális igénybevételnek legyen kitéve. Számos teszt lelhető fel a weben, melyek alapján kijelenthető, hogy egy mai csúcs VGA-nak az x8-as PCI Express sem korlátozza a teljesítményét, így a PCI Express 3.0 előnyeit biztos nem lehet majd azonnal kihasználni.

Ez sokak számára valószínűleg nem hat meglepetésként, hiszen ugyanezt eddig minden új PCI Express szabvány bevezetésénél el lehetett mondani. Ennek ellenére a PCI Express 3.0 mögött jelenleg óriási reklámkampány húzódik, ám a gyártók sosem mutatják be, hogy az elméletben elérhető extra sebességnek milyen gyakorlati hatásai vannak. Ennek nyilván az az oka, hogy most még az új interfész gyakorlatban mérhető előnye nem mutatható ki.

A Radeon HD 7970 természetesen az eddig ismertetett Tahiti cGPU-ra épül, és azon belül is aktiválva lesz az összes egység. Ennek megfelelően a lapka 2048 shader részelemet kínál 128 darab Gather4-kompatibilis textúrázó csatornával. A rendszerben két ACE és két setup motor lesz összesen 32 blending és 128 Z mintavételező mellett. A magórajel esetében az AMD mérnökei 925 MHz-et állítottak be, így a Tahiti elméletben 3,78 TFLOPS-os teljesítményre képes szimpla pontosság mellett. A 384 bites memóriavezérlőre 3 GB GDDR5 szabványú fedélzeti memória kapcsolódik, mely 5,5 GHz-es effektív frekvencián ketyeg. Ennek megfelelően a memória-sávszélesség eléri a 264 GB/s-os paramétert.

Az új VGA támogatja a Cayman esetében bevezetett PowerTune technológiát, így a maximális energiaigényt a felhasználó a Catalyst Overdrive menüjében képes szabályozni pozitív, illetve negatív irányban. A Radeon HD 7970 alapértelmezett beállítások mellett 250 wattos limittel rendelkezik, de a nyomtatott áramköri lap 300 wattra is fel van készítve, ami a tuningosok számára jól jöhet. A terheléstől mentes időszakokban a kártya természetesen visszafogja magát, és a fogyasztás ilyenkor kicsivel 20 watt alá esik.


[+]

Új technológia azonban a ZeroCore Power szolgáltatás, mely akkor lép érvénybe, ha a számítógépen az operációs rendszer készenlétbe kapcsolja a monitort. Ilyen esetben az előző generációs VGA-k továbbra is elfogyasztották az úgynevezett idle energiát, ám a Radeon HD 7970 már beéri 3 wattal is. A VGA-n a GPU szinte teljesen lekapcsol, így egyedül a PCI Express vezérlő marad aktív, hogy fogadhassa a felébresztéshez szükséges jelet. Természetesen a memóriákat sem lehet teljesen inaktiválni, így azokat továbbra is frissíteni kell, de a ventilátor teljesen kikapcsol, mivel azt a 3 wattos hőmennyiséget a hőkamrás hűtőborda is elvezeti.


[+]

A ZeroCore Power a CrossFireX konfigurációknál is jól jöhet, mivel ilyenkor csak az elsődleges VGA-nak kell 20 watt körül fogyasztania, a többi kártya lekapcsolható. Az AMD korábban is alkalmazott egyfajta hibernálást a CrossFireX a rendszerekre, de ez nem 3 wattra redukálta a fogyasztást, hanem 10 watt körüli értékre, ami még mindig elég sok volt.

A megcélzott piac igényeit figyelembe véve az AMD két BIOS-t épít a termékre, mivel ezen a szinten a legtöbb felhasználó sok finomhangolást hajt végre. Ha az elsődleges rendszer egy félresikerült frissítés következtében használhatatlanná válna, akkor egy kapcsoló átállításával könnyen aktiválható a másodlagos BIOS, ami helyrehozza a problémát.

A cikk még nem ért véget, kérlek, lapozz!

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés