HD 7750-ből Kaveri IGP-t
Az AMD Kaveri kódnevű lapkájáról már jó néhány alkalommal adtunk hírt, így a fejlesztésnek már viszonylag sok részlete ismert. A Trinity/Richland páros leváltására hivatott APU szinte minden téren hoz újításokat. Az összesen négy x86-os magot magában foglaló két modul immáron a Steamroller elnevezésű mikroarchitektúrára épül, mely a Piledriver továbbfejlesztéséből született. Végleges termék nélkül nem egyszerű behatárolni a több elemében módosított architektúra pontos hatását, de az előzetesen kiszivárgott eredmények ismeretében, azonos órajel mellett nagyjából 10-15% gyorsulásra számíthatunk a közvetlen elődhöz képest.
Az integrált grafikus szekció felépítése is változik, ugyanis a korábbi VLIW4 rendszert a GCN váltja, annak is C.I. elnevezésű utasításarchitektúrája. Hasonló rendszerre épül a Kabini és a Temash kódnevű SoC APU-k IGP-je, az új generációs konzolokban található APU-k integrált grafikus vezérlője, illetve a Hawaii kódnevű cGPU is. Ezen felül a lapka megkapja TrueAudio támogatást, frissül a fixfunkciós UVD dekóder és a VCE enkóder egység is, illetve mostmár a PCI Express 3.0 támogatás is megoldott lesz. Az AMD termékpalettáján a Kaveri lesz az első HSA-támogatással rendelkező termék, bár ennek kihasználásához megfelelő szoftverekre is szükség lesz, melyek megjelenésére általában hónapokat, rosszabb esetben akár éveket kell várni.
forrás: pc.watch [+]
A teljes lapka 47%-át fogja kitenni az integrált GPU, ami 5%-os növekedés a Trinity és Richland 42%-ához képest. Már viszonylag régóta ismert adat, hogy mindez 8 darab CU-t (Compute Unit) takar, ami összesen 512 végrehajtóegységet foglal magában. Ez a szám pontosan megegyezik a Radeon HD 7750 Cape Verde Pro kódnevű GPU-jában található egységek számával. Ahogy korábbi tesztünkben elmondtuk, a Cape Verde 10 CU-t, azaz összesen 640 számolóegységet tartalmaz, amiből két darab CU (128 végrehajtó) letiltásra kerül a HD 7750-ek GPU-ja esetében, így 512 végrehajtóegység, illetve 32 textúracímző és -szűrő marad a 16 ROP mellett. A Cape Verde egy 128 bites memóriavezérlőt tartalmaz, ami egyaránt támogatja a GDDR5, illetve a DDR3 memóriákat is, így a gyártók zöme mindkét típusra épít termékeket.
A GPU specifikációjában a DDR3-as és GDDR5-ös modellek teljesen megegyeznek. A maximálisan elérhető memória-sávszélesség tekintetében ez már egyáltalán nem mondható el, hisz míg a DDR3-as modellek az effektív 1600 MHz-en üzemelő chipekkel 25,6 GB/s-os értéket képesek elérni, addig a GDDR5-ös variánsok ennek majdnem triplájából, 72 GB/s-ból gazdálkodhatnak, ami igen nagy különbséget jelent.
Az A10-6800K IGP-je
A Kaveriről azt is tudjuk, hogy a Richland kódnevű A10-6800K-hoz hasonlóan legfeljebb DDR3-2133 szabványú memóriákat támogat, így az elérhető maximális sávszélesség ezen APU esetében is 33,33 GB/s lehet. A közeljövőben megjelenő modellek GPU órajele is ismert, amit 720 MHz-ben szabott meg az AMD. Ez az érték pontosan 10%-kal, azaz 80 MHz-cel alacsonyabb a HD 7750 GPU-jának üzemi frekvenciájánál.
Ezen adatok ismeretében próbáltuk meg szimulálni a Kaveri IGP-jének várható teljesítményét egy HD 7750 segítségével. Bár a Cape Verde még a korábbi GCN S.I.-re épül, de a 3D megjelenítés teljesítményét ez az eltérés valószínűleg nem fogja jelentősen befolyásolni. Első körben a DDR3-as HD 7750 memóriáinak órajelét próbáltuk megemelni, de ezzel még 2000 MHz-ig sem jutottunk. Ezután egy GDDR5-ös modell frekvenciáját csökkentettük, de a 33,33 GB/s-hoz szükséges meglehetősen alacsony, 533 Mhz-es órajelet egyik szoftver sem engedte beállítani, pontosabban 670 MHz alatt már automatikusan visszaugrott a gyári 1150 Mhz-re a chipek frekvenciája. Végül kénytelenek voltunk egy kicsit radikálisabb eszközhöz nyúlni, így egy VGA BIOS szerkesztővel átírtuk a kártya gyári értékeit, mely próbálkozásunkat már siker koronázta.
A végeredmény
IGP/VGA megnevezése | Radeon R7 2xxD* |
Radeon HD 7750 (DDR3) |
Radeon HD 7750 |
Radeon HD 7770 |
Radeon HD 6670 |
Radeon HD 8670D |
---|---|---|---|---|---|---|
Kódnév | Spectre | Cape Verde Pro | Cape Verde XT | Turks | Devastator | |
Gyártástechnológia | 28 nm (GF) | 28 nm (TSMC) | 40 nm (TSMC) | 32 nm (GF) | ||
Mikroarchitektúra | GCN C.I. | GCN S.I. | VLIW5 | VLIW4 | ||
Tranzisztorok száma | nem ismert | 1,5 milliárd | 716 millió | 1,3 milliárd | ||
Lapka mérete | nem ismert | 123 mm2 | 118 mm2 | 246 mm2 | ||
GPU órajele | 720 MHz | 800 MHz | 1000 MHz | 800 MHz | 844 MHz | |
Shader processzorok típusa | multiprecíziós vektor | szuperskalár | ||||
Számolóegységek száma | 512 | 640 | 480 | 384 | ||
Textúrázók száma | 32 textúracímző és -szűrő |
40 textúracímző és -szűrő |
24 textúracímző és -szűrő |
|||
ROP egységek száma | 4 blokk (16) | 2 blokk (8) | ||||
Memória mérete | 1024 MB | 2048 MB | 1024 MB | |||
Memóriavezérlő | 128 bites hubvezérelt | |||||
Memória órajele terhelve (effektív) | 2133 MHz (DDR3) | 1600 MHz (DDR3) | 4500 MHz (GDDR5) | 4000 MHz (GDDR5) | 2133 MHz (DDR3) | |
Max. memória-sávszélesség | 34 132 MB/s | 25 600 MB/s | 72 000 MB/s | 64 000 MB/s | 34 132 MB/s | |
Támogatott DirectX | 11.2 | 11 | ||||
*Az integrált grafikus vezérlő valószínűsíthető elnevezése |
Tesztelés
FM2 tesztplatform | AMD A10-6800K (4,1 GHz) processzor ASUS F2A85-V PRO alaplap (A85X chipset, BIOS: 6104) 2 x 4 GB G.Skill RipjawsX DDR3-1866 F3-14900CL9Q-16GBXL memória DDR3-2133 beállítás, 11-12-11-30-2T időzítések |
---|---|
Videokártyák | AMD Radeon HD 7770 GHz Edition 1 GB GDDR5 – Catalyst 13.11 beta ASUS Radeon HD 7750 1 GB GDDR5 – Catalyst 13.11 beta Sapphire Radeon HD 7750 2 GB DDR3 – Catalyst 13.11 beta Sapphire Radeon HD 6670 1 GB GDDR5 – Catalyst 13.11 beta AMD Radeon HD 8670D (A10-6800K IGP) 1 GB DDR3 – Catalyst 13.11 beta |
Háttértárak | Intel SSD 510 250 GB SSDSC2MH250A2 (SATA 6 Gbps) SSD Seagate Barracuda 7200.12 500 GB (SATA, 7200 rpm, 16 MB cache) merevlemez |
Processzorhűtő | Prolimatech Megahalems Rev.C |
Tápegység | Seasonic Platinum Fanless 520 – 520 watt |
Monitor | Samsung Syncmaster 305T Plus (30") |
Operációs rendszer |
Windows 7 64 bit |
Az általunk egyedileg beállított HD 7750 mellett a referencia GDDR5-ös, illetve DDR3-as HD 7750 is bekerült a tesztbe, továbbá a szintén referencia HD 7700 és HD 6670 is részt vett az összehasonlításban. A tesztekhez most öt játékot, illetve a LuxMarkot választottunk ki.
Hirdetés
Játékok
- Crysis 3 (DirectX 11) – motor: CryEngine 3 / műfaj: FPS
- DiRT Showdown (DirectX 11) – motor: EGO Engine / műfaj: autóverseny
- Hitman: Absolution (DirectX 11) – motor: Glacier 2 / műfaj: TPS
- Sleeping Dogs (DirectX 11) – motor: United Front Engine / műfaj: TPS/akció
- Tomb Raider (DirectX 11) – motor: Crystal Engine / műfaj: TPS/kaland
A méréseket 1680x1050-es és 1920x1200-as felbontásban végeztük el, miközben a részletességet az adott játék erőforrásigényeinek megfelelően próbáltuk még játszható szintre belőni.
Crysis 3 alatt nagyon limitáló volt a szűkös memória-sávszélesség, amit már a két HD 7750 közötti szakadék is jól szemléltet.
A DiRT már nem igényel akkor sávszélességet, így itt az általunk beállított megoldás közelebb tudott férkőzni a GDDR5-ös HD 7750-hez.
Az eredmények alapján a Crysishoz hasonlóan a Hitman is eléggé sávszélesség-igényes játék, így itt szerzeményünk csak a HD 6670 szintjére volt elég.
Sleeping Dogs alatt az iméntihez nagyon hasonló tendenciát láttunk.
És ugyanez igaz Tomb Raiderre is ahol megint csak a HD 6670 szintjét hozta a módosított HD 7750.
A GPGPU teljesítményre kihegyezett, LuxMark névre hallgató félszintetikus ray-tracing benchmark adta a legjobb eredményt. Ennek legfőbb oka, hogy az ilyen jellegű feladatok jóval kevésbé igénylik a nagy sávszélességet, mint a játékok, illetve itt a GCN általános számításokban tapasztalható erőssége is megmutatkozik.
Esélylatolgatás
A megszokás kedvéért összesítettük a néhány játékban kapott eredményeket.
Egyszerű szimulációnk alapján a januárban megjelenő A10-7850K APU-ban található grafikus processzor körülbelül 20%-kal múlhatja majd felül az A10-6800K IGP-jét, mellyel nagyjából a HD 6670 vonalába kerülhet. A két HD 7750 közötti űr jól mutatja, hogy ezért az eredményért a szűkös memória-sávszélesség a felelős, mely sok esetben limitálja az 512 számolóegység által elérhető maximális megjelenítési tempót. Ezzel minden bizonnyal a tervezők is tisztában vannak, így érdekes lesz látni, hogy a végleges termék esetleg tartalmazni fog-e bármilyen, a DDR3-as rendszermemória sávszélességégének limitációját enyhítő vagy kompenzáló megoldást.
Nincs könnyű dolga az AMD-nek, hisz a DDR4 szélesebb körű elterjedéséhez még legalább két év szükséges. A vállalat kacérkodott a GDDR5 bevetésével is, de ez a terv végül piacképtelennek bizonyult, így elvetették. Egy potenciális megoldás lehet a lapkába (vagy mellé) integrált buffer (cache), bár ez további szilíciumot vagy egy plusz lapkát, illetve utóbbi esetében valamivel bonyolultabb tokozást jelentene, ami az előállítási költségekre kedvezőtlen hatással lenne, akárcsak a 3 vagy 4 csatornás memóriavezérlő lehetősége. A tervezőknek a megfelelő haszonkulcs fenntartása mellett azt is szem előtt kell tartaniuk, hogy ezeknek a 140-150 dollár körüli csúcsmodelleknek rendszerszinten kell jó ár/teljesítménnyel mutatóval rendelkezniük, ergo hasonló összegből ne érje meg jobban megvásárolni a különálló processzor és videokártya kettősét, mint az APU-t. Minden bizonnyal nagy segítség lehet majd egyes játékoknál a Mantle API, de ez "csak" a konkurenciával szemben jelenthet előnyt, hisz példának okáért a HD 7750 ugyanúgy képes lesz (gyorsabban) futtatni az API-t támogató játékokat, mint az új APU.
A Kaveri rajtja után szokásunkhoz híven majd részletes teszttel jelentkezünk, mely már jóval pontosabb információkkal fog szolgálni az APU számítási teljesítményét és képességeit illetően.
Oliverda