A hatmagos AMD Phenom II X6 tesztje

Felzárkózás? Van rá esély...

Az AMD az elmúlt időszakban számos jól sikerült, versenyképes asztali processzort dobott a piacra, érthetjük ezalatt bármelyik Phenomot vagy Athlont. Azt azonban be kell látni, hogy ezek mindegyike inkább csak a belépőszinten vagy a középkategóriában lett népszerű, ott is elsősorban az árazás miatt. A felső- vagy csúcskategóriás processzorok „versenye" egy ideje már nem is nevezhető versenynek, elvégre ebben a szegmensben csak az Intel termékeit találhatjuk meg. Az AMD eddigi csúcs asztali processzora, a Phenom II X4 965 csak az Intel középre pozicionált, előző generációs Core 2-eseivel, illetve a kétmagos és Hyper-Threadinget támogató, vagy négymagos, de a HT-t nem támogató Core i5 ellenében bizonyult elegendőnek. Ez sajnos nem csak az AMD számára rossz hír, de nekünk vásárlóknak sem jó, mert így a gyorsabb processzorok az emberek többsége számára szinte elérhetetlen áron kelletik magukat; a legolcsóbb Core i7 még mindig a 70-75 000 forintos ársávban tartózkodik, pedig már majdnem egy éve piacon van.


Phenom II X6 1095T [+]

Az már évek óta egyértelmű, hogy a processzorok nyers számítási kapacitását nem (csak) az órajel, hanem a szílicumlapkán található CPU-magok száma határozza meg. E tekintetben igen komoly harc folyik a két gyártó között annak ellenére, hogy ezt egy asztali PC-s felhasználó nem biztos, hogy látja. A szerverekbe szánt processzorok terén az AMD már 12 (Magny-Cours), az Intel pedig 8 magot (Beckton) kínál lapkánként, melyek ezen a felhasználási területen hozzák a tőlük elvárható teljesítményt, ugyanis ott, ahol az idő komolyan számít, és pénz forog kockán, ott fontos az erőforrások kiaknázása. De mi a helyzet az otthoni PC-s alkalmazásokkal? Az általunk is tesztelt programcsokorban jópár olyan alkalmazás található, melyek igen népszerűek, de még a négymagos CPU-k erőforrásait sem képesek kellően kiaknázni. Akkor mire számíthatnánk akár egy 12 magos Opterontól?

Nem kell ennyire messzire mennünk, hiszen az Intel március elején mutatta be a hatmagos Core i7-et, mellyel megszilárdította totális egyeduralmát a csúcskategóriás processzorok piacán (1000 USD-ért), tehát már mi, szimpla PC-s felhasználók is betekintést nyerhettünk a jövőbe, ami immár a jelen. Az AMD hatmagos válasza két héttel ezelőtt érkezett meg a Phenom II X6 személyében (Thuban kódnéven), ő lesz tesztünk főszereplője.

Fontos kiemelni, hogy az Intel és az AMD teljesen másként közelíti meg a hatmagos kérdést, bármilyen szempontot is vegyünk figyelembe, különbözőek a válaszok. Egyvalami közös, ez pedig a hat mag. Az Intel a Gulftownt (a hatmagos Core i7 alapjául szolgáló CPU-mag kódneve) a csúcsszegmensbe szánta, a földi halandók számára megfizethetetlen árkategóriába, ahol ugyan mintegy státuszszimbólumként díszeleghet, de ettől nekünk nem lesz jobb, mert sosem fogjuk tudni megvenni. Ezzel szemben az AMD hatmagosait szimpla átlagprocesszornak pozicionálja, gyakorlatilag csak kicsit kell tovább gyűjteni a pénzt ahhoz, hogy X4 helyett X6-ot vehessünk. Az olcsóbb modell 1055T néven kb. 55-60 000 forintba kerül, ami egyáltalán nem megfizethetetlen, de még a csúcsmodell, az 1090T ára sincs túlságosan elszállva, kb. 80-85 000 forintért valószínűleg sokkal többen fogják megvenni, mint a hatmagos Core i7-et. A forint újbóli gyengülése miatt megint drágábbak lettek a hardverek, 2 héttel ezelőtt még jó 6-7000 forinttal olcsóbb lett volna a Phenom II X6. Az Intel Gulftown a 2011-ben leköszönő LGA1366-os foglalat utolsó tagja, míg a Phenom II X6 az elviekben még a Bulldozer kiszolgálására is képes AM3-as alaplapokba érkezik, csak egy BIOS-frissítésre van szükség az üzembe helyezéséhez.

De mi a helyzet magával a processzorral, az architektúrával? Itt is komoly eltéréseket fedezhetünk fel. A Gulftown egy újnak nevezhető gyártási eljárással, 32 nm-es csíkszélességen készül, míg a Phenom II X6-ot a már bejáratott, de nem biztos, hogy a hatmagosokra szabott 45 nm-en készítik. Az Intel ezzel elérte, hogy a hatmagos csúcsprocesszor annyit vagy kevesebbet fogyasszon, mint a 45 nm-es, négymagos Bloomfield kevesebb CPU-maggal, illetve gyorsítótárral, tehát az AMD esetében is az az elvárható minimum, hogy a hatmagos Phenom ne csússzon kívül a 125 wattos kereten. Ez elvileg sikerült nekik, az 1055T és az 1090T is a 125 wattos TDP-osztályba került.


Thuban (X6) / Deneb (X4)

A teljesítményt befolyásoló tényezők terén is különbözőek az álláspontok. A Phenom II X6 első ránézésre olyan, mintha másfél Phenom II X4 lenne, pedig korántsem ez az igazság. Ha jobban megvizsgáljuk a specifikációkat, akkor látható, hogy a hatmagos Phenom bizonyos szempontok szerint jobb, más szempontok szerint viszont gyengébb, mint egy valódi, 1,5-szerezett Phenom II X4, de a helyzet az, hogy inkább kevesebb, mint több. Ehhez egyébként mégcsak a paramétereket sem kell szemügyre vennünk, elég ránézni a két processzorról készült fényképre. Nagyon úgy tűnik, hogy az AMD úgymond „hozzáillesztett" két további processzormagot a Deneb maghoz, és ebből lett a Thuban. Gyakorlatilag ez a legegyszerűbb, leggyorsabb és legfájdalommentesebb megoldása a problémának, mondhatnánk akár azt is, hogy vészhelyzetben valahogy így kell csinálni, csak éppenséggel ettől ne várjunk csodákat.

Mi is a probléma? Először is hat mag az nem egyszerűen plusz két mag, más tényezőket is figyelembe kell venni. Több CPU-magnak magasabb sávszélességre és több, egyazon időintervallum alatt elérhető adatra van szüksége belül és kívül egyaránt. A Thuban nem felel meg ezeknek a feltételeknek. A CPU-n belül a harmadszintű gyorsítótár mérete változatlan maradt, optimális esetben 6 MB-ról 9 MB-ra kellett volna növelni (szimpla lineáris skálázódással számolva, persze nem ilyen egyszerű a helyzet, de mindenképpen növelni kellene). A gyorsítótár órajele sem változott, továbbra is 2 GHz, ami már a négymagos Denebet is sokszor visszafogta, szűk keresztmetszetként jellemezhetjük. Nem változott az északi híd vezérlőlogikájának az órajele sem, ez az L3 cache-sel egyetemben 2 GHz-en jár, pedig, amint az a képen is jól látszik, a két "odatapasztott" CPU-magtól az adatoknak hosszabb utat kell megtennie a harmadszintű gyorsítótárig, mint a másik négytől, és mivel eleve több a CPU-mag, így az adatok magok közti körbejáratásának sebessége is számít. És akkor még ott van a HyperTransport-link sebessége, ami a külvilággal való kapcsolattartásban játszik kulcsszerepet, ennek órajele szintén változatlan maradt, illetve az AMD a memóriavezérlőhöz sem nyúlt hozzá. Nyilván ezen „problémák" egy része arra vezethető vissza, hogy az AMD egyazon foglalathoz ragaszkodik. Az AM2+/AM3-nak megvannak a maga korlátai, a HT-link órajeléhez még akár hozzányúlhattak volna, de a memóriavezérlőhöz már nem, mert az a meglévő AM3-as infrastruktúrával való inkompatibilitást eredményezte volna.

Hogy teljes legyen az összkép, lássuk, hogy az Intel miként csinálta: másfélszeresére növelte a harmadszintű gyorsítótár méretét, és megemelte az órajelet az északi híddal egyetemben (2,66 GHz-ről 3,2 GHz-re), illetve egy új utasításkészlettel látta el a Gulftownt (AES-NI). A memóriavezérlő változatlan maradt, de az LGA1366-os platform eleve egy háromcsatornás felépítés köré épül, ami magasabb sávszélességet kínál. A QPI-link órajele sem változott, de a sávszélesség ez esetben kicsit másként alakul, hiszen az Intel megoldása 25,6 GB/s-et kínál, az AMD-é viszont csak 16 GB/s-ot.

Hogy ne csak arról legyen szó, hogy mi hiányzik, lássuk a pozitívumokat is. Mint már említettük, a Thuban (X6) fogyasztása elvileg megegyezik a Denebével (X4), ami szép kis előrelépés ugyanazon csíkszélesség mellett. Így már esélyt látunk arra is, hogy az Intel CPU-ihoz képest eléggé sokat fogyasztó C2/C3 steppinges X4-ből kijöjjön egy jóval alacsonyabb fogyasztású verzió a Thubannál alkalmazott E0 stepping köré építve. És ez még nem minden!

A Thubanban bemutatkozik az AMD Turbo Core névre keresztelt technológiája, ami néhány tekintetben hasonlít az Intel-féle Turbo Boost-hoz, de más szemszögből nézve különbözik is attól. Az alapprobléma a következő: napjaink alkalmazásainak nagy része képtelen profitálni a sokmagos processzorok nyújtotta előnyökből, mert vagy még nem készült el az adott feladat párhuzamosított verziója, vagy egyszerűen képtelenség párhuzamosítani azt, ilyenből is van szép számmal. Hiába „magyarázzuk" a programnak, hogy de hát ott az a sok kihasználatlan erőforrás, tessék használni, az adott alkalmazás fittyet hányva erre mindössze egy esetleg két magon fog számolni. Ez káros, mert az erőforrások csúcsrajáratása felesleges, ebből következően a fogyasztás is indokolatlanul magas. A Turbo Core bekapcsolásával mindkét szempontból javíthatunk a helyzeten.

A TC érzékeli, hogy hány processzormag dolgozik, és ettől függően állítja be az egyes magok órajelét. Ha mind a hat mag dolgozik, akkor az alapórajel érvényesül, ez pl. az 1055T esetében 2,8 GHz. Ha viszont csak egy, kettő vagy három mag dolgozik, akkor ennek a három magnak az órajele felugorhat egy előre meghatározott szintre, ami 400 vagy 500 MHz adalékot jelent típustól függően, a többi „alvó" mag pedig a CnQ-nak köszönhetően 800 MHz-en kegyeg. A Turbo Core lényegében egy megfordított Cool'and'Quiet. Ez egy igen szimpla megoldás az Intel Turbo Boostjához viszonyítva. A Turbo Core nem kapcsolja le a kihasználatlan magokat, csak az órajelüket és a feszültségüket csökkenti. Ugyanakkor a használt három mag órajelén felül a feszültségüket is megemeli, így képes a meghatározott TDP-kereten belül maradni. Az Intel Turbo Boostja teljes, 4 vagy 6-magos terhelés mellett is megemeli az órajelet, kevesebb erőforrást igénylő esetekben pedig még tovább emeli a szorzót egy bizonyos szintig, ugyanakkor a feszültséghez nem nyúl hozzá, és a kihasználatlan processzorokat képes teljesen lekapcsolni (power gating).

Az a helyzet, hogy némi kisérletezgetés után rá kellett jönnünk, a Turbo Core elméletben jól hangzik (bár nem olyan jól, mint a Turbo Boost), a gyakorlatban elég sok a buktató. Először is, ha egy program jól párhuzamosított, akkor az mind a hat magon dolgozik, tehát ebben az esetben a Turbo Core nem aktiválódik. Ugyanakkor nem találkoztunk még olyan alkalmazással, ami pont kettő vagy három magon számol. Az a baj, hogy egy egy szálon számoló program futtatása sem csak pont egyetlen magot fog leterhelni, az operációs rendszer ütemezője ezt a szálat körbe-körbe járatja az egyes processzormagokon, miközben a háttérben más, kisebb terhelésű, de a Turbo Core aktiválódását megakadályozó kis folyamatok futnak, így a Turbo Core gyakorlatilag csak néhány speciális esetben képes működésbe lépni. Pl. a DivX kódolás teljesen, 100%-osan nem képes leterhelni még egy kétmagos CPU-t sem, de 60-70%-ra még egy hatmagoson is képes: a Turbo Core nem fog bekapcsolni. Vagy mondhatnánk a WinRAR tömörítését is (nem a benchmarkot), ez egy négy vagy hatmagos processzor egyes CPU-magjait alig 40-50%-ra terheli, ami éppen elég arra, hogy megakadályozza a Turbo Core bekapcsolását. Az lenne az ideális, ha az adott program az első két-három magot 100%-ra terhelné, a másik hármat viszont egyáltalán nem, csak hogy ilyen nem létezik, mert a milliónyi kis háttérben futó folyamat ezt megakadályozza.

Processzor típusa Phenom II X4 965 Phenom II X6 1055T Phenom II X6 1090T
Foglalat AMD AM2+ / AM3
Magok / kezelt szálak száma 4 / 4 6 / 6
Órajel 3400 MHz 2800 MHz 3200 MHz
Turbo Core - 3300 MHz 3600 MHz
Szorzó x HT-ref. 17 x 200 MHz 14 x 200 MHz 16 x 200 MHz
Max. memória órajel DDR3-1600 (kétcsatornás)
L1 cache mérete 4 x 64/64 kB 6 x 64/64 kB
L2 cache mérete 4 x 512 kB 6 x 512 kB
L3 cache mérete 6 MB
L3 cache órajele 2000 MHz
Kommunikáció az északi híddal 2 GHz-es HyperTransport-link
(16 GB/s)
SIMD utasításkészletek 3DNow(+), MMX, SSE, SSE2, SSE3, SSE4a
Egyéb technológiák CnQ 3.0, C1E, Enhanced Virus Protection, AMD-V
Gyártástechnológia / feszültség 45 nm SOI
1,312 V
C3 stepping
45 nm SOI
~1,3 V
E0 stepping
TDP 125 watt
CPU kódneve Deneb Thuban
Tranzisztorok száma 758 millió 904 millió
Mag mérete 258 mm² 346 mm²

A cikk még nem ért véget, kérlek, lapozz!

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés