Phenom II: bevezető
Az AMD valószínűleg nem szívesen emlékszik majd vissza a 2007-es és 2008-as évre, hiszen számukra másról sem szólt ez az időszak, mint a túlélésről, ezért kiemelt figyelmet érdemelne 2009-es újévi fogadalmuk (már ha volt egyáltalán ilyen). Idén a cég azonnal beleugrott a mély vízbe, elvégre hogyan kezdhették volna jobban ezt az évet, mint egy új platform bemutatásával, a Dragonnal? Jelen cikkünkben ennek egyik, ha nem a legfontosabb alkotóeleméről, a második generációs négymagos AMD processzorról, a Phenom II X4-ről lesz szó.
Rövid visszatekintő:
2007-ben bemutatkozott a K10, az első monolitikus, azaz vérbeli négymagos mikroarchitektúra. A koncepció, az elképzelés, a látomás irigylésre méltó volt, de a kivitelezésbe hibák csúsztak. Először is eléggé elkésett, hiszen az Intel egyéves előnyben volt a négymagosok piacán. Erre rátett egy lapáttal, hogy a megjelenést követően a Barcelona kódnéven ismert, K10-alapú szerverprocesszorról kiderült, hogy hibás, az ominózus TLB-probléma miatt a szerverprocesszorok piaci terítését el kellett tolni, miközben az Intel már régen a négymagos Clovertownt futtatta. Később a sajtó a TLB-hibát annyira felfújta, hogy az új architektúrára épülő asztali CPU, a Phenom sem számíthatott örömteli fogadtatásra. Mindezek következtében az AMD piaci részesedése lassacskán csökkent, a profitkilátások romlottak, az Intel pedig már a 45 nm-re "átültetett" Core architektúra bemutatásával nyűgözte le a közönséget (még magasabb teljesítmény, még alacsonyabb fogyasztással). A videokártyák szegmensében jól megy az AMD-nek, de a diszkrét grafikus vezérlőkön keresett haszon aligha elég ahhoz, hogy egy processzorgyártót kihúzzon a gödörből. Év közben aztán megjelent a Phenom javított változata, de nem sikerült vele megnyerni a vásárlók szívét (legalábbis a többségükét), mert a négymagosok mezőnyében továbbra is az Intel Core 2-ese maradt a mérvadó, márpedig a Phenom lassabb, többet fogyaszt, jobban melegszik és kevésbé tuningolható, mint riválisa, így az AMD csak az ár/teljesítmény mutatók javításával tudta korrigálni hibáit és fenntartani önmagát. Mikor jönnek már vissza azok az (Athlon 64 X2-es) idők, amikor az AMD volt a topon? Talán most, a K10 folytatása megadja erre a választ.
A Phenom II bemutatása előtt szóljunk néhány szót a Dragonról, a Spider platform utódjáról. Nem másról van szó, mint egy komplett rendszerről, ami egy alaplap (és az azon szolgálatot teljesítő chipset), processzor és videokártya triumvirátusára épül. Az AMD-ATI kooperáció első ilyen gyümölcse a Spider platform volt, ami egy AMD 790FX chipsetre, egy Phenom processzorra és egy-négy Radeon HD 3800-as grafikus chipre (CrossFireX) épült. A koncepció lényege, hogy – az Intellel ellentétben – előre letesztelt, jól összekombinált és összhangban lévő komplett rendszert kínáljanak, hiszen az átlagvásárló számára mégiscsak vonzóbb egy minden téren AMD-s komponensekből felépülő számítógép (egy platform kódnevek és kompatibilitási problémák nélkül), mint egy mindenhonnan összegereblyézett konfiguráció. Ezt az alapötletet viszi tovább a Dragon, ami szintúgy egy AMD 790(GX)-es chipset köré épülő alaplapból, egy-négy Radeon HD 4800-as videokártyából (CrossFireX) és egy Phenom II X4-es processzorból áll össze. A platform részét képező lapkakészlettel és a videokártyával már jóval korábban megismerkedhettek a PROHARDVER! olvasói, ezért nem maradt más hátra, mint a Phenom II kielemzése.
Az AMD január elején mutatta be a második generációs Phenom processzorok első hírvivőit, a Phenom II X4 940 Black Editiont és a Phenom II X4 920-at, melyek 3, illetve 2,8 GHz-en járnak, előbbi szorzózár nélkül kerül forgalomba, csak azért, hogy a tuningra hajlamos felhasználók szemében vonzóbb legyen. A két processzor 275, illetve 235 dolláros listaárral kerül fel a boltok polcaira (azóta már árcsökkentésről szólnak a hírek), tehát már ebből is látható, hogy az AMD a most bejelentett processzorokkal sem a csúcsszegmensben, hanem inkább valahol középtájon szeretné megvetni a lábát. De akkor mi újat tudnak felmutatni ezek a processzorok a megemelt órajelen kívül? - merülhet fel a kérdés.
Ha a régi és az új Phenom viszonyát szeretnénk szemléltetni, akkor a legegyszerűbb, ha felidézzük a Conroe és a Penryn közti kapcsolatot. A Penryn a Conroe alacsonyabb csíkszélességen gyártott, némileg megnövelt számítási teljesítményű verziója, és gyakorlatilag ugyanezt mondhatjuk el a Phenom II X4 alapjául szolgáló K10.5-ös, Deneb kódnevű processzorról is (amely az egyik legfényesebben ragyogó csillagról kapta a nevét). A különbség az, hogy míg az Intel annak idején egyszerűen gazdaságossági szempontokból váltotta le a Conroe-t (lényegében semmi nem sietette), addig az AMD-nek több oka is volt rá, hiszen az első Phenom nemcsak versenyképességi problémákkal küszködött, de házon belül is problémákat okozott a magas gyártási költség és a gyenge skálázódás miatt. A K10.5 lenne a gyógyír? Lássuk, hogy van-e új a nap alatt...
A Barcelona és a Shanghai, vörössel kiemelve a harmadszintű gyorsítótár
A K10.5 mindenekelőtt azért mérföldkő az AMD történelmében, mert ez az első 45 nm-es csíkszélességen gyártott AMD processzor. A cég 65 nm-es gyártástechnológiával gyártott központi egységei enyhén szólva sem váltották be a hozzájuk fűzött reményeket. A K8-as Brisbane (Athlon 64 X2) processzorok nem voltak képesek felülmúlni a 90 nm-es Windsorok által felállított követelményeket, és az Agena (illetve a Barcelona) sem sült el túl jól. A 45 nm-re való átállás segít leszorítani a gyártási költségeket, a fogyasztást és remélhetőleg a melegedést (ez esetben a szivárgási áram a kulcs), illetve segédkezik a magasabb órajelek elérésében. Mint tudjuk, az Intel a 45 nm-es processzorok gyártásához egy hafniumalapú (high-k) kapuoxidot és egy fémalapú kapuelektródát hívott segítségül, ezek ötvözésével adott területen kétszeres tranzisztorsűrűséget ért el, és ötödére csökkentette a szivárgási áramot. Az AMD egy teljesen más utat választott ahhoz, hogy 45 nm-es chipeket készítsen. Egy úgynevezett immerziós litográfia alapú levilágítást használnak a szíliciumostyák feldolgozása során, a kritikus áramkörök precízebb megrajzolása érdekében. A hagyományosnak nevezhető fotolitográfiai eljárás esetében a fényforrás (ultraibolya fénysugarak) rávilágít egy maszkra (ami az adott szíliciumréteg áramköri struktúráit tartalmazza), majd miután a fény átszűrődik rajta, kialakítja az áramköröket a szíliciumostyán (ez elméletileg 50 nm-ig jól működik). Az immerziós litográfiai eljárás annyiban más, hogy egy nagy tisztaságú folyadékréteget állítanak a fényforrás és a wafer közé, a folyadékréteg pedig könnyebben fókuszálhatóvá teszi a fénysugarat, azaz nagyobb felbontású leképezést tesz lehetővé. Gyártástechnológia terén végül is elmondható, hogy végre 1-1 az állás, hiszen mindkét cégnek van 45 nm-es csíkszélességű gyártósora, de míg az AMD továbbra is poliszilícium kaput és oxinitrid kapuoxidot használ (amivel a kékek felé billen a mérleg nyelve), addig az Intel kénytelen pontosabb és drágább maszkokat készíteni az ostyák megmunkálásához (a mutató visszaáll középre).
Hirdetés
Az a tény, hogy végre az AMD is képes 45 nm-es chipeket készíteni, számos optimalizációnak és teljesítményfokozó átalakításnak a lehetőségét veti fel, és meg is lépték ezeket. Az elvárásaink azonban ne legyenek túl magasak, mert a K10 két generációjának megjelenése között mindössze 1 év telt el, ez az idő pedig éppenhogy elég volt arra, hogy az új struktúrák a tesztelés, majd a gyártás felfutása után kereskedelmi forgalomban is megjelenjenek, ennyi idő alatt képtelenség gyökeres változtatásokat eszközölni. De azért van néhány, lássuk ezeket:
Phenom II: a megmentő?
A K10.5-alapú processzorok elődeiknél több, 758 millió tranzisztorból épülnek fel, miközben a mag mérete csökkent, 285 mm2-ről 258 mm2-re. Táblázatunkból kiderül, hogy a Core i7 alapját adó Bloomfield nagyon hasonló karakterisztikával rendelkezik, ezért kiváltképp érdekes, hogy a két rivális mire jutott a teljesítményt tekintve közel azonos mennyiségű tranzisztorból, közel azonos méretű szíliciumlapkán.
Az új architektúra első és legszembetűnőbb tulajdonsága (a megemelt órajeleket leszámítva) a 6 MB-ra növelt harmadszintű gyorsítótár, gyakorlatilag ennek tudható be a tranzisztorszám drasztikus megemelkedése. Az AMD elkapkodta a K10-et: ha már a harmadszintű gyorsítótár bevezetése mellett döntöttek, tudniuk kellett volna, hogy 2 MB ebből a cache-ből nem lesz elég négy rendkívül adatéhes processzormag számára, márpedig 65 nm-en nem voltak képesek ennél nagyobbat ráapplikálni a lapkára, mert az már így is túl nagy volt. A K10.5-ön 6 MB-nyi harmadszintű gyorsítótárat találunk, háromszor annyit, mint elődjén. De a cache-nek nemcsak a méretét növelték meg, hanem az elérési idejét is csökkentették (elvileg 2 órajelciklusnyi idővel), ugyanakkor asszociativitási szintje 32-ről 48-ra emelkedett.
Némileg átalakították a memóriavezérlőt: az új család memóriavezérlője a DDR2-es memóriákon túl már a DDR3-as szabványt is támogatja, ráadásul a kompatibilitási lista bővítése közben végeztek némi optimalizációt is. Ezzel elvileg nőtt a processzor számára elérhető memória-sávszélesség, de arról nem szól a fáma, hogy pontosan mit csináltak, és mennyivel lett gyorsabb a memóriavezérlő.
A "Smart Cache" kifejezés már biztosan ismerős az olvasók számára innen vagy onnan, annyi bizonyos, hogy bármelyik gyártótól is származzon az elnevezés, valamiféle gyorsítótárral kapcsolatos optimalizáció áll mögötte. Az AMD-féle K10.5-ben bemutatkozó "Smart Cache, cache flush on halt" lehetővé teszi, hogy a gyorsítótárakban található információkat csak azokból a gyorsítótárakból olvashassa ki a processzor, melyek éppen működésben vannak, azaz egy adat megkeresése során egyik processzort sem "ébresztik" fel feleslegesen, már amennyiben az előtte leállt, mert nincs használatban. Erre a harmadszintű gyorsítótár ad lehetőséget: a leálló processzorok első- és másodszintű gyorsítótárjában található információk a "halt" stádium meghívása során átmásolódnak a harmadszintű gyorstárba (elvégre exkluzív cache-ről van szó), így a processzorokat később "nyugiban" lehet hagyni, ami természetesen fontos szempont az energiahatékonyság szempontjából.
A javítások listájáról nem hiányozhat a továbbfejlesztett elágazásbecslő logika sem, de arról sajnos nincs információnk, hogy pontosan mit optimalizáltak rajta. Meg kell még említenünk a load és store várakozási sor (LSU vagy LSQ) meghosszabbítását, illetve az FPU puffer kiterjesztését, igaz ez esetben sem tudjuk, hogy pontosan miről is van szó (regiszterkészlet vagy ütemezés?). Elvileg gyorsult az FP regiszterből-regiszterbe átmozgatás (mov), és javítottak a LOCK prefixek feldolgozásán.
Mindezt összegezve és magyarul:
- nagyobb és gyorsabb L3 gyorsítótár
- még több memória-sávszélesség
- enyhén feljavított, gyorsabb processzormagok
- kisebb fogyasztás és melegedés
Vegyük kézbe...
Csomagolás: Phenom II X4 940 Black Edition [+]
Fentebb látható az újonnan megjelent Phenom II X4 940 Black Edition csomagolása, ami éppen olyan, mint az elődöké. AM2+ foglalatba illeszkedik, tehát csak a DDR2-es memóriákat támogatja, bár az AMD azt ígérte, hogy a termékskála februárban kibővül az AM3-as processzorokkal, melyek már támogatni fogják a DDR3-as modulokat is(!) és visszafelé kompatibilisek lesznek, tehát passzolnak majd az AM2+-os alaplapokba is. A most bejelentett két új processzor belsőleg – az órajelüket és a szorzózárat leszámítva – nem különbözik semmiben, a chipsethez kapcsoló HyperTransport-link sebessége továbbra is 1,8 GHz, az északi híd (memóriavezérlő plusz harmadszintű gyorsítótár) órajele pedig szintén 1,8 GHz, ami enyhe visszalépés az eredeti Phenomokhoz képest, hiszen a magasabb órajelű változatokban már 2 GHz-en ketyegett ez a részegység, de az AMD megígérte, hogy az AM3-as processzorokban már az északi híddal sem lesz probléma (már csak az a kérdés, hogy akkor minek adták ki az AM2+ processzorokat, mikor az AM3 visszafelé is kompatibilis lesz, és gyorsabbnak is ígérkezik). Elvileg az AM3-asok termékskáláján újra feltűnnek majd a hárommagos Phenomok, melyekben három aktív processzormagot találunk (a gyártó nyilván a hibás processzoroktól akar így megszabadulni).
A Phenom II X4 külsőre semmiben sem különbözik az elődeitől, az AM3-asokkal némileg változik a helyzet, mert azokon kettővel kevesebb lábbal találkozhatunk majd. A processzorhoz gyárilag csomagolt hűtő nem különösebben figyelemre méltó, rézbetét érintkezik a processzorral, két hőcső segít átvezetni a meleget az alumíniumlamellákon; a ventilátor fordulatszáma szabályozható, de alapon sem hangos.
A tesztelés során egy AMD 790-es lapkakészletre épülő Asus M4A79 Deluxe alaplap segítségét vettük igénybe, a beüzemelést követően a CPU-Z szépen felismerte a processzort, és azonnal láthattuk a változásokat a korábbi Phenomhoz képest: a megnövekedett harmadszintű gyorsítótárat, és az alacsonyabb órajelű északi hidat. A processzor alapfeszültsége 1,35 V, ami picit magasnak tűnik az Intel 45 nm-es lapkáinál megszokott értékekhez (1,20-1,28 V) képest. Az AM2+ lábkiosztású Phenom II-esek kompatibilisek az összes korábbi AM2-es alaplappal, csak egy BIOS-frissítésre van szükségünk (vagy még arra sem) a beüzemeléskor. Ilyenkor elválik, hogy melyik alaplapgyártó igazán felhasználóbarát... Megkötések sajnos vannak, ugyanis be kell érnünk az 1 GHz-es HyperTransport-órajellel és a kevésbé dinamikus energiamenedzsmenttel, de ez már az első Phenom megjelenésekor tudvalevő volt.
Az AMD nyilván tudja, hogy a most bejelentett új Phenomok még mindig nem elég gyorsak ahhoz, hogy versenyre keljenek egy Core i7-tel, ezért igyekszik kihangsúlyozni az adott platform ár/teljesítmény mutatóját, amiben a zöldek (saját maguk szerint) jobban állnak. Kétségtelen, hogy a gyártó által előkészített konfigurációk összehasonlításában az AMD ezen a téren előrébb jár (a Dragont egy Core i7, X58-as alaplap és DDR3 memóriapár kombinációjával hasonlítják össze), de azért legyünk őszinték, lássuk először a Phenom II teljesítményét; könnyen lehet, hogy inkább egy Core 2-es rendszerrel kellene az összehasonlítást elvégezni. Az AMD mellett szól a visszafelé kompatibilis infrastruktúra, az tény, hogy az AMD ebből a szemszögből sokkal inkább felhasználóbarát. Legalábbis annak tűnik, de ne felejtsük el, hogy a Core i7-nek sem véletlenül volt szüksége egy gyökeresen átalakított foglalatra (elvégre a Core 2-Core i7 váltás kb. olyan volt, mint az Athlon XP Athlon 64 általi leváltása), míg a Phenom II és a Phenom között gyakorlatilag nincs architektúrális eltérés, mondhatni nem jelentősek a különbségek, tehát az lett volna csak az igazán kirívó eset, ha az AMD most foglalatot vált (a Penryn megjelenése után sem kellett alaplapot cserélni). A Core 2 mellé is vehetünk DDR2-es alaplapot (azaz megelégszik a DDR2-es memóriákkal), ami semmivel sem lassabb, mint a DDR3-asok. Ezeket úgy gondoltuk, hogy meg kell említenünk, mert a különböző gyártói diák sokszor félrevezetőek, kb. annyira, mint a 80%-ról kezdett grafikonok...
Processzor megnevezése | AMD Phenom II | AMD Phenom | Intel Core i7 | Intel Core 2 Quad |
Architektúra Családnév Kódnév | K10.5 Stars rev. 2 Deneb | K10 Stars Agena | Core Nehalem Bloomfield | Core Penryn Yorkfield |
Órajel | 2800-3000 MHz* | 2000-2600 MHz | 2666-3200 MHz | 2333-3200 MHz |
Támogatott memória | DDR2-800/1066 | DDR2-800/1066 | DDR3-1066 (DDR3-1333) | DDR2-800 / DDR3-1066/1333 |
Gyártástechnológia | 45 nm SOI | 65 nm SOI | 45 nm Hi-K + Metal Gate | 45 nm Hi-K + Metal Gate |
Tranzisztorszám (millió) | 758 (Deneb) | 463 (Agena) | 781 (Bloomfield) | 2 x 410 (2 x Wolfdale) |
Magméret (mm2) | 258 (Deneb) | 285 (Agena) | 265 (Bloomfield) | 2 x 107 (2 x Wolfdale) |
Stepping | C2 | B2 | C0 | C0 |
L1 cache | 4 x 64 kB adat és 64 kB utasítás (2 utas) | 4 x 64 kB adat és 64 kB utasítás (2 utas) | 4 x 32 kB adat (8 utas) és 32 kB utasítás (4 utas) | 2 x [2 x 32 kB adat és 32 kB utasítás (8 utas)] |
L2 cache | 4 x 512 kB (16 utas; 256 bit) | 4 x 512 kB (16 utas; 256 bit) | 4 x 256 kB (8 utas; 256 bit) | 2 x 6 MB megosztott (24 utas; 256 bit) |
L3 cache | 6 MB megosztott (48 utas; 128 bit) | 2 MB megosztott (32 utas; 128 bit) | 8 MB megosztott (16 utas; 256 bit) | nincs |
SIMD | 3DNow!(+), MMX, SSE, SSE2, SSE3, SSE4a | 3DNow!(+), MMX, SSE, SSE2, SSE3, SSE4a | MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2 | MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1 |
Egyéb támogatott technológiák | CnQ 3.0, Enhanced Virus Protection, x86-64, AMD-V | CnQ 2.0, Enhanced Virus Protection, x86-64, AMD-V | C1E, EIST, Execute Disable Bit, EM64T, Intel VT | C1E, EIST, Execute Disable Bit, EM64T, Intel VT |
Rendszerbusz órajele | 1800 MHz HyperTransport | 1800 MHz HyperTransport | maximum 6,4 GT/s QuickPath Interconnect | 333 MHz FSB – 1333 MHz QPB |
Feszültség | 1,35 V | 1,25 V | ~1,12 V | 1,25 V |
TDP | max. 125 W | max. 145 W | max. 130 W | max. 130 W |
*: jelenleg, később alacsonyabb és magasabb órajelű típusok megjelenését várjuk
Konfiguráció és fogyasztás
A most kiadott processzorok:
Processzor megnevezése | Phenom II X4 940 (Black Edition) | Phenom II X4 920 |
Órajel (CPU-magok) | 3 GHz | 2,8 GHz |
L3 cache, északi híd órajele | 1800 MHz | 1800 MHz |
L3 cache mérete | 6 MB | 6 MB |
Támogatott memóriatípus | DDR2-1066 (AM2+) | DDR2-1066 (AM2+) |
HT-link sebessége | 1800 MHz | 1800 MHz |
Szorzólock | nincs | van |
TDP | 125 W | 125 W |
Bevezető ár | 275 USD | 235 USD |
Tesztkonfigurációk:
AMD K10.5 tesztrendszer | Phenom II (Deneb) X4 940 (15 x 200) és 2,8 GHz-en (14 x 200) [4 x 512 kB L2; 6 MB L3] Asus M4A79 Deluxe alaplap (BIOS v0801) ATI Catalyst 8.12 SB driver 2 x 1024 MB CSX Diablo DDR2-1200 1066 MHz-en 5-5-5-15-2T időzítésekkel (unganged mód) | |||||
AMD K10 tesztrendszer | Phenom 9850 (Agena) tuningolt változatai 2,66 (13 x 205) és 3,2 GHz-en (16 x 200) [4 x 512 kB L2; 2 MB L3] MSI KDA790GX Platinum alaplap (BIOS v1.2) fogyasztásméréshez: Asus M4A79 Deluxe alaplap (BIOS v0801) ATI Catalyst 8.12 SB driver 2 x 1024 MB CSX Diablo DDR2-1200 1066 MHz-en 5-5-5-15-2T időzítésekkel (unganged mód) | |||||
Intel Nehalem tesztrendszer | Core i7-940 és 920 processzor (4 x 256 kB L2) Intel DX58SO alaplap (BIOS 2260) Intel Chipset Driver v9.1.0.1007 2 x 1024 MB Samsung DDR3-1066 és 1 x 1024 MB Crucial DDR3-2000 1066 MHz-en 7-7-7-21 időzítésekkel | |||||
Intel Core 2 tesztrendszer | Core 2 Extreme Q6700 és QX9770, Core 2 Quad Q9450 processzor (2 x 4 MB illetve 2 x 6 MB L2) Asus P5E3 Deluxe alaplap (BIOS 1404) Intel Chipset Driver v9.1.0.1007 2 x 1024 MB Samsung DDR3-1066 1066 MHz-en 7-7-7-21 időzítésekkel | |||||
Videokártya | Radeon HD 4850 ATI Catalyst 8.9 | |||||
Merevlemez | Samsung Spinpoint T166 500 GB (HD501LJ; SATA; 7200 rpm; 16 MB cache) | |||||
Operációs rendszer | Windows Vista Ultimate 32-bit SP1 | |||||
Tápegység | Cooler Master 700 watt |
Tesztprogramok
- Szintetikus tesztprogramok
- Lavalys Everest 4.6
- FRAPS 2.9.2
- Konvertálás-kódolás
- TMPEGEnc XP v4.4 + DivX 6.8
- Windows Media Encoder 9 + Advanced Profile
- x264 rev. 711
- iTunes v7.5
- Tömörítés, fotó- és videofeldolgozás
- 7-Zip v4.57
- WinRAR v3.71
- Adobe Photoshop CS3
- Adobe Premier CS3
- Sony Vegas 7.0
- Renderelés
- POV-Ray v3.7 beta23
- Cinebench 10
- 3ds max 2008
- Lightwave 9.3
- Maya 2008
- Játékok
- Crysis
- Race Driver GRID
- Unreal Tournament 3
- Lost Planet: Extreme Condition
- World in Conflict
- További tesztek
- ABBYY FineReader v9
- Apache v2.2.6
- Reaper v2.019
- Sun Java 6.3 + JATMARK
- Fritz benchmark
A következőkben a Phenom II X4 940-es teljesítményét látjuk majd viszont, illetve a processzort leteszteltük 2,8 GHz-en is (14-es szorzóval), ami a 920-as típusjelölésű Phenom II X4 órajeleinek felel meg. Az összes ellenfél négymagos, elővettük a korábbi Phenom-eredményeinket, a táblázatokban szereplő Phenom X4 9950 valójában egy 9850 volt 2,66 GHz-re tuningolva (2 GHz-es órajelű északi híddal), illetve összehasonlításképpen a 3,2 GHz-re tuningolt Phenom eredményeket is rajta hagytuk a grafikonokon. Az Intel részéről egy 2,66 GHz-es Conroe magos Quad, illetve egy 2,66 GHz-es és egy 3,2 GHz-es Penryn magos Quad szerepelt a tesztekben, valamint az olcsóbbik (ami kb. egy árban van a Phenom II X4 940-nel) és a középső Core i7 is meghívást kapott. A Nehalem tesztelése során ki volt kapcsolva a Turbo mód.
Az új generációval kapcsolatban az egyik legnagyobb kérdés az volt, hogy sikerült-e lenyomni a fogyasztását. Az első Phenomban jó pár ígéretes, energiatakarékossággal összefüggésben álló funkció látott napvilágot, de a processzor fogyasztása mégis magasabb volt, mint amire számítottunk (illetve amire mindenki más számított), ami a 65 nm-es gyártástechnológia számlájára írható. Úgy tűnik, hogy az AMD most jó munkát végzett, mert üresjáratban a Phenom II X4 940 fogyasztását sikerült leszorítani a Conroe, illetve a Core i7 szintjére, ám ez még mindig elmarad a Penryn igen alacsony értékeitől, ami egyáltalán nem meglepő, mert a Penryn ezen a téren nagyon jó lett. Az új Phenom fogyasztása 3 GHz-en alacsonyabb, mint a régié 2,66 GHz-en, nem is szólva a 3 GHz-en történő összehasonlításról (meg kell jegyezni, hogy a régi Phenomot ekkor 1,45 V-on járattuk, másképp nem ment volna). Az üresjárati fogyasztással kapcsolatosan ki kell emelni, hogy míg a régi Phenom a C'n'Q használata közben 1250 MHz-re csökkentette a processzormagok órajelét (1,05 V mellett), addig a Phenom II már 800 MHz-ig skálázódik vissza 1 V-os feszültség kíséretében. Talán ennél is fontosabb, hogy az új Phenomban található C'n'Q harmadik verziójával már nincsenek gondok Vista alatt, igaz ez áldozatot is követelt, ugyanis a Phenom II-ben található magok immár nem képesek egymástól eltérő órajelen működni (de így nem tapasztalunk belassulásokat sem).
A terhelt értékek láttán nem sokat változik a kép, az új Phenom (illetve az aköré épülő rendszer) egyértelműen kevesebbet fogyaszt a réginél, és kb. annyi áramra van szüksége, mint egy régi, 65 nm-es Conroe-alapú rendszernek. Ez még mindig több, mint egy Core i7-es rendszer étványa, legalábbis egy és két processzormagot leterhelve, márpedig ez a legjellemzőbb a mindennapi használatnál. Négy magot leterhelve a Phenom II jobb a Core i7-esnél, de a számokból jól látszik, hogy közel sem skálázódik olyan jól a fogyasztás, mint az első Phenom esetében, ez valószínűleg az új C'n'Q-nak tudható be (hiszen már egyetlen mag leterhelése is elég ahhoz, hogy a többi is a maximális órajelre ugorjon fel). Ha a Phenom II X4 fogyasztását megpróbáljuk kimatekozni, akkor az jön ki, hogy a 3 GHz-es Phenom II X4 kb. 60-70 wattot disszipálhat (a teljes rendszer fogyasztása terhelve, mínusz a teljes rendszer C'n'Q-s fogyasztása, plusz a Phenom II X4 C'n'Q-s fogyasztása [kb. 10-15 watt], mínusz a többi komponens [RAM-ok, alaplap, chipset, táp] terhelés miatt megnőtt fogyasztása). Az első Phenom 2,2 GHz-es órajelen kb. 85-90 wattot evett a számításaink szerint...
Gyorsítótárak, memóriaelérés
Lassan már szokásunkká vált, hogy egy-egy új architektúra megjelenését követően az alkalmazástesztek előtt szintetikus benchmarkok segítségével is feltérképezzük az újonnan kifejlesztett lapkák tudását. Az átlagfelhasználó számára ezek a benchmarkok, illetve az ezekben elért eredmények nem jelentenek szinte semmit, mégis, érdekesség gyanánt egy-egy új architektúra felbukkanását követően érdemes egy kicsit lejjebb ásni, hogy lássuk, mi történt, mit alkottak a mérnökök az elmúlt évben (években), mely területek az újdonság gyengéi vagy erősségei, és mi következik mindebből. Cikkünk ezen része két felvonásra osztható fel, először a memóriavezérléssel és a cache-hierarchiával foglalkozik (ez a kettő nehezen választható ketté), majd az utasításvégrehajtás kapja a főszerepet.
Az összes most következő teszt 3,2 GHz-es processzorórajel és a Phenomok esetében 2 GHz-es északi híd mellett futott le. A késleltetési időket ábrázoló grafikonról kiderül az, amit már az AMD is állított, hogy a Phenom II-ben található harmadszintű gyorsítótár késleltetése/elérési ideje alacsonyabb lett, egészen pontosan 0,7 ns-mal, ami 3,2 GHz-es órajelet feltételezve ~2 órajelciklust jelent (ezt állítja az AMD is), azaz a végső érték ~23 órajelciklus, ami még mindig jóval magasabb, mint a Core i7-es 13 ciklusnyi ideje.
Az L1D és az L2-es gyorsítótár sebessége semmit sem változott az elődjéhez képest, ami nem is volt meglepő, hiszen az órajel (3,2 GHz) és az elérési idő (lásd fentebb) is változatlan.
Az L3-as gyorsítótárak összevetésében már látszik, hogy az AMD alkotott valamit, de az a 2 ciklusnyi különbség a valós használatban nem jelent túl sokat. Olvasásban az új Phenom kicsit lassabb volt a réginél (mérési hibahatáron belüli az eltérés), írásban már 7,5%-ot, másolásban pedig 7,7%-ot javult az eredmény, ami a különböző memóriabenchmarkokban látszik, de használat közben aligha érződik. A Core i7 harmadszintű gyorsítótára továbbra is vetélytárs nélküli.
Ezek után a memóriaelérési, azaz késleltetési időkkel foglalkoztunk. Elsőként az Everest benchmarkjával teszteltünk, ez lineáris elérési időt mér. A benchmark azt méri, hogy a memóriaolvasási parancs kiadásától számítva mennyi idő telik el, míg az adat megérkezik a regiszterekbe. Az AMD azt állítja, hogy az új Phenom memóriavezérlője gyorsabb, mint a régié: az Everest első tesztje ezt meg is erősíti, hiszen csökkent a memória elérési ideje, bár ez a különbség minimális (4%), hibahatáron belüli érték.
Az Everest lineárisan végzett méréseinek következő állomása a memóriaműveletek sebességének lemérése, egyetlen szálon. A Phenom II X4 itt már jól látható, "valódi" előnyre tesz szert elődjével szemben, igaz, olvasásban itt is csak 1,7%-ot, de írásban és másolásban 30%-ot, illetve 11%-ot javult az eredmény, ami komoly optimalizációra utal.
Ennél talán izgalmasabb téma a nem lineáris, azaz véletlenszerű memóriaelérés. A processzor számára szükséges, memóriában található adatok nem csak lineárisan helyezkedhetnek el, ezért a véletlenszerű memóriaelérés lemérése is kulcsfontosságú. A problémát a legjobban egy LATER nevezetű programmal tudtuk illusztrálni, az alkalmazás a memória véletlenszerű elérését méri kétféle módon: egyrészt az L1-es cache-t is bevonva a munkába, másrészt az L1-et kivonva a forgalomból. A továbbfejlesztett K10 ebben az esetben is jelentős előnyre tesz szert elődjével szemben, az elérési idők a 100-120 ns-os tartományban mozognak a régi Phenom 140-170 ns-os értékeihez képest. Úgy tűnik, hogy a memóriavezérlőn elvégzett javításokat sikerült szemléletesen kimutatni, a lineáris és a véletlenszerű memóriaelérés is csökkent, azaz javult.
Az előzőleg tárgyalt programok sajnos csak egy szálon mérnek, ezért keresnünk kellett egy olyan benchmarkot, mellyel több szálon is képesek vagyunk a memóriaelérés tesztelésére. Végül megtaláltuk a Rightmark Multi-Threaded Memory Testet, amit pontosan ennek a kérdésnek a megválaszolására fejlesztettek ki. A programmal az operációs rendszer által látott összes logikai processzoron külön-külön végeztethetünk el írást vagy olvasást. Be kell állítani a tesztelés során használt memóriablokkok méretét, a művelet típusát (olvasás, írás, szoftveres prefetchcsel olvasás, non-temporal írás) és a használt regiszterek típusát, ezek a következők lehetnek:
- 64 bit MMX: MOVQ reg, [mem]; MOVQ [mem], reg és MOVNTQ [mem], reg
- 128 bit SSE2: MOVDQA reg, [mem]; MOVDQA [mem], reg és MOVNTDQ [mem], reg
Beállítható a szoftveres prefetch hossza is. Mi 64 MB-os blokkokat alkalmaztunk (tehát a 64 MB-ot osztottuk annyi felé, ahány szálon folyt a tesztelés, két szálon 32 MB, négy szálon 16 MB), és 128 bites regisztereket használtunk. A program lényege tehát a több szálon végzett konkurens memóriaelérés tesztelése, amivel kimutatható a rendszerbuszt használó processzorok ilyen téren való gyengélkedése, illetve az integrált memóriavezérlők fejlettsége.
Az egyszerű olvasási teszt, mint neve is mutatja, egyszerűen a memóriaolvasást méri, az L2 cache is beleszól az eredménybe, az így kapott érték pedig az „átlagos”, mindennapi memóriaolvasást jelképezi.
Az olvasás szoftveres prefetchcsel egy szoftveres prefetch segítségével méri az olvasást, ezzel megkerülve az L2 cache-t valóban csak a maximálisan elérhető memóriaolvasási sávszélességet méri. Ez a módszer a processzor OoO-végrehajtását segíti ki azáltal, hogy előre betölti azokat az adatokat, amikre később szüksége lesz a végrehajtó egységeknek, így nem alakulnak ki függőségek és várakozási sorok, tehát gyorsul az adatfeldolgozás. A mindennapi életben ilyennel nem nagyon találkozunk.
Az írás egyszerű lineáris írást mér, az L2 cache sebessége is számít, az eredmény pedig amolyan átlagos, mindennapi írási sebességnek felel meg.
A non-temporal írás a cache-hierarchiát megkerülve, külön erre a célra bevezetett utasítások segítségével mér maximálisan elérhető, tiszta memóriaírási sávszélességet. Ez a módszer nagy mennyiségű adat kiírása során a cache olvasási/írási kényszere alól menti fel a processzort (ugyanis nem kell állandóan felülírni a cache-cellákat, lásd fentebb), így az írási sebesség drasztikusan megnőhet a sima íráshoz képest. A valóságban ezzel sem nagyon találkozni, csak speciálisan olyan feladatoknál, amikor erre van szükség.
Először az egyszálas tesztek futottak le, ami nagyon hasonló az Everest tesztelési metódusához, ez pedig az eredményeken meg is látszik, hiszen a sorrend nem változott. A Deneb gyorsabb, mint az Agena, de a számok nem túl meggyőzőek, hiszen még a Penryn is versenyben van szűkös kis rendszerbuszával.
A két szálon végzett mérés már izgalmasabb, mert valóban arra ad választ, amire kíváncsiak vagyunk, ráadásul asztali környezetben is előfordulhat egy ehhez hasonló szituáció. Lényegében azt látjuk, mint az előző tesztekben, az AMD architektúrájának új implementációja picit gyorsabb, mint a régi, az eltérés 13-16%-os, ráadásul végre az is látszik, hogy a Penryn alatt futó rendszerbusz kezd szűk keresztmetszetté válni. A sima olvasási/írási teszt itt a mérvadó, hiszen ez áll közelebb az átlagos felhasználáshoz.
A négy szálon végzett memóriatesztnek már inkább csak a szerverek világában van jelentősége, de mindenképpen érdekes látni az egyes architektúrák teljesítményét. Végül is újabb meglepetés már nem ért minket, nincs új a nap alatt, a Phenom II-es memóriavezérlője ténylegesen, bizonyítottan gyorsabb és jobban teljesít az "első verziós" memóriavezérlőnél. Tekintetbe véve a K10.5 forgalomba kerülésének idejét, dicséretre méltó, hogy az AMD-nek sikerült – ha csak ennyit is, de – javítania a processzoron ilyen rövid idő alatt.
Utasításvégrehajtás
Az utasításvégrehajtással kapcsolatos különbségek feltérképezésére szintén az Everest tesztjeit vettük elő. Itt különösen érdekes lehet a Hyper-Threading használata, hiszen ezekből a tesztekből kiderül, hogy a Nehalem esetében kínról vagy áldásról van-e szó. Hogy az egyes eredmények hátterét megértsük, felvettük a kapcsolatot a program készítőivel.
A CPU Queen egy egyszerű, egész számokkal dolgozó benchmark, amely a processzorok elágazásbecslési képességeire fókuszál, és a „nyolc királynő egy sakktáblán” feladványra épül (10 x 10-es játékmezőn). A teszt MMX-, SSE2- és SSSE3-optimalizált, és kevesebb mint 1 MB memóriát foglal le. Ebben a tesztben az elágazáskezelés képességei határozzák meg a pontszámot. Nemcsak a branch prediction táblák és a becslés pontossága, a return stack mérete, hanem az is, hogy az utasításkészlet támogatja-e valamilyen módon maguknak az elágazásoknak az elkerülését (van-e CMOV vagy PABSB utasítás), illetve képes-e egyszerre párhuzamosan több bábu helyzetével számolni.
A CPU Photoworxx különböző digitális fotófeldolgozási műveleteket hajtat végre a processzorral (kitöltés, forgatás, random stb.). Ez a teszt főleg a processzorok integer számolási végrehajtási egységeit dolgoztatja meg a memória-alrendszerrel egyetemben, ezért nem skálázódik olyan jól több processzormag esetén. A teszt csak alap x86-os utasításokat használ. Photoworxx a legösszetettebb teszt, többféle méretű képpel dolgozik, sok minden számít benne, de leginkább az átlagos memóriaelérés ideje a döntő. Sokat jelentenek a jobb prefetcherek, és itt számít a legtöbbet a memória és a cache-ek hatása, márpedig a memória elérése javult, így a Photoworxx eredmény is magasabb lett.
A CPU ZLib is egy integer benchmark, amely a publikusan elérhető ZLib fájltömörítési algoritmussal méri le a processzor és a memória-alrendszer teljesítményét, ez a teszt is csak alap x86-os utasításokat használ. Itt inkább a CPU sebessége, illetve képességei számítanak (dekódolás szélessége, out-of-order load támogatása, ugrásbecslés, reordering ablak mérete), mint a memória sebessége.
A CPU AES is egy integer benchmark, amely az AES (azaz Rijndael) adattitkosító algoritmust használja. A teszt Vincent Rijmen, Antoon Bosselaers és Paulo Barreto publikusan elérhető C kódját használja ECB módban. A benchmark alap x86-os utasításokat, és összesen 48 MB memóriát használ. Itt is inkább a CPU sebessége a fontos, illetve kiugróan az out-of-order load képesség számít (a hardveres AES-támogatást leszámítva persze). A főleg végrehajtási sebességtől függő tesztek közül egyedül itt volt kimutathatóan, 8%-kal gyorsabb a felújított architektúra, ami valamelyik kisebb optimalizáció eredménye lehet.
Az FPU Julia a processzorok 32 bites (egyszeres pontosságú) lebegőpontos teljesítményét méri le a „Julia” fraktál segítségével. A benchmark kódja assemblyben íródott, és extrém mértékben használja ki az egyes AMD és Intel SIMD-utasításkészleteket (x87, 3DNow!, 3DNow!+, SSE). Az eredmények okán előző tesztünkben sokat töprengtünk, ugyanis nem értettük, hogy a K10 miért ennyivel lassabb. Végül a program készítői adták meg a magyarázatot, miszerint a Julia bench beleszalad a K8/K10-nek abba a korlátjába, hogy az architektúra nem bírja, ha cserélődnek az SSE regisztereknél az adattípusok. A Core-on ez nem gond, és emiatt gyorsabb/rövidebb kódot lehet írni.
Az FPU Mandel a 64 bites (kétszeres pontosságú) lebegőpontos teljesítményt méri le a „Mandelbrot” fraktál egyes frame-jeinek kiszámolása révén. Ez a benchmark is assemblyben íródott, és hasonlóan az FPU Juliához, kihasználja az egyes SIMD-utasításkészleteket (x87 vagy SSE2). Itt a Nehalem még HT nélkül is gyorsabb a Penrynnél. A Julia benchez képest a K10 itt azért szerepel jól (pontosabban fogalmazva nem vérzik el úgy, mint az előbb), mert a Julia belső ciklusa egyszerre 8 pixelen dolgozik, a Mandelé viszont csak 4 pixelen, emiatt a típusváltást (int/float) kiváltó kód Mandelban rövidebb és gyorsabb az AMD CPU-kon.
Az FPU SinJulia a 80 bites (kiterjesztett pontosságú) lebegőpontos teljesítményt méri le a „Julia” fraktál módosított változatának kiszámolásával. A kód assemblyben íródott, és erősen kihasználja a trigonometrikus és exponenciális x87-es utasításokat. Míg a Juliánál a raw 32 bites lebegőpontos MUL/ADD/MOV képességek számítanak, addig a SinJuliánál a legpontosabb 80 bites mód kihajtása a lényeg, és a transzcendens utasítások (sin, cos, ex) megvalósítása. Teljes végrehajtási idő szempontjábol a sin, cos, ex sebessége a döntő, amiben egyébként a P6 leszármazottai hagyományosan gyorsabbak.
A szintetikus tesztekből levonhatjuk a tanulságot: a Phenom II az utasításvégrehajtás szempontjából lényegében változatlan az első verzióhoz képest, a memóriára támaszkodó PhotoWorxx teszten kívül az új K10-esnek csak a CPU AES benchmarkban volt kimutatható előnye.
Tömörítés, videokódolás
A harmadszintű gyorsítótár kiterjesztése és a memóriavezérlő optimalizálása tömörítésben előrébb segítette az új Phenomot a ranglétrán, WinRAR alatt megelőzte vetélytársát, de 7-Zipben még nem tudott elbánni a még nagyobb, összesen 12 MB L2-es cache-sel rendelkező Penrynnel, nem is beszélve a Core i7-ről, ami egy másik dimenzióban leledzik, a nagy és gyors cache-ek mellett még tripla-csatornás memóriavezérlő is segíti.
A különböző konvertálóprogramokban elért eredmény nagyban függ attól, hogy ismerik-e az egyes SIMD utasításkészleteket. A TMPGEnc és a DivX 6.8 már támogatja az SSE4.1-et, de az SSE4.2-t még nem (igaz, ez elvileg nem tartalmaz olyan utasításokat, melyeknek a konvertálásban hasznát vehetnénk). DivX 6.8-ban az Intel processzorok az MPSADBW és PHMINPOSUW utasításoknak köszönhetően ilyen gyorsak, az AMD SSE4a-ja ezeket nem támogatja. Összességében, mint látható, ezen a területen az Intel dominanciája töretlen, kiváltképpen a DivX kódolásban nagy az AMD lemaradása (a Conroe magos QX6700 nem támogatja az SSE4.2-t, ennek jól látható jele a grafikonon elfoglalt helye).
A következő három konvertálásra használt program még nem támogatja az SSE4-et, ráadásul a WME9 maximálisan négy, az iTunes pedig két szálat kezel, ezek a kis különbségek pedig az AMD malmára hajtják a vizet, WME-ben és x264-es kódolásban a 940-es Phenom, ha minimálisan is, de gyorsabb volt, mint a Core 2 Quad Q9450. A Phenom II X4 940-ről elmondható, hogy 3 GHz-es órajele ellenére általában hozza vagy felül is múlja a Phenom X4 3,2 GHz-es változatának teljesítményét.
3D-s tervezés, renderelés
A különböző animációszerkesztő és renderelőprogramokban elég vegyes a kép. Ez egy tradicionálisan több szálra optimalizált alkalmazásterület, azaz a programok szeretik a sok processzormagot, így a Hyper-Threading technológia miatt egyértelműen a Core i7 a nyerő. Általánosságban azt látjuk, hogy a Phenom II X4 940-es épphogy csak, de nem tudja befogni a Core 2 Quad Q9450-et, nem is beszélve a Core i7-920-ról, és ezekben a programokban még a régi, Conroe magos Core 2 Quad is komoly ellenfélnek bizonyul. Az AMD processzoroknak itt nem termett sok babér...
Fotó- és videofeldolgozás, további programok
Az Adobe alkalmazások tipikus példái az Intel processzorokra optimalizált programoknak, ez jól látszik az eredményeken is, a Phenomoknak nem volt túl sok esélyük. A Sony Vegas már jobb színben tünteti fel az AMD Phenomját, de továbbra is csak a lassabbik Penrynnel tartja a lépést.
További néhány kevésbé szokványos, vagy kisebb körben alkalmazott programot vetettünk be a processzorok közti különbségek kimérésére, ezek közül a JATMARK java benchmarkot leszámítva az összes képes akár 8 szálon is dolgozni. Az zenerenderelő Reaper alatt az AMD processzorai megalázó vereséget szenvednek, az Apache webszerver-tesztben viszont jól szerepelnek, csak a legerősebb Intel processzorokkal nem bírtak. A sakkprogramban elért eredményekkel sem büszkélkedhet az AMD, bár az elágazásbecslésen javítottak valamit, ez csak alig-alig látszik meg (a Phenom II X4 3 GHz-en hozza az első Phenom teljesítményét 3,2 GHz-en). A PDF-beolvasó és -szerkesztő ABBYY FineReader is kedvezett a Phenom II-nek, ebben a programban úgy vettük észre, hogy sokat számít a memóriaelérés sebessége.
Játékok
A játékok világa az az alkalmazásterület, ahol inkább a videokártya dominál, nem a processzor. A játékok a magas órajelet és a nagyméretű, klasszikus, gyors gyorsítótárat részesítik előnyben, miközben egy-két játékmotort leszámítva még mindig csak egy vagy két magot képesek kihasználni. Mi azért megpróbáltunk ismertebb és lehetőleg több szálon is működni képes motorokat letesztelni, ezeket is többnyire két felbontásban. Mint látható, a játékokkal nincs különösebb probléma, legalábbis vegyeslimites beállítás mellett, a CPU-limites tesztekben nem tündökölt a régi és az új Phenom sem, de ebben nincs is semmi meglepő. A gyorsulásra egyetlen dolog adhat okot, a harmadszintű gyorsítótár méretének megnövelése, de úgy tűnik ezzel a 6 MB-tal sem megy sokra a Phenom, mert az Intel processzoraiban még így is több a cache (ami ráadásul még gyorsabb is), innentől kezdve pedig inkább az órajel számít.
Összegző grafikonok és tuning
A konvertálóprogramok vagy több szálon képesek számolni, vagy extrém módon használják ki a(z Intel) SIMD utasításkészleteket, ennél fogva az AMD Phenomja nem tudta legyűrni a Core 2 Quadot. A Phenom II X4 – azonos órajelet feltételezve – picit gyorsabb volt az előző Phenomnál, de ez nem volt elég az üdvösséghez. Szerintünk, ha valaki sokat konvertál, akkor azt nézze meg, hogy az általa leggyakrabban használt program mennyire párhuzamosított, és milyen mértékben támogatja az egyes SIMD utasításkészleteket. A konvertálóprogramok újabb változatai már jórészt elég fejlettek ebből a szempontból.
A fotó- és videófeldolgozó programok az Intelnek kedveznek.
A renderprogramokban az új Phenom a régivel egy szinten teljesített, mert ezek az alkalmazások folyamszerű adatcsomagokkal dolgoznak, így a gyorsítótárak mérete nem igazán releváns, inkább az utasításfeldolgozáson van a hangsúly.
Játékokban a Phenom II picit gyorsabb tudott lenni elődjénél (azonos órajelen is), ami a megnövekedett gyorsítótárnak köszönhető, de ezt leszámítva nem lépett előrébb az AMD. A Core processzorokban még így is több a cache, ráadásul azok gyorsabbak is, így ezt a tényt és a gyorsabb műveletvégzést figyelembe véve nem is meglepő, hogy az Intel volt a nyerő itt is.
Tuning
Phenom II X4 940 3,7 GHz-en, nem rossz... [+]
A Phenom II X4 túlhajthatóságáról valóságos legendák keringenek, ezért kíváncsian vártuk, hogy a mi tesztprocesszorunk (egy bolti példány) mire képes. Szokás szerint olyan beállításokat használtunk, amihez a felhasználók többsége hozzáfér, tehát nem tettünk a processzorra semmilyen egzotikus hűtőrendszert, a dobozos AMD processzorhoz adott szimpla gyári hűtővel kellett beérnie a Phenomnak. Alapfeszültségen, azaz 1,35 V-on a tesztpéldány 3,6 GHz-en is "elmegyegetett" (szorzóállítással tuningoltunk), de csak 3,5 GHz környékén bizonyult stabilnak, ami az első Phenom tuningra való hajlandóságát ismerve egészen szép eredmény. Ezután megpróbálkoztunk az 1,5 V-os feszültséggel, és a 940 Black Edition még 3,8 GHz-en is elindította a Windowst, de sajnos nem volt stabil, ahhoz, hogy a tesztek lefussanak, 3,7 GHz-re kellett visszavenni az órajelet, de a 23%-os órajeltuning még az olcsóbb Core 2 Quad-ok körében is jó eredménynek számít. A lényeg tehát, hogy a 45 nm-es Phenomban még van egy kis plusz, ami nagyon jól jön az AMD-nek, mert az órajelversenyben le volt maradva. Néhány eredmény alapórajelen és a tuningot követően:
Phenom II X4 940 | |||
Processzor órajele | 3000 MHz | 3700 MHz | különbség (23%) |
WinRAR benchmark (KB/s) | 2229 | 2401 | +7,7% |
TMPGEnc HDV -> MPEG2 konvertálás (mp) HD MOV -> x264 (fps) | 73 62,21 | 66 75,3 | -10% (időben) +21% |
Cinebench 10 (pontszám) Fritz benchmark (knodes/s) | 9831 7397 | 11 871 8644 | +20% +17% |
UT3 (fps) World in Conflict (fps) | 144 79 | 151 88 | +5% +11% |
Konklúzió
Őszintén szólva a látottak után vegyes érzelmek kavarognak bennünk. Mindenekelőtt gratulálunk az AMD-nek ahhoz, hogy a K10 bevezetését követően végre elkészültek a 45 nm-es folytatással, a kisebb csíkszélességen gyártott processzor nem mindenkit fog lenyűgözni, de az AMD mindenképpen jól jár majd az alacsonyabb gyártási költségek miatt. Minket nem ért csalódás (mások talán másképp gondolják majd), mert már egy évvel ezelőtt is szinte bizonyos volt, hogy az új K10 nem lesz számottevően gyorsabb a réginél, az AMD-nek egyszerűen nem volt elég ideje a chip nagyobb horderejű áttervezésére. A harmadszintű gyorsítótár kiterjesztése az asztali alkalmazások többségében alig érezhető, ez pedig nem túl meglepő, hiszen az alig gyorsabb, mint az integrált memóriavezérlőn keresztül elérhető fizikai memória (a szerverek világában valószínűleg több előnnyel jár). Véleményünk szerint a Phenom II X4 olyanra sikerült, amilyenre az első Phenomnak kellett volna, mert ez egyrészt végre egy kiegyensúlyozott, a cache-éhséget nem ismerő processzor, másrészt a magméret csökkentésével a gyártás során felmerülő kockázatok is jelentősen csökkentek, de ez nem bók a Phenom II-nek, hanem kritika az elsővel szemben...
A teljesítményt és a fogyasztást illetően nem ért minket meglepetés, de kicsit mégis csalódottak vagyunk, mert sebesség tekintetében az AMD még így is legalább egy generációval le van maradva az Intel mögött. A Phenom II X4 – azonos órajelet feltételezve – kb. 10%-kal gyorsabb, mint az előző Phenom, ami szép teljesítmény, de 3 GHz-en nagy általánosságban lassabb, vagy egálban van a már réges-régen kapható, 2,66 GHz-es Core 2 Quad Q9450-nel, és ironikus, de ezt a modelt az Intel lassan kivezeti a forgalomból, míg az AMD-nek még ezt sem sikerült maradéktalanul beérnie. Meg kell említenünk, hogy az X4 940 egy árban van (vagyis volt a teszt készültének idején, azóta olcsóbb lett) a Core i7-920-szal, ami a mezőny drágább tagjai között egyértelműen a legjobb ár/teljesítmény mutatóval rendelkezik, de az AMD-nek egyelőre megvan az az előnye (illetve az a szerencséje), hogy a Core i7-hez passzoló alaplapok és memóriák drágábbak, így egy komplett rendszert nézve végül kiegyenlítődik az állás (az árak folyamatosan változnak, tehát mindig mérlegeljünk vásárlás előtt). De ne felejtsük el, hogy az Intelnek (és alaplapgyártó partnereinek) nem kerül semmibe picit lejjebb vinni az árakat, ami ismét gondokat okozhat a zöldeknek. A tuningtesztből világosan látszik, hogy a 45 nm-es Phenomban még bőven van tartalék, ráadásul ez a processzor első verziója (stepping), tehát a helyzet később még tovább javulhat, de a túlhajtott eredmények arra engednek következtetni, hogy a Phenom II X4 jelenlegi állapotában 3,7 GHz-en még mindig éppenhogy csak elég lenne a 3,2 GHz-es Penryn ellenében (ez persze nem lebecsülendő, de ahhoz, hogy árverseny legyen a csúcskategóriában, kevés)...
Hamarosan megjelennek az AM3-as processzorok, melyek már támogatni fogják a DDR3-as memóriát, és talán magasabb órajelű északi híddal rendelkeznek majd, de ami a teljesítményüket illeti, csodát mi ezektől sem várunk. A K10-es memóriavezérlője a DDR2 által felkínált sávszélességet még kétcsatornás módban sem képes teljesen kihasználni, így igen valószínűtlen, hogy a DDR3-as memóriák bevezetésével lényegi gyorsulásnak lennénk szemtanúi, pláne ha figyelembe vesszük, hogy a DDR3-asok magasabb késleltetéssel rendelkeznek. Az északi híd, azon belül is a harmadszintű gyorsítótár órajelének növelése nagyobb potenciált rejt magában, de ha megnézzük az erre a területre összpontosító résztesztünket, akkor kiderül, hogy ez sem fog megváltást hozni. A pesszimista jóslataink ellenére mi azt tanácsoljuk azoknak, akik Phenom II-es rendszerbe szeretnének beruházni, hogy várják meg az AM3-as processzorokat, mert ki tudja, lehet, hogy azok mégiscsak gyorsabbak lesznek, esetleg kijön egy új stepping, ami még a jelenleginél is jobban tuningolható lesz.
Összegezve: mi azt látjuk, hogy az új Phenom végül is hozza az elvárt szintet, de ez még mindig csak az olcsóbb Core 2 Quadok ellen elég, és aki egy ilyen teljesítményű rendszerre vágyott, az valószínűleg már régen megvette magának az Intel processzorra épülő konfigurációt. Az új Phenom színre lépésével bővült a kínálat, de az AMD továbbra sem tud a csúcs közelébe férkőzni, ezért kénytelen lesz az árak manipulálásával, csökkentésével, illetve az AMD alkatrészekre épülő platformok előnyeinek kihangsúlyozásával életben maradni, ami nehéz feladatnak ígérkezik. Mindeközben a csúcskategóriában az Intel továbbra is élvezheti árbefagyasztós, malmozós taktikáját (ez szerencsére nem teljesen igaz, mert a konkurencia gyengesége ellenére zajlanak a fejlesztések).
![]() |
AMD Phenom II X4 |
fLeSs
Az Intel Nehalem tesztrendszert az Intel, az Asus alaplapot pedig az Asus hazai képviselete bocsátotta rendelkezésünkre.