Phenom II: az AMD mentőövet dob önmagának

Phenom II: bevezető

Az AMD valószínűleg nem szívesen emlékszik majd vissza a 2007-es és 2008-as évre, hiszen számukra másról sem szólt ez az időszak, mint a túlélésről, ezért kiemelt figyelmet érdemelne 2009-es újévi fogadalmuk (már ha volt egyáltalán ilyen). Idén a cég azonnal beleugrott a mély vízbe, elvégre hogyan kezdhették volna jobban ezt az évet, mint egy új platform bemutatásával, a Dragonnal? Jelen cikkünkben ennek egyik, ha nem a legfontosabb alkotóeleméről, a második generációs négymagos AMD processzorról, a Phenom II X4-ről lesz szó.

Rövid visszatekintő:

2007-ben bemutatkozott a K10, az első monolitikus, azaz vérbeli négymagos mikroarchitektúra. A koncepció, az elképzelés, a látomás irigylésre méltó volt, de a kivitelezésbe hibák csúsztak. Először is eléggé elkésett, hiszen az Intel egyéves előnyben volt a négymagosok piacán. Erre rátett egy lapáttal, hogy a megjelenést követően a Barcelona kódnéven ismert, K10-alapú szerverprocesszorról kiderült, hogy hibás, az ominózus TLB-probléma miatt a szerverprocesszorok piaci terítését el kellett tolni, miközben az Intel már régen a négymagos Clovertownt futtatta. Később a sajtó a TLB-hibát annyira felfújta, hogy az új architektúrára épülő asztali CPU, a Phenom sem számíthatott örömteli fogadtatásra. Mindezek következtében az AMD piaci részesedése lassacskán csökkent, a profitkilátások romlottak, az Intel pedig már a 45 nm-re "átültetett" Core architektúra bemutatásával nyűgözte le a közönséget (még magasabb teljesítmény, még alacsonyabb fogyasztással). A videokártyák szegmensében jól megy az AMD-nek, de a diszkrét grafikus vezérlőkön keresett haszon aligha elég ahhoz, hogy egy processzorgyártót kihúzzon a gödörből. Év közben aztán megjelent a Phenom javított változata, de nem sikerült vele megnyerni a vásárlók szívét (legalábbis a többségükét), mert a négymagosok mezőnyében továbbra is az Intel Core 2-ese maradt a mérvadó, márpedig a Phenom lassabb, többet fogyaszt, jobban melegszik és kevésbé tuningolható, mint riválisa, így az AMD csak az ár/teljesítmény mutatók javításával tudta korrigálni hibáit és fenntartani önmagát. Mikor jönnek már vissza azok az (Athlon 64 X2-es) idők, amikor az AMD volt a topon? Talán most, a K10 folytatása megadja erre a választ.

A Phenom II bemutatása előtt szóljunk néhány szót a Dragonról, a Spider platform utódjáról. Nem másról van szó, mint egy komplett rendszerről, ami egy alaplap (és az azon szolgálatot teljesítő chipset), processzor és videokártya triumvirátusára épül. Az AMD-ATI kooperáció első ilyen gyümölcse a Spider platform volt, ami egy AMD 790FX chipsetre, egy Phenom processzorra és egy-négy Radeon HD 3800-as grafikus chipre (CrossFireX) épült. A koncepció lényege, hogy – az Intellel ellentétben – előre letesztelt, jól összekombinált és összhangban lévő komplett rendszert kínáljanak, hiszen az átlagvásárló számára mégiscsak vonzóbb egy minden téren AMD-s komponensekből felépülő számítógép (egy platform kódnevek és kompatibilitási problémák nélkül), mint egy mindenhonnan összegereblyézett konfiguráció. Ezt az alapötletet viszi tovább a Dragon, ami szintúgy egy AMD 790(GX)-es chipset köré épülő alaplapból, egy-négy Radeon HD 4800-as videokártyából (CrossFireX) és egy Phenom II X4-es processzorból áll össze. A platform részét képező lapkakészlettel és a videokártyával már jóval korábban megismerkedhettek a PROHARDVER! olvasói, ezért nem maradt más hátra, mint a Phenom II kielemzése.

Az AMD január elején mutatta be a második generációs Phenom processzorok első hírvivőit, a Phenom II X4 940 Black Editiont és a Phenom II X4 920-at, melyek 3, illetve 2,8 GHz-en járnak, előbbi szorzózár nélkül kerül forgalomba, csak azért, hogy a tuningra hajlamos felhasználók szemében vonzóbb legyen. A két processzor 275, illetve 235 dolláros listaárral kerül fel a boltok polcaira (azóta már árcsökkentésről szólnak a hírek), tehát már ebből is látható, hogy az AMD a most bejelentett processzorokkal sem a csúcsszegmensben, hanem inkább valahol középtájon szeretné megvetni a lábát. De akkor mi újat tudnak felmutatni ezek a processzorok a megemelt órajelen kívül? - merülhet fel a kérdés.

Ha a régi és az új Phenom viszonyát szeretnénk szemléltetni, akkor a legegyszerűbb, ha felidézzük a Conroe és a Penryn közti kapcsolatot. A Penryn a Conroe alacsonyabb csíkszélességen gyártott, némileg megnövelt számítási teljesítményű verziója, és gyakorlatilag ugyanezt mondhatjuk el a Phenom II X4 alapjául szolgáló K10.5-ös, Deneb kódnevű processzorról is (amely az egyik legfényesebben ragyogó csillagról kapta a nevét). A különbség az, hogy míg az Intel annak idején egyszerűen gazdaságossági szempontokból váltotta le a Conroe-t (lényegében semmi nem sietette), addig az AMD-nek több oka is volt rá, hiszen az első Phenom nemcsak versenyképességi problémákkal küszködött, de házon belül is problémákat okozott a magas gyártási költség és a gyenge skálázódás miatt. A K10.5 lenne a gyógyír? Lássuk, hogy van-e új a nap alatt...


A Barcelona és a Shanghai, vörössel kiemelve a harmadszintű gyorsítótár

A K10.5 mindenekelőtt azért mérföldkő az AMD történelmében, mert ez az első 45 nm-es csíkszélességen gyártott AMD processzor. A cég 65 nm-es gyártástechnológiával gyártott központi egységei enyhén szólva sem váltották be a hozzájuk fűzött reményeket. A K8-as Brisbane (Athlon 64 X2) processzorok nem voltak képesek felülmúlni a 90 nm-es Windsorok által felállított követelményeket, és az Agena (illetve a Barcelona) sem sült el túl jól. A 45 nm-re való átállás segít leszorítani a gyártási költségeket, a fogyasztást és remélhetőleg a melegedést (ez esetben a szivárgási áram a kulcs), illetve segédkezik a magasabb órajelek elérésében. Mint tudjuk, az Intel a 45 nm-es processzorok gyártásához egy hafniumalapú (high-k) kapuoxidot és egy fémalapú kapuelektródát hívott segítségül, ezek ötvözésével adott területen kétszeres tranzisztorsűrűséget ért el, és ötödére csökkentette a szivárgási áramot. Az AMD egy teljesen más utat választott ahhoz, hogy 45 nm-es chipeket készítsen. Egy úgynevezett immerziós litográfia alapú levilágítást használnak a szíliciumostyák feldolgozása során, a kritikus áramkörök precízebb megrajzolása érdekében. A hagyományosnak nevezhető fotolitográfiai eljárás esetében a fényforrás (ultraibolya fénysugarak) rávilágít egy maszkra (ami az adott szíliciumréteg áramköri struktúráit tartalmazza), majd miután a fény átszűrődik rajta, kialakítja az áramköröket a szíliciumostyán (ez elméletileg 50 nm-ig jól működik). Az immerziós litográfiai eljárás annyiban más, hogy egy nagy tisztaságú folyadékréteget állítanak a fényforrás és a wafer közé, a folyadékréteg pedig könnyebben fókuszálhatóvá teszi a fénysugarat, azaz nagyobb felbontású leképezést tesz lehetővé. Gyártástechnológia terén végül is elmondható, hogy végre 1-1 az állás, hiszen mindkét cégnek van 45 nm-es csíkszélességű gyártósora, de míg az AMD továbbra is poliszilícium kaput és oxinitrid kapuoxidot használ (amivel a kékek felé billen a mérleg nyelve), addig az Intel kénytelen pontosabb és drágább maszkokat készíteni az ostyák megmunkálásához (a mutató visszaáll középre).

Az a tény, hogy végre az AMD is képes 45 nm-es chipeket készíteni, számos optimalizációnak és teljesítményfokozó átalakításnak a lehetőségét veti fel, és meg is lépték ezeket. Az elvárásaink azonban ne legyenek túl magasak, mert a K10 két generációjának megjelenése között mindössze 1 év telt el, ez az idő pedig éppenhogy elég volt arra, hogy az új struktúrák a tesztelés, majd a gyártás felfutása után kereskedelmi forgalomban is megjelenjenek, ennyi idő alatt képtelenség gyökeres változtatásokat eszközölni. De azért van néhány, lássuk ezeket:

Phenom II: a megmentő?

A K10.5-alapú processzorok elődeiknél több, 758 millió tranzisztorból épülnek fel, miközben a mag mérete csökkent, 285 mm2-ről 258 mm2-re. Táblázatunkból kiderül, hogy a Core i7 alapját adó Bloomfield nagyon hasonló karakterisztikával rendelkezik, ezért kiváltképp érdekes, hogy a két rivális mire jutott a teljesítményt tekintve közel azonos mennyiségű tranzisztorból, közel azonos méretű szíliciumlapkán.

Az új architektúra első és legszembetűnőbb tulajdonsága (a megemelt órajeleket leszámítva) a 6 MB-ra növelt harmadszintű gyorsítótár, gyakorlatilag ennek tudható be a tranzisztorszám drasztikus megemelkedése. Az AMD elkapkodta a K10-et: ha már a harmadszintű gyorsítótár bevezetése mellett döntöttek, tudniuk kellett volna, hogy 2 MB ebből a cache-ből nem lesz elég négy rendkívül adatéhes processzormag számára, márpedig 65 nm-en nem voltak képesek ennél nagyobbat ráapplikálni a lapkára, mert az már így is túl nagy volt. A K10.5-ön 6 MB-nyi harmadszintű gyorsítótárat találunk, háromszor annyit, mint elődjén. De a cache-nek nemcsak a méretét növelték meg, hanem az elérési idejét is csökkentették (elvileg 2 órajelciklusnyi idővel), ugyanakkor asszociativitási szintje 32-ről 48-ra emelkedett.

Némileg átalakították a memóriavezérlőt: az új család memóriavezérlője a DDR2-es memóriákon túl már a DDR3-as szabványt is támogatja, ráadásul a kompatibilitási lista bővítése közben végeztek némi optimalizációt is. Ezzel elvileg nőtt a processzor számára elérhető memória-sávszélesség, de arról nem szól a fáma, hogy pontosan mit csináltak, és mennyivel lett gyorsabb a memóriavezérlő.

A "Smart Cache" kifejezés már biztosan ismerős az olvasók számára innen vagy onnan, annyi bizonyos, hogy bármelyik gyártótól is származzon az elnevezés, valamiféle gyorsítótárral kapcsolatos optimalizáció áll mögötte. Az AMD-féle K10.5-ben bemutatkozó "Smart Cache, cache flush on halt" lehetővé teszi, hogy a gyorsítótárakban található információkat csak azokból a gyorsítótárakból olvashassa ki a processzor, melyek éppen működésben vannak, azaz egy adat megkeresése során egyik processzort sem "ébresztik" fel feleslegesen, már amennyiben az előtte leállt, mert nincs használatban. Erre a harmadszintű gyorsítótár ad lehetőséget: a leálló processzorok első- és másodszintű gyorsítótárjában található információk a "halt" stádium meghívása során átmásolódnak a harmadszintű gyorstárba (elvégre exkluzív cache-ről van szó), így a processzorokat később "nyugiban" lehet hagyni, ami természetesen fontos szempont az energiahatékonyság szempontjából.

A javítások listájáról nem hiányozhat a továbbfejlesztett elágazásbecslő logika sem, de arról sajnos nincs információnk, hogy pontosan mit optimalizáltak rajta. Meg kell még említenünk a load és store várakozási sor (LSU vagy LSQ) meghosszabbítását, illetve az FPU puffer kiterjesztését, igaz ez esetben sem tudjuk, hogy pontosan miről is van szó (regiszterkészlet vagy ütemezés?). Elvileg gyorsult az FP regiszterből-regiszterbe átmozgatás (mov), és javítottak a LOCK prefixek feldolgozásán.

Mindezt összegezve és magyarul:

  • nagyobb és gyorsabb L3 gyorsítótár
  • még több memória-sávszélesség
  • enyhén feljavított, gyorsabb processzormagok
  • kisebb fogyasztás és melegedés

Vegyük kézbe...


Csomagolás: Phenom II X4 940 Black Edition [+]

Fentebb látható az újonnan megjelent Phenom II X4 940 Black Edition csomagolása, ami éppen olyan, mint az elődöké. AM2+ foglalatba illeszkedik, tehát csak a DDR2-es memóriákat támogatja, bár az AMD azt ígérte, hogy a termékskála februárban kibővül az AM3-as processzorokkal, melyek már támogatni fogják a DDR3-as modulokat is(!) és visszafelé kompatibilisek lesznek, tehát passzolnak majd az AM2+-os alaplapokba is. A most bejelentett két új processzor belsőleg – az órajelüket és a szorzózárat leszámítva – nem különbözik semmiben, a chipsethez kapcsoló HyperTransport-link sebessége továbbra is 1,8 GHz, az északi híd (memóriavezérlő plusz harmadszintű gyorsítótár) órajele pedig szintén 1,8 GHz, ami enyhe visszalépés az eredeti Phenomokhoz képest, hiszen a magasabb órajelű változatokban már 2 GHz-en ketyegett ez a részegység, de az AMD megígérte, hogy az AM3-as processzorokban már az északi híddal sem lesz probléma (már csak az a kérdés, hogy akkor minek adták ki az AM2+ processzorokat, mikor az AM3 visszafelé is kompatibilis lesz, és gyorsabbnak is ígérkezik). Elvileg az AM3-asok termékskáláján újra feltűnnek majd a hárommagos Phenomok, melyekben három aktív processzormagot találunk (a gyártó nyilván a hibás processzoroktól akar így megszabadulni).


A processzor [+]


A gyári hűtés [+]

A Phenom II X4 külsőre semmiben sem különbözik az elődeitől, az AM3-asokkal némileg változik a helyzet, mert azokon kettővel kevesebb lábbal találkozhatunk majd. A processzorhoz gyárilag csomagolt hűtő nem különösebben figyelemre méltó, rézbetét érintkezik a processzorral, két hőcső segít átvezetni a meleget az alumíniumlamellákon; a ventilátor fordulatszáma szabályozható, de alapon sem hangos.


CPU-Z [+]

A tesztelés során egy AMD 790-es lapkakészletre épülő Asus M4A79 Deluxe alaplap segítségét vettük igénybe, a beüzemelést követően a CPU-Z szépen felismerte a processzort, és azonnal láthattuk a változásokat a korábbi Phenomhoz képest: a megnövekedett harmadszintű gyorsítótárat, és az alacsonyabb órajelű északi hidat. A processzor alapfeszültsége 1,35 V, ami picit magasnak tűnik az Intel 45 nm-es lapkáinál megszokott értékekhez (1,20-1,28 V) képest. Az AM2+ lábkiosztású Phenom II-esek kompatibilisek az összes korábbi AM2-es alaplappal, csak egy BIOS-frissítésre van szükségünk (vagy még arra sem) a beüzemeléskor. Ilyenkor elválik, hogy melyik alaplapgyártó igazán felhasználóbarát... Megkötések sajnos vannak, ugyanis be kell érnünk az 1 GHz-es HyperTransport-órajellel és a kevésbé dinamikus energiamenedzsmenttel, de ez már az első Phenom megjelenésekor tudvalevő volt.

Az AMD nyilván tudja, hogy a most bejelentett új Phenomok még mindig nem elég gyorsak ahhoz, hogy versenyre keljenek egy Core i7-tel, ezért igyekszik kihangsúlyozni az adott platform ár/teljesítmény mutatóját, amiben a zöldek (saját maguk szerint) jobban állnak. Kétségtelen, hogy a gyártó által előkészített konfigurációk összehasonlításában az AMD ezen a téren előrébb jár (a Dragont egy Core i7, X58-as alaplap és DDR3 memóriapár kombinációjával hasonlítják össze), de azért legyünk őszinték, lássuk először a Phenom II teljesítményét; könnyen lehet, hogy inkább egy Core 2-es rendszerrel kellene az összehasonlítást elvégezni. Az AMD mellett szól a visszafelé kompatibilis infrastruktúra, az tény, hogy az AMD ebből a szemszögből sokkal inkább felhasználóbarát. Legalábbis annak tűnik, de ne felejtsük el, hogy a Core i7-nek sem véletlenül volt szüksége egy gyökeresen átalakított foglalatra (elvégre a Core 2-Core i7 váltás kb. olyan volt, mint az Athlon XP Athlon 64 általi leváltása), míg a Phenom II és a Phenom között gyakorlatilag nincs architektúrális eltérés, mondhatni nem jelentősek a különbségek, tehát az lett volna csak az igazán kirívó eset, ha az AMD most foglalatot vált (a Penryn megjelenése után sem kellett alaplapot cserélni). A Core 2 mellé is vehetünk DDR2-es alaplapot (azaz megelégszik a DDR2-es memóriákkal), ami semmivel sem lassabb, mint a DDR3-asok. Ezeket úgy gondoltuk, hogy meg kell említenünk, mert a különböző gyártói diák sokszor félrevezetőek, kb. annyira, mint a 80%-ról kezdett grafikonok...


  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés