Hirdetés

AMD Bulldozer – kislapát vagy munkagép?

Összegzés

A Bulldozer felépítése radikálisan eltér mind elődeiétől, mind pedig aktuális versenytársaiétól, nagyrészt azért, mert már a kezdetektől fogva magas órajeleket szántak hozzá. Az AMD jövőbeni processzorai is ezt az alapvető szerkezetet viszik tovább, viszont első generációs termékként jó néhány ponton kompromisszumokra kényszerült a termék. Az nem jó ómen – gondoljunk csak a Netburstre –, ha egy órajelre kihegyezett felépítés az őt megelőző, hagyományosabb tervezési elvekkel készült generációval közel azonos órajeleken működik.

Nem kérdés, hogy az AMD eredeti tervei szerint nem 3,6 GHz lett volna az induló csúcsmodell órajele. Már hónapokkal ezelőtt lehetett hallani olyan pletykákat, hogy a vállalat elégedetlen a GlobalFoundries által gyártott lapkák órajeleivel, elég ha csak a Llano alapú Fusion processzorokra gondolunk, melyek kihozatali arányával szintén probléma van. Ugyan ennek legfőbb oka a GPU szekció gyártási nehézségei miatt van, ennek ellenére a CPU magórajelek sem túl izmosak. Ez különösebben nem feltűnő, hisz a koncepció nem erre megy rá, viszont az sok mindent elárul, hogy míg a közvetlen előd, azaz a 2009 legelején, kerek 3 GHz-en indult 45 nm-es Phenom II X4 utolsó modellje, az X4 980 vígan viszi a 3,7 GHz-es gyári magórajelet, addig a Llanót még tuninggal sem könnyű rávenni erre.

Ami ennél nagyobb probléma, hogy a kezdetektől fogva magas órajelekre tervezett, általunk kipróbált FX a leggyorsabb X4-nél csak alacsonyabb, 3,6 GHz-es induló órajelet kapott, melynek okán az asztali Bulldozer jelenleg egy félkarú óriás. Mindez annak ellenére van így, hogy a kisebb csíkszélességen készülő lapkák egyik hozománya éppen az kellene legyen, hogy magasabb órajeleket, vagy azonos órajel mellett alacsonyabb fogyasztást lehessen kihozni a gyártástechnológiában egy szinttel előrébb lépett, hasonló mikroarchitektúrákból.

A magasabb órajeleknek tehát egyelőre nyomát sem lehet látni, sőt meg merjük kockáztatni, hogy a GlobalFoundries aktuális 32 nm-es gyártástechnológiája rosszabb skálázódást nyújt, mint a korábbi 45 nm-es. Ergo jelenleg talán az egyetlen, bár nem éppen elhanyagolható pozitívum a lapka mérete, mely természetesen jóval kisebb, mint amilyen a korábbi csíkszélességen lenne. Úgy fest, hogy a gyártó nagy fába vágta a fejszéjét a SOI, a HKMG, valamint az immerziós litográfia technológiájának ötvözésével. A Bulldozer fogyasztási adataiból jól látszik, hogy bőven van min javítani a bérgyártónak. Kissé ironikusan ugyan, de jelenleg pont úgy szivárog az áram a B2 steppinges lapka belsejében, mint ahogy az információáradat tette azt az elmúlt néhány hónapban.


AMD FX - 4 GHz felett még jó lehet

Az imént ecsetelt szempontból a Bulldozer nagyon hasonlít a legelső B2 steppinges Phenom processzorokhoz, és nem csak abban, hogy mindkettő a B2 jelölést kapta. Érdekes tendenciát lehet megfigyelni az AMD álal korábban fejlesztett és ma már csak megvásárolt gyártástechnológiák terén. A 90 nm nagyon jól teljesített. Emlékezzünk csak vissza, hogy ezzel debütált az első Athlon X2, mely végül egészen 3200 MHz-ig jutott. Ezután érkezett a 65 nm, ami szinte teljesen ugyanazzal a mikroarchitektúrával sem volt képes felvenni órajelben a versenyt az azt megelőző csíkszélességgel. Később ezen debütált az említett Phenom is. Ezt követően jött a 45 nm, mely már a kezdetektől fogva lényegesen jobb volt, és az anno 2300 MHz-en induló K10-et egészen 3700 MHz-ig repítette fel. Most pedig itt a 32 nm, mely eddig kísértetiesen hasonlít a 65 nm-re. A B2 steppinges Phenomot az azt követő B3, ha nem is teljesen, de részben helyre tudta rázni. Ezek tükrében nem meglepő, hogy a Bulldozerből már készülőben van az új stepping, melyet – ha hinni lehet a híreknek – C0 jelöléssel fognak ellátni, és jövő év első negyedévében kerülhet forgalomba.

Néhány szót érdemel az ütemezés kérdése, nevezetesen az, hogy kevés programszálat használó programoknál mi a jobb megoldás: egy-egy modulra csak egy szálat indítani, vagy kettőt? Láthatjuk, hogy a modulonkénti front-endet, az L2 cache-t és az FPU-t megosztva használja két futtatott szál, így ha egy modulra csak egy szál kerül (főleg ha az túlnyomórészt SIMD vagy lebegőpontos utasításokat tartalmaz) akkor az profitál abból, hogy kizárólag övé az összes megosztott erőforrás. Viszont a Bulldozer energiagazdálkodása jórészt modul-alapú, azaz ha 3 vagy 4 szál két modulon fut, akkor ezek órajele jócskán megnövelhető, ezzel párhuzamosan a másik két, feleslegessé vált modul teljesen lekapcsolható, így a fogyasztás csökken, valamint ebből a tisztán integer programok előnyt kovácsolhatnak.

A szálakat alapértelmezésben az operációs rendszer ütemezője osztja ki az általa látott magok között, de ebbe szerencsére vagy sajnos az adott program készítője bármikor kézzel beavatkozhat, ugyanis ez az úgynevezett affinitás programozási eszközökkel szálszinten is állítható, nem csak hagyományosan programszinten (pl. a Windows Feladatkezelőjében látott módon). Azért szerencsére, mivel azok a programok, amelyek készítésénél törődnek ezzel, ott további eszközök (Windows-frissítés, új ütemező) nélkül már ma is megoldható olyan ütemezés kialakítása, amely teljes mértékben megfelel a program készítői szándékainak. Azért sajnos viszont, mivel amely programoknál nem törődnek vele, azok az operációs rendszerre lesznek utalva, amely egyetlen általános megoldást tartalmaz csak, ami bizonyos programok számára előnyös, mások számára pedig hátrányos lesz. A Windows 8 ezt már helyesen fogja kezelni, de a Windows 7 megfelelő frissítés hiányában erre jelenleg nem képes.

Cikkünk végéhez érve térjünk rá az eredmények összesítésére! Először nézzük, hogy az egyes programcsoportokban hogyan alakulnak az eredmények:

A különféle renderer alkalmazások alatt összesítve körülbelül az FX az 1100T szintjét hozta. Nézőpont kérdése, hogy ezt most negatívan vagy pozitívan fogjuk fel, de a Thuban nagyon jó ezen a területen. Aki ilyen jellegű munkát végez és költséghatékony megoldást keres, annak még mindig jó választás lehet a Phenom II X6. Aki az árcímkétől függetlenül itt a leggyorsabbat akarja, annak hatmagos Gulftown után kell keresgélnie.

A Cockos Reaper és a LameXP két olyan alkalmazás, melyekben amellett, hogy elég szokatlan eredményeket kaptunk, az FX-8150 különösen hátra szorult. Ennek köszönhetően itt az utolsó helyen áll cikkünk főszereplője.

Fotó- és videófeldolgozó programok alatt összesítve, kis előnnyel az i5-2500K előtt a harmadik helyen végzett az első Bulldozer.

A különféle konvertálásokban és tömörítésekben szintén a az i5-2500K szintjén van az FX-8150, bár a leggyorsabb i7-980X processzorhoz képest itt összesítve csak 8% a lemaradása.

Mindent egybevéve, azaz az eredményeket összesítve, tesztjeink alapján az i5-2500K 4,5%-kal van az FX-8150 előtt. A korábbi csúcs AMD processzor, a Phenom II X6 1100T pedig durván 11%-kal lassabb az új jövevénynél.

A teljesítmény/fogyasztás mutatót nézve azt láthatjuk, hogy az FX-8150 szinte pont annyival gyorsabb a a Phenom II X6 1100T-nél, mint amennyivel többet fogyaszt annál. Ezen a téren a két Sandy Bridge továbbra is az élen áll.

Első körben négy modell jelent meg az FX sorozatból. Ezek sorrendben az FX-8150, FX8120, FX-6100 és FX-4100 jelölésű darabok.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

Előzmények

Hirdetés