Gyorskeresés
Phenom II: az AMD mentőövet dob önmagának
Cikkünkből megismerhetjük az újításokat, és az új processzor teljesítményére is fény derül.
Hirdetés
Utasításvégrehajtás
Az utasításvégrehajtással kapcsolatos különbségek feltérképezésére szintén az Everest tesztjeit vettük elő. Itt különösen érdekes lehet a Hyper-Threading használata, hiszen ezekből a tesztekből kiderül, hogy a Nehalem esetében kínról vagy áldásról van-e szó. Hogy az egyes eredmények hátterét megértsük, felvettük a kapcsolatot a program készítőivel.

A CPU Queen egy egyszerű, egész számokkal dolgozó benchmark, amely a processzorok elágazásbecslési képességeire fókuszál, és a „nyolc királynő egy sakktáblán” feladványra épül (10 x 10-es játékmezőn). A teszt MMX-, SSE2- és SSSE3-optimalizált, és kevesebb mint 1 MB memóriát foglal le. Ebben a tesztben az elágazáskezelés képességei határozzák meg a pontszámot. Nemcsak a branch prediction táblák és a becslés pontossága, a return stack mérete, hanem az is, hogy az utasításkészlet támogatja-e valamilyen módon maguknak az elágazásoknak az elkerülését (van-e CMOV vagy PABSB utasítás), illetve képes-e egyszerre párhuzamosan több bábu helyzetével számolni.

A CPU Photoworxx különböző digitális fotófeldolgozási műveleteket hajtat végre a processzorral (kitöltés, forgatás, random stb.). Ez a teszt főleg a processzorok integer számolási végrehajtási egységeit dolgoztatja meg a memória-alrendszerrel egyetemben, ezért nem skálázódik olyan jól több processzormag esetén. A teszt csak alap x86-os utasításokat használ. Photoworxx a legösszetettebb teszt, többféle méretű képpel dolgozik, sok minden számít benne, de leginkább az átlagos memóriaelérés ideje a döntő. Sokat jelentenek a jobb prefetcherek, és itt számít a legtöbbet a memória és a cache-ek hatása, márpedig a memória elérése javult, így a Photoworxx eredmény is magasabb lett.

A CPU ZLib is egy integer benchmark, amely a publikusan elérhető ZLib fájltömörítési algoritmussal méri le a processzor és a memória-alrendszer teljesítményét, ez a teszt is csak alap x86-os utasításokat használ. Itt inkább a CPU sebessége, illetve képességei számítanak (dekódolás szélessége, out-of-order load támogatása, ugrásbecslés, reordering ablak mérete), mint a memória sebessége.

A CPU AES is egy integer benchmark, amely az AES (azaz Rijndael) adattitkosító algoritmust használja. A teszt Vincent Rijmen, Antoon Bosselaers és Paulo Barreto publikusan elérhető C kódját használja ECB módban. A benchmark alap x86-os utasításokat, és összesen 48 MB memóriát használ. Itt is inkább a CPU sebessége a fontos, illetve kiugróan az out-of-order load képesség számít (a hardveres AES-támogatást leszámítva persze). A főleg végrehajtási sebességtől függő tesztek közül egyedül itt volt kimutathatóan, 8%-kal gyorsabb a felújított architektúra, ami valamelyik kisebb optimalizáció eredménye lehet.

Az FPU Julia a processzorok 32 bites (egyszeres pontosságú) lebegőpontos teljesítményét méri le a „Julia” fraktál segítségével. A benchmark kódja assemblyben íródott, és extrém mértékben használja ki az egyes AMD és Intel SIMD-utasításkészleteket (x87, 3DNow!, 3DNow!+, SSE). Az eredmények okán előző tesztünkben sokat töprengtünk, ugyanis nem értettük, hogy a K10 miért ennyivel lassabb. Végül a program készítői adták meg a magyarázatot, miszerint a Julia bench beleszalad a K8/K10-nek abba a korlátjába, hogy az architektúra nem bírja, ha cserélődnek az SSE regisztereknél az adattípusok. A Core-on ez nem gond, és emiatt gyorsabb/rövidebb kódot lehet írni.

Az FPU Mandel a 64 bites (kétszeres pontosságú) lebegőpontos teljesítményt méri le a „Mandelbrot” fraktál egyes frame-jeinek kiszámolása révén. Ez a benchmark is assemblyben íródott, és hasonlóan az FPU Juliához, kihasználja az egyes SIMD-utasításkészleteket (x87 vagy SSE2). Itt a Nehalem még HT nélkül is gyorsabb a Penrynnél. A Julia benchez képest a K10 itt azért szerepel jól (pontosabban fogalmazva nem vérzik el úgy, mint az előbb), mert a Julia belső ciklusa egyszerre 8 pixelen dolgozik, a Mandelé viszont csak 4 pixelen, emiatt a típusváltást (int/float) kiváltó kód Mandelban rövidebb és gyorsabb az AMD CPU-kon.

Az FPU SinJulia a 80 bites (kiterjesztett pontosságú) lebegőpontos teljesítményt méri le a „Julia” fraktál módosított változatának kiszámolásával. A kód assemblyben íródott, és erősen kihasználja a trigonometrikus és exponenciális x87-es utasításokat. Míg a Juliánál a raw 32 bites lebegőpontos MUL/ADD/MOV képességek számítanak, addig a SinJuliánál a legpontosabb 80 bites mód kihajtása a lényeg, és a transzcendens utasítások (sin, cos, ex) megvalósítása. Teljes végrehajtási idő szempontjábol a sin, cos, ex sebessége a döntő, amiben egyébként a P6 leszármazottai hagyományosan gyorsabbak.
A szintetikus tesztekből levonhatjuk a tanulságot: a Phenom II az utasításvégrehajtás szempontjából lényegében változatlan az első verzióhoz képest, a memóriára támaszkodó PhotoWorxx teszten kívül az új K10-esnek csak a CPU AES benchmarkban volt kimutatható előnye.
A cikk még nem ért véget, kérlek, lapozz!
Azóta történt
-
Processzorok 40 000 forintért
Nem olcsó, de nem is túl drága, mégis gyors. Vagy mégsem? Öt darab processzort teszteltünk le.
-
Az Intel megint dobbantott: Gulftown, a hatmagos asztali processzor
Még a négymagosok sem igazán terjedtek el, máris itt az első hexa-core processzor, a Core i7-980X Extreme Edition.
-
Core i3-530 vs. Phenom II X4 925
Két hasonló árú platform, na de kétmagos a négymagos ellen? Ez egy lefutott meccs... Vagy mégsem?
-
Mit tud a kétmagos Core i5 mint processzor?
A GPU-t is tartalmazó CPU grafikus képességei után ezúttal magát a processzort teszteltük le.
-
Az Intel-féle „Fusion” első verziója
A Core i5 kétmagos változata már majdhogynem egy komplett platform. Itt az idő kicsit jobban szemügyre venni...
-
Phenom II X4 L3 cache nélkül = Athlon II X4
Teszteltük az AMD újabb három, illetve négymagos processzorait, melyek még a korábbiaknál is olcsóbbak.
-
Terítéken a Lynnfield lapkás processzorcsalád
Az Intel új, Core i5 és i7 modelljei a középkategóriát célozzák, megvizsgáltuk, milyen sikerre számíthatnak.
-
Három AM3-as lap AMD 790 chipsettel
Az Asus, a Gigabyte és az MSI AMD 790X, illetve 790GX chipsetre épülő alaplapjait vettük szemügyre.
Előzmények
Mától elérhetőek az AM3 tokozású Phenom II processzorok
Érkezőben az új Phenom II processzorok
AMD: a Phenom II ára is csökken
Hivatalosan is útnak indult a Dragon platform
Tuningra született a Phenom II?
-
Intel Nehalem - egy újabb mérföldkő
Az Intel nem szándékozik lassítani: az új architektúrát jártuk körbe alaposan tesztünkben.
-
K10 élesben - nyúzópadon a Phenom
Az AMD új architektúráját elemző írásaink után éles helyzetben, valós alkalmazásokkal teszteltük a Phenom processzort.
-
Fókuszban az AMD K10 architektúra
Elemzésünkből kiderül, milyen újításokat tartalmaznak a harmadik generációs Opteronok és a friss Phenom processzorok.
Gyártók, szolgáltatók
Percről percre
Skyrim: Dawnguard DLC videó és ár
A Bethesda kiadta az első mozgóképeket a Skyrim...
Ma vagy holnap érkezhet a Windows 8 Release Preview
Két forrás, két dátummal – vajon melyik lesz az...
Az EA megerősítette: Jön a Battlefield 3 Premium szolgáltatás
Immár hivatalosan is megerősítették az előfizet...
Kiszivárogott a véglegeshez közeli Windows 8
Kínai oldalakon már elérhető a Microsoft új asz...
Steam alá érkezik a Dark Souls PC verziója
A Namco Bandai bejelentette, hogy a Dark Souls ...
CORSAIR Carbide 300R USB3
Azt gondolom ez egy profi cucc, a Corsair nevéhez méltó, ez egy letisztult fekete párduc!
Galaxy Pocket - zsebibaba
Megérkezett szerkesztőségünkbe a Samsung legolcsóbb androidos mobilja, amely még így is kicsit drágább a tudásánál.
Win7: cégeknek megéri váltani
Alacsonyabb IT- költséggel és jobb terméktámogatással csábít az új rendszerre a redmondi vállalat.





