Penryn - az Intel sebességet vált

  • (f)
  • (p)
Elemzés – Írta: fLeSs | 2007-10-29 12:40

Az új CPU-generáció hozománya nem merül ki a 45 nm-es csíkszélességben, egy sor más újdonsággal is szolgál.

Az Intel sebességet vált: itt a Penryn

Az Intel folytatni kívánja tikk-takk taktikáját, melynek lényege, hogy 2 évente vezet be új gyártástechnológiát, e ciklus félidejében pedig megújítja architektúráját is. 2005 végétől kezdte csökkenteni a Pentium processzorcsalád csíkszélességét 65 nm-re, tavaly pedig bejelentette a Core mikroarchitektúrát és az erre alapozó Core 2 családot (szintén 65 nm-en). Bár a 45 nm-es Core processzorok már most rendelkezésünkre állnak, nagyobb mennyiségben csak jövőre kerülnek forgalomba. Ezzel el is érkeztünk tesztünk tárgyához, a Core mikroarchitektúra második generációjához, melyet összefoglalóan Penryn kódnéven ismerhetünk.


Penryn-ostya [+]

A Penrynt első hallásra akár el is intézhetnénk egy legyintéssel – kisebb csíkszélesség, nagyobb cache... Mégsem tesszük ezt, ugyanis jóval többről van szó, az új processzorcsalád számos tekintetben megújult, ezek közül is a legfontosabb, hogy megváltoztatták a tranzisztorok anyagi felépítését. Az Intel mindig is élen járt a különböző gyártástechnológiai újítások terén, ám voltak a cégnek nehezebb időszakai is, gondoljunk csak a Prescott bevezetésére, melynek kedvezőtlen tulajdonságai miatt a legnagyobb processzorgyártó bizony veszített piaci részesedéséből. Mi volt a baj? Eltekintve az architekturális felépítéstől, a Prescott gyártástechnológiai szempontból is egy sor újítást hozott magával. Az Intel sorozatgyártásban itt alkalmazta először a feszített szilícium technológiát, mellyel a tranzisztorok teljesítményét 10–20%-kal volt képes növelni. Ennél fontosabb számunkra, hogy szintén a Prescott esetében használtak először alacsony k állandójú (low k) dielektrikumot a szigeteléshez, ezzel további 20%-kal csökkentették a kapacitív ellenállást. A mérleg másik serpenyőjét azonban lehúzta, hogy a csíkszélesség 130 nm-ről 90 nm-re történt csökkentése miatt nagyon megnőtt a szivárgási áram, ami miatt végül ez az architektúra nem érte el eredetileg tervezett órajeleit, s ezzel a kitűzött teljesítményt sem, miközben a disszipáció nagy volt.


Az ábra szerint a legproblémásabb a 90 nm-es csíkszélesség volt, azaz a Prescott
forrás: spectrum.ieee.org

A tranzisztorokban korábban hosszú éveken keresztül szilícium-dioxidot (SiO2) használtak kapuoxidként. Miközben a tranzisztorok mérete (csíkszélessége) csökkent, a szigetelőréteg vastagsága is csökkent, azonban törvényszerű, hogy létezik egy határ, melyen túl az adott réteg vastagságának csökkentésére már nincs mód (SiO2 esetén elvileg 1-2 nm, az Intel 65 nm-es gyártástechnológiája mellett nem vastagabb, mint 5 atomi réteg), ugyanis ezen a ponton túl a szivárgási áram drasztikusan megnő, ezzel a fogyasztás is, miközben a tranzisztor megbízhatósága csökken. A szivárgás egy félvezető több pontján is létrejöhet, de a legproblémásabb, amikor a kapuoxid szivárog.

A mérnökök jól tudták ezt, ezért ennek kiküszöbölésére hosszú évek után olyan anyagot kísérleteztek ki, melyeket alacsony k állandójú (low k) dielektrikumokként ismerhettünk meg: ezek általában az SiO2 továbbtisztított variánsai, melyek az eredeti anyagtól eltérő elektromos tulajdonságokkal bírnak, mégis megbízhatóan bevethetők szigetelőként. A tranzisztorok méretének további csökkenésével azonban újabb és újabb, nagyobb kapacitív ellenállással rendelkező szigetelő anyagok bevetése válik szükségessé, így a low k dielektrikumok után az Intel most bevezette a nagy k együtthatójú (high k) kapuoxidot tranzisztoraiban. Nevéből következik, hogy ennek az anyagnak – melynek a Penryn esetében a hafnium a fő összetevője – nagyobb a dielektromos állandója, mint a szilícium-dioxidé. A dielektromos állandó egy anyag azon tulajdonságára utal, hogy milyen mértékben képes az elektromos töltést visszatartani. Egy magasabb dielektromos állandójú anyag magasabb kapacitív ellenállást biztosít két vezető réteg között, miközben vastagsága nem csökken/nő, így megakadályozza a szivárgást. Az új eljárás révén az Intel esetében – bár tovább csökkent a csíkszélesség – nem nőtt a szivárgási áram.


Forrás: spectrum.ieee.org

Ezzel azonban még nem küszöböltek ki minden, a tranzisztorok méretcsökkenésével járó problémát. Fentebb a kapuoxiddal foglalkoztunk, amely a csatornát (azt a régiót, ahol áram folyik a tranzisztor bekapcsolt állapotában) választja el a kapuelektródától, de az Intel ez utóbbin is változtat. A kapuelektródában itt használnak először hagyományos polikristályos szilícium helyett fémes anyagokat. A pontos összetétel persze titok, annyi ismert, hogy a p és n típusú tranzisztoroknál eltérő anyagot alkalmaznak. Mindezzel tovább folytatódhat a mikroelektronikai komponensek miniatürizációja, és – egyelőre – Moore törvénye sem veszti aktualitását.

Számokban kifejezve ezek az újítások azt eredményezik, hogy körülbelül kétszeresére nőhet a tranzisztorsűrűség; a gyártó dönthet arról, hogy kisebb csíkszélesség mellett kisebb területű chipet vagy közel azonos méretű, de fejlettebb, gyorsabb, összetettebb chipet gyárt. Hozzávetőleg 30%-kal csökken a tranzisztor állapotváltásának feszültségigénye, több mint 20%-kal nőhet az állapotváltás sebessége, illetve kevesebb mint ötödére csökkenhet a source és drain elektródák közötti szivárgási áram. És akkor még nem szóltunk arról, hogy kevesebb mint tizedére csökkenhet a kapuelektróda szivárgása.

Gyártástechnológiai szemszögből tehát a csíkszélesség csökkentése és a tranzisztorok – több évtizede használt – anyagának módosítása jelenti a Penryn fő újdonságát. Az Intel azonban nem pusztán miniatürizálta a Core 2 processzorokat, hanem – részint a technológiai előrelépésnek köszönhetően – nagyobb teljesítményt ígérő funkciókkal is ellátta chipjeit. A gyártástechnológiai újítások után lássuk az architekturális változtatásokat.

Először is a Penryn az aktuális Core 2-nél 50%-kal nagyobb másodszintű gyorsítótárral rendelkezik. Ez azt jelenti, hogy egy kétmagos Core 2 processzor esetében 4 helyett immár 6 MB lehet az L2 cache maximális mérete (négymagos processzornál kétszer 6 MB). A méret megnövelésén felül a cache késleltetési ideje is csökkent, tehát – legalábbis az Intel szerint – gyorsult a tár, emellett 16 helyett immár 24 utas csoportasszociatív tárról beszélünk.


[+]

A lebegőpontos számításokat végző egységgel kapcsolatos újítás a Fast Radix-16 Divider bevezetése, mellyel akár 3-szorosára gyorsulhat a bitek eltolása, a négyzetgyökvonás (egyszeres, kiterjesztett és kétszeres pontossággal) és 1,6–2-szeresére gyorsulhatnak az osztások (ugyancsak egyszeres, kiterjesztett és kétszeres pontosságnál is). A Fast Radix-16 Divider órajelenként 4 bitnyi hányados kiszámolására képes a Merom (az első generációs Core 2) Radix-2,4 2 bites sebességével szemben. Szintén az FPU gyorsítását célozza a Super Shuffle Engine megjelenése, melynek segítségével az SSE adatműveletek feldolgozása gyorsul; a Penryn immár az összes 128 bites SSE utasítás végrehajtását egy órajelen belül befejezi. Ezek az újítások elvileg – egyebek mellett – a különböző képszerkesztő és videovágó programoknak kedveznek (a shuffle bitek eltolását/újrapozicionálását jelenti). Továbbfejlesztették az Intel Virtualizaton Technologyt is, főleg a virtuális gépek közötti váltások sebessége javult 25–75%-kal.

A Core-nál megismert Smart Memory Access, illetve annak továbbfejlesztett Memory Disambiguation nevezetű technológiája is változott: az új processzor a STORE műveleteket méggyorsabban képes betűzni az utasítássorozatba (mint ismeretes, a Memory Disambiguation a soron kívüli, out-of-order műveletek írási és olvasási hatékonyságát növeli azáltal, hogy a LOAD műveleteket a STORE-ok elé helyezi). Ha már a memóriaelérésnél tartunk, meg kell említeni, hogy a Penryn processzorok rendszerbuszának órajele immár elérheti az 400 MHz-et is (1600 MHz QPB), szemben a Core 2-esek 333 MHz-es (1333 MHz QPB) csúcssebességével. Ez jól jön majd a DDR3 piacának.

Talán a leglényegesebb újítás egy új utasításkészlet, az SSE4, pontosabban annak első verziójának, az SSE4.1-nek az implementálása (további hét SSE4-es utasítás jelenik meg majd a Nehalemben). A Core 2 processzoroknál megismerhettük a Supplemental SSE3-at (SSSE3), melyet először sokan az SSE4-nek hittek, de végül kiderült, hogy nem az. Az SSE4.1-et most vezetik be a Penrynben, ez 47 új utasítást tartalmaz (további 7 utasítás a Nehalemben), melyek az élet minden területén gyorsulást hozhatnak magukkal (képszerkesztés, grafika, videófeldolgozás, játék, multimédia, adatbáziskezelés, szövegkeresés, víruskeresés, és különféle memóriaintenzív alkalmazások), feltéve, hogy a programozók erre optimalizálják a kódot.

A Penryn család mobil processzorai további fejlesztésekkel bővültek, úgy mint az Enhanced Dynamic Acceleration Technology és a Deep Power Down Technology. Ezeknek hála a processzorok fogyasztása tovább csökkenhet, ami notebookok esetében fontos tényező az energiamegtakarítás és az akkuidő miatt. Az Intel mobil processzorok több módon képesek csökkenteni a fogyasztást: csökkentik a feszültséget, az órajelet, mindkettőt és/vagy lekapcsolják a cache-t. A Deep Power Down Technologyval kiegészítve a Penryn mobil processzorok a következő állapotokat ismerik:


  • C0: teljes terhelésnél aktív, nincs energiagazdálkodás.
  • C1 (Halt): csökken a feszültség és lekapcsol a processzormag, viszont az alaplapi áramkörök feszültség alatt vannak, és a gyorsítótárakban található adatok is tovább élnek (a teljesítmény nem csökken érezhetően, mert a „felébredési” idő nagyon rövid, viszont az energiamegtakarítás sem jelentős).
  • C3 (Deep Sleep): ugyanaz, mint a C1, de lekapcsolnak az alaplapi áramkörök, és kiürül az L1 cache is. Az L2 cache tartalma megmarad. A felébredési idő kicsit hosszabb, viszont még mindig nem jelentős a megtakarítás.
  • C4 (Deeper Sleep): ugyanaz, mint a C3, de a magfeszültség tovább csökken, és az L2 cache egy része is lekapcsol (valószínűleg csak az üres területek), illetve az egyik CPU-mag teljesen kikapcsolhat.
  • DC4 (Enhanced Deeper Sleep): a C4-gyel ellentétben már mindkét processzormag kikapcsol.
  • C6 (Deep Power Down): minden kikapcsol (CPU, alaplapi áramkörök, L1 és L2 cache), és a magfeszültség drasztikusan lecsökken. Maximális megtakarítás, de a felébredési idő itt a leghosszabb.

A különböző állapotok között a processzor természetesen önmagától váltogat, tehát nem úgy kell kapcsolgatni egyikből a másikba, mintha az operációs rendszert állítgatnánk.

Az Enhanced Dynamic Acceleration Technology tovább keveri a kártyákat: ha az egyik processzormag eléri legalább a C3 állapotot, akkor a Penryn mobil processzorok esetében elképzelhető, hogy a másik, nem alvó processzormag megnöveli órajelét egészen addig, amíg el nem éri a hivatalos TDP-értéket, tehát a két mag együttes fogyasztásának maximumát. Ennek következménye, hogy a processzor az egy szálon futó programokat gyorsabban fogja futtatni, még akár az is elképzelhető, hogy tuningra kerül sor.

Specifikációk, tesztkonfiguráció, fogyasztás

Ismerve az új Intel processzornál eszközölt gyártástechnológiai és architekturális változásokat, nincs is más hátra, mint összevetni azt az előző generáció képviselőjével. A Penryn család asztali vonalon első körben két tagból fog állni, a négymagos Yorkfieldből és a kétmagos Wolfdale-ből. Mivel a Penryn bejelentését egyelőre csak egyetlen asztali processzor, a négymagos Core 2 Extreme QX9650 piacra kerülése követi, így a Prohardver! is ezt tesztelhette először. A kisebb órajelű kétmagos és a négymagos változatok 2008 első negyedében jelennek meg a jelenlegi Intel ütemterv szerint. Kétmagos Penrynt nem kaptunk, de a specifikációkat (pár kérdőjelet leszámítva) már ismerjük, ezért összegzésként készítettünk egy összehasonlító táblázatot.


Processzor megnevezéseCore 2Core 2 / ExtremeCore 2 DuoCore 2 Quad/Extreme
KódnévWolfdaleYorkfieldConroeKentsfield
Típusjelölés?QX9650E6550, E6750, E6850Q6600, Q6700, QX6800, QX6850
Órajel?3000 MHz2333, 2666, 3000 MHz2400, 2666, 2933, 3000 MHz
Támogatott memóriaDDR2-800 / DDR3-1066/1333/1600DDR2-800 / DDR3-1066
Gyártástechnológia45 nm high k + Metal Gate65 nm
Tranzisztor (millió)410 (Wolfdale)2 x 410 (2 x Wolfdale)291 (Conroe)2 x 291 (2 x Conroe)
Magméret (mm2)107 (Wolfdale)2 x 107 (2 x Wolfdale)143 (Conroe)2 x 143 (2 x Conroe)
Stepping??G0G0/B3
L1 cache2 x 32 kB adat és 32 kB utasítás (8 utas)2 x [2 x 32 kB adat és 32 kB utasítás (8 utas)]2 x 32 kB adat és 32 kB utasítás (8 utas)2 x [2 x 32 kB adat és 32 kB utasítás (8 utas)]
L2 cache6 MB megosztott
(24 utas; 256 bit)
2 x 6 MB megosztott
(24 utas; 256 bit)
4 MB megosztott
(16 utas; 256 bit)
2 x 4 MB megosztott
(16 utas; 256 bit)
SIMDMMX, SSE, SSE2, SSE3, SSSE3, SSE4.1MMX, SSE, SSE2, SSE3, SSSE3
Egyéb támogatott technológiákC1E, EIST, Execute Disable Bit, EM64T, Intel VT
Rendszerbusz órajele333–400 MHz FSB / 1333–1600 MHz QPB333 MHz FSB / 1333 MHz QPB266 MHz FSB / 1066 MHz QPB
QX6850: 333 MHz FSB / 1333 MHz QPB
Feszültség?1,250 V0,962–1,350 V1,100–1,372 V
Maximális fogyasztás65 W95–130 W65 W95–130 W

Ami jelen pillanatban biztosra vehető, hogy a processzorok a gyorsabb rendszerbusz miatt magasabb órajelű DDR3 memóriákat is támogatni fognak. Csökkent a csíkszélesség, így bár az L2 cache mérete 50%-kal nőtt, a magméret csökkent (–33%). Az új Core 2-esek már támogatják az SSE4 utasításkészletet, kisebb feszültséget igényelnek, és bár jóval több tranzisztort tartalmaznak (+38%), mint elődeik, a fogyasztásuk nem nőtt. Összességében ígéretesnek tűnik a Penryn, lássuk, hogyan muzsikál a való életben.


TesztrendszerCore 2 Extreme QX9650, QX6850 és Core 2 Duo E6850 processzorok (333 MHz FSB; 2x6, 2x4, 1x4 MB L2 cache)
Gigabyte P35T-DQ6 alaplap (BIOS F2)
Intel Chipset Driver v8.3.3.1011
2 x 1024 MB Samsung PC3-8500 DDR3-1066
1333 MHz-en, 7-7-7-20 időzítésekkel
VideokártyaASUS EAX1900 CrossFire (625/725 MHz)
ATI Catalyst 7.6
MerevlemezMaxtor DiamondMax 10 250 GB (PATA; 7200 rpm; 16 MB cache)
Operációs rendszerWindows XP Professional Service Pack 2 + DirectX 9.0c
TápegységCooler Master RS-550-ACLY


Core 2 Extreme QX9650 processzor [+]

Tesztprogramok

  • Szintetikus tesztek
    • Lavasys Everest Ultimate Edition v4.2
    • Sciencenmark 2.0
  • Konvertálás-kódolás
    • TMPEGEnc XP v4
    • VirtualDub v1.6.19 + DivX 6.6.1
    • QuickTime 7.1
    • iTunes v7.0.1
    • L.A.M.E. MT v3.97b2
  • Tömörítés, fotó- és filmfeldolgozás, illetve szövegfelismerés
    • 7-Zip v4.48
    • WinRAR v3.7
    • Adobe Photoshop CS3
    • Adobe Premier Pro v2.0
    • Sony Vegas 7.0
    • ABBYY FineReader v8.0
  • Renderelés
    • POV-Ray v3.7 beta16
    • Cinebench 9.5
    • 3ds max 9
    • Lightwave 9
    • Maya 8
  • Játékok
    • Prey
    • Far Cry
    • The Elder Scrolls: Oblivion
    • Test Drive Unlimited
  • Webszerver tesztek
    • Apache v2.2.3
    • Web Application Stress Test

Alacsonyabb csíkszélesség bevezetésénél a Prescott óta talán a legkényesebb téma a fogyasztás kérdése. Annak ellenére, hogy a Wolfdale a Conroe-nál (és a Yorkfield a Kentsfieldnél) jóval több tranzisztort tartalmaz, a gyártó nem növelte a specifikált fogyasztást, elvégre a csíkszélesség csökkent és ennél fogva a mag mérete is. Mégis, a fogyasztási értékek láttán tátva maradt a szánk, ugyanis mint kiderült, a Yorkfieldes tesztrendszer jó 20–30%-kal kevesebbet fogyaszt, mint a Kentsfieldet tartalmazó, és alig eszik többet, mint a kétmagos (!) Conroe. A Yorkfield gyárilag 1,25 V-os feszültséget igényel, ezért csak úgy a móka kedvéért a Kentsfieldet is lemértük 1,25 V-os feszültség mellett, és a különbség szinte kézzel fogható.

Terhelve (Cinebench alatt) maradt a 20–30%-os különbség az egyes tesztrendszerek között, legalábbis ha azonos feszültségen mérjük a Yorkfieldet és a Kentsfieldet. Mint látható, a Yorkfield éppen annyit fogyaszt, mint a Conroe, holott a Conroe 291 millió, a Yorkfield pedig 820 millió tranzisztorból épül fel, ez egyszerűen elképesztő!

A fogyasztási adatokat látva azt hihetnénk, hogy a Penryn a tuning császára lesz. Ezt egyelőre nem tudjuk megerősíteni, ugyanis a nálunk járt Yorkfieldet 3 GHz-ről „mindössze” 3,66 GHz-ig sikerült túlhajtanunk alapfeszültségen – a 4 GHz-es órajelben reménykedtünk, de nem jött össze. Remélhetőleg ez csak a korai nullszériás tesztpéldány jellemzője, és a jövőre megjelenő és polcokra kerülő processzorok azért jobban bírják majd a strapát.

Ezek után a memória sebességével foglalkoztunk; az Intel azt állította a dokumentációkban, hogy a Penrynben javult a memóriaelérés, csökkent a késleltetés. Az Everest ennek félig-meddig ellentmond, ugyanis a Yorkfield memóriaolvasásban lassabb, írásban viszont gyorsabb volt a Kentsfieldnél, és a memóriaelérési tesztben is lemaradt, igaz, csak picivel. Az olvasásbeli hátrány a cache magasabb késleltetésének köszönhető, a gyorsabb írás pedig a gyorsítótár nagyobb méretének és a javított store forwarding-nak.

A Sciencemark az Everesttel ellentétes sorrendet hozott ki, ezúttal a Yorkfield volt a gyorsabb, bár csak alig pár százalékkal.


Kentsfield


Yorkfield

A Sciencemark cache-sebességmérő rutinját is lefuttattuk, és meglepő eredményt tapasztaltunk: a Yorkfield másodszintű gyorsítótára picit lassabbnak bizonyult a Kentsfieldénél. Csak 1 ciklusos, azaz 1/3 nanoszekundumos eltéréseket mértünk ki, ám egy cache esetében ez komolyan befolyásolhatja a sebességet. Kérdés, hogy a magonkénti (vagyis kétmagonkénti) plusz 2 MB L2 cache ellensúlyozza-e ezt a kis lemaradást.

Video- és zenekonvertálások

A video- és zenekonvertáló szoftverekről nagy általánosságban elmondható, hogy elsőként szokásuk felhasználni az egyes processzorok különböző kiegészítő utasításkészleteit (SSE). Háromból három tesztben a Yorkfield lett a győztes, de előnye nem olyan jelentős, mint amire számítani lehetett az előzetes pletykák alapján. Egyesek azt terjesztették, hogy az SSE4-et ismerő DivX 6.6.1-gyel a Yorkfield feleannyi idő alatt konvertál át egy filmet, mint a Kentsfield, ami azért – valljuk be – nonszensz lett volna. A Yorkfield gyorsabb, mint a Kentsfield, még az SSE2 és SSE4 közti különbség is jól látható, de a különbség nem 50–100%, hanem 16%.

A két audiokonvertáló program esetében arra számítottunk, hogy semmit nem fog változni az eredmény, mert ezek korábbi tesztjeink szerint se a cache méretére, se az utasításkészletek típusára nem érzékenyek, jóslatunk azonban csak félig vált be: az iTunes nem gyorsult, viszont a LAME igen (talán a Fast Radix-16 Divider lehet a háttérben).

Tömörítés, fotó- és filmfeldolgozás, szövegfelismerés

A tömörítők érzékenyek a memóriasebességre és a cache méretére is, három tesztből háromban a Yorkfield a nyerő.

A kép- és filmfeldolgozó szoftverek közül csak az Adobe Premier Pro gyorsult a Yorkfield alatt, meglepetésre a (cache-szenzitív) Photoshop és a (műveletvégrehajtás sebességével skálázódó) Sony Vegas nem. A szövegfelismerő szoftver sem gyorsult. Ezek a programok tipikusan abba a csoportba tartoznak, melyek az SSE4-et nagyon szépen ki tudnák használni, ha megoldott lenne a szoftveres optimalizáció (frissíteni fogjuk a programokat).

Renderelés

A render-benchmarkok a Yorkfieldnek kedveztek.

A 3ds max, a Lightwave és a Maya, ha kicsit is, de gyorsult a Yorkfield alatt. A következő verziókban a Penrynek biztosan nagyobb előnyre fognak szert tenni, hiszen az SSE4-et a jelenlegi programverziók még nem ismerik.

Játékok, webszerver

A játékok ritkán függnek a különböző utasításkészletektől, ezek inkább a memóriaelérés és a cache sebességének, illetve méretének megfelelően skálázódnak. A négy tesztelt játék közül (melyek már nem mai csirkék) mindegyik profitált a Yorkfield nagyobb másodszintű gyorsítótárából.

A webszerver tesztek nem túl megbízhatóak, ha nüansznyi különbségek kimérése a cél, így a Kentsfield és a Yorkfield közti differenciát is kicsit érdekesen mutatták ki. Az Apache jobban futott Yorkfielden, viszont a WAST nagyobb terhelést processzorra hárító tesztjében a Kentsfield volt a nyerő. Korábbi méréseink során fordult már elő olyan, hogy a nagyobb L2 cache-t felmutató processzor esetében magasabb volt a CPU-terhelés, ez a programnak valamiféle sajátossága lehet.

Konklúzió

Ha pontosak az információink, akkor az Intel már 2003 óta fejlesztgeti a high k kapuoxidot. Négy év alatt sikerült nekik odáig eljutni, hogy sorozatgyártásba kerülhessen – talán akkor gondolhattak erre először, amikor szembesültek a Prescott problémáival. Most, 2007-ben viszont a már eleve nagyon jó teljesítmény/fogyasztási aránnyal büszkélkedő Core mikroarchitektúrára ültették át a fejlesztést, és azt kell, hogy mondjuk, jól cselekedtek. A Penryn-generáció, annak is a négymagos asztali változata, az általunk tesztelt Yorkfield nagyszerűen szerepelt. Azonos órajelen 20–30%-kal alacsonyabb fogyasztás mellett 1–10%-os teljesítménybeli javulást mutatott fel az előző generációs Kentsfielddel szemben. Az Intel kicsit kacifántosan fogalmaz, hiszen azt állítja, hogy azonos fogyasztás esetén a Penryn akár 20%-kal is gyorsabb lehet a Conroe-nál. Mivel a Penryn 20–30%-kal kevesebbet fogyaszt, így ez az állítás hihető.

Ne feledjük azonban, hogy a Penryn család, azon belül is a Yorkfield elsődleges ellenfele nem saját elődje, hanem a rivális AMD natív négymagos processzora, a Phenom. Kérdés, hogy azzal szemben mire lesz képes az új Intel processzor. Figyelembe véve, hogy az AMD még 65 nm-en gyártja CPU-it, ráadásul eleve sokkal nagyobb magmérettel (hiszen nem két darab kétmagos lapkát drótoz össze, hanem natív négymagos chipeket gyárt), túl sok jót nem jósolunk az AMD-nek, már ami a gazdaságosságot és nyereséget illeti. A Core architektúrát eleve nehéz megszorongatni, és most itt van a feltupírozott változat, sokkal kedvezőbb fogyasztással, magasabb teljesítménnyel és sokkal kisebb magmérettel – az AMD helyzete nem éppen irigylésre méltó. Éppen egy évvel ezelőtt az első négymagos Intel chipet tesztelhettük, akkor a végszó így hangzott: „mást egyelőre nem is tehetünk, mint hogy megvárjuk az AMD bejelentését, és leteszteljük a rivális platformot is, ugyanis addig az Intel négymagos processzora ellenfél hiányában egyértelmű győztes”. Kicsit szomorú, hogy ezt kell mondanunk, de a helyzet változatlan, az AMD négymagosára egy év múltán még mindig csak várunk.


Justin Rattner, az Intel technológiai igazgatója egy Penryn ostyával

Jelen pillanatban a Penryn az Intel számára minden, ami öröm, az AMD számára pedig nem más, mint bánat és bosszúság. Egy gyors, moderált fogyasztású, olcsón előállítható, a korábbi platformmal kompatibilis processzor, amelyre az ellenfélnek egyelőre nincs (vagy inkább továbbra sincs) válasza. Ha belegondolunk, hogy az AMD a K10 architektúrát (a következő generációs négymagos CPU-k alapját) részben a fejlett energiagazdálkodási technológiák miatt fejlesztette ilyen sokáig, akkor az Intel ez irányú váltása egy igen komoly pofon lehet számára... Igaz, az AMD megoldása hangzatosabb funkciókat kínál (dinamikus órajel- és feszültségszabályozás, precíz energiavezérlés a CPU-magokon belül), ám egyáltalán nem biztos, hogy ez a villanyszámlán is látszani fog (legalábbis amíg 65 nm-es gyártástechnológiát használnak).

Intel Yorkfield CPU

fLeSs

A tesztben szereplő Intel processzort az Intel bocsátotta rendelkezésünkre.