Ringben az Athlon 64 és az Athlon 64 FX

A kalapács

Az AMD új K8 architektúrája bármily hihetetlen is, de a K7 továbbfejlesztett változata, annak előnyeivel és hátrányaival együtt. Az új processzorok több jelentősebb újítást is tartalmaznak: a K8 a K7 64 bites funkcióival (regiszterek, címtartomány, stb.) felvértezett, integrált memóriavezérlővel ellátott, jobb elágazás-becsléssel és hosszabb pipeline-nal rendelkező, illetve a külvilággal a HyperTransporton keresztül kommunikáló változata, amely az IBM által kifejlesztett SOI technológiával készül. Itt most potenciálisan több ismeretlen fogalom is feltűnt, ezeket - ha nem is a teljesség igényével, de - nagyjából kitárgyaljuk.

Az integrált memóriavezérlő

A hagyományos értelemben vett memóriavezérlő ezidáig a chipsetbe építve volt jelen, azon belül is az északi híd látta el ezt a feladatot. Ennek a megoldásnak (ha nem is éreztük különösebben) létezik egy hátránya, miszerint a memória a rendszerbuszon (Front Side Bus) keresztül kommunikál a processzorral, ami magas(abb) memóriaelérési késleltetést jelent. Az AMD ezt egy egyszerű megoldással váltotta ki: a processzorba építette a memóriavezérlőt, aminek hatására az a processzor órajelén üzemel. A processzor és a memória közötti adatok eddigi útját a processzor-chipset-memória, illetve visszafelé a memória-chipset-processzor trió alkotta, azonban ezzel a megoldással a processzor közvetlenül fér a memóriához. A megoldás előnyei nagyon is kézenfekvőek: a memóriaelérés-késleltetés drasztikus mértékben csökkent, amely az eddigiek során egy visszatartó tényező volt a rendszer összteljesítményét illetően. Ezen felül többprocesszoros környezetben a memória-sávszélesség arányosan nő a processzorok számával, ugyanis azok nem egy közös memóriabuszon osztoznak, hiszen mind külön memóriavezérlővel vannak ellátva. A Hammer processzorok beépített DDR333/DDR400 memóriavezérlővel rendelkeznek, tehát támogatják a jelenlegi legújabb szabványt.

Ezen kívül más kézenfekvő előnyei is származnak ennek a megoldásnak, amelyek a rendszer későbbi kiépítésének velejárói lesznek. Gondoljunk csak bele, a chipsetgyártóknak többet nem kell foglalkozniuk a memóriavezérlő kifejlesztésével, gyártásával, hiszen azt a processzor elvégzi! Ez több tényezőt is magában hordoz: az eddigi északi hidak AGP-vezérlővé degradálódnak, tehát az északi híd csak a videokártyával kell, hogy foglalkozzon. A chipsetek árai is csökkenhetnek, hiszen kevesebb funkciót kell ellátniuk. A north bridge elhagyásával az új processzoroknak többé nem létezik a hagyományos értelemben vett FSB-jük -- erről később még szólunk.

HyperTransport kommunikáció

A HyperTransport egy, az AMD által kifejlesztett technológia, melynek neve eredetileg Lightning Data Transport (LDT) volt. A cég végül ezt nyílt ipari szabványként átadta a HyperTransport konzorciumnak, amely egy, több nagy céget is magába foglaló szervezet. A technológia egy csomag-alapú chip-to-chip (chipből chipbe) összeköttetés (link), amely 2, 4, 8, 16 vagy 32 biten képes adatokat továbbítani a két végpont között. A busz szabványos sebessége 800 MHz, ami a felépítéséből következően támogatja a "DDR"-t (két adat egy órajel alatt, hiszen képes egyet küldeni, egyet pedig fogadni), tehát effektíve 1600 MHz. Mindezek hatására a maximálisan elérhető egyirányú HT-linksebesség 6.4 GB/mp (800 MHz x 32 bit x 2) / 8 = 6,400 MB/mp). A HT totális áteresztő-sebessége 12,8 GB/mp, ha adatküldés/fogadást feltételezve számolunk. Ha utánaszámolunk, akkor ez a sebesség igencsak meghökkentő: 48-szorosa a 32 bites 33 MHz-es PCI 133 MB/mp-es, vagy 6-szorosa a PCI-X 1 GB/mp-es sebességének.

A K8 rendszerekben több helyen is felfedezhetőek HyperTransport-linkek. A Hammer processzorok egy 16 bites HT-linken keresztül kommunikálnak a chipsettel, illetve ha szerverprocesszorról van szó (Opteron), akkor az további két 16 bites HT-linken keresztül kommunikál(hat) két további Opteron CPU-val. Az Athlon 64 és az Athlon 64 FX csak egy darab 16 bites HT-linkkel rendelkezik, amely a lapkakészlettel kommunikál. A HyperTransportot fel lehet még használni az eddigi chipsetet érintő feladatokra is, amelyek a chipkészlet és például az AGP, a PCI vagy a déli híd I/O műveleteinél lépnek fel. A HyperTransport remélhetőleg a jövőben egy széles körben elterjedt szabvány lesz, amelyet főleg az alaplapokon láthatunk majd, mint az eddigi lassabb megoldások leváltója.

AMD64 utasításkészlet

Az AMD bátornak bizonyult, amikor az x86 utasításkészletet kiterjesztette saját AMD64 ISA-jával (Instruction Set Architecture). Az AMD64 nem egy egetverő újdonság, de ígéretesen hangzik és több probléma megoldása lehet a jövőben a 64 bites memóriacímzés és a regiszter-szegény x86 kiterjesztése. Elsőként a 32 bites rendszerek egyik, lassan kínossá váló problémáját küszöböli ki, ugyanis a maximálisan megcímezhető 4 GB (2 a 32-ediken) memóriát elméletben megnöveli 18 millió (!) Terabyte-ra (2 a 64-ediken). Másodsorban további 32 bittel terjeszti ki az x86 ISA-t, mellyel az AMD egy - bizonyos szempontból - életképes alternatívát kínál az Intel Itanium ellenében, amely minden hardveres kompatibilitást megszakít az eddigi x86 ISA-val, csak emulálja azt. Az AMD megoldása jóval ésszerűbb lehet rövidtávon, ha azt vesszük alapul, hogy az eddig megírt programokat csak újra kell fordítani (recompile) egy újabb fordító (compiler) segítségével, míg az IA-64 esetében az egész programot újra kell írni. Harmadsorban az AMD64 további regiszterei kihasználásával minden eddiginél jobb teljesítményt ígér (elméletben) egy AMD64-re optimalizált vagy újrafordított programkód esetén.

SSE2 utasításkészlet támogatása

A K7 processzorok nyers FPU teljesítményét eddig az AMD 3DNow! és az Intel féle SSE utasításkészletek erősítették, azonban a K8 már tartalmazza az Intel által Pentium 4 processzoroknál bevezetett SSE2 utasításkészletet is, így nagyobb ellenfél lehet a konkurens processzor számára. Az SSE2 egy SIMD utasításkészlet (Single Instruction - Multiple Data), amely 128 bites dupla pontosságú (double-precision) lebegőpontos számokkal dolgozik, míg például az MMX csak egész számokkal, a 3DNow! és az SSE pedig csak egyszeres pontosságú (single-precision) számokkal képes műveleteket végezni. Az SSE2 használata 3D-rendereléskor, grafikus optimalizációknál, játékoknál és média enkódolásnál jöhet nagyon jól, a teljesítményt rendkívüli mértékben képes befolyásolni.

Hosszabb pipeline

Az AMD a Hammer futószalagját (amelyet a K7-ből örökölt) két fokozattal hosszabbra növelte, így tehát 12 fokozatú integer és 17 fokozatú lebegőpontos futószalaggal rendelkezik. Javítottak az elágazásbecslő-egységen is, ami a hosszabb pipeline-nal együtt már magasabb és hatékonyabb működési frekvenciát biztosít - az órajelenként kevesebb végrehajtható utasítások kompromisszumaként. Ez még mindig "sehol nincs" a Pentium 4 húszfokozatú futószalagjához képest.

1 MB L2 cache

Az előző generációs AMD processzorokat változó L2 cache méretük miatt is megkülönböztették. A 64 KB másodszintű gyorsítótárral felvértezett Durontól a 256 KB-os Athlon/Athlon XP-n (Thunderbird, Palomino, Thoroughbred) át az 512 KB L2 cache-sel szerelt Barton magos Athlon XP-ig sok idő eltelt. A Hammer processzorok már 1 MB másodszintű gyorsítótárral rendelkeznek, amely szintén a processzor frekvenciáján működik. A K8 örökölte a K7 L1 cache méretét, amely 64 KB-ot biztosít az utasításoknak és 64 KB-ot az adatoknak. Mindemellett a K8 a K7-tel egyetemben "exclusive" cache-sel rendelkezik, tehát az L1 cache-ben megtalálható adatokat már nem tartalmazza az L2 cache. Az L1 adat- és az L2 cache összeadásával kiszámolhatjuk, hogy a Hammer összesen 1088 KB adatcache-t tartalmaz.

0.13-micronos SOI gyártástechnológia

Az AMD Athlon 64 processzorok kivétel nélkül Németországban, a drezdai Fab 30 gyárban készülnek, Silicon on Insulator technológiával. A SOI technológiát az IBM fejlesztette ki, és a dokumentációk szerint az új gyártástechnológia 35%-kal magasabb órajelet tesz lehetővé, miközben az igényelt feszültség csökken! Az Athlon 64 a drezdai gyárban felmerülő SOI-technológiai problémák miatt késett, az AMD-nek segítségre volt szüksége, amit az IBM-től meg is kapott (cirka 45 millió dollár ellenében, ha minden igaz..). A SOI használata az AMD számára mostantól elengedhetetlen, hiszen a processzor magja jóval több tranzisztort tartalmaz, mint a K7. Összehasonlításul a Barton magos Athlon XP processzorok kb. 54 millió tranzisztort tartalmaznak 101 négyzetmilliméteres magmérettel, emellett a Northwood (C1 stepping) Pentium 4 55 millió tranziszort tartalmaz 131 négyzetmilliméteren, az Athlon 64 pedig 106 millió tranzisztort tartalmaz (főleg a nagy L2 cache-nek köszönhetően) 192 négyzetmilliméteren.

Gyártási nehézségek

Az AMD-nek mindamellett, hogy egy ígéretes processzorcsaládot vezetett be a piacra, sok nehézséggel meg kell küzdenie. A legnagyobb probléma az új processzorok gyártása, amellyel valljuk be, a gyártó egyelőre küszködik. A Hammer processzorok magmérete 192 négyzetmilliméter, miközben az AMD a drezdai gyárban még mindig 200 mm-es waferekkel dolgozik, ami azt jelenti, hogy a 0%-os hibaarány mellett is maximum 131 Hammer processzor születhet egy szilíciumostyából. A valóságban azonban egy körülbelül 40%-os selejtarány reális becslés, így viszont csak 70-80 teljes értékű Hammer processzormag kerülhet le egy szilíciumostyáról, amelyből heti 6000 darabot tud legyártani a cég. A problémának két megoldása létezik: a waferek méreteit kell növelni (így kisebb selejtarány érhető el) és/vagy be kéne vezetni a 0.09 mikronos gyártástechnológiát (az Intel épp ezen munkálkodik), aminek következtében a processzor magmérete csökkenne. Az új processzorok terjedését pont ezen okok késleltetik leginkább, hiszen minél nagyobb a selejtarány, annál drágább az előállítási költség, tehát annál drágább a termék.

Szoftvertámogatottság

Az új processzorok bevezetésével kapcsolatban még egy kérdés felmerül: vajon mikor jelennek meg azok a programok, operációs rendszerek, amelyek az AMD64 lehetőségeit kihasználják? Jelen pillanatban "csak" különböző Linux verziókat találhatunk, amik az új processzorok képességeit kihasználják, ugyanis a Windows 64 bites kiadására még várnunk kell, a Microsoft szerint immáron 2004 második feléig.

A 64 bites processzorok bemutatásának napján a Microsoft bétateszterek részére elérhetővé tette új Microsoft Windows XP 64 bit Edition for 64 bit Extended Systems operációs rendszerének bétaverzióját, azonban a drivertámogatottság hiánya miatt ez még gyakorlatilag használhatatlan. Szerencsére a korábban már részletezett AMD64 utasításkészlet visszafelé-kompatibilitása miatt ezzel nincs semmi gond, hiszen ugyanúgy, mint eddig, nyugodtan használhatjuk 32 bites operációs rendszerünket is az új processzorokkal, mindössze bizonyos teljesítmény-tartalékok kiaknázatlanok maradnak. A másik probléma az operációs rendszer hiánya mellett a driverek, és a programok hiánya, ami remélhetőleg az új OS hivatalos bejelentése után rövid időn belül enyhül.

A cikk még nem ért véget, kérlek, lapozz!

  • Kapcsolódó cégek:
  • AMD

Azóta történt

  • A Shuttle Athlon 64-es XPC-je

    A mini PC-k piacán a Shuttle abszolút brand, évek óta úttörőként van jelen. Most is, Athlon 64 és nForce 3 alapú rendszerével.

  • Bemutatkozik az extrém Pentium 4

    Cikkünkben annak járunk utána, hogy az Intel legújabb csúcsprocesszora felveszi-e versenyt az AMD 64 bites chipjeivel.

  • Athlon 64-es lapok a szorítóban

    Megatesztünkben kilenc darab, AMD Athlon 64 processzorhoz szánt alaplapot mutatunk be. A felvonultatott termékek az nForce3 és K8T800 chipsetekre épülnek.

  • Soltek SL-K8AN-RL

    A korábbi megatesztünkről lekésett, nForce3 lapkakészletű Soltek Athlon 64-es alaplap most bizonyít.

Előzmények

Hirdetés