Hirdetés

PIII-S: fityisz a Palomino-nak?

Intel inside!


Az "Intel inside" szlogen biztos sokaknak ismerős. Avítt egy darab, annyi szent. Hosszú évek óta élnek vele, sok esetben persze inkább csak vissza: mint a minőség védjegye már rég túlhaladott, csupán erős csúsztatások árán kényszeríthető efféle szerepkörbe. Mert hát ugye nem ezen múlik. Elnézőbben fogalmazva: nem csak ezen. Egyrészt amíg "User outside", addig ugye lehet bármi inside, a következmények "beláthatatlanok", másrészt.. De hagyjuk is magára mindezt, a mostani témán nem ez a nyerő fogás. Vissza a szlogenhez! Mainapság legtöbbször talán úgy szokás kiterjeszteni, hogy "Intel P4 inside", tudjuk miért. Indoklásképp ugye olyanokat szokás emlegetni, mint a már most is --akár-- 2GHz-es órajel, a Quad-pumped FSB, vagy a hihetetlenül tág CPU-to-memory sávszélesség. Egy, a jövőbe fullra belemutató technológia sarökkövei.. És tényleg. A jobban informáltak persze a Double-pumped ALU-t, a 20 lépcsős pipeline-t, vagy akár a procit felépítő 42milliónyi tranzisztort is képbe ránthatják, és nekik is igazuk van. Azt azonban könnyelműség lenne kijelenteni, hogy per pillanat ennél/ezeknél nagyobb technológiai attrakció nincs is az Intel tarsolyában.

Mert hiába a 42 000 000 tranyó, meg a 217 négyzetmilliméteres die-size (mag méret), amikor 0.18 mikron-on manapság már vér-ciki CPU-t gyártani! :) Na, ez persze túlzás, de a P4, csak mint architektúra a "létező" legnaprakészebb (füttykoncert "on"), a gyártástechnológia már más tészta.

Az 1133MHz-es Coppermine-magos PIII fiaskójára talán még mindenki emlékszik. Ezek voltak azok a CPU-k, amelyekkel az Intel először lépte volna át a GHz-es "álomhatárt". Csak hát épp akkor még nem volt rá vízuma.. (a procik baromira melegedtek, stabil üzemre nem voltak foghatók, szégyen szemre vissza lettek rendelve mind..) A nyolc napon túl sem gyógyuló sérelmek okán a cég sokáig csak méricskélte az akadályt, végül arra jutott, hogy az ügy rendezésére egy új architektúrát lesz muszáj bevetnie, és lőn. A július 31-ei kudarc után ekkor már 2000 november 20-át írtuk.


Az új időszámítás kezdete.. :))

Természetesen ez az első P4-ek (1.4/1.5GHz) debütálásának dátuma. Mindezt még épp időben, vagy talán éppen az utolsó pillanatban, hiszen ez idő tájt az AMD már 1200MHz-en röpteti Thunderbird-jeit. A kocka fordulni látszott.. De itt megint kénytelenek vagyunk megtorpanni, hiszen nem a Technika Krónikáját írjuk, azt meghagyjuk az Officina Nova-nak: a P4 tokozási-allűrjeit, a GHz-ek ellenére "szerény" teljesítményét, valamint az egész RDRAM-os hóbelevancot most jobb, ha békén hagyjuk..

Azt azonban ismét kihangsúlyoznánk, hogy az Intel azóta is mindent egy lapra tesz fel: ez pedig ugye a Pentium 4. Persze mi továbbra sem vagyunk biztosak abban, hogy --éltetve még a képzavart-- ez lesz a pakli nyerő lapja. Az Intel stratégái mindenesetre mindannyian egyetlen termékvonalat próbálnak belekényszeríteni a PC-s trend-mederbe (vagy akár fordítva..), amely kényszerítés persze áldozatokkal jár: eleve elvérzésre ítél például egy roppant ígéretes platformot, amelyről ez a mostani dolgozat is szólni próbál. Nos, ez lenne a Tualatin. (mint látni fogjuk, ez a core egyértelműen vakvágányként szerepel az Intel-nél, de korántsem azért, mint anno az 1133-as Cu-mine..)


Alapfok

A Tualatin igazándiból a PIII-ragozás felsőfoka: a Katmai és a Coppermine után ez a core zárja a sort. Immár 0.13 mikron-on, és minden esetben 44 000 000 tranzisztortól dagadva: tehát ahogyan a Coppermine-128 core köré épült Celeron-ok esetén, úgy itten is le vagyon tiltva az L2-es cache jobbik fele (bár ezt csak igen bajosan sikerült kideríteni: az Intel-nél nem találtunk róla infót, az xbitlabs hibásan következtet, és már majdnem feladtuk, de végül a sandpile.org mégis megmondta a tutit..), annyi különbséggel, hogy a Tualatin-Cerkák még így is 256KB L2-es cache-t hoznak (nem is akármilyet!), ráadásul a tranzisztorok mind rézvezetékekre vannak felfűzve. Nos, akik olvastak az Athlon XP-ről, most persze rögtön rávágják, hogy "akár a Palomino.." És nem csak ennyiben helytálló az összehasonlítás: a Tualatin-core, amellett, hogy alapkoncepcióját tekintve nem sokban tér el a Coppermine-tól, fel tudja mutatni pl. a Data Prefech Logic-ot is, amit legutóbb (bár picit más néven..) szintén a Palomino kapcsán emlegettünk. Az Athlon XP-k persze egyelőre még csak 0.18 mikron-os holmik.. (de tegnap óta nyitható szorzózárral! :))

Katmai, Cu-mine, Mialatin?..

Amikor 1999 tavaszán megjelent az első PIII, sokan méltatlankodtak, hiszen a CPU legjelentősebb újítása --a PII után-- mindössze az SSE utasításkészlet támogatása volt. AMD oldalon egyébként elsőként csak a Palomino tudja ugyanezt, sejthetően tehát még manapság sincs minden alkalmazás SSE-re optimalizálva. (a P4-nél már SSE2-t találunk..) Az első Katmai PIII-ak 450MHz-en ketyegtek, és 2*256KB L2-es cache volt a NYÁK-ra építve. Majd a debüt után fél évvel 0.18 mikron-ra migrált a chip-gyártó (0.25-ről), az L2-es cache-t pedig beköltöztette a core-ba, és ugyan csak 256KB maradt belőle, ám a szélesített cache data bus okán (256bit, Quad Quadword Wide) ez a megoldás semmiben sem volt gyengébb elődjénél, sőt. A cache persze már full CPU speed-en pörgött.


Minden kezdet..lassú?

Nem állítanánk, hogy végül csupán emiatt a korábbi látszólagos megalkuvás miatt tette volna le az Intel Pentium III-S jelű CPU-t (512KB L2) az asztalra, egy biztos, az ötlet a teljesítmény érdekében fogant, és semmi köze erőfitogtatáshoz. (az Intel erejét egyébként pont az mutatja, hogy lazán elhajít a bal váll fölött egy ilyen ütős platformot, csak mert az nem illeszkedik az aktuális trendbe..) A Tualatin-core nem sok stepping-et él majd, és ezt már most tudni lehet. Nincs is nagyon helye az intel-es roadmap-ekben. Pedig a maga módján teljes értékű platform, hiszen van belőle mobil és Celeron változat is. A kulcs mindhárom esetben a 0.13 mikron, amely egyszer inkább, mint az alacsony fogyasztás letéteményese, másszor meg mint a teljesítmény abszolút záloga kerül képbe. A mobil változat egyébként szintén fél MB L2-es cache-sel bír, és nyugodt szívvel kijelenthető, hogy a mostani legütősebb mobil megoldás.


Az asztali CPU-k FC-PGA2-es tokozottak, és ismét majdnem láb-kompatibilisek a korábbi (FC-PGA tokba szerelt) Socket 370-es procikkal. Csak hát ez a "majdnem" megint semmit sem ér: nincs az a régebbi lap, amely magától elboldogulna a Tualatin-hoz (át)alakított AGTL(+) CPU-bus (tehát az FSB) feszkó elvárásaihoz: az 1.25V sajna csak a kimondottan Tualatin compatible lapokban/chipset-eknél hozzáférhető. A Tualatin Vcore-ja ráadásul 1.4V (PIII-S adat..), amihez a lapoknak már a legújabb szabvány (8.5) szerinti Voltage Regulator Modul-okat (VRM) kell tartalmazni, amelyek tudják a Vcore-t 0.025V-onként állítani.

Ám mi is megírtuk, hogy már létezik a PowerLeap-től olyan Slot 1-es átalakító, amely minden, a Tualatin lapokkal szemben támasztott elvárásainak megfelel, így gond nélkül passzintható általa kedvenc BH6-osunkba akár egy Pentium III-S proci is! Más kérdés, hogy túl jól nem járunk a manőverrel, hiszen ezek a procik hivatalosan 133-as FSB-n futnak, így a bennük rejlő tuning-tartalékok kiaknázásához bizony nem árt a komolyabb lap. A BX chipset-et pedig ugye nem 133MHz-re tervezték. Ha már a komoly lapnál tartunk: látni fogjuk, hogy az MSI vizsgált board-ját nem sikerült zavarba hoznunk, bármekkora FSB-vel is próbálkoztunk, így a proci abszolút tartalékait --a zárt szorzó miatt-- még ma sem ismerjük.

Egy valami azonban biztos: hiába a Tualatin-core, Data Prefech-csel, 512KB cache-sel, ha a CPU bus továbbra is SDR hajtott. És bár eképp a kiegyensúlyozottsággal nem lehet gond, a rendszer sávszélessége olykor elég lehangoló. De ez nem általános tünet, sőt, a nagy és gyors L2-es cache miatt a CPU hihetetlen dolgokra képes.. :)

Még néhány "apróság". Az első, hogy immár nem kell rettegnünk az ultra-sérülékeny CPU-die csorbulása miatt: az FC-PGA2-es tokozás ugyanis egy Integrated Heat Spreader (IHS) néven futó fém kupak alá rejti a proci szilíciumát, akár a P4-nél, így a lesarkazás kizárt, persze csupán addig, amíg a kalapács a polcon marad.. Mindezeken felül már csak az L2-es cache-re térnénk vissza néhány mondat erejéig.


FC-PGA2 vs. FC-PGA

Leírtuk, hogy a gyártástechnológia okán az L2-es cache-t végre sikerült "full size" visszaintegrálni a core-ba, ahol --továbbra is-- full speed fut. Azonban nem csak ennyi történt. Legyen szó akár Celeron-ról, akár PIII-S/M-ről, az L2-es cache minden esetben 8-utasan asszociatív. Összehasonlításképp: az Coppermine PIII-ak (256KB, latency 0) 8-utassága mellett a Coppermine-128 Cerkák (128KB, latency 2) csak 4-utasak voltak. A helyzet alapvetően megváltozott: dupla cache méret mellett a Tualatin Celeron-ok mindössze 1-es, míg a PIII-S/M-ek 0-ás késleltetéssel (L2 latency) bírnak. Ez pedig annyit tesz, hogy a Tualatin Celeron-ok immár minden porcikájukban lelépik a Cu-mine PIII-akat, és itt ismét a Data Prefeching-et említenénk, amely ugye az L2-es cache és a RAM közti sajátos kapcsolatra utal: a CPU magától töltögeti fel adattal a cache-t, így "jóval" (kimérhetően 4-5%) optimálisabb működés adódik.

Dióhéjban az x-utas asszociativitásról: mind az L2-es cache, mind pedig a RAM azonos számú részre bontott, ahol egy cache-szelet egy-egy RAM blokkot képez le. Egy-egy ilyen cache-szelet 8-utas asszociativitás esetén 8*32Byte nagyságú. A PIII-S esetében az 512KB L2-es cache 2048 ilyen asszociatív mezőre osztott. Tehát pl. 1GB RAM mellett, 256KB-nyi memóriát 128Byte-nyi L2 képez le. Amely rögtön többet mond, ha megemlítjük, hogy a Cu-mine Cerkák-nál ugyanennyi cache még 1MB RAM-ra jutott! (a Cu-mine PIII-ak esetén fél megára..)

Gyakorlatilag..

Az architektúra átmazsolázása után azonban lépdeljünk kicsit közelebb az élő platformhoz, hiszen ez alapvetően nem egy teoretikus cikk szeretne lenni! Van is rá sansza, hiszen tesztvasaink anno (több mint egy hónapja L ) eléggé naprakészek voltak, még ha a cikk késése miatt ez az előny végül mégiscsak elévült.

Ugyanis elsők közt kaparíthattunk meg egy ECS lapot, VIA 694T alapokon nyugvót, de viszonylag gyorsnak sikerült lennünk az MSI 815EPT Pro deszkája esetén is. (persze nem eléggé.. :) ) Azonban amire azóta is büszkék vagyunk, az a CPU, amely egy "hús-vér" Pentium III-S szerver-proci volt. (thx G!) Bár csak 2db nap erejéig, így ismételten piros törülközőt küldhettünk hétfőn a Patyolatba, lásd vért-izzadás..


"Ilyen a box!" :)

A szerver-prociság amúgy inkább csak a cucc árát tekintve reális meglátás (45-50e Ft, ha a listáink nem tévednek..), nomeg azt a képességét figyelve, hogy 2-utas szerverekben is elfut, hiszen mi is 30e Ft alatti lapokban fogtuk vallatóra. Az árat illető bizonytalanság abból adódik, hogy a legtöbb helyen (árlistán) nem tüntetik fel az L2-es cache méretét. Ja, hogy ezt eddig még nem mondtuk?.. :) Igen, tényleg kimaradt: léteznek ugyanis --bár csak OEM-ek részére-- a Tualatin PIII-akból 256KB cache-sel szerelt változatok is, PIII 1.13A és PIII 1.20GHz néven. Ezek azonban nem PIII-S CPU-k, tehát cache-ügyileg semmivel sem tudnak többet, mint az azonos (1200MHz) frekin futó Celeron-ok. Na jó, az 1-es helyett azért 0-ás latency az övék..

Direkt nem javítunk visszamenőlegest: mint mostanra kiderült, 45-50e Ft-ért természetesen a csupán OEM-eknek szóló PIII-ak kelletik magukat (256KB L2), PIII-S-ről még csak véletlenül sincs ott szó, azt úgy 120 000(!!) körül mérik..

Újfent pontosítanunk kell :(, ugyanis ezt a CPU-t csak a Compaq méri ennyiért, normális nagyker-áron 62e nettóért is láttuk a minap, ami már nem is olyan rengeteg.. Jó lett volna mindezt előbb látni. Nehéz lesz átírni a köztudatban a 120-at 62-re.. :((

Tesztkonfigunk eképp állt össze ezen a bizonyos hétvégén:

Tesztkonfiguráció
Alaplap ECS P6VXAT -- DTK Magyarország Rt.
MSI 815EPT Pro -- Kelly-tech Kft.
Proci Intel PIII-S (1133/512/133/1.45)
Intel PIII 866EB (866/256/133/1.7)
Cooler COOLINK Cool 122 -- Kelly-tech Kft.
RAM 256MB Winbond PC133 SDR SDRAM
VGA Leadtek GeForce3 64MB -- Kelly-tech Kft.
HDD Fujitsu 40GB 5400rpm
Hangkártya Golden Melody Hi-Live / ESS Allegro -- Kelly-tech Kft.
Billentyűzet Acer Airkey I (infra) -- Kelly-tech Kft.
Táp SPI 235W -- Pixel Mulimédia

A két fajta lap csupán azért, mert több platformra is kíváncsiak voltunk, bár ezzel még korántsem merítettünk ki minden lehetőséget, hiszen akad az ALi-nak is Tualatin-kompatibilis chipkészlete (Aladdin Pro 5T), de említhetnénk akár a szintén (ahogyan az i815EPT is ilyen..) "B stepping"-es i810-et, vagy akár a VIA Pro266T-jét is.. Ám most ennyire futotta.


i815 B-step

Napjaink lapjai

Az alaplapokat leginkább aszerint vettük szemügyre, hogy mennyire jó partnerek egy ilyesmi procinak, ez pedig egyértelműen --persze a stabilitás mellett-- a lapok tuning-képességeit is próbára tevő vállalkozássá fajult. Miért? Mint említettük, ez a CPU nem két fillér, akik tehát eredeti környezetéből (lásd: szerverek) kiragadva tervezik hasznosítani, azoknál mindez vélhetőleg az alapvető szempontok egyike lesz.


FSB-magasugró?..

Ily módon a gyengébben húzható lapnak most nem teremhetett babér, és bár állta a sarat, meg vitte is a Tualatin-t, ahogy kell, az, hogy esetleg olcsóbb pár ezer forinttal, egy 100e Ft körüli CPU mellett igazán nem szempont. Egyébként szó sincs róla, hogy az ECS lapja esetleg csalódás lett volna: utóbbi időben csak remek ECS lapokkal találkozunk! (hamarosan remélhetőleg az olvasók is, csak győzzük megírni..)

Pont az előbbiek miatt érdekes, hogy egyik alap-benchmark-unkban, a Sisoft Sandra CPU-to-memory tesztjében mégis az ECS VIA694T-s lapja kerekedett felül, pedig kerek 26MHz-es hátrányban volt!


Mire elég 26MHz-es hátrány?


A lapok kialakítását is egy kalap alá vennénk, ugyanis egyikőjük sem tudott ebből a szempontból különlegeset nyújtani: a két különféle chipset-ből adódóan ugyan voltak észrevehető eltérések (vagy inkább ennek ellenére akadt azért pár közös pont..), mint a PCI slot-oknak vagy a RAM slot-oknak a száma, de ezek sem tűntek sorsdöntőnek. Az i815 minden EPT-k ellenére még most sem támogat fél giga RAM-nál többet, így ilyesmi környezetben egy szerver proci akár feszélyezve is érezhetné magát. Persze a CPU-k ilyesmire egyelőre nem képesek..

Mindkét lapon fent felejtettek egy-egy CNR slot-ot, ám ez talán elnézhető. Mint két viszonylag kommerszebb lap (főként a platform miatt), mostani versenyzőink egyikénél sem tűnt fel, hogy gondot fordítottak volna a CPU-foglalat helyes(ebb) tájolására, ahogyan a köré telepített kondenzátor-erdőt sem próbálták praktikusan tájrendezni. Amíg az MSI lapja a szokásos "-R" nélküliségből adódó varratokkal nagyzolt, addig az ECS kicsit szerényebben és letisztultabban állt mindehhez: náluk csak egy féle lap van, így kérdés sincs. A táp csatit rosszabbnál rosszabb helyekre ültették, mintha sosem olvastak volna prohardver-t.. :)

Ami pedig már szemet se szúr, az a PIII-as lapok esetén megszokott 2-fázisú feszültség-szabályozó, amely itt sincs másképp. A procik teljesítményfelvétele persze nem is kíván egyebet, főleg egy Tualatin-magos holmi nem, ő ugyanis a maga mindössze 80 négyzetmilliméteren(!!) megvalósított 44miller tranzisztorából is alig tud 20W-ot kipréselni! Ez kb. a harmada egy 1400-es Tbird hasonló értékének. De egy 2GHz-es P4 is úgy négyszer ennyi hőt termel. 0.13 mikron, semmi egyéb.. (jó, a teszt másik CPU-ja se vitte túlzásba, a két proci kb. hasonlót fogyaszt..)


Hiába az 1420MHz!

A teszt készültekor kint lévő Wincpuid sajnos még nem ismerte a típust, így túl sok használható információval nem is bírt szolgálni, mint azt a következő screen shot is mutatja..


Tesztüzem & theend

Nos, eddig bírtuk, hogy ne lőjük le a poént! :) Mi szerint az MSI lapja a BIOS-ban beállítható FSB-értékek bármelyikén vígan elfutott, 100-166MHz-ig!! Ezt az elején nem is reméltük, így csak negyedszeri próbálkozásra jutottunk el a végéig.. Azt ugyan már korábban is leírtuk, hogy ettől függetlenül a Sandra CPU-to-mem. eredményei kis kívánni valót hagytak maguk után, azonban ez sem annyira meglepő: az MSI lapok mindig is moderált RAM eredményeikről voltak "híresek".


Ez csak a lap teteje!!

Itt ragadnánk meg az alkalmat, és röviden "cáfolnánk" azon híreszteléseket, amelyek szerint a Tualatin-ból a Celeron az igazán tuti, mert az ugye alapból 100-as FSB-n közlekedik.. Az előbbiek alapján már tudható, hogy a platformot kiszolgáló lapoknál végre van mód az FSB-t kitolni az égbe, ám csak akkor, ha a proci is úgy akarja. És bár a Tualatin-core klasszis CPU-kat jelöl, 66%-kal még ezeket sem lehet meghúzni. (1200..1992MHz) Persze az is igaz, hogy ha az itt elért 166MHz ellenére még maradt (mert még biztos maradt..) a prociban kakaó, akkor az egyelőre marad is benne, kihasználatlanul, míg egy Celeron-nál ilyesmi biztos nem fordul elő. Persze egy Cerkának még a 133 is rengeteg (124 körüli érték a reális..), a rendszernek pedig még ez is édes kevés.. A PIII Tualatin persze nem olcsó muri, így marad az, hogy mindenki maga dönt, mire-miből-mennyit.

Az ECS ellenben megelégedett a még így is jónak mondható 140MHz-cel: a 150-es küszöbön már rendre elbucskázott. Ám itt még ment neki a CAS-2, így oda is csördített a nagy MSI-nek..




Leadtek GeForce3 64MB, 200/458MHz, D3D (Unreal),
NVIDIA 12.40, DX8.1, Win98
FPS (Frame Per Sec.)
MSI 815EPT Pro, PIII 866EB @ 1080MHz, SDR @ 166MHz (CAS3, 4-Way) 640 * 480 800 * 600
32bit 171 168
MSI 815EPT Pro, PIII-S 1.133 @ 1133MHz, SDR @ 133MHz (CAS2, 4-Way)
32bit 182 177
MSI 815EPT Pro, PIII-S 1.133 @ 1411MHz, SDR @ 166MHz (CAS3, 4-Way)
32bit 222 218
ECS P6VXAT, PIII-S 1.133 @ 1190MHz, SDR @ 140MHz (CAS2)
32bit 197 192
ECS K7S5A, Athlon XP 1700+ @ 1460MHz, DDR @ 133MHz (CAS2, Ultra)
32bit 212 204
ECS P4IBMS, P4 1.8 @ 2107MHz, SDR @ 156MHz (CAS2)
32bit 181 177
Leadtek GeForce3 64MB, 200/458MHz, OpenGL (Q3),
NVIDIA 12.40, Win98
FPS (Frame Per Sec.)
MSI 815EPT Pro, PIII-S 1.133 @ 1411MHz, SDR @ 166MHz (CAS3, 4-Way) 640 * 480 800 * 600
32bit 212 208
ECS K7S5A, Athlon XP 1700+ @ 1460MHz, DDR @ 133MHz (CAS2, Ultra)
32bit 218 211
ECS P4IBMS, P4 1.8 @ 2107MHz, SDR @ 156MHz (CAS2)
32bit 206 201
MSI 850 Pro5, P4 1.8 @ 1980MHz, RD @ 880MHz
32bit 262 247

Tualatin. Hasonlót jelent intel-es körökben, mint a Palomino AMD-éknél. Mögötte egy kérész életű platform, amelyből hamarosan már semmi sem látszik majd. Ami itt fontos, az a gyártástechnológia, amellyel egyelőre az Intel-nél az előny. 0.13 mikron. Láthattuk, mire elég: akár 512KB-nyi L2-es cache-t is el lehet így rejteni 80 négyzetmilliméteren(!!), minden további (pl. melegedés..) nélkül. A Tualatin-core, mint "a PIII felsőfoka", egy architektúra hattyúdala, ám már most klasszikus.. Meg persze kuriózum. Főképp mostani 1133MHz-es teszt-procink. 512KB-nyi --használható-- L2-es cache nincs más asztali CPU-ban (kivétel ugyanennek a procinak 1.20GHz-es változata..), így a szintén kiszolgált és jövőre le is köszönő Socket 370-es platform kap még egy utolsó esélyt. A túlélésre persze nem, de legalább emelt fővel távozást osztanak rá. A P6-os architektúrát olyan kompánia búcsúztatja majd, mint a Willamette-128-as Celeron-ok (0.18) és a szintén 0.13-as Northwood-ok, hogy csak az Intel-nél maradjuk. "The big wheel keeps on turning.." Meglepődni megint nincs miért. Szokás, megszokás..

keopsz!

Hirdetés