HT- és memóriateljesítmény
HyperTransport
A gyakran használt programokkal végzett mérések előtt lássuk, hogy az 1 GHz-es HyperTransport hordoz-e valamilyen teljesítménytöbbletet a 800 MHz-essel szemben. A teszthez az Athlon 64 3800+ processzort tartalmazó konfigurációt használtuk fel.
Program / HyperTransport | 800 MHz | 1000 MHz |
Quake 3 (fps) | 422 | 423 |
UT2003 botmatch (fps) | 108 | 108 |
WinRAR (perc:másodperc) | 01:27 | 01:27 |
3ds max 6 renderelés (perc:másodperc) | 04:41 | 04:41 |
Az MSI alaplap BIOS-ában lehetőségünk nyílik a HyperTransport szorzójának megváltoztatására, mi ezt használtuk ki. Négyes és ötös szorzóval is lefuttattunk néhány tesztet. Azért csak néhányat, mert elméletileg a szokásos tesztprogramokkal a két beállítás között nem lehet különbség, és ezt a gyakorlat is igazolta. A két beállítás között egyedül Quake 3 alatt észlelhető – még mérési hibának sem mondható – 1 fps különbség, ez mindössze 0,0024%-nak felel meg. A HyperTransport sebességének növelése jelen pillanatban még nem érezteti hatását, hiszen a rendszer elemeinek együttes adatátviteli igénye bőven a 8 GB/s-os határ alatt van. A későbbiekben a PCI Express csatolójú eszközök megjelenésével a helyzet talán változhat, de a HyperTransport link sebessége akkor sem fogja a rendszer teljesítményét befolyásolni (úgyis mondhatnánk, hogy ez egy reklámfogás).
Command Rate – egy újabb fontos tényező
A hardverekkel foglalkozó felhasználók számára biztosan ismerősen csengenek a CAS Latency, RAS to CAS Delay és hasonló memóriaidőzítésekkel foglalkozó, az alaplap BIOS-ában megtalálható menüpontok, melyeknek idáig nem tulajdonítottunk különösebb jelentőséget. Egy memóriamodul megvétele esetén eddig a CAS Latency volt a meghatározó tulajdonság, azonban ezentúl érdemes lesz odafigyelni a memóriák Command Rate paraméterére is. A Command Rate egy órajelciklusokban kifejezett késleltetés a chipkiválasztás (a RAM kiválasztása) és a megfelelő parancsok végrehajtása között. 1T vagy 2T értékeket vehet fel, ez 1 vagy 2 órajelciklust jelent. Tesztjeink szerint az új Athlon 64-ek memóriavezérlőjét nagyon érzékenyen érinti ez a beállítás.
Program / időzítés | 2T Enabled | 2T Disabled (1T) |
Everest memóriaolvasás (MB/s) | 5773 | 5995 |
Everest memóriaírás (MB/s) | 1683 | 2446 |
Sciencemark memóriakésleltetés (256 byte) | 47,5 ns | 42,08 ns |
Quake 3 - 640 x 480 (fps) | 402 | 423 |
UT2003 botmatch - 640 x 480 (fps) | 105 | 108 |
WinRAR (perc:másodperc) | 01:35 | 01:27 |
3ds max 6 renderelés (perc:másodperc) | 04:42 | 04:41 |
A nálunk járt MSI alaplap BIOS-ában ez az opció "2T Enabled" néven található meg, az "Enabled" állás az alapértelmezett érték. A táblázat bal oszlopában találhatóak az így lemért teszteredmények. Amint az opciót "Disabled" állásra, azaz a Command Rate értékét 1-re állítjuk, az Everest szerint a memóriaírás sebessége nem kevesebb, mint ~800 MB/s-mal, azaz kb. 45%-kal ugrik meg, míg a memóriaolvasás ennél kisebb mértékben, kb. 200 MB/s, vagyis kb. 4%-kal nő meg. Ez a memóriasebesség-növekedés a memória-sávszélességre fokozottan érzékeny alkalmazások esetében jó néhány százalékos teljesítménynövekedést eredményezett. Emlékezzünk: a processzorba integrált memóriavezérlő az Athlon 64-es processzorok teljesítményét jelentősen befolyásolja, ezért nem szabad elfeledkeznünk az ilyen apró részletekről sem.
A memóriaidőzítések hatása
Végül pedig kíváncsiak voltunk a memóriaidőzítéseknek az integrált kétcsatornás memóriavezérlőre gyakorolt hatására is.
Program / időzítés | Everest memória-olvasás | Everest memória-írás | Q3 (fps) | UT2003 (fps) | WinRAR (p:mp) | 3ds max6 (p:mp) |
2-3-2-5 - single-channel | 3094 | 1192 | 395 | 103 | 01:37 | 04:42 |
2-3-2-5 - dual-channel | 5995 | 2446 | 423 | 108 | 01:27 | 04:41 |
2-3-2-5 Burst length = 8 Beat | 5930 | 2446 | 420 | 108 | 01:28 | 04:41 |
2-3-2-5 Bank Interleaving disabled | 6103 | 1610 | 404 | 106 | 01:33 | 04:41 |
2-3-2-5 Node Interleaving disabled | 5888 | 2440 | 422 | 108 | 01:27 | 04:41 |
2,5-3-3-7 | 5681 | 2402 | 418 | 107 | 01:29 | 04:41 |
3-4-4-7 | 5542 | 2402 | 414 | 106 | 01:30 | 04:41 |
Első lépésben a rendszert kipróbáltuk 1 memóriamodullal is, ami sajnos nem ment zökkenőmentesen. Először a memóriamodulokat az egyes memóriacsatornába helyeztük, így a gép nem indult el. Ezután csak az egyik memóriafoglalatba tettünk memóriamodult, de így sem történt semmi (még az első memóriacsatornánál tartunk). Aztán elkezdtünk kombinálni különböző memóriamodulokkal, de még mindig nem akart elindulni a gép (többféle Corsair és Kingmax memóriával próbálkoztunk). Aztán végül a kettes memóriacsatorna második szlotjába behelyezve (logikus?) a memóriamodult a rendszer végre elindult. Nagyon úgy tűnik tehát, hogy a processzorba integrált kétcsatornás memóriavezérlő innentől kezdve még háklisabb lesz a memóriákra, sőt, nagyon úgy tűnik, hogy a csak egy memóriamodullal rendelkező felhasználók nem tudják megkerülni egy második modul beszerzését, már amennyiben Socket 939-es rendszerre szándékoznak váltani. A tesztek szerint egycsatornás módban a memóriaolvasás és -írás szinte pontosan a fele a kétcsatornás eredményeknek, azonban ez a tesztekben nem okoz ennyire drasztikus teljesítménycsökkenést (ahogyan sejteni lehetett). A Burst Length, a Bank Interleaving és a Node Interleaving opciók módosítása sem okozott látványos teljesítménycsökkentést vagy -növekedést – érdekes módon a rendszer a BIOS alapbeállításaival volt a leggyorsabb. Az időzítések csökkentése csak a memóriaolvasás sebességét csökkentette nagyobb mértékben, azonban a programok esetében ezek sem okoznak drasztikusabb teljesítménycsökkenést – szerencsére.
Memória-sávszélesség
A memóriaelérés sebességének lemérése során a Sandra ismét nem hazudtolta meg önmagát, hiszen a Prescott továbbfejlesztett hardveres előbehívásának és nagyobb gyorsítótárának köszönhető – a Northwoodénál – nagyobb memória-sávszélességet nem képes kimutatni. Az új Athlon 64-es processzorok esetében azonban érdekes módon a sebesség növekedésével növekszik a sávszélesség is.
Az Everest is hasonló képet mutat. Az Athlon 64 memória-sávszélessége eléri a 6 GB/sec-ot, ami azt jelenti, hogy a chip – az integrált vezérlőnek köszönhetően – az elméleti 6,4 GB/s-os maximum 94%-át kihasználja. A grafikonok alapján egyértelműsödik, hogy azonos órajelet feltételezve az Opteron és az új Newcastle mag közül az utóbbi a gyorsabb, köszönhetően az unbuffered memóriamoduloknak.
A cikk még nem ért véget, kérlek, lapozz!