Hirdetés

Új hozzászólás Aktív témák

  • Raymond

    félisten

    válasz dezz #96 üzenetére

    1) "De nem is láttam még ilyen modul rendszerű szervereket"

    Pedig van par ilyen. Nezz korul a nagyobb (4+ socket) kepeknel. Es ezert is fura hogy nem egy olyan rendszert hasznaltak ahol az alaplapon vannak a CPU-k.

    Egyebkent az hogy a ket eredmeny pont ugy jon ki az ismert STREAM eredmenyek alapjan hogy a Shanghai rendszer 1Ghz HT link es DDR2-800 eredmenyeket ad (kb. 25GB/s) az Istanbul pedig kb. olyat ami egy 2Ghz koruli HT es magasabb orajelu DDR3 memoriakkal (1066 minimum, de inkabb 1333Mhz) jonne ki szinten nem lehet a veletlen muve.

    2) "Ha ez teljesen igaz lenne, akkor minden tesztnél egyforma MB/s értékek jönnének ki,"

    Nezd, ha megtalaltad a STREAM oldalat ott minden megvan. Az hogy vannak apro elteresek egy-egy futam es egy-egy metodus kozott nem lenyeges. Ez mindig is lesz es minden architekturan elojon. Van ahol picit nagyobbak a difik, van ahol alig van valami. Ezert publikaljak mindig mind a negy metodus eredmenyet.

    De oszinten szolva nem akarlak egy industry standard benchmarkrol gyozkodni, uttananezhetsz magad is. Egyebkent azt is mondhatjuk A STREAM a memoria atereszto kepesseg LINPACK-ja. A LINPACK a realisan elerheto vektoros szamitasi teljesitmenyt meri, a STREAM pedig a maximum elerheto realis memoria atereszto kepesseget meri.

    "Nem teljesen egyértelmű a számomra, hogy a "the code is structured so that data re-use is not possible" rész 1-1 procimagra vonatkozik, vagy a teljes rendszerre."

    A teszt a rendszerben elerheto osszes magot hasznalja. Ezert vagja haza a 4 socket Opteron rendszer a 4 socket Intel rendszereket. Mind a negy procinak kulon elerese van a memoriahoz ugyhogy a lokalis CPU-n futo kernelt konyebb etetni. Az Intelnel ez egy vagy ket (amugy sem gyors) FSB-n kene hogy tortenjen es meg is latszik az eredmenyeken.

    Amint lathattad a program oldalan a dataset ugy van felallitva hogy az adatokat mindig a memoriabol kelljen huzni es a cache metodusok ne jussanak szerephez. Ezert is van az hogy ha egy 4 socket 2 core (8 total) Opteron rendszer ugyanazt az eredmenyt adja mint egy 4 socket 4 core (16 total) rendszer. Mar a 2 mag vektoros szamitasi teljesitmenye is nagyobb annal mint amilyen gyorsan az adatokat a memoriabol be tudod tolteni.

    Privat velemeny - keretik nem megkovezni...

Új hozzászólás Aktív témák