Keresés

Hirdetés

Új hozzászólás Aktív témák

  • dezz

    nagyúr

    válasz #95904256 #1747 üzenetére

    Hmm, akkor miért nem említetted a Penrynnél az SSE4-et? Illetve a már Core2-nél is meglévő SSSE3-at (pl. shuffle-k).

    Vagy K10-nél a 256 bites elérésű L1i-t (bár nem tudom, ez mennyit számít - de gondolom, nem véletlenül csinálták, és emlegetik elsősorban az FPU-val kapcsolatban).

    ''A legtöbb SIMD utasítás lassabb K10-en mint Core2-ön.''
    Ezt mire alapozod? Az utasítások latency értékeinek összehasonlítására?
    Mindenesetre, nem tudom, ez hogy lehetne, ha egyszer a Core2 jóval kevesebb, mint 2x olyan gyors, mint a K8, miközben a K10 kb. 2x gyosabb lesz SIMD-ben, mint a K8. Meg ugye itt van ez a bizonyos teszt, amiben 50%-kal gyorsabb azonos órajelen a K10, mint a Core2 - ez mitől lehet akkor? (A natív 4-magosság és a L3 önmagában nem igazán lenne elég ahhoz, hogy a lassabból másfélszer gyorsabbat csináljon [kivéve, ha befér az egész kód+adatok a cache-ekbe, de a specFP-kre, és társaikra ez nem jellemző].)

    [Szerkesztve]

Új hozzászólás Aktív témák