Hirdetés

Új hozzászólás Aktív témák

  • Balala2007

    tag

    a zen 4ns-os L1 latency

    4ns L1D-je a 750MHz-es K7-nek volt :), ez ma mar az L2 nagysagrendje. 4clk lesz az.

    Support for new AMD instructions of monitorx and mwaitx. There's support for AMD Zen CPUs in GCC 6 via the -march=znver1 and -mtune=znver1 switches

    Ez igy kiragadva elegge felrevezeto, MONITORX/MWAITX mar Excavatorban is van. Eddig 1db CLZERO nevu Zen specifikus utasitas ismert. Meglepne, ha lenne tobb, a Zennek pont ez a lenyege, csak a mainstream, semmi extra 3DNow/SSE4a/SSE5/XOP/TBM-szeru kiterjesztes. (Az FMA4 kerdeses, a legutolso verzio szerint lesz, de nem tudom hogy ez-e a vegso szo.)

    Végső soron a XV-nak magonként 2-2 integer ALU-ja van

    Dehogyis.

    Bulldozer 600F1x, 2 AGU csak cimeket fordit:
    22 X86 :MOV r32, r32 L: 0.28ns= 1.0c T: 0.14ns= 0.50c
    23 AMD64 :MOV r64, r64 L: 0.28ns= 1.0c T: 0.14ns= 0.50c
    72 X86 :ADD r32, r32 L: 0.28ns= 1.0c T: 0.14ns= 0.50c
    73 AMD64 :ADD r64, r64 L: 0.28ns= 1.0c T: 0.14ns= 0.50c
    Piledriver 600F2x, 610F01, 610F31, 2 AGU sima MOV-okat is kezel, decoder megosztott:
    22 X86 :MOV r32, r32 L: 0.25ns= 1.0c T: 0.06ns= 0.25c
    23 AMD64 :MOV r64, r64 L: 0.25ns= 1.0c T: 0.08ns= 0.31c
    72 X86 :ADD r32, r32 L: 0.25ns= 1.0c T: 0.12ns= 0.50c
    73 AMD64 :ADD r64, r64 L: 0.25ns= 1.0c T: 0.12ns= 0.50c
    Steamroller 630F0x, 2 AGU sima MOV-okat is kezel, decoder dedikalt:
    22 X86 :MOV r32, r32 L: 0.27ns= 1.0c T: 0.07ns= 0.25c
    23 AMD64 :MOV r64, r64 L: 0.27ns= 1.0c T: 0.07ns= 0.25c
    72 X86 :ADD r32, r32 L: 0.27ns= 1.0c T: 0.14ns= 0.50c
    73 AMD64 :ADD r64, r64 L: 0.27ns= 1.0c T: 0.14ns= 0.50c
    Excavator 660F0x, 2 AGU ADD/SUB/CMP/AND/OR/XOR/NOT/NEG/TEST/INC/DEC-t is tud:
    22 X86 :MOV r32, r32 L: 0.36ns= 0.8c T: 0.12ns= 0.25c
    23 AMD64 :MOV r64, r64 L: 0.36ns= 0.8c T: 0.12ns= 0.25c
    72 X86 :ADD r32, r32 L: 0.48ns= 1.0c T: 0.13ns= 0.28c
    73 AMD64 :ADD r64, r64 L: 0.48ns= 1.0c T: 0.13ns= 0.27c

    XV 0.8-as MOV latency-je az jelenti, hogy a MOV-ok legalabb egy reszet elliminalni tudja EU-k nelkul. Raw x86/x64 integer throughput mertekben mar az XV a Skylake szintjen van. Hogy ez miert nem erzodik? Write-through L1D, joval lassabb L2, az L3 hianya, kisebb Reorder Buffer, gyengebb branch prediction, gyenge memoria hatekonysag, stb.
    Meg azert van ahol latszodik. Az AMD egy ideje nem frissiti a techdoc-okat (talan a leepites miatt?), igy mire kipofoztak a K15 sorozatot, hivatalos dokumentacio nem szuletett rola.

    [ Szerkesztve ]

    AIDA64.com

Új hozzászólás Aktív témák