Keresés

Új hozzászólás Aktív témák

  • S_x96x_S

    addikt

    válasz Petykemano #1580 üzenetére

    öszintén - nekem is magas.

    csak találgatok.

    > Elmondod, hogy ez jó vagy rossz?

    szerintem: más implementáció ; és ez csak egy kiragadott mikro optimalizációs részprobléma ...

    találgatok1: lehet, hogy a sávok("lane") között is valami infinity-fabrik szerű kapcsolat müködik - és ezért ez a nagy késleltetés az Inteleshez képest?

    találgatok2: esetleg valami security oka is lehet az extra késleltetésnek az AVX2 cross-lane utasításoknál? vagyis valamilyen biztonsági műveletre kell az az idő? - olyanra amit az Intel kispórol?.
    "By utilizing a previously unknown side channel based on the
    execution time of AVX2 instructions,
    we also demonstrate the first
    Spectre attack which does not rely on a cache covert channel at all.
    Our AVX-based covert channel achieves a native code performance
    of 125 bytes per second at an error rate of 0.58 %. By using this
    covert channel in our NetSpectre attack :Y instead of the cache covert
    channel, we achieve higher performance. Since cache eviction is
    not necessary anymore, we increase the speed of leaking to 60 bits
    per hour from the target system in a local-area network. In the
    Google cloud, we can leak around 3 bits per hour from another
    independent virtual machine."

    Amúgy a szakszerű válasz:

    "Although #AMD #Matisse is good at the usual vertical and in-lane horizontal instructions, it struggles with the cross-lane ones. E.g. VPERMQ/VPERMPD still uses 3 uops (it seems they are P1+2P2; 6|1.25 instead of 6|0.6 in the instlat dump) vs 3|1 of Skylake"
    https://twitter.com/InstLatX64/status/1152293280102719490

    .. cross-lane instructions megértéséhez: AVX/AVX2 -es utasításokkal függhet - össze;

Új hozzászólás Aktív témák