Hirdetés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz westlake #14883 üzenetére

    Azért az architektúra működősét nyilván elég sok tényező befolyásolja. A Kepler elsősorban azért kezd lemaradni, mert a konzolos kódok egyre több shared memory atomicset futtatnak. Az ilyen műveleteket a TFLOPS-októl függetlenül nagyságrendekkel lassabban végzi a Kepler, mert LUU (lock update unlock) mintát alkalmaz, míg a Maxwell1/2-GCN1/2/3-Gen8/9 architektúrák natívak és mindegyik biztosít CAS-t (compare and swap). Semmit sem érsz el a TFLOPS-okkal és a GB/s-okkal, ha a jellemző shared memory atomics kódok futtatásához szükséges tudás hiányában ezek nagyon körülményesen futnak a hardveren, és egy csomószor arra kényszerítik az ütemezőt, hogy állítson le minden munkát, amíg a címzett memória nem válaszol.
    A Maxwellben is van egy rakás olyan dolog, ami korrigálásra szorul.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák