Hirdetés

Új hozzászólás Aktív témák

  • ddekany

    veterán

    válasz thgergo #18 üzenetére

    Gondolom nem lenne olyan szempontból értelme, hogy az AVX2-es megvalósítása egy funkciónak kicsit gyorsabb lenne, mint keskeny feldolgozós AVX-512 megvalósítása. Persze értem, kompromisszum, mert viszont ha nagy magra jut a szál, akkor meg gyorsabb. De ez lehet egy ok, amiért nem voltak erre motiváltak.

    A másik, hogy az új és kiszélesített regisztereket megvalósítását nem tudod megúszni azzal, hogy a feldolgozás keskenyebb. De nem tudom mennyi overhead ez egy little CPU-ban, lehet nem sok, de ez is bosszantó. Meg nyilván a fele szélességű AVX-512 megvalósítás többi része is visz extra tranzisztorokat.

    Ránéztem SVE-re. Alapvetően kihat az utasítás készletre az, hogy a binárisnak ne kelljen feltételeznie semmilyen feldolgozó szélességet, és mégis minden optimálisan legyen "felszeltelve".

Új hozzászólás Aktív témák