Keresés

Hirdetés

Új hozzászólás Aktív témák

  • b.

    félisten

    válasz lenox #76 üzenetére

    "Ha 64 bites lebegőpontos operációról, azaz FP64-ről van szó, akkor egy darab 8 utas, FP32 esetében már egy darab 16 utas, integer mellett egy darab szintén 16 utas, míg az új Tensor műveleteknél egy darab 128 utas tömb áll rendelkezésre. Utóbbi esetben fontos kiemelni, hogy ezek strukturálva vannak, vagyis egy 128 utas tömb gyakorlatilag két darab úgynevezett tensor magot jelent, amelyek 64-64 darab ALU-t használnak. Ezek a tensor magok egyébként speciálisan gépi tanuláshoz, ezen belül is mátrixaritmetikára tervezett, kevert pontosságú feldolgozók."

    " Tensor magok, amik csak ezzel foglalkoznak. 4*4-es mátrixokkal végeznek műveleteket, két FP16-ost össze tudnak szorozni, majd hozzáadni egy FP16-oshoz vagy FP32-eshez egyetlen órajel alatt. "

    [ Szerkesztve ]

    "A számítógépek hasznavehetetlenek. Csak válaszokat tudnak adni." (Pablo Picasso) "Never underrate your Jensen." (kopite7kimi)

Új hozzászólás Aktív témák