Hirdetés

Új hozzászólás Aktív témák

  • DriderG

    tag

    1 CUDA magon belül 4 32-bites lebegőpontos egység? És a fixpontos egységekkel együtt 8? (gondolom itt is 2 órajel lesz 1 64-bites számítás, mivel a legtöbb helyen elég a 32 bit pontosság és 64-bit mellett pl. játékoknál kihasználatlan lenne a mag fele, akkor viszont már 16 végrehajtó egység kéne: 8*2db 32 bit-es) Azt elég nehéz lesz kis helyre besűríteni, nem beszélve a feladatütemezőről, hogy akkor hogy osztódik meg majd a számítás CUDA magon belül? Ott is felléphet ütközés, illetve ki nem használt egység? Ezt a párhuzamosítást kezdi az nVidia exponenciálisan befelé terjeszteni, de szerintem inkább egységesebb, homogénebb megoldást kéne találni (ott vannak pl. a dedikált egységek, SFU-k, textúrázók stb., amiket lehetne emulálni CUDA magokkal.) Persze ez biztos lassítaná a grafikus teljesítményt, de sokkal átláthatóbb, univerzálisabb felépítést jelentene.

Új hozzászólás Aktív témák