Keresés

Hirdetés

Új hozzászólás Aktív témák

  • Vitamincsiga

    tag

    Szóval, ha jól értelmezem, a "normál üzemmódban" 16 TFlops-ot tud. 32 bites egész és lebegőpontos számokkal. Ami ugye nem valami sok fejlődés a korábbi generációhoz képest.
    De ha FP16-ban, INT8-ban - az INT4-et, még értelmeznem kell :U - íródik meg a kód, akkor valami bődületes teljesítményre képes - 125 - 250 - 500 billió művelt mp-enként. Az viszont hűha!!
    A RT mag-ot most nem tudom hova kötni, de ha ekkorát tettek bele, akkor az biztos jó!

    A Vegánál megjelent a FP16 és az INT8, ott a "hagyományos módon számolódik ki", 1 FP32, vagy 2 FP16, vagy 4 INT8. Azaz 11 - 23 - 46 billió művelet mp-enként.
    A kettő között NV vs AMD - FP16 és INT8 számábrázolás mellett meglehetősen nagy a különbség!

    És adódnak a kérdések - jó, még nincs kéznél, tesztprogram sincs, Vega 20 sincs - melyik a jobb architektúra? Építsük külön - NV - vagy egybe - AMD?
    FP16-ot nézve "ki is jön" a HW-ből a 125 TFLOPS - 23 TFLOPS különbség? Vagy csak "egy szám"...
    A Vega 20 7 nm-en, A Turing 12 nm-en készül lesz-e válasz a fentebbire?
    Átjön az architektúra a játékszegmensbe is? /A tenzor egységre gondolok, a RT tuti!/
    Ki lehet-e használni ezt a játékszegmensben? A kérdés elvi - DX(Péntek!)13 :DDD Mert ha ekkora potenciál van benne, akkor azt vétek ki nem használni!
    Navi?

    Ötletek?

    Jó lenne egy varázsgömb ;-)

Új hozzászólás Aktív témák