Keresés

Hirdetés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz b. #4 üzenetére

    Mindenképpen használni kell a tensor magokat. Gondolj bele, az input+output szűrés -20%-os teljesítménnyel is járhat úgy, hogy közben a tensor magok minimalizálják az offchip adatmozgást, tehát kímélik a VRAM-ot és a memóriabuszt. Ha a tensor magokat kizárod, akkor sokkal nagyobb terhelést kap a VRAM, tehát még nagyobb lassulással kell kalkulálni. Szóval ez TensorRT-n marad, és lesz a natív mód, meg a fallback. Ma még csak natív mód van hivatalosan, és beműthető a fallback, csak nem ajánlott.

    Nem. Ekkora terhelés van az RTX-eken. Ezek friss adatok, amiket kaptunk. Tensor nélküli hardvereken még nincs mérés, mert nincs rá optimalizálva a program. Felesleges a számokkal dobálni, amikor nem történt meg az optimalizálás az egyes hardverekre. RTX-re van csak optimalizálás. Lényegében nem a számolás része ennek a megterhelő, hanem a memóriabusz csuklik bele egy picikét. És itt jön a Tensor előnye, hogy sok adatmozgás onchip marad, tehát a méréseket tekintve maximum -10-20%-kal (input/input+output konfigurációtól függően) megoldható a feladat. Ha ez nincs, akkor még többet eszik.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Sinesol

    veterán

    válasz b. #4 üzenetére

    Szerintem megmarad a tensor magok használata, egyrészt így a leghatékonyabb, másrészt meg az uj AMD kártyákban is lesznek elvileg tensor magok, szal mindenhol kihasználható lehet.
    Tuti jön valami AMD-s alternativa is, ha zárt marad a rendszer, mondjuk Radeon Speak. :D

    [ Szerkesztve ]

Új hozzászólás Aktív témák