Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz Abu85 #24328 üzenetére

    Ehhez még annyit, hogy ez már a tervezésen meglátszik, mert az NV a ROP-ok kialakításán spórol. A Maxwell óta kihagyják a dedikált color-depth cache-t. Ez egy alapvető tranyóspórolás, amivel ugyan vesztenek némi tempót, de számolni kell azzal, hogy sok ROP kell.

    A többi kérdésre:
    A DX11 eleve sokat hagy a modern GPU-kban. A D3BC egy tizenx éves alap a négykomponenses vektor ALU-s függőséglimites architektúrákra. Ma már ettől gyökeresen eltérnek a hardverek. Ezért jön a D3BC helyére a DXIL.

    Az API specifikáció nem foglalkozik a CPU-terheléssel. Az API csak követel valamit, amit valahogy a meghajtónak el kell érnie. Akár a host CPU befogásával. Nyilván a mintavételezőbe bekötött erőforrás nem varázslattal kerül át a multiprocesszorba.

  • Abu85

    HÁZIGAZDA

    válasz namaste #24325 üzenetére

    Nagyon is jellemző a TBR rendszerekre, hogy több ROP-ot igényelnek. Bár az NV-é nem tipikus TBR, de alkalmaz egy olyan optimalizálást a Maxwell óta, amivel a sok pixelt lefedő háromszögekre vonatkozóan nem engedi kiírni a részleges pixeladatokat a memóriába. Ezzel sávszélt spórol meg, és a hardver belül tárol sokezer nagy háromszögre vonatkozó adatot. Ezért van a nagy L2 cache. Viszont azt el kell dönteni, hogy melyik háromszög részleges pixeladatai maradnak belül és mi kerül kiírásra. Ezt a ROP ellenőrzi minden háromszögre még a valós munka előtt. Ez egy ballansz döntés az NV ROP teljesítményt áldoz a sávszél spórolásért. Ilyen formában legalább 40-50%-kal több ROP kell, de 30-40% sávszél spórolható.

Új hozzászólás Aktív témák