Hirdetés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz Yutani #65018 üzenetére

    Azzal a jellegű problémával, amivel például a Nanite szembesül a hw-es megoldás nem is futna egyáltalán, hacsak nem butítod a geometriát hozzá a bejáráshoz. Egyszerűen nincs meg hozzá a GPU-kban a memória. Szóval itt nem egy méregethető különbségről van szó, hanem aki sw-es megoldást alkalmaz a folyamatossághoz, az azért alkalmazza, mert a hw-es sebessége az 1 fps-t sem érné el.

    Nyilván az Ubisoftnak is sokkal egyszerűbb lenne a DXR-re építenie kizárólag, de egyszerűen az 1 fps sincs meg vele, ezért kell a programozható bejárás nekik, amivel meg megvan a 60-120 fps is hardvertől függően. Az Avatar játék tipikus problémája az, hogy a geometriai részletessége messze meghaladja egy átlagos játék szintjét, és ha azt elkezdenék bedobni a memóriába, akkor a VRAM terhelése 50-60 GB lenne. Nincs olyan GPU, ami ezt elviselné. Persze streaminggel összeraknák, de csak diavetítésre lenne jó, hiába számolja a hardver a sugárkövetést. Éppen ezért alkalmaznak olyan szoftveres megodlást, amivel ezt a VRAM terhelést 2-3 GB környékére csökketnik. Így ugyan az ALU-k számolnak, de nem 32 GB/s-os sebességgel lesz etetve a 600-900 GB/s-ra optimalizált GPU.
    Ezt sokan nem értik meg. Cseszheted a hardvert, ha a programozhatóság hiánya 32 GB/s-ra korlátozza a memóriaelérést.

    #65020 paprobert : Persze, hogy használhatatlan a mostani VGA-kon. Nincs elég VRAM-juk hozzá. De ezen később segít a több VRAM.

    Teljesen mindegy, hogy a VRAM sebessége mennyit gyorsul. A DXR jelenlegi működését az korlátozza le, hogy a sugár kilövésének pillanatában nem tudod, hogy az mit talál el. Éppen ezért nem tudod meghatározni, hogy a sugár kilövésekor milyen LOD szintet állítsd be az egyes objektumoknak. Ha túl alacsonyat állítasz, akkor szar lesz az eredmény, ha túl magasat, akkor pedig be kell tölteni a teljes modellet úgy is, ha csak 10 pixelt foglal el a képernyőn, vagy rosszabb esetben nem is látszik. Most elkezded DXR-rel betölteni a max LOD-ot, mert kényszerülsz rá programozhatóság hiányában, és így a GPU adatelérése 32 GB/s lesz, mert a PCI Express sáv fogja ezt korlátozni, hiszen nincs elég VRAM, hogy minden ott legyen a GPU mellett. Rakhatsz rá 4-5 TB/s-os memóriát is, akkor is 32 GB/s lesz a rendszermemória elérése.

    A programozhatóság pont ezt a problémát üti ki. Nem kell a sugár kilövésének pillanatában meghatározni a LOD szintet, elég akkor, ha a sugár egy adott dobozba belép. Minél távolabb van a doboz a kamerától, annál kisebb részletesség kell, így lehet spórolni a VRAM-mal, vagyis nem kell küzdeni azzal, hogy elfogy, és nem lesz ettől 32 GB/s-ra korlátozva a munka.

    És az teljesen mindegy, hogy lassabb maga a bejárási lépcső, ha közben az összes másik lépcső fényévekkel gyorsabb a memória jobb felhasználása miatt. Összességében ettől sokkal gyorsabb lesz a programozhatóság. Azért ezt az Avatar vastagon bizonyítja, ott annyira gyors maga a sugárkövetés, hogy ki sem lehet kapcsolni. Nem kell, mert nem akadályozza a sebességet a DXR masszív limitációs hatása.

    #65021 T.Peter : Nyilván nincs ott a DXR masszív korlátozó hatása, ami az UE5-nek elég problémás. A Fortnite geometriai részletessége lófasz. Meg sem közelíti azt a határt, ahol a DXR kifutna a VRAM-ból. De ha ugyanez Avatarban lenne megoldva, akkor nem is lenne ott a hardveres mód, ahogy például a Hellblade 2-ben sincs ott. Egyszerűen nagyjából 30 GB lenne a VRAM terhelése. Nincs elég memória a VGA-kon hozzá. Az meg nem sokat ér, ha az adatelérés 32 GB/s-ra esne vissza.

    És miért dönthet úgy, hogy a szoftveres használja (ami default engedélyezve van)? Mert gyorsabb. Túl pici a háromszög, hogy a hardveres megoldás gyorsabb legyen. És ez egy olyan jellegű működés, ami rosszabb lesz a jövőben, mert még kisebbek lesznek a háromszöget, hiszen már az UE5 tudja kezelni. És minél részletesebb a geometriai váz, annál inkább a szoftveres raszter fog dominálni benne. Márpedig a részeltesség nőni fog, és ez egyre inkább kiszorítja a hardveres rasztert. Itt is visszatértünk oda, hogy egy ideig jó volt a fixfunkciós hardver, de már most látszik, hogy van olyan tipikus körülmény, ahol annyira részletes a geometria, hogy túl lassú vele, és a szoftveres megoldás gyorsabb.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák