Még az év elején írtunk arról, hogy jön a neurális leképezés a DirectX API-ba, amelynek az egyik felhasználási formája a textúrák, neurális formában történű dekódolása lehet. Ezt a kooperatív vektor teheti majd lehetővé a HLSL nyelv frissítésében, amely a shader modell 6.9-cel fut majd be.
Hirdetés
Pár napja elérhetővé vált az NTC SDK 0.7-es béta verziója, amely kapott is egy olyan fejlesztői meghajtót, ami az aktuális, még nem végleges állapotában támogatja a DirectX új képességeit.
Osvaldo Pinali Doederlein, a Google szoftverfejlesztője az alábbi X bejegyzésében le is mérte a textúrák dekódolása kapcsán a neurális leképezés előnyeit az NTC SDK-ban szállított példaprogrammal. Egy GeForce RTX 5080-as VGA-val a hagyományos textúratömörítés majdnem 80 MB-nyi memóriát használt, de 2600 fps-re volt képes.
A neurális textúratömörítés a memóriaigényt minden esetben közel 10 MB-ra csökkentette, de ez mindenképpen áldozatokkal jár majd a teljesítményre nézve, mivel a működése számítási kapacitást igényel. A leglassabb mód a DP4A lesz, ami egyfajta fallback a nagyon régi, kooperatív vektort nem támogató GPU-khoz, és segítségével 1030 fps-t tudott felmutatni a fentebb említett VGA-n, ami 60%-os lassulást jelent. A kooperatív vektort támogató módok mellett kellemesebb a helyzet ugyanis 2160 vagy 2350 fps várható a különböző adatformátumokkal.
Kooperatív vektort egyébként azok a GPU-k fogják támogatni, amelyek rendelkeznek AI-ra szabott célhardverrel, vagyis olyan feldolgozási módokkal, amik a megszokottnál hatékonyabban oldják meg a mátrixszorzást, a többinek pedig ott a DP4A lehetősége, amit nagyon sok piacon lévő hardver kezel.
Azt még fontos kiemelni, hogy a szóban forgó példaprogram nem szimulálja egy játék komplexitását, tehát a GPU-nak nagyrészt csak a célfeladattal kell foglalkoznia. Egy játékban ennél sokkal komplikáltabb a helyzet, így a neurális leképezésből eredő lassulás mértéke a fentieknél azért nagyobb lesz, mert más feladatok is terhelni fogják majd azokat a multiprocesszorokat, amelyek végeredményben elvégzik a neurális formában történű textúradekódolást. Ez nagyjából megfelel annak a várakozásnak, hogy az új technikával sok memóriát lehet majd spórolni, de az aktiválásával – valós, játékon belüli körülmények között – 20-80% közötti lassulás várható hardvertől függően, a hagyományos textúratömörítést alkalmazó módhoz viszonyítva.