A DLSS 5 generatív iránya
Az NVIDIA az idei GTC-n jelentette be a DLSS 5-öt, amely a felskálázó modulban kínál majd jelentős változást, ráadásul olyan mértékűt, hogy az új rendszer már nem is számít klasszikus felskálázónak, inkább egy hibrid megoldás, mert a rekonstrukción túl új információt is létrehoz, vagyis részben generatív technológiának is nevezhetjük.
A DLSS 5 az alapkoncepcióját tekintve az úgynevezett feltételes generatív modellek közé tartozik, vagyis a képi bemeneti adatok alapján, a meghatározott feltételeket figyelembe véve generál új képi kimenetet. Bizonyos szempontból minden neuronhálót alkalmazó felskálázó ezt csinálja, csak rekonstrukció szintjén. Ehhez mozgásvektorokra és pár egyéb információra van szükségük, ami alapján egy bemeneti képhez rendkívül hasonló, de nagyobb felbontású kimeneti kép jön létre.
Az új rendszer ezt a modellt egészíti ki további bemeneti adatokkal, csak az NVIDIA nem részletezte pontosan, hogy ezek mik lesznek. Viszont, ha figyelembe vesszük, hogy a cég szerint a DLSS 5 integrálható a modern leképezőkbe, akkor sejthető, hogy itt a különböző információs pufferek adataira kell majd gondolni.
A fentiek alapján tehát a DLSS 5 veszi a bővített bemeneti adatokat a képi információ mellé, és azokat figyelembe véve generál egy új képet, majd azt a megszokott módon felskálázza. Így válik az egész hibrid modellé, vagyis először új információt hoz létre, majd a korábbi technikákból ismert módon rekonstruál.
A vállalat közzé is tett egy videót, amiben láthatók az eredmények, erre pedig azóta meglepően sok kritika érkezik a játékosok részéről. Annyira sok, hogy a cég írt is egy kiemelt kommentet, amelyben részletezik, hogy a fejlesztők kapnak egy SDK-t, amiben kontrollálhatják az effekt erősségét és a színkezelést, illetve maszkolhatják a bemeneti képet, hogy hol ne legyen alkalmazva a technika generatív része.
A játékosok kritikája egyébként elsősorban a művészi szabadság korlátozására vonatkozik, mivel a DLSS 5 helyenként hozza az AI által generált képek jellemző mellékhatásait, ami egyébként teljesen logikus következmény, hiszen ez az eljárás is részben generatívnak számít.
Az egész helyzetre reagálva Jen-Hsun Huang a Tom's Hardware számára elmondta, hogy a játékosok tévednek a DLSS 5-tel kapcsolatban, az ugyanis nem egy utófeldolgozás, hanem geometria szintjén tesz lehetővé generatív kontrollt. Hogy ezen konkrétan mit ért, azt nem fejtette ki az NVIDIA vezetője, ráadásul az általa közölt definíció is eléggé elnagyolt, bár nyilván ezeknél a nyilatkozatoknál gondolni kell a közérthetőségre is.
A gond az, hogy teljesen ellentétes álláspontok feszülnek egymásnak a DLSS 5-öt ellenzők és támogatók részéről. Ez abból eredhet, hogy játékosok nem értik a rendszer működését, amiben az is benne lehet, hogy az NVIDIA sem jól magyarázta el azt.
A cikk még nem ért véget, kérlek, lapozz!



