Játékos szemszögből is előrelépés az NVIDIA Pascal

Az új architektúrában a Maxwell legjobban vérző pontjait orvosolták, ami utat nyit a VR felé.

A compute és a grafika

A Pascal megváltozott a parancsmotorok terén is. A fő parancsprocesszor nyilván megmaradt, de ennek a képességeit is bővíteni kellett, mivel a DirectX 12 és a Vulkan API-k esetében jóval korlátozottabb lett az, hogy milyen parancsutakat lehet alkalmazni. A DirectX 12 konkrétan nem enged meg semmilyen alternatív, gyorsabb feldolgozást lehetővé tevő parancsutat sem, és egy ilyen alkalmazása a Vulkan esetében sem egyszerűbb, mivel teljes egészében az alkalmazás felel a vezérlésért. Emiatt több általános parancsutat kapott a rendszer, így megnőtt az a skálázhatóság, amit az új, explicit API-kkal el lehet érni. Emellett megújulnak a GMU-k, azaz a Grid Management Unitok is, így a Pascal jobb Hyper-Q képességekkel fog rendelkezni, mint a Maxwell. Ez egészen konkrétan azt is jelenti, hogy a GMU-k az operációk közötti szinkronizáció mellett támogatják az erőforrás-korlátozást is, ami a DirectX 12 és a Vulkan API-k esetében is hasznos, mivel ilyen formában az NVIDIA aszinkron módban is betölthet a GP104-be egy megfelelően időzített compute futószalagot. Ez tulajdonképpen az aszinkron compute néven emlegetett DXGI funkció hatékony támogatásához szükséges követelmény volt. Ezzel korrigálásra került a harmadik olyan terület is, ahol a Maxwell architektúra vérzett.

A compute és a grafikai futószalagok kezelése is módosult az architektúrán belül. Az aszinkron compute teljes hatékonyságához ugyanis ajánlott az is, hogy a compute parancsokat a rendszer speciális hardverállapotban kezelje. Az aktuális architektúrák ebből a szempontból nagyon különböznek. Például az Intel Gen7.5, Gen8 és Gen9 generációja képtelen egyszerre compute és grafikai parancsot futtatni, a teljes integrált grafikus vezérlőnek vagy az egyik, vagy a másik hardverállapotot kell felvennie. Ennek gyökeres ellentéte az AMD GCN architektúrája, amelynek minden iterációja úgynevezett stateless compute feldolgozást használ, vagyis a compute parancsokat akármilyen hardverállapotban képes futtatni, így akár egy multiprocesszoron belül is megoldható, hogy egyszerre fusson a grafikai és a compute futószalag, mindezt dinamikus erőforrás-menedzselés mellett, amiről egy beépített hardveres blokk gondoskodik.

Az NVIDIA a Maxwell architektúránál a két végpont közötti konstrukciót választott, vagyis a teljes grafikus vezérlő képes volt arra, hogy egyszerre futtasson grafikai és compute futószalagot, de ezt egy multiprocesszoron belül már nem tudta megtenni, így ott vagy az egyik, vagy a másik futhatott. A Pascal ezen a ponton lép némileg előre, ugyanis az NVIDIA lehetővé tesz egy hibrid üzemmódot, amikor egy SMP-n belül az egyik compute blokk grafikai, míg a másik három compute futószalagot futtat. Ez egy szoftveresen, egészen pontosan a felhasználói módban futó eszközillesztőben vezérelt üzemmód, vagyis a meghajtónak az alkalmazás által leadott parancsok alapján fel kell ismernie azt a helyzetet, amikor az SMP-t érdemes hibrid üzemmódba kapcsolni. Az is fontos, hogy ez jó időzítés mellett történjen, ugyanis maga a particionálás statikus és fix időegységre szól, vagyis ha éppen nem tudna a hardver compute futószalagot futtatni, de az SMP-n belüli három compute blokk erre már ki van rendelve, akkor tulajdonképpen az elérhető elméleti teljesítmény háromnegyede elvész, vagyis ezzel a funkcióval nagyon finoman kell majd bánniuk a rendszerprogramozóknak.

A Pascal architektúra túlságosan nem változott a setup területén, a GP104 esetében az NVIDIA továbbra is egy raszteres és egy úgynevezett PolyMorph részre vágja a hagyományos értelemben vett setup motort. Az előbbi egységből négy található a lapkában, azaz egy raszter motor öt darab streaming multiprocesszor ellátásáról gondoskodik. Ezt a felállást a vállalat Graphics Processing Clusternek (GPC) szokta nevezni, és ez most sincs másképp. A raszter motor órajelenként 16 pixelt képes feldolgozni, ami természetesen a teljes lapkára nézve 64 pixelt jelent, és ez tökéletesen egyensúlyban van a 64 blending egységgel is, azaz a friss lapka ezen a ponton kiegyensúlyozott. Mindemellett a GP104 órajelenként négy háromszöget képes feldolgozni.


[+]

A streaming multiprocesszorokban található PolyMorph motor továbbra is a geometriával kapcsolatos munkálatokat végzi, és a korábbi rendszerekhez képest semmit sem változott a működése. Mivel 20 darab SMM található a GP104-ben, így értelemszerűen ez ugyanennyi PolyMorph motort eredményez. Maga a részegység viszont fejlődött, mivel új multiprojekciós motort kapott, amely a Maxwellbe épített opció után már nem csak 9, hanem 16 nézőpozícióba képes továbbítani a geometriát. Ennél fontosabb, hogy lehetővé teszi az egymenetes sztereó 3D-t, vagyis úgy számolható sztereó 3D-s képkocka, hogy a geometriát kettő helyett csak egyszer kell kiszámolni. Ez a virtuális valóság szempontjából további előny.


[+]

A Maxwellhez viszonyítva javult az NVIDIA saját Delta Color Compression technikája, amely még takarékosabban bánik a sávszélességgel. Ezt lényegében két új veszteségmentes tömörítési technika bevezetésével éri el, az eddigi egy mellé.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

Előzmények

Hirdetés