Játékos szemszögből is előrelépés az NVIDIA Pascal

Az új architektúrában a Maxwell legjobban vérző pontjait orvosolták, ami utat nyit a VR felé.

3. A compute és a grafika
1. A Pascal részletesen 2. A GP104 részletesen 3. A compute és a grafika 4. Multimédia, HDR és API
Írta: Abu85
2016-05-17 16:38

A compute és a grafika

A Pascal megváltozott a parancsmotorok terén is. A fő parancsprocesszor nyilván megmaradt, de ennek a képességeit is bővíteni kellett, mivel a DirectX 12 és a Vulkan API-k esetében jóval korlátozottabb lett az, hogy milyen parancsutakat lehet alkalmazni. A DirectX 12 konkrétan nem enged meg semmilyen alternatív, gyorsabb feldolgozást lehetővé tevő parancsutat sem, és egy ilyen alkalmazása a Vulkan esetében sem egyszerűbb, mivel teljes egészében az alkalmazás felel a vezérlésért. Emiatt több általános parancsutat kapott a rendszer, így megnőtt az a skálázhatóság, amit az új, explicit API-kkal el lehet érni. Emellett megújulnak a GMU-k, azaz a Grid Management Unitok is, így a Pascal jobb Hyper-Q képességekkel fog rendelkezni, mint a Maxwell. Ez egészen konkrétan azt is jelenti, hogy a GMU-k az operációk közötti szinkronizáció mellett támogatják az erőforrás-korlátozást is, ami a DirectX 12 és a Vulkan API-k esetében is hasznos, mivel ilyen formában az NVIDIA aszinkron módban is betölthet a GP104-be egy megfelelően időzített compute futószalagot. Ez tulajdonképpen az aszinkron compute néven emlegetett DXGI funkció hatékony támogatásához szükséges követelmény volt. Ezzel korrigálásra került a harmadik olyan terület is, ahol a Maxwell architektúra vérzett.

Hirdetés

A compute és a grafikai futószalagok kezelése is módosult az architektúrán belül. Az aszinkron compute teljes hatékonyságához ugyanis ajánlott az is, hogy a compute parancsokat a rendszer speciális hardverállapotban kezelje. Az aktuális architektúrák ebből a szempontból nagyon különböznek. Például az Intel Gen7.5, Gen8 és Gen9 generációja képtelen egyszerre compute és grafikai parancsot futtatni, a teljes integrált grafikus vezérlőnek vagy az egyik, vagy a másik hardverállapotot kell felvennie. Ennek gyökeres ellentéte az AMD GCN architektúrája, amelynek minden iterációja úgynevezett stateless compute feldolgozást használ, vagyis a compute parancsokat akármilyen hardverállapotban képes futtatni, így akár egy multiprocesszoron belül is megoldható, hogy egyszerre fusson a grafikai és a compute futószalag, mindezt dinamikus erőforrás-menedzselés mellett, amiről egy beépített hardveres blokk gondoskodik.

Az NVIDIA a Maxwell architektúránál a két végpont közötti konstrukciót választott, vagyis a teljes grafikus vezérlő képes volt arra, hogy egyszerre futtasson grafikai és compute futószalagot, de ezt egy multiprocesszoron belül már nem tudta megtenni, így ott vagy az egyik, vagy a másik futhatott. A Pascal ezen a ponton lép némileg előre, ugyanis az NVIDIA lehetővé tesz egy hibrid üzemmódot, amikor egy SMP-n belül az egyik compute blokk grafikai, míg a másik három compute futószalagot futtat. Ez egy szoftveresen, egészen pontosan a felhasználói módban futó eszközillesztőben vezérelt üzemmód, vagyis a meghajtónak az alkalmazás által leadott parancsok alapján fel kell ismernie azt a helyzetet, amikor az SMP-t érdemes hibrid üzemmódba kapcsolni. Az is fontos, hogy ez jó időzítés mellett történjen, ugyanis maga a particionálás statikus és fix időegységre szól, vagyis ha éppen nem tudna a hardver compute futószalagot futtatni, de az SMP-n belüli három compute blokk erre már ki van rendelve, akkor tulajdonképpen az elérhető elméleti teljesítmény háromnegyede elvész, vagyis ezzel a funkcióval nagyon finoman kell majd bánniuk a rendszerprogramozóknak.

A Pascal architektúra túlságosan nem változott a setup területén, a GP104 esetében az NVIDIA továbbra is egy raszteres és egy úgynevezett PolyMorph részre vágja a hagyományos értelemben vett setup motort. Az előbbi egységből négy található a lapkában, azaz egy raszter motor öt darab streaming multiprocesszor ellátásáról gondoskodik. Ezt a felállást a vállalat Graphics Processing Clusternek (GPC) szokta nevezni, és ez most sincs másképp. A raszter motor órajelenként 16 pixelt képes feldolgozni, ami természetesen a teljes lapkára nézve 64 pixelt jelent, és ez tökéletesen egyensúlyban van a 64 blending egységgel is, azaz a friss lapka ezen a ponton kiegyensúlyozott. Mindemellett a GP104 órajelenként négy háromszöget képes feldolgozni.

[+]

A streaming multiprocesszorokban található PolyMorph motor továbbra is a geometriával kapcsolatos munkálatokat végzi, és a korábbi rendszerekhez képest semmit sem változott a működése. Mivel 20 darab SMM található a GP104-ben, így értelemszerűen ez ugyanennyi PolyMorph motort eredményez. Maga a részegység viszont fejlődött, mivel új multiprojekciós motort kapott, amely a Maxwellbe épített opció után már nem csak 9, hanem 16 nézőpozícióba képes továbbítani a geometriát. Ennél fontosabb, hogy lehetővé teszi az egymenetes sztereó 3D-t, vagyis úgy számolható sztereó 3D-s képkocka, hogy a geometriát kettő helyett csak egyszer kell kiszámolni. Ez a virtuális valóság szempontjából további előny.

[+]

A Maxwellhez viszonyítva javult az NVIDIA saját Delta Color Compression technikája, amely még takarékosabban bánik a sávszélességgel. Ezt lényegében két új veszteségmentes tömörítési technika bevezetésével éri el, az eddigi egy mellé.

A cikk még nem ért véget, kérlek, lapozz!

Kapcsolódó cégek:
NVIDIA

Azóta történt

Az NVIDIA publikálta a GeForce GTX 1070 specifikációját

Hivatalos start továbbra is nyár elejére van tervezve, de legalább papírra van vetve, hogy mi is lesz ebből a VGA-ból.
Vízhűtéses GTX 1080 Founders Edition jön a Colorfultól

Meg sem jelent még a videokártya, de máris lehetőséget kapunk a gyári hűtő korlátain túllépni.
Hiteles forrásból szivarognak az NVIDIA GPU-k kódnevei

Az AIDA64 által megosztott listában számos, eddig csak pletykákban említett GPU is feltűnik.
Felsorakoztak a GeForce GTX 1080-as VGA-k

Az NVIDIA partnerei végül kierőszakolták a gyári tuning és a hűtőcsere lehetőségét.

Előzmények

Az NVIDIA bemutatta a GP104-es GPU-ra épülő GeForce-okat

Az új lapkáról és a két új VGA-ról ha nem is mindent, de már sokat lehet tudni.
Bevezetés az NVIDIA Pascal architektúra rejtelmeibe

A vállalat az egész rendszer tervezését alárendelte a gépi tanulásnak.
Leteszteltük a DirectX 12-t és újításait!

Cikkünkből kiderül, hogyan párosíthatunk GeForce-ot Radeonnal, és hogy gyorsul-e a játék processzorlimit esetén.
NVIDIA GeForce GTX 980: Maxwell második felvonás

Leteszteltük az NVIDIA legújabb, GM204 GPU-jára épülő VGA-ját, amely referencia kivitelben érkezett hozzánk.