Az AMD leleplezte a Vega architektúrát

Az új Radeonok alapja az általános előrelépés mellett évek óta létező problémákra is reflektál.

Grafikai reform

A Vega másik nagy újítása a geometria kezelésében keresendő. A rendszer teljesen új, programozható geometriai futószalagot kapott, ami jobban ki tudja használni a Polaris családba tartozó GPU-k primitive discard accelerator egységét. Utóbbi önmagában is rendkívül hasznos, hiszen már a vertex shader lépcső után el tudja dönteni bizonyos primitívekről, hogy látszanak-e. Ha nem, akkor az adott primitív ki lesz vágva minden további feldolgozási lépcsőből.

A Vega célja az volt, hogy erre a rendszerre építve drámaian megnöveljék a geometria feldolgozásának hatékonyságát. Ez tulajdonképpen sikerült is, mivel az AMD szerint a Vega annyi setup motort alkalmaz, mint a Polaris 10 vagy a Fiji kódnevű GPU, egészen pontosan 4 darabot. Ugyanakkor, amíg ez a két grafikus vezérlő órajelenként maximum 4 háromszöget tud feldolgozni, addig a Vega maximum 11-et. Utóbbi szám elég erős, mivel például az aktuális csúcs-GPU-ra épülő NVIDIA Titan X maximum 6, míg a két GPU-s mezőnyben a Radeon Pro Duo maximum 8 háromszöget dolgozhat fel ciklusonként.


[+]

A Vega ezt a teljesítményt számos trükk bevetésével éri el. Egyrészt maga a setup motor teljesen új, másrészt lényegesen hatékonyabb lett a teljes rendszer erőforrás-elosztása. A leglényegesebb változás azonban a primitive shader bevezetése, ami egy alternatív, jóval gyorsabb feldolgozási utat jelent a vertex és a geometry shader kiváltására.


[+]

Az egészre az AMD szerint azért van szükség, mert a mai játékok geometriai komplexitása kezd igen durva lenni. A vállalat elővette példának a Deus Ex: Mankind Divided című alkotást, aminek a benchmark módjában szereplő jelenet 220 milliónál is több háromszöggel dolgozik (beleszámítva a tesszellálást is), ami a játékok között komoly terhelésnek számít, vagyis amelyik grafikus vezérlő jól akar szerepelni ebben a tesztben, annak nagyon tudnia kell bánni a komplex geometriákkal. Ugyanakkor ebből az elképesztően magas számból valójában nagyjából 22 millió háromszögre van szükség az egyes képkockák leképezéséhez, vagyis jelentős mennyiségű munkától lehet megkímélni a grafikus vezérlőt, ha az adott képkockára levetítve nem látható háromszögeket minél előbb ki tudja vágni az architektúra.

Jöhetnek a pixelek

Teljesen megújultak a pixelfeldolgozásért felelős részegységek is. Tipikusan jellemző az iparágra, hogy a klasszikus IMR és TBR modelleket már egyik gyártó sem használja, mindenki egyfajta hibrid konstrukcióra alapoz, amely vagy az IMR-hez vagy a TBR-hez van közelebb. Mozaikos optimalizálást azonban már mindenki alkalmaz, csak van amelyik cég jobban épít rá, van amelyik kevésbé. Az ultramobil piacon érdekelt cégek dolgoznak a legkomplexebb mozaikos optimalizálással, de a PC-s piacra az NVIDIA ezt erőteljesebben behozta a Maxwell architektúrával. Valójában utóbbi még mindig távol van a klasszikus TBR modelltől, de a mozaikos feldolgozás a rendszer működésének sok részére kiterjed.


[+]

Az AMD is erőteljesebben lépdel a mozaikos optimalizálás felé. A vállalat a Vega megoldását draw stream binning rasterizer névre keresztelte el. Ez a mozaikos optimalizálás mellett a PowerVR GPU IP-k speciális funkciói felé is tesz egy lépést a draw stream miatt. Utóbbi lényegében egy listát generál az adott mozaikhoz tartozó primitívekről és rajzolási parancsokról, amivel az Vega képes párhuzamosítani a raszterizációt, így az egész feldolgozás hatékonyabban hajtható végre. Bár nagyon pontos részletek a működésről még nincsenek, de az eddigi adatok alapján a draw stream binning rasterizer egy IMR és TBDR közötti hibrid modellnek tűnik.


[+]

Végül az AMD átalakította a ROP blokkok szervezését is. Eddig a ROP blokkokhoz tartoztak az L2 gyorsítótár partíciói, míg most az L2 gyorsítótár alkot egy nagy egészet, és ennek a részei lesznek a ROP blokkok. A konstrukciónak az a nagy előnye, hogy a pixel- és textúraadatokra vonatkozó memóriaelérések koherensé vállnak, szemben a többi GPU-architektúra nem koherens modelljével. Ilyen formában javul a deferred leképezőt használó applikációk alatti teljesítmény.

A cikk még nem ért véget, kérlek, lapozz!

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés