Az ARM Mali-G71-et másolja a Mali-G72, de mégis jobb az új dizájn

Máris szintet lépet az ARM Bifrost architektúrája, bár ez logikai felépítésen nem fog meglátszani.

Írta: Abu85
Forrás: PROHARDVER!
2017-05-29 20:33

Az egy éve mutatta be a Bifrost architektúrát és az erre épülő Mali-G71-es GPU IP-t. Utóbbi nagy előrelépés volt az ultramobil GPU-k piacán, de némi negatívumot is magával hozott, mivel viszonylag sokat fogyasztott. Persze itt rögtön hozzá kell tenni, hogy nagyon sok tudást is beépített a cég a dizájnba, tehát a megrendelők elfogadták, hogy az előnyök hátrányokkal is járnak.

Az új Mali-G72 viszont egy érdekes fejlesztés, mivel pontosan ugyanolyan a logikai felépítése, mint a Mali-G71-nek. Ugyanazokat az MP konfigurációkat lehet belőle kihozni, és az ajánlott 850 MHz-es órajelen ugyanazokat az elméleti paramétereket garantálja a számítási teljesítmény szempontjából. Felmerülhet a jogos kérdés, hogy ilyen formában miért is volt erre a friss GPU IP-re szükség? A válasz igazából mélyen az architektúrában rejlik, ugyanis a Bifrost amennyire forradalmi volt, annyira kiforratlan is.

Hirdetés

A Mali-G72 már egy második generációs Bifrost architektúrát használ, amely reagál azokra a problémákra, amik az első generációs dizájnt a gyakorlatban jellemzően limitálták, vagy esetleg előnytelenné tették az alternatív GPU IP-kkel szemben.

Az egyik legfontosabb változás, hogy a Mali-G72 teljes konfigurációban 25%-kal energiahatékonyabb, mint a Mali-G71 szintén a teljes konfigurációt tekintve. Vagyis ugyanarra a teljesítményre 25%-kal kisebb fogyasztás mellett képes. Ennél is lényegesebb, hogy az új dizájn 20%-kal kisebb helyre beépíthető, ami a rendszerchipek esetében jellemzően kritikus tényező.

Az ARM amellett, hogy a beépített részegységek számát változatlanul hagyta, a motorháztető alatt számos dolgon változtatott. Többek között módosult az utasításarchitektúra. Az új Bifrost verzió több komplex utasítástól megszabadult, amelyek nem igazán voltak kihasználhatók a programok alatt. Ezeket mostantól kevésbé komplex utasítás váltja fel, ami lényegében emulációnak számít, de ilyen formában rengeteg tranzisztort lehet megspórolni, és ha bizonyos utasításokat eleve ritkán használnak a programok, akkor azok nem feltétlenül hasznosak. Főleg az ultramobil szinten, ahol a dizájn által elfoglal szilíciumterület sokkal többet érhet. Gyorsult pár IEEE 754-2008-as szabványnak nem megfelelő, reciprokot használó utasítás, ami így csak a grafikai munka során lehet hasznos, tehát compute feladatban egyáltalán nem. Ennél fontosabb változás, hogy a belső adatút optimalizálásokat kapott, így hatékonyabbak lettek az adatmozgások az egyes feldolgozóegységek között.

A legfontosabb előrelépések azonban gyorsítótárakat érték. Egyrészt az L1 gyorsítótár mérete megnőtt, ahogy a mozaikok tárolására szolgáló puffer is, de az ARM nem közölte, hogy mennyivel. Javult egyébként az utasításgyorsítótár hatékonysága is, így az új Bifrost architektúra számára jobb kihasználhatóságot biztosít. Az egész változtatás célja a lehető legtöbb munka lapkán belül tartása, mivel az ultramobil lapkák memória-sávszélessége még mindig elég gyenge, így amennyire lehet a memória-hozzáféréseket kerülni kell.

[+]

Az ARM tesztjei szerint a Mali-G71-hez képest a Mali-G72-nél 42%-kal csökkent a memória terhelése a G-pufferek írásakor, ami igazából túl szép, hogy általánosan igaz legyen, szóval itt minden bizonnyal egy erősen szintetikus mérésről lehet szó. A gyakorlati előny minden bizonnyal jóval kisebb, de előnynek biztos, hogy előny, már csak azért is, mert igen valószínű a fogyasztásra vonatkozó előrelépés nagy része innen származik. Az ARM egyébként megjegyzi, hogy a memóriabuszt kímélhető pixel local storage eljárással további 45%-nyi sávszélesség takarítható meg, ami viszont már valósnak tűnő adat, ez a technika nagyjából ennyit tud ténylegesen spórolni.

A gyorsítótárak kapacitásának megnövelése a gépi tanulásnak is jót tett, mivel az ARM szerint a Mali-G72 a Mali-G71-hez képest 13%-kal teljesít jobban az SGEMM és 17%-kal a HGEMM feladatokban. Előbbi a szimpla pontosság, míg utóbbi a felezett pontosság melletti általános mátrixszorzást jelöli.

A Mali-G72 már licencelhető és minden bizonnyal a Mali-G71-et szükségtelenné teszi, hiszen nagyon sok szempontból jobb nála.

Hozzászólások (6)

Kapcsolódó cégek:
ARM

Azóta történt

Visszatérhet a PowerVR IGP-khez a Samsung?

A vállalat egy ideje szinte csak az ARM megoldásaira épít, de Series8XT sorozat nagyon meggyőző lett.
Nagyon vad lett az ARM legújabb kijelzőprocesszora

A Mali-D71 korábban Mali-Cetus néven futott, a képességei azonban a nevével ellentétben nem változtak.
A teljesítményre helyezi a hangsúlyt az Exynos 9810

A Samsung új csúcskategóriás rendszerchipje forradalmi újításokat nem hoz, de az biztos, hogy gyors lesz.
A Trillium projekt részeként jönnek az ARM gépi tanulásra szánt IP-i

A vállalat eddigi is nézegette a manapság felkapott piacot, és rájöttek, hogy dedikált hardver nélkül nehéz lesz helytállni.

Előzmények

Bemutatta az új Cortex magokat az ARM

A Cortex-A55-ös és -A75-ös fejlesztések már az új ARMv8.2-A utasítás-architektúrát használják, így a DynamIQ-t is támogatják.
Mindenhova kiterjeszti az ultramobil GPU-k reformját az ARM

A most bejelentett Mali-G51-es dizájn kis lapkaterületbe paszírozza bele a Mali-G71 tudását.
Okos trükköt vet be az ARM az új generációs Mali IGP-ben

A vállalat két lépcsőre szétválasztja a vertex shadert, így a nem látható háromszögeket még komolyabb munka előtt kivághatják.
Radikális irányba fejleszt az ARM az ultramobil GPU-k piacán

A most bejelentett Mali-G71 asztali szint közelébe viszi a hardver tudását, méghozzá ultramobil szintű fogyasztás mellett.