Az egy éve mutatta be a Bifrost architektúrát és az erre épülő Mali-G71-es GPU IP-t. Utóbbi nagy előrelépés volt az ultramobil GPU-k piacán, de némi negatívumot is magával hozott, mivel viszonylag sokat fogyasztott. Persze itt rögtön hozzá kell tenni, hogy nagyon sok tudást is beépített a cég a dizájnba, tehát a megrendelők elfogadták, hogy az előnyök hátrányokkal is járnak.
Az új Mali-G72 viszont egy érdekes fejlesztés, mivel pontosan ugyanolyan a logikai felépítése, mint a Mali-G71-nek. Ugyanazokat az MP konfigurációkat lehet belőle kihozni, és az ajánlott 850 MHz-es órajelen ugyanazokat az elméleti paramétereket garantálja a számítási teljesítmény szempontjából. Felmerülhet a jogos kérdés, hogy ilyen formában miért is volt erre a friss GPU IP-re szükség? A válasz igazából mélyen az architektúrában rejlik, ugyanis a Bifrost amennyire forradalmi volt, annyira kiforratlan is.
Hirdetés
A Mali-G72 már egy második generációs Bifrost architektúrát használ, amely reagál azokra a problémákra, amik az első generációs dizájnt a gyakorlatban jellemzően limitálták, vagy esetleg előnytelenné tették az alternatív GPU IP-kkel szemben.
Az egyik legfontosabb változás, hogy a Mali-G72 teljes konfigurációban 25%-kal energiahatékonyabb, mint a Mali-G71 szintén a teljes konfigurációt tekintve. Vagyis ugyanarra a teljesítményre 25%-kal kisebb fogyasztás mellett képes. Ennél is lényegesebb, hogy az új dizájn 20%-kal kisebb helyre beépíthető, ami a rendszerchipek esetében jellemzően kritikus tényező.
Az ARM amellett, hogy a beépített részegységek számát változatlanul hagyta, a motorháztető alatt számos dolgon változtatott. Többek között módosult az utasításarchitektúra. Az új Bifrost verzió több komplex utasítástól megszabadult, amelyek nem igazán voltak kihasználhatók a programok alatt. Ezeket mostantól kevésbé komplex utasítás váltja fel, ami lényegében emulációnak számít, de ilyen formában rengeteg tranzisztort lehet megspórolni, és ha bizonyos utasításokat eleve ritkán használnak a programok, akkor azok nem feltétlenül hasznosak. Főleg az ultramobil szinten, ahol a dizájn által elfoglal szilíciumterület sokkal többet érhet. Gyorsult pár IEEE 754-2008-as szabványnak nem megfelelő, reciprokot használó utasítás, ami így csak a grafikai munka során lehet hasznos, tehát compute feladatban egyáltalán nem. Ennél fontosabb változás, hogy a belső adatút optimalizálásokat kapott, így hatékonyabbak lettek az adatmozgások az egyes feldolgozóegységek között.
A legfontosabb előrelépések azonban gyorsítótárakat érték. Egyrészt az L1 gyorsítótár mérete megnőtt, ahogy a mozaikok tárolására szolgáló puffer is, de az ARM nem közölte, hogy mennyivel. Javult egyébként az utasításgyorsítótár hatékonysága is, így az új Bifrost architektúra számára jobb kihasználhatóságot biztosít. Az egész változtatás célja a lehető legtöbb munka lapkán belül tartása, mivel az ultramobil lapkák memória-sávszélessége még mindig elég gyenge, így amennyire lehet a memória-hozzáféréseket kerülni kell.
Az ARM tesztjei szerint a Mali-G71-hez képest a Mali-G72-nél 42%-kal csökkent a memória terhelése a G-pufferek írásakor, ami igazából túl szép, hogy általánosan igaz legyen, szóval itt minden bizonnyal egy erősen szintetikus mérésről lehet szó. A gyakorlati előny minden bizonnyal jóval kisebb, de előnynek biztos, hogy előny, már csak azért is, mert igen valószínű a fogyasztásra vonatkozó előrelépés nagy része innen származik. Az ARM egyébként megjegyzi, hogy a memóriabuszt kímélhető pixel local storage eljárással további 45%-nyi sávszélesség takarítható meg, ami viszont már valósnak tűnő adat, ez a technika nagyjából ennyit tud ténylegesen spórolni.
A gyorsítótárak kapacitásának megnövelése a gépi tanulásnak is jót tett, mivel az ARM szerint a Mali-G72 a Mali-G71-hez képest 13%-kal teljesít jobban az SGEMM és 17%-kal a HGEMM feladatokban. Előbbi a szimpla pontosság, míg utóbbi a felezett pontosság melletti általános mátrixszorzást jelöli.
A Mali-G72 már licencelhető és minden bizonnyal a Mali-G71-et szükségtelenné teszi, hiszen nagyon sok szempontból jobb nála.
