Teljesen lefedi az ultramobil GPU-k piacát az új ARM Mali generáció

A Bifrost architektúra persze változáson ment keresztül, ugyanis a BAFU-k alapos módosításokat kaptak.

Az ARM még 2016-ban mutatta be az első, Bifrost architektúra épülő, Mali-G71 nevű GPU IP-jét, amelyet később követett a Mali-G72 és a Mali-G51. Ezekkel az ultramobil GPU-k piacának egy jelentős részét le lehetett fedni, de lefelé nehéz volt skálázni, ami arra kényszerítette az ARM-ot, hogy még a régi dizájnnal támadják az olcsóbb lapkákat. A vállalat pont emiatt jelentette be, hogy némileg áttervezték a rendszert, így már kisebb lapkaterületre is igen értékelhető teljesítmény építhető, miközben a Bifrost előnyének tekinthető tudásszint megmarad.

A legfőbb változás a BAFU-kat, vagyis a feldolgozóegységeket éri. Ezek korábban összesen két darab 128 bites vektormotort tartalmaztak, amelyeket az új verzióban 256 bites egységek váltanak. A logikai felépítése a szélesebb feldolgozók ellenére megmarad, így egyik vektormotor FMA utasítást is végrehajtó lebegőpontos, míg a másik ADD utasításra kialakított fixpontos feldolgozó, illetve utóbbi biztosítja a speciális funkciókat is, ideértve a trigonometrikus és transzcendens utasításokat. A fő feldolgozóelem maradt a quad, ugyanakkor egy ilyen a szélesebb vektormotorok miatt már nem 4, hanem 8 szál széles, emellett további újítás még a 8 bites skaláris szorzatra vonatkozó speciális utasítás támogatása, ami többek között a gépi tanulás szempontjából lehet rendkívül hasznos.

Az új 8 bites skaláris szorzat operáció hatása a gépi tanulásra
Az új 8 bites skaláris szorzat operáció hatása a gépi tanulásra [+]

A változás hatására egy BAFU lebegőpontos számítási teljesítménye megduplázódott, miközben csupán 22%-kal több lapkaterületre van szükség. Persze vannak negatívumok is, amiről az ARM nyilván nem beszél, de azt tudni kell, hogy ezeket a szélesebb vektormotorokat nehezebb etetni is, viszont a jövőben valószínűleg az ultramobil szinten is lesz annyi párhuzamosan feldolgozható adat, ami mellett megéri a szélesebb egységek felé menetelni.

A Mali-G52 sok szempontból hasonlít a korábban megjelent Mali-G51-re. A BAFU-kat, vagyis a feldolgozómotorokat ért változásokon túl más módosításra nem érdemes számítani, így egy shader tömbön belül marad a kettő blending és kettő textúrázóegység. A GPU IP-kben egy, kettő, három vagy négy shader tömb lehet, ezeken belül pedig kettő vagy három BAFU dolgozhat, vagyis a skálázhatóság igen tág határok között történhet meg. A shader tömbök számától függ az L2 gyorsítótár kapacitása is, ugyanis egy tömb mellett ez 64 vagy 128 kB lehet, két tömbbel fixen 128 kB, míg három, illetve négy tömb esetén 256 vagy 512 kB.

ARM Mali-G31 és Mali-G52 ARM Mali-G31 és Mali-G52
ARM Mali-G31 és Mali-G52 [+]

A Mali-G31 jóval szerényebb rendszer, nem is igazán skálázható, hiszen csak egy shader tömb lehet benne. Ezen belül is a régebbi BAFU-k alkalmazhatók, vagyis a vektormotorok szélessége 128 bites. A megrendelő számára egyedül ezek száma lehet eldöntendő kérdés, ugyanis az egyetlen shader tömb kérhető egy vagy két ilyen feldolgozómotorral, és ettől a döntéstől függ az is, hogy egy vagy kettő blending, illetve textúrázóegység lesz beépítve. Az ARM ezt a dizájnt a belépőszintre szánja, tehát nagy teljesítmény igazából nincs mögötte, de a képességek tekintetében ugyanannyit tud, amennyit a nagyobb testvérek, így az OpenGL ES 3.2 mellett támogatja az OpenCL 2.0-t és a Vulkan API-t is.

Az új GPU IP-k kompatibilisek az ARM CoreLink CCI-550-nel vagy a NIC-450-nel, illetve támogatják az Assertive Display 5-ös és 3-as blokkokat. Emellett bemutatkozott egy új kijelzőprocesszor is, Mali-D51 néven, ugyanis a korábban megjelent Mali-D71 nem kifejezetten az olcsóbb lapkákhoz van tervezve. Az új fejlesztés sok szempontból hasonlít a nagyobbik testvérére, de ezt az ARM már nem 4K-ra kínálja, hanem csupán 2048 pixel széles kijelzőkhöz.

ARM Mali-D51 és Mali-V52 ARM Mali-D51 és Mali-V52
ARM Mali-D51 és Mali-V52 [+]

Végül új videokódoló és -dekódoló blokkot is hozott a vállalat, amely a Mali-V52 jelzést viseli, és a korábban bemutatott Mali-V61 kisebbik testvére lesz. A legfőbb különbség, hogy az új verziót nem nyolc, hanem csupán négy magig lehet skálázni, vagyis a teljesítménye korlátozottabb, viszont a legtöbb mobil eszközbe így is tökéletes lehet.

  • Kapcsolódó cégek:
  • ARM

Azóta történt

Előzmények

Hirdetés