Hirdetés

Meghozta az idei CPU és GPU IP frissítéseket az ARM

A menetrendszerű újítások a jól bevált alapokra építkeznek, de már a TSMC 5 nm-es eljárásához vannak optimalizálva.

Az ARM az idei TechDay rendezvényén bemutatta új fejlesztéseit, vagyis új CPU-k és GPU IP-kel bővül a piac. A processzor tekintetében a friss csúcs a Hercules kódnevű Cortex-A78 lesz, ami az alapként szolgáló Cortex-A76 továbbfejlesztésének számít, megőrizve persze a Cortex-A77 főbb tulajdonságait, így marad az ARMv8.2-A utasítás-architektúra, és a DynamIQ koncepció támogatása.

ARM Cortex-A78
ARM Cortex-A78 [+]

A gyorsítótárak tekintetében a Cortex-A78 alapértelmezetten 64-64 kB-nyi L1 utasítás- és adatgyorsítótárat használ, de mostantól az ARM kínál opciót a 32 kB-os kapacitásra is, ha a kis lapkaterület fontosabb a megrendelő számára. Az L2 gyorsítótár továbbra is 256 vagy 512 kB lehet, amelyek mellé 512 kB és 4 MB közötti L3 gyorsítótár építhető. A fő különbség a Cortex-A77-hez viszonyítva az előbbi már részletezett jobb konfigurálhatóság, illetve a hatékonyságot szem előtt tartva számos részegység lett áttervezve, így jobb teljesítmény mellett működnek, miközben a célzott fogyasztás nem nő, vagy még javul is. A vállalat szerint a legtöbb előnyt a konkrét feldolgozókat kiszolgáló IQ (issue queues) egységek módosításával sikerült elérni, de a részleteket nem közölték.


[+]

A további eltérések tekintetében a három integer ALU közül egy már MUL operációk végrehajtására is képes a már meglévő komplex ALU mellett, így ciklusonként mostantól két ilyen művelet is elvégezhető. A load/store AGU-k párosa kiegészült egy load AGU-val, load/store parancslisták sávszélessége 16-ról 32 bájtra nőtt, valamint az L2 gyorsítótár interfésze is kétszer gyorsabb a közvetlen elődnél.

Hirdetés

A fentiek módosítások azt eredményezik, hogy a Cortex-A78 a Cortex-A77-hez viszonyítva akár 20%-kal is tempósabb lehet egységnyi fogyasztás mellett.

Megérkezett a Mali-G77-ben bemutatott a Valhall architektúrára második generációja is, amely a Mali-G78-ban és Mali-G68-ban lesz elérhető. Az ARM elsődlegesen a dizájn skálázhatóságára fókuszált, de azért lecserélték a korábbi FMA feldolgozót. Az új egység nagyjából ugyanarra képes, amire az elődje, csak a működése 30%-kal kevesebb energiát igényel, ami nyilván nem mindegy, főleg ha számításba vesszük azt, hogy a korábbi csúcsnak számító Mali-G77 16 multiprocesszorig volt skálázható, míg a Mali-G78 esetében már 24 a maximális limit.

ARM Mali-G78
ARM Mali-G78 [+]

A másik nagy újításnak a két darab, aszinkron órajeldomén számít. Ezekkel külön órajelen, illetve feszültségen tudnak üzemelni a multiprocesszorok, illetve a GPU-ban található többi részegység, ráadásul az így kialakított csoportok dinamikus feszültségskálázása is független lehet. Utóbbi az igazán nagy fejlesztés, ugyanis ilyen formában az ARM teljesen külön szabhatja meg a multiprocesszorok, illetve például a fix funkciós részegysége paramétereit, vagyis igazodhatnak a munkafolyamathoz. A vállalat szerint, ha magas a geometriai terhelés, akkor a nem használható ki igazán a rendszerben lévő számítási kapacitás, miközben a fogyasztás jelentős részéért így is a shader ALU-k felelnek. Az új koncepcióval viszont maximalizálni lehet a geometriai futószalag órajelét a multiprocesszorok kárára, de utóbbiak ugye amúgy sincsenek kihasználva, tehát a rendszer valamennyire kiegyensúlyozhatóvá válik. Mindez egy igen komoly megoldás az ultramobil piacra szánt GPU-dizájnok tipikus gondjára, mivel a tranzisztorokkal való takarékosság miatt nem lehet úgy elszállni a geometriai részegységek áteresztő képességével, mint például a PC-s megoldásoknál.


[+]

A Mali-G78 rendkívül konfigurálható, a multiprocesszorok száma 7 és 24 között lehet, míg az L2 gyorsítótár 512 kB vagy 2 MB közé eshet. Utóbbi visszalépés a Mali-G77-hez képest, ahol 4 MB volt a maximális kapacitás az L2 cache-re nézve, de az igazság az, hogy egy GPU-nál ez nem kritikus tényező, mivel a működési elv a késleltetés átlapolására épül, tehát semmit sem veszít azzal az ARM, hogy mostantól 2 MB a felkínált maximum, egy kicsit egyszerűbbé tették maguknak a tervezést.

A Mali-G68 igazából a kisebbik testvérnek fogható fel, ami limitált teljesítményszint között skálázódik, hiszen a multiprocesszorok száma maximum 6 lehet. Minden egyéb tényezőben a Mali-G78-cal megegyező képességeket kínál.

Az ARM új CPU és GPU IP-jét már licencelhetik a partnerek. A dizájnok alapvetően TSMC 5 nm-es node-jához készültek, de persze bármire lehet portolni őket.

A fentiekhez némileg kapcsolódó újdonság még az Ethos-N78 NPU, amely egy neuronháló gyorsító, vagyis alapvetően azt a feladatot látja el, amit sok lapkában a CPU és a GPU, csak éppen sokkal hatékonyabban, elvégre célirányosan, a gépi tanulás dedukció szakaszához tervezett megoldásról van szó. A teljesítménye igény szerint konfigurálható 1 és 10 TOPS között, és a megrendelők lényegében 90 különféle módon paraméterezhetik a dizájnt, hogy biztosan megfeleljen az adott feladatra.

Az Ethos-N78 fő fejlesztése az elődnek számító Ethos-N77-hez képest, hogy egységnyi területre levetítve 25%-kal jobb hatékonyságot kínál, vagyis kisebb lapkaterületbe építhető bele ugyanaz a teljesítmény, ami eléggé fontos tényező, de persze az is lényeges, hogy elméletben dupla akkora számítási tempó érhető el az új generációs IP-vel. Emellett az ARM külön dolgozott azon, hogy kímélhessék a memóriaalrendszert, így a friss fejlesztés ebből a szempontból 40%-kal is jobb lehet az elődjénél.

Hirdetés

Fotóznál vagy videóznál? Mutatjuk, melyik okostelefon mire való igazán!

PR Vásárlás előtt érdemes megnézni, mit kínálnak az aktuális telefonok, ha igazán ütős képeket vagy profi mozgóképeket szeretnénk készíteni.

  • Kapcsolódó cégek:
  • ARM

Azóta történt

Előzmények