Meghozta az idei CPU és GPU IP frissítéseket az ARM

A menetrendszerű újítások a jól bevált alapokra építkeznek, de már a TSMC 5 nm-es eljárásához vannak optimalizálva.

Az ARM az idei TechDay rendezvényén bemutatta új fejlesztéseit, vagyis új CPU-k és GPU IP-kel bővül a piac. A processzor tekintetében a friss csúcs a Hercules kódnevű Cortex-A78 lesz, ami az alapként szolgáló Cortex-A76 továbbfejlesztésének számít, megőrizve persze a Cortex-A77 főbb tulajdonságait, így marad az ARMv8.2-A utasítás-architektúra, és a DynamIQ koncepció támogatása.

ARM Cortex-A78
ARM Cortex-A78 [+]

A gyorsítótárak tekintetében a Cortex-A78 alapértelmezetten 64-64 kB-nyi L1 utasítás- és adatgyorsítótárat használ, de mostantól az ARM kínál opciót a 32 kB-os kapacitásra is, ha a kis lapkaterület fontosabb a megrendelő számára. Az L2 gyorsítótár továbbra is 256 vagy 512 kB lehet, amelyek mellé 512 kB és 4 MB közötti L3 gyorsítótár építhető. A fő különbség a Cortex-A77-hez viszonyítva az előbbi már részletezett jobb konfigurálhatóság, illetve a hatékonyságot szem előtt tartva számos részegység lett áttervezve, így jobb teljesítmény mellett működnek, miközben a célzott fogyasztás nem nő, vagy még javul is. A vállalat szerint a legtöbb előnyt a konkrét feldolgozókat kiszolgáló IQ (issue queues) egységek módosításával sikerült elérni, de a részleteket nem közölték.


[+]

A további eltérések tekintetében a három integer ALU közül egy már MUL operációk végrehajtására is képes a már meglévő komplex ALU mellett, így ciklusonként mostantól két ilyen művelet is elvégezhető. A load/store AGU-k párosa kiegészült egy load AGU-val, load/store parancslisták sávszélessége 16-ról 32 bájtra nőtt, valamint az L2 gyorsítótár interfésze is kétszer gyorsabb a közvetlen elődnél.

A fentiek módosítások azt eredményezik, hogy a Cortex-A78 a Cortex-A77-hez viszonyítva akár 20%-kal is tempósabb lehet egységnyi fogyasztás mellett.

Megérkezett a Mali-G77-ben bemutatott a Valhall architektúrára második generációja is, amely a Mali-G78-ban és Mali-G68-ban lesz elérhető. Az ARM elsődlegesen a dizájn skálázhatóságára fókuszált, de azért lecserélték a korábbi FMA feldolgozót. Az új egység nagyjából ugyanarra képes, amire az elődje, csak a működése 30%-kal kevesebb energiát igényel, ami nyilván nem mindegy, főleg ha számításba vesszük azt, hogy a korábbi csúcsnak számító Mali-G77 16 multiprocesszorig volt skálázható, míg a Mali-G78 esetében már 24 a maximális limit.

ARM Mali-G78
ARM Mali-G78 [+]

A másik nagy újításnak a két darab, aszinkron órajeldomén számít. Ezekkel külön órajelen, illetve feszültségen tudnak üzemelni a multiprocesszorok, illetve a GPU-ban található többi részegység, ráadásul az így kialakított csoportok dinamikus feszültségskálázása is független lehet. Utóbbi az igazán nagy fejlesztés, ugyanis ilyen formában az ARM teljesen külön szabhatja meg a multiprocesszorok, illetve például a fix funkciós részegysége paramétereit, vagyis igazodhatnak a munkafolyamathoz. A vállalat szerint, ha magas a geometriai terhelés, akkor a nem használható ki igazán a rendszerben lévő számítási kapacitás, miközben a fogyasztás jelentős részéért így is a shader ALU-k felelnek. Az új koncepcióval viszont maximalizálni lehet a geometriai futószalag órajelét a multiprocesszorok kárára, de utóbbiak ugye amúgy sincsenek kihasználva, tehát a rendszer valamennyire kiegyensúlyozhatóvá válik. Mindez egy igen komoly megoldás az ultramobil piacra szánt GPU-dizájnok tipikus gondjára, mivel a tranzisztorokkal való takarékosság miatt nem lehet úgy elszállni a geometriai részegységek áteresztő képességével, mint például a PC-s megoldásoknál.


[+]

A Mali-G78 rendkívül konfigurálható, a multiprocesszorok száma 7 és 24 között lehet, míg az L2 gyorsítótár 512 kB vagy 2 MB közé eshet. Utóbbi visszalépés a Mali-G77-hez képest, ahol 4 MB volt a maximális kapacitás az L2 cache-re nézve, de az igazság az, hogy egy GPU-nál ez nem kritikus tényező, mivel a működési elv a késleltetés átlapolására épül, tehát semmit sem veszít azzal az ARM, hogy mostantól 2 MB a felkínált maximum, egy kicsit egyszerűbbé tették maguknak a tervezést.

A Mali-G68 igazából a kisebbik testvérnek fogható fel, ami limitált teljesítményszint között skálázódik, hiszen a multiprocesszorok száma maximum 6 lehet. Minden egyéb tényezőben a Mali-G78-cal megegyező képességeket kínál.

Az ARM új CPU és GPU IP-jét már licencelhetik a partnerek. A dizájnok alapvetően TSMC 5 nm-es node-jához készültek, de persze bármire lehet portolni őket.

A fentiekhez némileg kapcsolódó újdonság még az Ethos-N78 NPU, amely egy neuronháló gyorsító, vagyis alapvetően azt a feladatot látja el, amit sok lapkában a CPU és a GPU, csak éppen sokkal hatékonyabban, elvégre célirányosan, a gépi tanulás dedukció szakaszához tervezett megoldásról van szó. A teljesítménye igény szerint konfigurálható 1 és 10 TOPS között, és a megrendelők lényegében 90 különféle módon paraméterezhetik a dizájnt, hogy biztosan megfeleljen az adott feladatra.

Az Ethos-N78 fő fejlesztése az elődnek számító Ethos-N77-hez képest, hogy egységnyi területre levetítve 25%-kal jobb hatékonyságot kínál, vagyis kisebb lapkaterületbe építhető bele ugyanaz a teljesítmény, ami eléggé fontos tényező, de persze az is lényeges, hogy elméletben dupla akkora számítási tempó érhető el az új generációs IP-vel. Emellett az ARM külön dolgozott azon, hogy kímélhessék a memóriaalrendszert, így a friss fejlesztés ebből a szempontból 40%-kal is jobb lehet az elődjénél.

  • Kapcsolódó cégek:
  • ARM

Azóta történt

Előzmények

Hirdetés