Bemutatta az AI-ra tervezett Lumex platformját az ARM

A CSS-ként kínált konstrukció kiszedi a képletből az NPU-t, és meglepetésre a CPU-t ajánlja erre a feladatra.

Az ARM prezentálta az új, kliensoldali CSS, azaz Compute Subsystem platformját, amely a Lumex nevet viseli. Itt továbbra is olyan komplett referenciacsomagokról van szó, amelyek egymáshoz illesztett CPU- és IGP-konfigurációt biztosítanak a licencelők számára, egyszerűbbé téve a chiptervezést.

Hirdetés

A Lumex ARMv9.3-as architektúrát használó magokat kínál, ezen belül is négyféle magtípust, amelyeket a DynamIQ segítségével vegyíteni is lehet. Az új C1-DSU, azaz DynamIQ Shared Unit, akár mindegyik beépítését lehetővé teszi az adott lapkában, bár ez nem minden esetben célszerű.


[+]

A Lumex platform alapját a C1 kategóriás magok adják, és ezen belül a C1-Ultra, a C1-Premium, a C1-Pro és a C1-Nano. A leírt sorrendben csökken a magok teljesítménye, illetve a lapkán elfoglalt helyigény, viszont ugyanígy nő az energiahatékonyságuk.

Az IGP tekintetében a G1 kategóriát lehet használni, ezen belül lesz Mali G1-Ultra, G1-Premium és G1-Pro. A multiprocesszorok minimális száma rendre 10, 6 és 1 lesz, maximum pedig 24, 9 és 5 darabra lehet számítani. Itt lényeges kiemelni, hogy csak a Mali G1-Ultra kapja meg az ARM újratervezett, sugárkövetést gyorsító részegységét, tehát a gyengébb kiadások az aktuális verzióval érkeznek, viszont mindegyik támogatni fogja az FP16-os adattípust mátrixműveletek esetén.

A CPU-magok és IGP-n túl a Lumex platform bevezet egy új SI L1 dizájnt, amely a részegységek lapkán belüli, rendszerszintű összeköttetéséért és működtetéséért felel. Ezt az ARM már az AI munkafolyamatokat figyelembe véve tervezte meg, így képes az eltérő adatfolyamoknak QoS-t biztosítani, miközben az új SMMU részegység a késleltetést 75%-kal csökkentheti az elődhöz viszonyítva.

A Lumex platform legfontosabb eleme, hogy nem tartalmaz NPU-t. Ez ugyanakkor az ARM szerint koncepció, mivel mindegyik C1 kategóriás mag támogatja az SME2 utasításkészletet, amely a CPU-magokon belül kínál mátrixfeldolgozót az AI munkafolyamatokhoz. Itt alapvetően egy problémára reflektál a vállalat, ugyanis minden egyes, ultramobil eszközöket célzó, rendszerchipeket tervező cég saját fejlesztésű NPU-t használ, vagyis ebből a szempontból elképesztően fragmentált a piac. Ráadásul ezekre nem is létezik egy mindenki által támogatott átfogó API, és még a hardverek felépítését tekintve is igen eltérő utakat járnak az érintettek.

Az ARM az SME2-t pont azért engedélyezi az összes C1-es processzormagon, hogy rendkívül gyorsan terjedjen az említett utasításkészlet. Ezzel hoznak egy olyan közös alapot, ami mindegyik gyártó rendszerchipjében ott lesz, így a fejlesztőknek is lesz egy könnyen járható út, ha valamilyen mátrixfeldolgozót szeretnének az AI munkafolyamataikhoz használni. Ez egyébként nem jelenti azt, hogy a Lumex platform nem engedi meg a partnereknek az NPU-k alkalmazását a rendszerchipeken belül, de az eltérő NPU dizájnok okozta fragmentáltság miatt nem ebben látja a jövőt az ARM.

A Lumex CSS már licencelhető az érdeklődők számára, és 3 nm-es node-okra fizikai szintű implementáció is van. Mindemellett a fentebb felvázolt részegységek külön-külön is elérhetők, ha valakinek erre volna igénye.

Hirdetés

Gamer stílus a csuklón: sportóra vagy okoseszköz?

PR Az új chiparchitektúra berobbanása a csuklós eszközök világába nemcsak technológiai frissítést jelent, hanem egy teljes paradigmaváltást is.

  • Kapcsolódó cégek:
  • ARM

Előzmények