Az ARM prezentálta az új, kliensoldali CSS, azaz Compute Subsystem platformját, amely a Lumex nevet viseli. Itt továbbra is olyan komplett referenciacsomagokról van szó, amelyek egymáshoz illesztett CPU- és IGP-konfigurációt biztosítanak a licencelők számára, egyszerűbbé téve a chiptervezést.
Hirdetés
A Lumex ARMv9.3-as architektúrát használó magokat kínál, ezen belül is négyféle magtípust, amelyeket a DynamIQ segítségével vegyíteni is lehet. Az új C1-DSU, azaz DynamIQ Shared Unit, akár mindegyik beépítését lehetővé teszi az adott lapkában, bár ez nem minden esetben célszerű.
A Lumex platform alapját a C1 kategóriás magok adják, és ezen belül a C1-Ultra, a C1-Premium, a C1-Pro és a C1-Nano. A leírt sorrendben csökken a magok teljesítménye, illetve a lapkán elfoglalt helyigény, viszont ugyanígy nő az energiahatékonyságuk.
Az IGP tekintetében a G1 kategóriát lehet használni, ezen belül lesz Mali G1-Ultra, G1-Premium és G1-Pro. A multiprocesszorok minimális száma rendre 10, 6 és 1 lesz, maximum pedig 24, 9 és 5 darabra lehet számítani. Itt lényeges kiemelni, hogy csak a Mali G1-Ultra kapja meg az ARM újratervezett, sugárkövetést gyorsító részegységét, tehát a gyengébb kiadások az aktuális verzióval érkeznek, viszont mindegyik támogatni fogja az FP16-os adattípust mátrixműveletek esetén.
A CPU-magok és IGP-n túl a Lumex platform bevezet egy új SI L1 dizájnt, amely a részegységek lapkán belüli, rendszerszintű összeköttetéséért és működtetéséért felel. Ezt az ARM már az AI munkafolyamatokat figyelembe véve tervezte meg, így képes az eltérő adatfolyamoknak QoS-t biztosítani, miközben az új SMMU részegység a késleltetést 75%-kal csökkentheti az elődhöz viszonyítva.
A Lumex platform legfontosabb eleme, hogy nem tartalmaz NPU-t. Ez ugyanakkor az ARM szerint koncepció, mivel mindegyik C1 kategóriás mag támogatja az SME2 utasításkészletet, amely a CPU-magokon belül kínál mátrixfeldolgozót az AI munkafolyamatokhoz. Itt alapvetően egy problémára reflektál a vállalat, ugyanis minden egyes, ultramobil eszközöket célzó, rendszerchipeket tervező cég saját fejlesztésű NPU-t használ, vagyis ebből a szempontból elképesztően fragmentált a piac. Ráadásul ezekre nem is létezik egy mindenki által támogatott átfogó API, és még a hardverek felépítését tekintve is igen eltérő utakat járnak az érintettek.
Az ARM az SME2-t pont azért engedélyezi az összes C1-es processzormagon, hogy rendkívül gyorsan terjedjen az említett utasításkészlet. Ezzel hoznak egy olyan közös alapot, ami mindegyik gyártó rendszerchipjében ott lesz, így a fejlesztőknek is lesz egy könnyen járható út, ha valamilyen mátrixfeldolgozót szeretnének az AI munkafolyamataikhoz használni. Ez egyébként nem jelenti azt, hogy a Lumex platform nem engedi meg a partnereknek az NPU-k alkalmazását a rendszerchipeken belül, de az eltérő NPU dizájnok okozta fragmentáltság miatt nem ebben látja a jövőt az ARM.
A Lumex CSS már licencelhető az érdeklődők számára, és 3 nm-es node-okra fizikai szintű implementáció is van. Mindemellett a fentebb felvázolt részegységek külön-külön is elérhetők, ha valakinek erre volna igénye.
