Az AI-piac eddig nagyrészt a tréningről szólt, amihez főleg GPU-alapú gyorsítókat vásároltak az érintettek, de a gépi tanulás következtetés szakasza egyre szélesebb területeket fed le, ami átalakította az adatközpontok tervezését is. Manapság az ügynökalapú AI a fő irány, amelyhez például a GPU-k nem túl optimálisak, mivel a kapcsolódó munkafolyamatoknak csak egy részét adják a nagy nyelvi modellek, vagyis az összes számításnak arányaiban kevesebb részét teszik ki a mátrixműveletek. Melléjük számos, jóval nehezebben párhuzamosítható munkafolyamat társult be, amelyek elágazásokat, rendszerhívásokat, rengeteg kis, változó méretű feladatot, illetve jelentő mennyiségű IO műveletet tartalmaznak, ami a CPU-k felé tereli az ügyfeleket.
Az ARM most bejelentette, hogy elkészítették az első olyan processzordizájnjukat, amely specifikusan az ügynökalapú AI-hoz készült, és ezt AGI CPU-nak hívják. Az egész fejlesztés masszív változást jelent a cég üzletpolitikájában is, ugyanis eddig licencelhető dizájnokat terveztek, most viszont konkrét hardvert, amit meg is lehet majd vásárolni. Ilyen formában az ARM direkt versenytársa lesz az ARM IP-ket licencelő partnereiknek.
A stratégiaváltás nem jelenti azt, hogy a licencelés megszűnne, így az ARM továbbra is biztosítja a legújabb magjait a partnerek felé, csak nem várják meg, amíg a szóban forgó cégek kiadják a saját dizájnjaikat, hanem elérhetővé teszik azt saját maguk is egy amolyan referenciaplatform részeként. Ez alapvető előnyöket jelent a cégnek, mivel ilyen formában minden partnerüknél hamarabb piacra dobhatják az éppen aktuális csúcskonfigurációt, illetve a konkrét hardver közvetlen eladásával több nyereséget tudnak realizálni, noha a gyártás felvállalásával a kockázat is nagyobb. Mindez arra sarkalhatja az ARM partnereit is, hogy a korábbinál gyorsabban tervezzenek az ARM gyári rendszerétől eltérő konstrukciókat.
Az AGI CPU a TSMC 3 nm-es eljárásán készül, és két darab CPU chiplet van egy tokozásra helyezve. Ezek összesen 136 darab Neoverse V3 magot kínálnak, magonként 2 MB-os dedikált L2 gyorsítótárral, az órajel pedig terheléstől függően elérheti a 3,7 GHz-et is. A 8,8 GHz-es effektív órajelet támogató DDR5-ös memóriavezérlő 12 csatornát biztosít, PCI Express 6.0-s sávból pedig 96 darab található összesítve a két chipletben. Mindezek mellett a CXL 3.0 is támogatott, és a teljes csomag 300 wattos TDP fogyasztási kerettel jön, a kiépíthető memória kapacitása pedig tokozásonként 6 TB.
A szerverdizájnt az ARM a piac által tipikusan igényelt többutas konfigurációkra tervezte, vagyis egy pengeszerveren belül több tokozásba helyezett AGI CPU lelhető majd fel. A skálázhatóság léghűtés esetén 30 darab kétutas, vízhűtés mellett viszont 42 darab nyolcutas konfigurációban tetőzik egy rackre levetítve. Magukat a szervereket a vállalat partnerei szállítják majd az ARM előírásainak megfelelően. Első körben az ASRock Rack, a Lenovo, a Quanta és a Supermicro épít majd kereskedelmi szinten megvásárolható rendszereket, de az adatközpontokat birtokló cégek is tervezhetnek maguknak saját alternatívát.
Az ARM már tervezi a következő két generációt is, amelyek majd később érkeznek meg, és ezekről igazából még semmit sem lehet tudni. Az útiterv szempontjából azonban elsősorban az üzenet a fontos, hogy a vállalat mostantól ezen a fontos piacon saját, fizikailag megvásárolható hardverrel is jelen lesz, hogy az ügyfeleik a lehető leghamarabb hozzájussanak a legmodernebb fejlesztéseikhez.
A vállalat azt is elmondta, hogy az AGI CPU rackszinten kétszeres teljesítményt kínál a modern x86/AMD64-es rendszerekhez viszonyítva, és itt az ARM konkrétan az AMD Turin platformot veszi számításba, amely jelenleg magasan a legjobb, mindenki számára elérhető alternatíva ezen a piacon. Ugyanakkor az AGI CPU startja az év második felében esedékes, és akkor már az AMD Venice platformmal kell megküzdenie. Az tehát még nem egyértelmű, hogy a trónra reálisan esélyes két rendszer közül melyik lesz majd az erősebb, annak viszont már most örülhet a piac, hogy az AMD több éve tartó szerverpiaci háziversenyét végre felszámolhatja az ARM.

