Mindenben (is) gyors lesz az IBM Power10

De leginkább a gépi tanulás fekszik majd neki, köszönhetően az erre vonatkozó fejlesztéseknek.

Az IBM az idei Hot Chips alkalmával bemutatta az új Power10 processzorát, amely derekas előrelépést kínál az előző generációhoz viszonyítva. A 602 mm²-es kiterjedésű lapka a Samsung 7 nm-es node-ján készül, és összesen 16 darab processzormagot sikerült belepréselni, de a tényleges termékeken maximum 15 lesz aktív, amire a cég szerint a kihozatal növelése érdekében van szükség.


(forrás: ServeTheHome) [+]

A Power10-es magok viszont egészen combosak, 48 kB-os utasítás és 32 kB-os adat gyorsítótárral dolgoznak, amelyekhez 2 MB-os L2 gyorsítótár kapcsolódik, míg a megosztott L3 gyorsítótár kapacitása a teljes lapkákra levetítve 128 MB. Egy mag maximum nyolc hardveres szálat futtathat. A vállalat szerint a Power9-hez képest az új megoldásuk 30%-kal nagyobb magszintű, és 20%-kal jobb egyszálú teljesítményt biztosít, miközben a teljesítményhatékonyság 2,6-szeresére nőtt, de utóbbi a tokozás szintjén elérheti a háromszoros előrelépést is.


(forrás: ServeTheHome) [+]

Az új fejlesztés már az Power ISA v3.1-es utasításarchitektúrára épül, amely az OpenPOWER konzorcium fejlesztése, és ennek számos újítása van, ezek közül is külön kiemelt szerep jut a biztonságnak, ugyanis az IBM bemutatta a saját memóriatitkosító eljárását. Erre építhetők majd bizalmas hozzáférés a virtuális gépekhez, pont ugyanolyan, amilyet a Google nemrég bemutatott a Confidential Virtual Machines szolgáltatás keretében.


(forrás: ServeTheHome) [+]

Nagy változások érték a SIMD teljesítményt is, ugyanis a Power9-hez képest kétszeres általános, és legalább négyszeres mátrixműveletek melletti tempóra lehet számítani, de utóbbi szempontból lényegesen több is összejöhet, köszönhetően az új MMA (Matrix Math Assist) utasításoknak, ráadásul az adattípusok tekintetében támogatott a bfloat16 a gépi tanulás tréning szakaszához, emellett persze van 4 és 8 bites integer is a dedukcióhoz. Az IBM itt az iparnak arra a problémájára reagál, hogy a kifejezetten méretes modellek tréningelésénél egyszerűen nem tudnak gyorsítókat alkalmazni, mert olyan extrém a művelet memóriaigénye, hogy csak a processzorban lehet bízni, amely mellé be lehet rakni fél terabájtnyi memóriát is.


(forrás: ServeTheHome) [+]

Az interfészek tekintetében egy Power10 processzor maximum 64 darab PCI Express 5.0-s sávot kínálhat, emellett 16 darab 8x-os OMI (Open Memory Interface) várja a memóriákat. Utóbbi még a Power9 AIO változatában mutatkozott be, és egy olyan soros interfésznek számít, amely lehetővé teszi az eltérő memóriamegoldások támogatását, a lapka memóriavezérlőjének fejlesztése nélkül. Ilyen formában az IBM processzorához olyan OMI DDIM memóriák is érkezhetnek, amelyeken DDR4, DDR5, vagy akár GDDR6 lapkák is lehetnek, de opció a többszintű memória is, tehát nagyon rugalmas a rendszer. Mindezért nagyjából 5-10 ns-os extra késleltetéssel fizet, viszont a memória-sávszélesség oldalán lényeges előnyöket tud felmutatni, akár 1 TB/s is elérhető. Ilyen formában a rendszermemória kapacitása és teljesítménye igen széles tartományon belül skálázható.


(forrás: ServeTheHome) [+]

A processzor része még 16 darab 8x-os PowerAXON interfész is, ami a többutas kiépítést szolgálja. De ebben is van egy kis csavar, ugyanis az IBM kétféle dizájnt fog kínálni: SCM és DCM. Előbbi esetében a tokozáson egy, míg utóbbinál két darab Power10 processzor található majd. Az se mindegy, hogy melyik kerül kiválasztásra, ugyanis az SCM opcióból 16-utas, míg a DCM-ből 4-utas konfiguráció építhető, továbbá a processzorok közötti összeköttetés sebessége elérheti az 1 TB/s-ot.

  • Kapcsolódó cégek:
  • IBM

Azóta történt

Előzmények

Hirdetés