Hirdetés

Nagyon specifikusra tervezte az NVIDIA a Grace-t

A saját egyedi igényeiket remekül kiszolgálja majd a fejlesztés, a klasszikus adatközpontok piacát viszont már kevésbé.

Még tavasszal írtunk arról, hogy az NVIDIA a Grace processzorral szeretné rendezni nagy adósságát, vagyis a jövőben már teljes platformot fognak kínálni a szerverpiac számára. A fejlesztésről korábban kiderült, hogy 72 darab ARMv9 architektúrára épülő magot használ, míg az ECC-t is támogató, tokozás mellé integrált rendszermemória LPDDR5X szabványú lesz.

Hirdetés

Mára sokkal többet tudni a rendszerről, így érdemes részletesebben is megnézni, hogy mivel készülnek a zöldek. A 72 darab mag alapját a ma leleplezett Neoverse V2 adja, amelyek négymagos processzorklaszterekbe vannak rendezve, és ezekből a klaszterekből van 18 darab. Értelemszerűen így jön ki a 72 mag, amelyek 117 MB-os L3 gyorsítótáron osztoznak egymással.

Az NVIDIA nem fogja teljesen követni az ARM dizájnkoncepcióját, így nem lesz annyi gyorsítótár a Grace-ben, amennyire amúgy lehetőség lenne a Neoverse V2 platformot tekintve. Mindennek azonban megvan az oka, ugyanis a zöldek nem számolnak a klasszikus adatközpontok piacával. Ez már a memóriaválasztáson is látszik, ugyanis a Grace 32-csatornás, LPDDR5X szabványú memóriavezérlőt használ. Ennek az előnye, hogy relatíve olcsón megoldható az igen nagy memória-sávszélesség, konkrétan 546 GB/s-ról beszélünk, de nagy hátrány, hogy a rendszermemória maximális kapacitása csak 512 GB lehet. Utóbbi az adatközpontokba nem igazán optimális, és pont emiatt a gyorsítótárak tekintetében is spórol a vállalat, mert ezeknek is igazából az adatközpontokban lehetne igazán komoly haszna, de a Grace már a rendszermemória tekintetében limitált.

A fentiek következtében a Grace kifejezetten azt a HPC-piaci szegmenst célozza, amit az NVIDIA le akar fedni a saját gyorsítóival, és ennek megfelelően lett kialakítva a dizájn, itt pedig hasznosabb a memória-sávszélesség, illetve az energiahatékonyság.

Korábbról már ismert adat volt, hogy a Grace a beépített NVLink-C2C interfésszel megduplázható. Ez gyakorlatilag két Grace processzort jelent egymás mellett, lényegében minden paramétert kétszerezve. Ezt a konfigurációt az NVIDIA Grace Superchipnek hívja. Más módja is van ugyanakkor a skálázásnak, ugyanis mindegyik Grace lapka tartalmaz még 12 darab cNVLINK interfészt, és ezeken keresztül a négyutas kiépítés is megvalósítható. Persze a célpiacot tekintve jó eséllyel nem ez lesz a leginkább kedvelt kialakítás, valószínűleg csak a megrendelők elenyésző része kéri majd így a rendszert, de megvalósítható.

A PCI Express 5.0-s sávok száma egyébként 56 lesz egy lapkán belül, viszont ha nincs használva a 12 darab cNVLINK interfész, akkor ezek 12 darab PCI Express 5.0-s sávként is kioszthatók.

A Grace a friss adatok alapján egyáltalán nem tűnik egy általános megoldásnak, kifejezetten érződik rajta, hogy az NVIDIA a saját specifikus igényeihez tervezte, így gyakorlatilag a HPC/AI terület lesz a célpiac.

Azóta történt

Előzmények

Hirdetés