Még az előző év végén írtunk az AMD Instinct MI300-as fejlesztések startjáról, és ez a sorozat most kapott egy kisebb ráncfelvarrást, ugyanis az AMD bejelentette az Instinct MI325X jelzésű gyorsítóját. Az alapokat tekintve a dizájn nem változik, vagyis a friss megoldáson ugyanaz a fejlesztés feszít, ami az Instinct MI300X-en, a különbséget a fogyasztási keret, illetve memória kapacitása adja. Előbbi 750 wattról 1000 wattra nőtt, míg utóbbi szempontból a jelenlegi modell 8Hi kategóriás HBM3 memóriákat használ, miközben az új dizájnt 12Hi stackekre tervezték, illetve a HBM3E szabványt is támogatja.
Hirdetés
Az Instinct MI325X pontos specifikációit az alábbi táblázat részletezi:
Típus | MI325X |
---|---|
IO chipletek száma |
4 |
XCD-k chipletek száma | 8 |
CCD-k chipletek száma | - |
XCD architektúra | CDNA 3 |
CCD architektúra | - |
XCD-k és CCD-k összeköttetése | - |
Maximális XCD magórajel | 2100 MHz |
Shader részelemek száma | 19 456 |
Processzormagok száma | - |
Int8 számítási teljesítmény | 2600 TOPS |
bfloat16 számítási teljesítmény | 1300 TFLOPS |
FP16 számítási teljesítmény | 1300 TFLOPS |
FP32 mátrix számítási teljesítmény | 163,4 TFLOPS |
FP64 mátrix számítási teljesítmény | 163,4 TFLOPS |
FP32 számítási teljesítmény | 163,4 TFLOPS |
FP64 számítási teljesítmény | 81,7 TFLOPS |
Effektív memória-órajel | 6000 MHz |
Memória típusa | HBM3E |
Memóriabusz | 8192 bit |
VRAM kapacitása | 256 GB |
Memória-sávszélesség | 6 TB/s |
ECC támogatás |
van |
TDP/maximális fogyasztási keret | -/1000 watt |
Formátum/Tokozás | OAM |
PCI Express vezérlő |
x16-os PCI Express 5.0 |
Infinity Fabric linkek száma | 8 |
RAS és Page Retirement |
van |
Memóriakoherencia a host CPU oldalán |
van |
Az Instinct MI325X OAM formátumban érkezik, és passzív hűtést használ, vagyis az adott szervernek kell megoldania a légáramlást. A rendszerből készül UBB platform is, ami nyolc darab Instinct MI325X OAM gyorsítót alkalmaz.
Az Instinct MI325X elsődleges előnye a fedélzeti memóriájának kapacitása, ami kellően nagy ahhoz, hogy kifejezetten méretes neuronháló modellek tréningjét is megoldja.
Az AMD közben dolgozik a CNDA 4 architektúrán is, ami a jövőre érkező, Instinct MI350-es sorozat alapja lesz. Erről annyit árult el a cég, hogy új, FP4 és FP6 adattípusokat fog támogatni, és jelentősen nő majd az AI feladatokban leadott számítási kapacitása. A fő chiplet 3 nm-es node-on fog készülni, míg a HBM3E szabványú memória maximum 288 GB-os kapacitást kínálhat majd.