Az AMD még a múlt év novemberében mutatta be az Instinct MI250 és MI250X jelzésű gyorsítókat, amelyekről az alábbi cikkben be is számoltunk. Ezeket a vállalat úgynevezett OAM formátumban tervezte, vagyis nem helyezhetők bele a klasszikus PCI Express 4.0-s interfészbe, de a cég már akkor megemlítette, hogy készül egy Instinct MI210 nevű variáns, amely már a szervereken belüli tömegpiacot is célozni tudja.
A mai napon ez a kisebbik modell indul hódító útjára, és ugyanazt a TSMC 6 nm-es node-ján készülő, Aldebaran kódnevű lapkát használja, mint a nagyobb testvérei, csak éppen nem kettőt egyszerre, hanem csupán egymagában. Az Instinct MI210 paramétereit az alábbi táblázat foglalja össze:
Típus | MI210 PCIe |
---|---|
GCD kódneve | Aldebaran |
Architektúra | CDNA 2 |
Maximális magórajel | 1700 MHz |
Shader részelemek száma | 6656 |
Mátrixfeldolgozók száma | 416 |
QoS-t támogató parancslista | van |
DMA motorok száma | 2 |
Int4 mátrix számítási teljesítmény | 181 TOPS |
Int8 mátrix számítási teljesítmény | 181 TOPS |
bfloat16 mátrix számítási teljesítmény | 181 TFLOPS |
FP16 mátrix számítási teljesítmény | 181 TFLOPS |
FP32 mátrix számítási teljesítmény | 45,3 TFLOPS |
FP64 mátrix számítási teljesítmény | 45,3 TOPS |
Int8 számítási teljesítmény | 181 TOPS |
FP16 számítási teljesítmény | 181 TFLOPS |
FP32 számítási teljesítmény | 22,6 TFLOPS |
FP64 számítási teljesítmény | 22,6 TFLOPS |
Effektív memória-órajel | 3200 MHz |
Memória típusa | HBM2E |
Memóriabusz | 4096 bit |
VRAM kapacitása | 64 GB |
Memória-sávszélesség | 1,6 TB/s |
Infinity Fabric linkek száma | 3 |
TDP fogyasztási keret | 300 watt |
Formátum | x16 PCI Express 4.0 |
RAS képességek támogatás | van |
Az Instinct MI210 mellett a ROCm 5-re is kitért az AMD, melyhez kapcsolódóan korábban készítettek egy Infinity Hub nevű weboldalt, és ezt folyamatosan töltik fel tartalommal, amely mellett egy olyan katalógust is bejelentette a cég, amely a ROCm platformmal kompatibilis alkalmazásokat sorolja fel.
A passzív hűtéssel rendelkező Instinct MI210 már elérhető a vállalat partnereinek. Az AMD elsődlegesen két területet céloz vele a HPC-piacon. Egyrészt a dupla pontosság melletti számítási teljesítményt igénylő szimulációs feladatokra alapból nagyon rá van tervezve a rendszer, hiszen a piac aktuálisan leggyorsabb PCI Express 4.0-s megoldása ebből a szempontból, míg a gépi tanulásra vonatkozó munkafolyamatok tekintetében a tréning van megcélozva az IEEE754-es lebegőpontos szabványnak megfelelő lebegőpontos formátumok által.