Az AMD az EPYC sorozat mellett bejelentette a Radeon Instinct termékcsaládot is, amelyről korábban már beszéltek, de ezúttal a specifikációk is kiderültek, pont úgy, ahogy az új szerverprocesszoroknál.
Hirdetés
A Radeon Instinct természetesen továbbra is a gépi tanulást tartja szem előtt. Ennek rendel mindent alá a sorozat, de igazából használható más szerveres feladatok gyorsítására is. A gépi tanulást manapság amúgy is szokás kihangsúlyozni, hiszen ez a terület produkál lényeges növekedést.
Az érkező, x16-os PCI Express 3.0-s Radeon Instinct modellek pontos paramétereit az alábbi táblázat részletezi:
Típus | MI6 |
MI8 |
MI25 |
---|---|---|---|
GPU kódneve | Polaris 10 |
Fiji |
Vega 10 |
Architektúra | GCN4 |
GCN3 | GCN5 |
Maximális magórajel | 1243 MHz | 1000 MHz | 1500 MHz |
Shader részelemek száma | 2304 | 4096 | 4096 |
Mintavételezők száma | 144 | 256 | 256 |
Parancslisták száma | 64 |
64 | 64 |
QoS-t támogató parancslista |
van | van | van |
DMA motorok száma | 2 | 2 | 2 |
FP16 számítási teljesítmény | 5,7 TFLOPS | 8,2 TFLOPS | 24,6 TFLOPS |
FP32 számítási teljesítmény | 5,7 TFLOPS |
8,2 TFLOPS |
12,3 TFLOPS |
FP64 számítási teljesítmény | 0,358 TFLOPS | 0,512 TFLOPS | 0,768 TFLOPS |
Effektív memória-órajel | 7000 MHz | 1000 MHz |
1890 MHz |
Memória típusa | GDDR5 | HBM | HBM2 |
Memóriabusz | 256 bit | 4096 bit | 2048 bit |
VRAM kapacitása | 16 GB | 4 GB | 16 GB |
Memória-sávszélesség | 224 GB/s | 512 GB/s | 484 GB/s |
Maximális fogyasztás |
150 watt |
175 watt |
300 watt |
A táblázatban szereplő gyorsítók között elég sok különbség van. A célpiac szempontjából az AMD a MI6-ot a gépi tanulás dedukció, míg a MI25-öt a tréning szakaszára ajánlja. A MI8 igazából egy kivételes megoldás, mivel ennek a méreteiből származik az előnye, elvégre olyan helyre is befér, ahova más hasonló teljesítményű gyorsító nem. Továbbá, amennyiben az adott feladat nem érzékeny a memória kapacitására, de a sávszélességre és a számítási teljesítményre igen, akkor a MI8 egy ideális választássá válik.
A képességek tekintetében az összes Radeon Instinct modell támogatja az AMD, PCI-SIG SR-IOV (single root I/O virtualization) szabványára épülő, hardveres virtualizációs rendszerét, amelyet MxGPU technológiaként szoktak emlegetni. Mindezek mellett a large BAR támogatása is megoldott a több GPU-s peer-to-peer kommunikációhoz.
AMD Radeon Instinct MI6, MI8 és MI25 [+]
A MI25-ös modell a MI6-hoz és MI8-hoz képest további extra képességeket kínál. Ezek közül az egyik a fejlettebb menedzsmentáramkör, amivel a hardverek egyszerűen monitorozhatóvá válnak a széles spektrumon skálázható szerverekben, és a menedzselhetőség távolról is megoldható. További extra az ECC támogatása, illetve a fejlett memóriaalrendszer is lényeges, ami képes közvetlenül elérni az x86/AMD64-es szerverprocesszorok laptábláit. Utóbbi talán a konstrukció legnagyobb előnye, mivel lehetővé teszi azt, hogy a MI25 nagyméretű adathalmazzal is könnyedén megbirkózzon. Ezzel a képességgel a GPU-s gyorsítás használata az x86/AMD64-es szerverekben egyszerűbbé válik, mivel a korábbi hardvereken viszonylag sok programozói munkaórát elvitt a gyorsító memóriájára való optimalizálás, vagyis a feldolgozásra váró adatok olyan méretekre történő felosztása, hogy azok beférjenek a GPU fedélzeti memóriájába, illetve a szoftver képes legyen az elérhető fedélzeti tárat hatékonyan menedzselni. Ezt a Radeon Instinct MI25-ös gyorsító nem igényli, a hardver képes magától megoldani a feladatot, mindenféle szoftveres segítség nélkül.
A három év garanciával érkező Radeon Instinct gyorsítók a 64 bites Linux operációs rendszeren üzemképesek, és a ROCm szoftvercsomag biztosítja működésüket. A programozási környezet lehet ISO C++, OpenCL, CUDA a HIP konverziós eszközökön keresztül, illetve Python az Anaconda Numba fordítóját használva.
Az AMD elsődlegesen az EPYC mellé szánja a Radeon Instinct megoldásokat, kiemelve azt, hogy az egyutas EPYC platformba hat is beépíthető anélkül, hogy PCI Express átkapcsolót kellene használni, de nyilván bármilyen processzorral üzemképesek. Az Inventec már bejelentette, hogy terveznek egy olyan rack szervert, amely 125 darab Radeon Instinct MI25-öt használ, és 3 PFLOPS lesz a teljesítménye. A Falconwitch egy jóval szerényebb megoldással készül, mivel ennél a fejlesztésnél maximum 16 Radeon Instinct MI25-öt lehet bevetni, de sokak számára a 400 TFLOPS is elég lehet. A gyorsítók már elérhetők a partnerek számára, míg a rájuk épülő szerverek forgalmazása egy picit később kezdődik meg.