Tovább hengerelne a szerverpiacon az AMD

A cég az Intelnek esélyt sem ad a felzárkózásra, most pedig célba vették az NVIDIA-t is.

Haverkodó EPYC és Instinct

Az előző két oldalon külön-külön volt szó új processzorról és gyorsítóról, de az AMD előadásának sarkalatos pontja az volt, hogy együtt mire képesek. Eddig a gyorsítót a processzorral PCI Express interfészen keresztül lehetett összekötni, viszont az új Instinct MI250 és MI250X modellek úgynevezett OAM, azaz OCP Accelerator Module kiszerelésben érkeznek. Ennek a haszna, hogy már magához a processzorhoz is Infinity Fabric 3.0-s interfészen keresztül csatlakozhatnak, bár ennek valós haszna csak az MI250X modell esetében van.


[+]

A fentiek által lehetséges egy olyan kiépítés alkalmazása, amelynek keretén belül egy EPYC CPU-ra négy Instinct MI250X gyorsító jut, és ez az öt tokozás egymással egymással közvetlenül össze van kötve, míg a gyorsítók PCI Express 4.0-s interfészéhez csatlakoztathatók a 200 Gbps-os NIC-ek. Ilyen kiépítésben az egyes lapkák memóriakoherens módon hozzáférnek a kapcsolódó memóriában tárolt adatokhoz, ami eliminálja a memóriamásolások direkt kezelését a program oldalán.

Hirdetés

Mindez igen jelentős változás, mert a gyorsítóra átvitt kód problémáját maga a memóriamásolás okozza. Például egy CUDA vagy egy HIP kód sok szempontból hasonló processzoron és gyorsítón is. Az eltérő kód jelentős része, gyakorlatilag majdnem minden extra kódsor azt szolgálja, hogy az egységes memória hiánya miatti memóriamásolások megtörténjenek. Ez persze extra humánerőforrás, hiszen be kell írni a kódot, holott igazából erre egyáltalán nem lenne szükség, ha a processzor és a gyorsító memóriakoherensen lenne összekötve, így megfelelően tudnák kezelni egymás memóriáit.

Az Infinity Fabric 3.0-val összekötött EPYC és Instinct pont ezt szolgálja. Az AMD ezt már Infinity Architecture néven emlegeti, és gyakorlatilag elmondható róla, hogy egy ilyen rendszeren a meglévő, CPU-ra írt kód csak alig igényel módosítást, miközben gyorsítva képes futni. Az új konstrukcióval tehát a memóriamásolásokkal nem kell törődni, nem kell semmit beírni a kódba, hagyni kell, hogy a rendszer automatikusan végezze a dolgát, mivel az új platform ezt képes megoldani programozói segítség nélkül is.


[+]

Természetesen később lesz PCI Express 4.0-s interfészbe helyezhető Instinct MI210 PCIe nevű variáns is, amelynél egy kétutas konfigurációba akár nyolc is beköthető, viszont a nem memóriakoherens összeköttetés miatt a fenti képességet elveszíti, vagyis hagyományos módon lesz programozható.


[+]

A szoftveres háttérként érkezik az AMD-től a ROCm 5.0, ami már fel lesz készítve a fenti, összeköttetést érintő változásokra.

Az előbbiekből látható, hogy az AMD az új hardverekkel magára tervez. Ha valaki használni szeretné az Infinity Architecture által kínált, egyszerűbb programozhatóság adta előnyöket, akkor gyakorlatilag csak EPYC processzorban és megfelelő Instinct gyorsítóban gondolkodhat. Mindegy, hogy az ügyfél melyiket szemelte ki magának, a másik hardverelemből is az AMD-től kell vásárolni az újítások kihasználáshoz. Ez egy olyan szintű termékkapcsolás, ami a programozhatóságot javítja, illetve a szoftver karbantartási költségeit csökkenti, viszont olyan jelentős mértékben, hogy sokan el is gondolkodhatnak rajta.

Ebből a szempontból rögtön látszik, hogy a piacnak nagy szüksége lenne egy gyártófüggetlen memóriakoherens interfészre, de amíg ez nem érhető el, addig a zárt megoldásokat birtokló cégek élvezik a saját, gyakorlatilag hozzáférhető alternatívájuk előnyeit, és nyilván az AMD célja, hogy ebből anyagi hasznot húzzon. Emiatt olcsóságokra senki se számítson, még nagyvállalati mércével sem. Amíg az új EPYC és Instinct fejlesztések memóriakoherens összeköttetésére nincs konkurens alternatíva, addig ezt az árazópisztoly is érzékeltetni fogja.

Abu85

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés