Szó szerint a processzor alá kerülnek az AMD Instinct gyorsítói

A nagymértékű integráció egy új, Socket SH5 nevű foglalattal lesz majd bevezetve.

Tavasszal írtunk arról, hogy az AMD még idén bemutatná az Instinct MI200 nevű gyorsítót, amely viszonylag gyorsan követné a novemberben bejelentett Instinct MI100-at. A friss fejlesztés persze abból a szempontból érdekes, hogy a Trento kódnevű platformhoz van tervezve, így az egyik készülő, exascale szuperszámítógép alapja lesz. Mondhatni, hogy ez így egy egyedi megrendelésnek is számít, és ez már abból is látszik, hogy az egyes hardverek az Infinity Fabric 3.0-s interfészen keresztül csatlakoznak egymáshoz.

Az sem titok, hogy az AMD egy speciális kiépítést fog alkalmazni, amelynek keretében egy EPYC CPU-ra négy Instinct MI200 gyorsító jut, és ez az öt tokozás egymással közvetlenül össze van kötve. Ennek a fejlesztésnek gyakorlatilag ez a lényege, és ilyen kiépítésben az egyes lapkák memóriakoherens módon hozzáférnek a kapcsolódó memóriában tárolt adatokhoz, ami eliminálja a memóriamásolások direkt kezelését a program oldalán, jóval egyszerűbb programozhatóságot kínálva.

Egy friss útitervben viszont nemrég feltűnt egy új, Socket SH5 nevű foglalat, amely a fenti koncepciót görgeti tovább olyan formában, hogy az egész egy tokozásra kerül. Ennek az elmúlt napokban utánakérdeztünk, és megtudtuk, hogy magán a tokozáson négy darab Instinct chiplet lesz, amelyeket az AMD GCD néven emleget, és magukon a GCD-ken kapnak helyet a CPU chipletek, vagyis a CCD-k.

A skálázás is a szerverprocesszorokra jellemző formában fog megvalósulni, vagyis több Socket SH5 foglalatot kell alkalmazni egy node-on belül, emellett a tokozott memória is említésre került, de utóbbi nincs ennél jobban kifejtve. Nyilván ez jelenthet valamilyen HBM szabványt, esetleg más hasonló megközelítést.

A nagymértékű integráció okáról annyit tudtunk meg, hogy az AMD jó ideje arról tájékoztatja a partnereit, hogy a jelenlegi szerverdizájnokban a fogyasztás nagyjából kétharmadát az adatmozgás teszi ki. A valós számítások mindössze az energiaigény harmadából vannak megoldva, és emiatt a következő nagy lépcsőfokot az adatmozgások energiaigényének redukálása jelenti. Ilyen formában mindent annyira közel kell rakni a CPU-hoz, amennyire csak lehet, és ebbe a memóriát is bele kell érteni. Hosszabb távon valószínűleg az adatmozgások megszüntetése is egy vizsgálat tárgyává válhat, de ehhez a rendszer strukturális működésbe is bele kellene nyúlni, ami nehezebben kivitelezhető, később viszont ez is alternatíva lehet.

A nagy kérdés, amire egyelőre nincs válasz, hogy az MI200 utáni Instinct dizájn érkezik-e klasszikus, PCI Express interfészt használó gyorsítóként. Egyelőre az AMD csak Infinity Fabric összeköttetésről ír, ami nyilván jó a memóriakoherencia szempontjából, de a rendszert az EPYC platformokhoz köti. Persze ettől még magukban a GCD-kben lehet egy aktuális PCI Express szabványhoz tervezett vezérlő, amivel a klasszikus gyorsító kiadása csak formalitás, és ezt nem is feltétlenül kell szerepeltetni a tervekben.

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés