Nagyban épít a 7 nm-re az AMD

A Rome platform mellé ígért Radeon Instinct MI60 hamarosan elérhető lesz.

Az AMD megtartotta a beígért Next Horizon prezentációt, amelyen belül kiderült számos részlet a vállalat 7 nm-es node-on készülő portfóliójáról. Maga az esemény a szerverekre volt kihegyezve, elsődlegesen a Zen 2 magokat használó Rome szerverplatform nézőpontjából, ez ugyanis a cég legfontosabb, szerverekbe szánt projektje a következő évre.

Az AMD stratégiájában az Infinity Fabric továbbra is vezető szerepet kap. Ennek a költségelőnyei jelentősek, így kiemelt szerepe volt abban a technológiának, hogy az eddig megjelent EPYC processzorok ennyire jól teljesítenek. Az első generációs Zen magokra alapozó fejlesztésekhez viszonyítva azonban nehéz továbblépni a gyártástechnológia fejlesztése nélkül. És itt nem feltétlenül olyan kis változásra kell gondolni, hogy 14 nm-es FinFET node-ról 12 nm-re ugranak, ami a maga módján hasznos, de a hatékonyság komolyabb növeléséhez ennél távolabbra kell tekinteni. Éppen ezért az AMD úgy döntött, hogy átugranak egy lépcsőfokot, vagyis a 10 nm helyett a 7 nm-t célozták meg, ezen belül is a TSMC első generációs node-ját. Ennek azért van jelentősége, mert a vállalat szerint jó ideig maradnak az említett csíkszélességen, vagyis érdemes a lehető leghamarabb megkezdeni a tapasztalatgyűjtést.

A Zen 2-re rátérve az új mag alapvetően a Zen alapos továbbfejlesztése, többek között optimalizált utasítás-gyorsítótárat, hatékonyabb utasítás-előbetöltést, jobb elágazásbecslést, valamint megduplázott, azaz 256 bites lebegőpontos végrehajtókat kapott az ezekhez szükséges fejlesztésekkel. Javult még a rendszermemóriát titkosító rendszer működése, illetve a Zen 2 már hardveresen védekezik a Spectre ellen, míg a Meltdown és a Foreshadow sebezhetőségre eleve immunis az AMD. A fejlesztés alapvető célja volt, hogy az operációk végrehajtása az aktuális generációhoz képest csak feleannyi energiát emésszen fel, ez nyilván a szerverpiacon igen fontos, hiszen a komolyabb adatközpontokban rengeteg processzor dolgozik, vagyis az energiaigény lefaragása jelentősen javítja a kiépített rendszer fenntartási költségeit.

A Zen 2 magok a Rome szerverplatformban érkeznek, de van egy csavar a történetben, amit ezúttal is az Infinity Fabric szolgáltat csak éppen ennek a második generációs verziója. Az aktuális EPYC processzorok skálázhatósága igen kedvezőnek mondható, gyakorlatilag elég volt egy kisebb lapkát tervezni, majd abból négyet elhelyezni a tokozáson. Az előnyöket a második bekezdés elején linkelt hír leírja, de a 7 nm-es node-on már nem ilyen egyszerű a helyzet. Maga a gyártástechnológia bonyolult, tehát az a legcélszerűbb, ha a tervezett lapka is kisméretű. Itt viszont már gondot jelent a skálázhatóság biztosítása, hiszen négyet még nem nehéz egymáshoz kötni, de mondjuk nyolcat már az. Nem beszélve arról, hogy a tokozáson történő összeköttetés ilyen formában nem túl kedvező, hiszen előfordulhat, hogy egy processzor olyan adatot kér, amelyhez egy fizikailag relatíve messze lévő társa férhet csak hozzá.

Ezen a szinten az optimális skálázhatósághoz már valódi chiplet dizájnra van szükség, így az AMD Rome platformjánál, az adott processzor tokozásának közepén lesz egy 14 nm-es node-on készülő I/O lapka, amely lényegében tartalmazza a memória- és PCI Express vezérlőt, a déli vezérlőhidat, illetve a különféle egyéb interfészeket. Ehhez lesznek hozzákötve a 7 nm-es node-on készülő CPU chipletek, amelyek kellően picik ahhoz, hogy sok elférjen a Socket SP3r2 foglalatba illeszthető tokozáson. Végeredményben tehát az AMD-nek egy igen kicsi lapkát kellett csak leterveznie, aminek úgy néz ki, hogy a gyártásával sem lesz gond. A fenti képből kiindulva ebből akár nyolcat is el lehet majd helyezni az I/O lapka köré, de az AMD hivatalosan nem mondott számot.

A 7 nm-es irány itt nem ért véget, mivel a frissen bemutatott Radeon Instinct MI60 gyorsító is ilyen node-on készülő GPU-t használ. Ez az a híres Vega 20 kódnevű fejlesztés, amely számtalan alkalommal ütötte már fel a fejét a pletykákban, most pedig végre materializálódott egy konkrét termékben is. Az alapot a Vega 10 szolgáltatta, amit az AMD gyakorlatilag áttervezett, illetve kiegészítette a memóriavezérlőt 2048 bitről 4096 bitre, továbbá kapott olyan interfészeket is, amelyekkel az Infinity Fabric technológia a tokozáson kívülre vezethető. Mindemellett az x16-os PCI Express vezérlő is fejlődött, amely immáron megfelel a 4.0-s szabványnak, vagyis a CPU és a GPU között 64 GB/s-os kétirányú kapcsolat építhető ki. Az új gyártástechnológiának hála 13,23 milliárd tranzisztor fér a 331,46 mm²-es kiterjedésbe, továbbá az AMD szerint azonos órajelen sikerült megfelezni a fogyasztást. A Vega 20 fő fejlesztése még a dupla pontosság natív támogatása, illetve a 4 bites integer számítások teljes sebesség melletti kezelése.


[+]

A Radeon Instinct MI60 alapvetően a Rome platformhoz készült, de persze használható bármilyen, PCI Express csatolóval rendelkező szerverben. A Rome platformon belül viszont egy processzorhoz akár négy darab Radeon Instinct MI60 is köthető, méghozzá PCI Express elosztólapka nélkül. Emellett az Infinity Fabric technológia segítségével ez a négy darab gyorsító is összeköthető, linkenként 100 GB/s-os memóriakoherens interfésszel. A Vega 20 GPU-hoz négy darab 8 GB-os HBM2 memória kapcsolódik, amivel az összkapacitás eléri a 32 GB-ot, a memória-sávszélesség pedig az 1 TB/s-ot. Az AMD későbbre ígért pontos specifikációt, így amint ez megérkezik, írunk róla egy hírt. A szoftveres hátteret természetesen a ROCm 2.0 szoftvercsomag biztosítja. A programozási környezet lehet ISO C++, OpenCL, CUDA a HIP konverziós eszközökön keresztül, illetve Python az Anaconda Numba fordítóját használva.

Az új, adatközpontokba szánt Radeon Instinct MI60 szállítása még idén megkezdődik.

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés