Hirdetés

Alaposan meglöki a Zen magok szekerét az AMD

A vállalat erőteljes letámadásba kezd a szerverpiacon, amit egy APU koronáz meg.

Az AMD megtartotta az idei Financial Analyst Day rendezvényét, amelyen a szokásoknak megfelelően felvázolták, hogy milyen újítások várhatók a jövőben. A jelenlegi útitervben feltűnnek később érkező dizájnok is, de érthető okokból a Zen 4 kapta a főszerepet, hiszen leghamarabb az erre épülő fejlesztések jelennek majd meg.

A vállalat szerint a Computexen már megszellőztetett Zen 4 mag jelentős hatékonyság-, illetve órajelbeli előrelépést biztosít a Zen 3-hoz viszonyítva, miközben bevezeti az AVX-512-t, illetve a VNNI utasításkészleteket. Az AMD szerint 8-10%-kal nő az órajelenként végrehajtható utasítások száma, illetve minimum 15%-kal az egy szálon leadott teljesítmény. Mivel a friss fejlesztés fő újítása lesz a magasabb működési órajel, így a cég elővette a CineBench tesztet, amely kapcsán egy 16-magos Zen 3 és egy szintén 16-magos Zen 4 dizájnt mértek össze. Utóbbi minimum 25%-kal jobb hatékonyságot, illetve 35%-kal nagyobb teljesítményt biztosított.

[+]

A CPU-kra vonatkozó útiterv tekintetében a Zen 4 és 4c jelzésű magokra lehet számítani a idén, illetve jövőre, és ezek a TSMC 5 és 4 nm-es node-ján készülnek majd. A Zen 4c egy specifikusan adatközpontokba tervezett verziója az alap Zen 4-nek, és emiatt várhatóan csak a szerverpiacon jelenik meg. Ezen túlmenően a Zen 4-nek is lesz 3D V-Cache kiegészítése, ahogy a Zen 3-nak is volt. A 2024-ben érkező Zen 5 és 5c az előbbiekhez hasonló minta alapján készül, de már a 4 és 3 nm-es node-okon. Az AMD szerint ez teljesen új mikroarchitektúrára épít, és a gépi tanulásra vonatkozó képességei is kibővülnek.


[+]

Az asztali piacot tekintve a már bejelentett Ryzen 7000 sorozatba érkezik a Raphael kódnevű dizájn, ami 16 mag erejéig hozza a Zen 4-et, illetve ennek már készül a 3D V-Cache verziója is. A Zen 5-öt is jegyzi már az útitervben a cég, ami a Granite Ridge kódnevet viseli. Szokás szerint érkezik majd a Ryzen Threadripper frissítése, amelyről egyelőre kevés adat van, de ahogy eddig is, valószínűleg valamelyik Zen 4-es szerverplatform asztali leszármazottja lesz.


[+]

A Ryzen Threadripper szempontjából azért sem egyértelmű a helyzet, mert az AMD korábban a szerverpiacra egy platformot tervezet, de ez mostantól megváltozik. Egyszerűen annyira eltérőek lettek az igények, hogy nehéz pusztán egy dizájnnal lefedni mindet. Az alapplatformot az 6096 tűs Socket SP5 nevű, LGA típusú tokozást használó Genoa biztosítja 96 darab Zen 4 maggal, 12-csatornás DDR5-ös memóriavezérlővel, 12 TB-nyi rendszermemória támogatásával, illetve PCI Express 5.0 és CXL támogatással. Ennek is jön egy Genoa-X verziója, ami hozza a 3D V-Cache-t, és ezzel az L3 gyorsítótára összkapacitása tokozásonként 1 GB fölött lesz. Végül a hiperskálázható adatközpontokat a Bergamo platform célozza meg a következő év első felében. Ez ugyanazt a tokozást használja, amit a Genoa és a Genoa-X, viszont 128 darab Zen 4c magot használ.

A Zen 5 majd a Turin platformmal érkezik meg a szerverpiacra, és ez a név a PROHARDVER! olvasóinak nem lehet ismeretlen, mivel már a 2020-as esztendő végén beszámoltunk a Genoa leváltójáról.


[+]

Ami igazán érdekes, és kvázi újdonságként hat, az a Siena platform. Ez kvázi a pénztárcabarát EPYC, amely ugyanazt a Zen 4 magot használja, amit a Genoa, de maximum 64 darabot tud felkínálni belőle, illetve a memóriacsatorna tekintetében is lesznek butítások, ahogy a PCI Express 5.0 sávból sem lesz annyi. Cserébe maga a tokozás jóval egyszerűbb lesz, így a készülő rendszerek előállítási költségei javulnak. Az egész helyzetet az szülte meg, hogy a Genoa a 12 darab memóriacsatorna és a sok PCI Express sáv miatt igen nagy tokozást használ, és 6096 tűt kivezetni az alaplap felé nem éppen olcsó mulatság. Eközben a piac igényli az ilyen extrém módon skálázható processzorokat, a 96 mag mögé pedig oda kell rakni a megfelelő memória-sávszélességet, különben nem működne optimálisan a dizájn. Van tehát egy igen jelentős igény a nagy adatközpontok tekintetében a teljesítmény és a hatékonyság növelésére, de ha ezt teljesíti az AMD, akkor ugyanazzal a platformmal nem tudja kiszolgálni a piac kisebb szereplőit, például a telekommunikációs üzletágat, mert ezen belül sokan az ilyen processzorszörnyeket egyszerűen képtelenek megfizetni, nincs is igazán rájuk igény. A Siena platform pont az utóbbi kategóriát fedi le, egy kvázi megfizethető dizájn kellően nagy teljesítmény biztosításával.

[+]

Az mindenképpen meglepő lehet, hogy az AMD gyakorlatilag három fő platformmal fedi le a a következő körben a szerverpiacot, de a chiplet felépítés miatt számukra egészen olcsók ezek a fejlesztések. A Siena platform igazából csak egy új tokozást igényel, mert a Zen 4 chipleteket meg tudja örökölni a nagyobb testvérétől, tehát a sok pénzbe kerülő munkát megspórolja a vállalat, így pedig könnyebben ki lehet gazdálkodni több platform generációnkénti frissítését is.

A processzorok mellett a gyorsítók tekintetében is lesz újítás, ugyanis érkezik a CNDA 3 architektúra, ami a TSMC 5 nm-es node-jára lett tervezve. Változás lesz viszont, hogy az AMD most nem klasszikus gyorsítóban gondolkodik, ahogy azt tették az előző Instinct modellek esetében, mivel a 2023-ban érkező Instinct MI300 egy APU lesz.


[+]

Az integráció koncepciója a processzor és a gyorsító közötti összeköttetés javítása. Mint ismeretes a HPC-piacnak tervezett Trento kódnevű EPYC platformmal az AMD lehetővé tette az Instinct MI250 sorozatú gyorsítók bekötését a memóriakoherens Infinity Fabric 3.0-val, ami nagymértékben egyszerűsítette a rendszer programozhatóságát, elvégre ezzel a képességgel már nem kellett a memóriamásolások direkten kezelni a programkód oldalán. Ugyanakkor ezek még megtörténtek, csak a hardver gondoskodott róluk.

[+]

Az Instinct MI300 bevezeti az Infinity Fabric 4.0-t, és ez már a redundáns memóriamásolásokat is eliminálja, tehát nemhogy nem kell direkten kezelni ezeket a programkódban, hanem konkrétan nem is történnek majd meg. A fejlesztés tokozására egyébként Zen 4 magokat CDNA 3 multiprocesszorokat használó lapkák kerülnek némi gyorsítótár, illetve HBM szabványú fedélzeti tár társaságában. Utóbbi lesz maga a rendszermemória, ami teljesen meg lesz osztva a feldolgozók között.

Az új felépítéssel az AMD szerint nyolcszoros előrelépés várható gépi tanulással kapcsolatos munkafolyamatokban az Instinct MI250X-hez viszonyítva.

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés