Újra a zöld csúcsra lövi magát a PEZY Computing

A PEZY-SC2 jelzésű gyorsító ott folytatja ahol az előd abbahagyta, csak éppen jobb hatékonysággal.

A PEZY Computing a 2014-es esztendőben üstökösként tűnt fel a gyorsítók piacán, ugyanis a PEZY-SC jelzésű fejlesztésük a viszonylag limitált erőforrások ellenére is nagyon jó helyezést ért el a zöld szuperszámítógépek akkori toplistájában. Azóta csak javult a helyzet, hiszen a szoftveres alapok fejlődtek, de három év alatt a konkurensek is javultak, így az eredeti PEZY-SC ma már nem számít kiemelkedő hardvernek. Gond azonban nincs ugyanis már kész a PEZY-SC2, ami alaposan túltesz az elődön, hála a megduplázott magszámnak, de ennél jóval több változás történt.

Hirdetés

A PEZY-SC2 legnagyobb újítása, hogy eldobja a prefektúra névvel illetett felépítést, vagyis a feldolgozást végző elemek mostantól nincsenek nagy, egymástól elkülönülő blokkokra osztva. Ehelyett megjelenik a 40 MB-os utolsó szintű gyorsítótár, amelyekhez kapcsolódnak az úgynevezett városok. Mindegyik város rendelkezik saját L2 adatgyorsítótárral és utasítás-gyorsítótárral, valamint egy speciális végrehajtóval és négy darab úgynevezett faluval. A falukon belül található négy darab feldolgozó, amelyek két blokkba vannak rendezve, így két-két feldolgozóhoz tartozik egy-egy L1 adatgyorsítótár.


[+]

A nyolc hardveres szálat futtató feldolgozókon belül két fixpontos és két lebegőpontos végrehajtó található. Ezek dupla pontosság mellett összedolgoznak, így az elméleti számítási teljesítmény ebben a módban a felére esik. Újítás viszont a felezett pontosság támogatása, ami a rendszer a gépi tanulás piacát célozza. A 700 MHz-es órajelen üzemelő PEZY-SC2 esetében az elméleti számítási teljesítmény szimpla pontosság esetén 5,73 TFLOPS lenne, de az aktuálisan szállított modellnél 16 darab úgynevezett falu le van tiltva, így az elméleti tempó 5,56 TFLOPS-ra csökken.

A memóriabusz is változott, ugyanis az előd nyolc darab 64 bites DDR4-es csatornáját felváltotta egy kevert megoldás, amely négy darab 64 bites DDR4-es összeköttetést és négy darab egyedi TCI-3D-s wide-IO kapcsolatot kínál. Előbbi esetben 25,6 GB/s-os, míg utóbbinál 0,5 TB/s-os memória-sávszélesség biztosítható, természetesen csatornánként számolva. A lehetőségek következtében a memóriakonfiguráció igen változékony lehet. Végeredményben a 2 TB/s-os összteljesítményű TCI-3D DRAM-tól, a nagy kapacitást kínáló, de csupán 102,6 GB/s-os DDR4-es opcióig bármi használható, akár a kettő keveréke is. Ezzel nyilván a PEZY Computing majd élni fog a jövőben, egyelőre azonban a nagy teljesítményű wide-IO konstrukciót favorizálják az aktuális modellen.

A gyorsító vezérlését továbbra is külön processzormagok látják el, de a korábbi ARM926-os duót felváltja nyolc darab MIPS64 P6600-as mag. Ezekkel a rendszer akár önállóan is üzemképes lehet, de az aktuális verzió PCI Express 3.0-s csatolóba helyezhető, így ennek szüksége van külön host processzorra is.

A PEZY-SC2 immáron 16 nm-es node-on készül, de a kiterjedése így is óriási, konkrétan 620 mm². Ugyanakkor az alacsony órajelnek, és a kifejezetten jól átgondolt dizájnnak hála a hatékonysága ~15 GFLOPS/watt. Ráadásul ez gyakorlatban mért értékekből származik, és egy igen nagy konfigurációt tekintve is megközelíti a rendszer ezt a paramétert, amivel úgy néz ki, hogy a Green500.org új listájának az élén fog landolni a PEZY-SC2-ket alkalmazó ZettaScaler-2.2-es szuperszámítógép.

Azóta történt

Előzmények

Hirdetés