Kína saját gyorsítót tervez a Tianhe-2-be

Kína régóta magabiztosan áll a top500.org listájának az élén a Tianhe-2 nevű szuperszámítógéppel, ez azonban nem lesz mindig így, hiszen más is fejleszt, vagyis Kína sem lehet tétlen. Az már a Tianhe-2 bemutatásakor kiderült, hogy a rendszer bővíthető, és akkor tervezték is a modernizálást, méghozzá a Knights Landing kódnevű lapkával, amely gyakorlatilag egy érkező Xeon Phi lesz. Mára ezt a tervet teljesen elvetették, és frissítésnek tekinthető Tianhe-2A egy teljesen saját fejlesztésű gyorsítóra épül, amely a Matrix2000 nevet viseli.

Kína döntése mögött részben az áll, hogy a Tianhe-2 a gyakorlatban kihasználhatatlan. Nemrég írtunk is róla, hogy benne lévő Xeon Phi-k gyakorlatilag nem csinálnak semmit, így a gép számítási kapacitásának 85%-a nincs is befogva. A problémát az jelenti, hogy rendkívül nehéz a Xeon Phi-t programozni, ami nagyrészt az évtizedekkel korábban lerakott x86-os alapokra vezethető vissza. A programozók nagyon nehezen tudják kezelni a manuális többszálú feldolgozást, az előbetöltést, illetve a kevés regiszter is komoly gond. Mivel ezekre problémákra vonatkozóan nem várható reform a Knights Landing architektúrában, így a Xeon Phi gyorsítók eltűnnek Kína szuperszámítógépéből.

A Matrix2000 látszólag tökéletes utód lesz. Ezt Kína már jó ideje fejleszti, és az eddigi eredmények is elég jónak mondhatók. Maga a rendszer egy GPDSP, vagyis egy általános feldolgozásra tervezett digitális jelfeldolgozó processzor. Az utasításarchitektúra teljesen saját fejlesztésű, az architektúra pedig VLIW (Very Long Intruction Word) elvű, vagyis a függőségek kezelése a fordítóprogramra hárul, ami egyszerűsíti a hardvert, így pedig energiát lehet spórolni. A Matrix2000 fontos tulajdonsága, hogy a szálkezelése teljesen hardveres, vagyis ezzel ki lett ütve a Xeon Phi esetében felmerült egyik legnagyobb probléma, és ettől a programozók hatékonyabban dolgozhatnak.

A Matrix2000 GPDSP egy PCI Express 3.0-s interfészbe helyezhető kártya lesz 32-64 GB-nyi nagy sávszélességre képes memóriaalrendszerrel. Magán a lapkán a feldolgozók hat blokkba lesznek rendezve két I/O egység társaságában. Egy blokkban két csoportra osztva 16-16 feldolgozó lesz. Ezeken belül lesz egy skalár- és egy vektorprocesszor, illetve dedikált vektormemória pár speciális feldolgozó társaságában. A Matrix2000 1 GHz-en dolgozik, és ez Kína szerint dupla pontosság mellett 2,4, míg egyszeres pontosság esetén 4,8 TFLOPS-os számítási teljesítményt jelent. Mindehhez 200 wattos fogyasztás társul.

A frissítésnek tekinthető Tianhe-2A egy node-jában három Matrix2000 gyorsító lehet, így a kiegészítés után Kína szuperszámítógépének teljesítménye átlépheti a 100 PFLOPS-ot, és eközben a fogyasztása csak elhanyagolható mértékben nő. Persze szuperszámítógépes mércével, azaz megawattokban mérve.

A Matrix2000 gyorsító OpenMP 4.0-n keresztül lesz programozható, és erre Kína nagy hangsúlyt fektet. A legjobb eredmény érdekében a hardveres és a szoftveres csapat közösen dolgozik a problémák megoldásán, így a hardver és a szoftvercsomag, ideértve az operációs rendszert is egymáshoz lesz építve. Kína jelenleg 54000 darab Matrix2000 gyorsító beépítését tervezi a frissítéskor, ami azt is jelenti, hogy 18000 node-osra bővül a szuperszámítógépük. A processzor nem változik, így a bővítéshez szükséges majd 4000 Intel Xeon E5-2692 vásárlása is.

Úgy tudjuk, hogy Kína jelenleg a Matrix2000-re belső projektként tekint, de később nem zárkóznak el a termék más szuperszámítógépekbe való értékesítésétől sem.

Azóta történt

Előzmények

Hirdetés