Az IBM és a DOE lerántja a leplet a világ leggyorsabb szuperszámítógépéről

A Kék Óriás és az Amerikai Egyesült Államok Energiaügyi Minisztériuma "parkolópályára" küldte a Sunway TaihuLight-ot.

Hirdetés

Évtizedekkel ezelőtt az Amerikai Egyesült Államok úttörő szerepet vállalt a szuperszámítógépek fejlesztésében, az utóbbi időben azonban a legerősebb rendszerek Kína mélyén teljesítettek szolgálatot. Ez a trend most változni látszik; az IBM és az Amerikai Egyesült Államok Energiaügyi Minisztériumának fennhatósága alá tartozó Oak Ridge National Laboratory (ORNL) bemutatja legújabb szuperszámítógépüket, a Summitot, másik nevén az OLCF-4-et, melynek teoretikus csúcsteljesítménye 200 PFLOPS. A korábbi amerikai rekordot a Jaguarból továbbfejlesztett Titan tartotta 27 PFLOPS-szal, ami az első GPU-alapú szuperszámítógép volt a 10 PFLOPS feletti tartományban. A napnál is világosabb, hogy a Summit nem csupán nagyságrendekkel nagyobb számítási kapacitás birtokában van, mint a korábbi jenki rekorder, de a világ jelenlegi összes többi nagygépét is kenterbe veri, beleértve a 125 PFLOPS-ra képes kínai Sunway TaihuLight-ot is. A fejlesztőmérnökök azonban nem érték be ennyivel; a rendszer eddig soha nem látott mértékben támogatja a gépi tanulást, így a mesterséges intelligenciával (AI) kapcsolatos feladatok elvégzését.


[+]

Az ORNL az elmúlt néhány évet az új platform összebarkácsolásával töltötte, mert a struktúra elképesztően komplex; 4 608 darab számításokat végző szerverből (node) áll, amelyekbe egyenként két darab, 22 magos, 14 nm-es csíkszélességen készülő IBM Power9 CPU és hat darab, Volta architektúrára épülő NVIDIA Tesla V100 GPU került elhelyezésre, mely GPU-k rendelkeznek a gépi tanulás szempontjából fontos, dedikált tensor magokkal is. Összesítve az alaprendszer specifikációit, 202 752 processzormagot és 27 648 különálló GPU-t számolhatunk össze, amihez több, mint 10 PB RAM és 250 PB tárhely társul. A CPU-k és GPU-k NVLinkkel kapcsolódnak egymáshoz, így alakul ki heterogén számítási környezet, a node-ok között pedig 25 GB/s sebességű adatátvitel valósul meg a kétsínes Mellanox EDR InfiniBand révén. A számítási kapacitás nagy részét egyébként a gyorsítók adják, de ez ma már nem tekinthető egyedinek.

Egy node belseje.
Egy node belseje. [+]

A mesterséges intelligencia támogatásával felvértezett hardver a kutatók számára lehetővé teszi a neurális hálózatokkal és a masszív adatcsomagokkal történő hatékony munkát – az IBM és az ORNL számít is a tudósok sorban állására a gépidőért. Az oak ridge-i labor munkatársai halkan hozzáteszik, hogy a Summit már most teljesen be van táblázva és a leendő munkamenetbe egyebek mellett beletartozik a rákkutatás, a fúziós energia titkainak feltárása, vagy éppen a függőségek kezelésének biokémiai vizsgálata.

Az Energiaügyi Minisztérium időközben dolgozik a Summit kisebbik testvérén, a Sierrán is. Ez a rendszer "csupán" négy Tesla V100-at fog használni node-onként, maximális számítási kapacitása pedig 125 PFLOPS környékén alakul majd, és várhatóan még idén üzembe helyezik a Lawrence Livermore National Laboratory épületegyüttesében.

  • Kapcsolódó cégek:
  • IBM

Azóta történt

Előzmények

Hirdetés