Nem gyorsítókártya lesz az új Xeon Phi

Az Intel Larrabee és később MIC kódnéven futó fejlesztését már sokszor eltemették, és legalább ennyiszer ki is ásták, mivel a vállalat nem akar eltávolodni a lassan 10 éve megálmodott jövőképétől. A koncepció sok áldozatot követelt, hiszen amellett, hogy rengeteg pénz áll benne, elfogyasztotta már a világ legjobb mérnökeit és szoftverfejlesztőit (John Gustafson, Michael Abrash, illetve Andrew Richards) is. A vezetőség bizalma azonban töretlen, holott más cég ennyi eredménytelen év után már rég kidobta volna az egész tervet.

Az első kereskedelmi terméknek a Knights Corner kódnevű gyorsítókártya számított, mely Xeon Phi néven egy évvel korábban mutatkozott be. Ezen a rendszeren látszottak még a Larrabee projekt hagyatékai, hiszen fizikailag még mindig ott volt a lapkában számos fixfunkciós textúrázó, de ezek már nem tettek semmit, hiszen az Intel a Larrabee formális kivégzésével letett a VGA-piac megtámadásáról. A Xeon Phi gyorsítókártyák legnagyobb előnye, hogy nagyságrendekkel olcsóbbak, mint az NVIDIA Tesla megoldásai. Sajnos konkrét összevetés a teljesítményre vonatkozóan nem született. Csupán egyetlen teszt került fel az internetre a Xeon Phi tempójáról, amiből nehéz lényegi következtetést levonni.

A legfőbb visszajelzésekre természetesen az Intel folyamatosan reagált, így az év közepére elkészült az OpenCL fejlesztőkörnyezet a Knights Corner kódnevű lapkához is, amivel a fejlesztők kihasználhatták a hardverben rejlő lényeges tartalékokat. Bár az Intel elsősorban úgy hirdeti a rendszert, hogy a magas szintű programozási nyelveken is lehet benne dolgozni, ettől azonban nem lehetett komoly hatékonyságot várni, ugyanis az algoritmust mindenképp a Knights Corner képességeihez kellett igazítani. Ez azt jelenti, hogy a problémát olyan kicsi szeletekre kell bontani, hogy az egyes feladatok feldolgozása megoldható legyen a magokhoz rendelt dedikált L2 gyorsítótárakon belül. Erre messze az OpenCL programozási modellje a legalkalmasabb.

Természetesen a hardver kihasználását sok szempontból befolyásolja a programozás. A MIC architektúra esetén számolni kell azzal, hogy a túl sok szinkronizáció miatt a szükségesnél több magot nem érdemes használni. Ez lényegesen eltér a hagyományos GPGPU-s felfogásnál megszokott feldolgozástól, mivel érdemes optimális gyorsulásra törekedni, azaz egy bizonyos szint után már nem éri meg több erőforrást befogni. Az optimalizálással kapcsolatban az alábbi cikk bővebb tájékoztatást kínál.

A Xeon Phi azonban az ismert formájában eltűnik. Az új koncepció tulajdonképpen nem is tekinthető hagyományos értelemben gyorsítónak, hiszen kap egy tokozást az alaplapon, azaz a 14 nm-es gyártástechnológiával készülő Knights Landing inkább tekinthető homogén többmagos processzornak. Az Intel ezzel a lépéssel a PCI Express 3.0-s interfész igen korlátozó hatásait próbálja megszüntetni, mivel ez a csatoló nem csak magas késleltetést, hanem lassú adatátviteli tempót is jelent. Sajnos a lapkán belüli részletekről nem sok adat derült ki. Az biztos, hogy új processzorarchitektúráról van szó, aminek a célja az volt, hogy közelebb kerüljön a rendszer a normál processzorokban fellelhető aktuális magok architektúrájához. Ezzel az LNI helyét átveszi az 512 bites AVX (vélhetőleg AVX3) utasításkészlet.

A magok száma szintén kérdés, ám ennél mindenképp lényegesebb, hogy a lapka mellé tokozott memória kerül. Ezzel a módszerrel a Knights Landingben található gyorsítótárak és a DDR4-es rendszermemória között még lesz egy kisebb kapacitású, de gyorsabban elérhető köztes memória, ami gyorsítótárként funkcionál. Ez a MIC architektúra esetében nagyon fontos, ugyanis a rendszer a hagyományos gyorsítókkal ellentétben nagyon érzékeny a késleltetésre, mivel relatíve kevés szállal dolgozik. Mindemellett a gyorsabban elérhető memória hatékonyabb programozást tesz lehetővé, mivel nem kell annyira ügyelni arra, hogy az adott munkafolyamat lehetőleg sose igényeljen olyan adatot, ami nincs benne az adott maghoz kapcsolódó L2 gyorsítótárban.

A Knights Landing kódnevű fejlesztés megjelenése egyelőre kérdéses. Leghamarabb a következő év végén kerülhet rá sor, de ez eléggé optimista becslés, így a realista szemlélet szerint inkább 2015-ben épülhet az újdonságra termék. Természetesen az Intel most is a HPC szerverek piacát célozza meg.

  • Kapcsolódó cégek:
  • Intel

Azóta történt

Előzmények

Hirdetés