Még idén megjelenik az Intel Xeon Phi

Az Intel a jelenleg is zajló International Supercomputing Conference alkalmával működés közben is bemutatta a Knights Corner kódnevű fejlesztést, melynek alapjai a megboldogult Larrabee-ig vezetnek vissza. Az Intel az egész projektet sok évvel korábban kezdte, majd a célegyenesben ki is pukkant az a bizonyos lufi. A Knights Ferry kódnevű fejlesztés ugyan létezik, de sosem került kereskedelmi forgalomba, így lényegében csak a kiválasztott partnerek kaphattak belőle. Andrew Richards korábban még azt is elemezte, hogy mi okozta a projekt vesztét, amiről természetesen mi is beszámoltunk.

Az Intel természetesen okult a begyűjtött tapasztalatokból, és több szempontból is változtattak a projekten. A rossz emlékű Larrabee nevet eldobták, és helyette a MIC került elő. Az új verziójú lapka a Knights Corner kódnevet kapta, és komoly változás, hogy az Intel erre már úgy gondolt, mint egy HPC szerverekbe szánt gyorsítókártya, vagy jobban mondva koprocesszor, ami azt is jelentette, hogy hagyományos VGA-ként nem is számolnak többet a rendszerrel.

A Knights Corner alapvető felépítése sokban nem különbözik a Knights Ferry-től. Az alapokat tekintve továbbra is x86 architektúrára épülő processzormagok sokaságáról van szó, a lebegőpontos feldolgozásért pedig széles 512 bites vektoros egység felel. A legfontosabb újítás, hogy a rendszer rengeteg új utasítást kap, mely javíthatja a hatékonyságot. A 22 nm-es gyártástechnológián készülő lapkán pontosan 64 darab mag található. Az Intel hivatalosan annyit mond, hogy a végleges terméken 50-nél több mag lesz, de mind biztosan nem lesz aktív. A processzormagok egyébként támogatják a Hyper-Threading technológiát, ezen belül is magonként négy szál kezelése biztosított. A gyorsítótárak szervezéséről egyelőre nincs adat, de később valószínűleg kiderül, hogy az Intel miképp alakította át a Knights Ferry legproblémásabb részét. A PCI Express interfészbe helyezhető kártya 8 GB GDDR5 szabványú memóriát kap, az ECC támogatásáról azonban még hallgat a vállalat.

Intel Xeon Phi
Intel Xeon Phi [+]

Az Intel mindig is arra tért ki a Knights Corner előnyeinek ecsetelésénél, hogy az x86-ra fordított alkalmazások némi módosítás és újrafordítás után futtathatók a Knights Corneren, ami jelentős anyagi megtakarítás lehet a megrendelők számára. Az NVIDIA és az AMD elképzelésével a szoftvereket komolyan módosítani kell, vagy rossz esetben a kódbázis jelentős részét újra kell írni. Az Intel technikailag nem mond semmi rosszat azzal, hogy a programok újrafordíthatók, ugyanis ez technikailag lehetséges, és biztosan futni fog a Knights Corneren. Az egyetlen kérdés, hogy mennyire hatékonyan. A Knights Corner ugyanis egy gyorsítókártya, vagyis hasonló a célja, mint az NVIDIA Tesla és az AMD FireStream termékeknek, sokkal egyszerűbben tehát nem lehet majd programozni.

A legfontosabb meglátni, hogy a fejlesztések erősen az energiahatékonyság növelése felé tartanak. A rendszerek nem homogén, hanem heterogén módon programozhatók. A gyorsítókártyák ellátják az adatpárhuzamos feladatokat, míg a komplex felépítésű központi processzormagok egy szálon biztosítanak nagy teljesítményt. A programozás tehát nem könnyű, hiszen el kell dönteni, hogy mi fusson a késleltetésre optimalizált magokon, és mely kódrészek legyenek úgymond gyorsítva. Lényegében a Knights Corner is egy gyorsításért felelős koprocesszor. Bár az igaz, hogy az Intel nem éppen a hagyományos értelemben közelítette meg a kérdést, hiszen visszanyúltak 90-es években hódító Pentium dizájnjáig és azt alakították át, de a rendszer alapvetően széles vektorfeldolgozót kapott, vagyis megfelelő lehet a FLOPS/watt mutatója. Mindaz viszont, hogy a rendszer x86 architektúrára épül, még nem jelenti azt, hogy bármilyen eddig megírt MPI, illetve OpenMP kód hatékonyan képes futni a Knights Corneren.

Az MPI kódok futtatása erős korlátokba ütközhet a memória oldaláról. A Knights Corner 8 GB memóriát kap, de ez több mint 50 mag igényeit szolgálja ki, ami magokra levetítve nem túl nagy kapacitást eredményez. Az biztos, hogy 1-2 GB-nál kevesebb jut egy-egy processzormagnak, márpedig a HPC-n futtatott alkalmazások ennyit általában igényelnek. Emellett, ha az MPI folyamatok túllépik a magok számát, akkor az alkalmazásnak használnia kell a hálózati interfészt, hogy kommunikáljon a többi node-on futó MPI folyamatokkal. Ez túlterhelheti a rendelkezésre álló sávszélességet, ami egyáltalán nem kívánt tényező. Az OpenMP kódok futtatása sem sokkal kedvezőbb. Tény, hogy kevesebb szál fog kommunikálni a hálózati interfészen keresztül, ami kisebb terhelést jelent, de az OpenMP-t használó HPC-n futó programok jellemzően nem skálázódnak tovább 4-8 feladatnál, mivel kevesebb maggal rendelkező processzorokra írták őket, és így nyilván nehéz lesz 50-nél is több magot etetni.

Bár az Intel sosem állította azt, hogy az alkalmazások módosítása nélkül tökéletes lesz a Knights Corner, de a fentiekből látszik, hogy nem elég csak kicsit módosítani a kódon. Az újrafordítás önmagában, vagy kis módosításokkal funkcionálisan futtatható programot ad, de a legtöbb alkalmazás esetében a hatékonyság nagyon messze lesz az ideális szinttől. A jó hatásfokú párhuzamosítás tehát a gyorsítókártyáknál kemény munkával érhető el, és nem elég néhány sort elhelyezni a kódban, amivel kijelölésre kerülnek a párhuzamosan futtatható részek.

Az Intel egyébként rendelkezik már egy Knights Cornerek erejére építő szuperszámítógéppel, mely a Discovery névre hallgat. A rendszer adataiból kikalkulálható, hogy a Linpack hozama 65% körül van, ami az aktuális gyorsítókártyák 50%-os eredményéhez képest nagyon jónak tekinthető, noha a processzorok 75-95%-os értékeitől elmarad. A GK110-es Kepler architektúrára épülő lapka esetében ez a paraméter még nem tudható, de a GPUDirect funkció nyilván segíthet a rendszer hatékonyságának növelésében.

A Knights Corner hivatalos Xeon Phi néven kerül piacra. Az Intel a startot a negyedik negyedévre tervezi, ami tarthatónak tűnik. Ez abból a szempontból izgalmasnak ígérkezik, hogy az NVIDIA is ekkorra ígéri a Tesla K20 bemutatását. Természetesen készülnek az új MIC verziók is, melyek az eddig kiszivárgott információk szerint a Knights Landing és Knights Hill kódnevet viselik, emellett a 2015-ben esedékes a Skylake APU, mely már integrálva tartalmazhatja a rendszert.

  • Kapcsolódó cégek:
  • Intel

Azóta történt

Előzmények

Hirdetés