Az NVIDIA lát fantáziát a HPC-specifikus lapkákban?

Az NVIDIA az elmúlt héten viszonylag sokat beszélt a Pascalról, amelyről természetesen be is számoltunk. Az már biztosnak tűnik, hogy az új csúcslapkára két Tesla gyorsító érkezik, és ezek közül az egyiken egy, míg a másikon két darab Pascal architektúrára épülő lapka lesz található.

Az is kiderült, hogy a vállalat 4 TFLOPS-os dupla pontosság melletti teljesítményt szeretne elérni, amelyre az eddigi adatok szerint a két lapkával felvértezett Tesla modell lesz képes. Persze a fókuszt elsődlegesen a felezett pontosság jelenti, mivel leginkább ez szükséges a gépi tanuláshoz.

Hirdetés

Természetesen azokon a rendezvényeken, ahol ennyire fontos téma a HPC-piac, még a bejelentések hiánya sem akadályozza meg az egyes pletykákat. Ezzel kapcsolatban megtudtuk, hogy az NVIDIA az aktuálisan elérhető Tesla K80-as fejlesztést valójában egy próbának szánta. Mint ismeretes, ehhez a termékhez a vállalat fejlesztett egy GK210-es lapkát, amely elsődlegesen arról híres, hogy a Kepler architektúra módosítására épül, ezen belül is az SMX modulokon belül dupla annyi regiszterterület és L1 gyorsítótár található, illetve dupla olyan gyors utóbbi elérése is.

Kevésbé ismeretes tény, hogy a GK210-ből az alapként szolgáló GK110-hez viszonyítva hiányoznak a setup motorok, illetve a különböző multimédiás fixfunkciós blokkok. Utóbbi egységeket nyilván nagyon egyszerű kiműteni a rendszerből, de a főbb komponenseket már nem. És itt jön elő a GK210 lényege. Az NVIDIA akart némi tapasztalatot arról, hogy hogyan tudnának olyan moduláris dizájnokat tervezni, ahol a multiprocesszorokból és tulajdonképpen az egész lapkából könnyen ki lehet szedni a HPC-piac szempontjából szükségtelen komponenseket. Ezek eltávolításával ugyanis rengeteg tranzisztort lehet megspórolni, amelyeket el lehet költeni például a regiszterterület és a gyorsítótárak növelésére, vagy például az olyan vezérlők beépítésére, amelyek szükségesek az NVLINK működéséhez.

Az SC15-ös pletykák szerint a Pascal architektúra tervezésénél a GK210-nél gyűjtött tapasztalatokra építve a moduláris dizájn fontos szerepet játszott, így nem véletlen az, hogy az új csúcslapkára Tesla gyorsítók érkeznek. Ezekből ugyanis valószínűleg hiányzik minden olyan elem, amely szükséges például a 3D-s grafikához, de egyáltalán nem fontos a HPC-piacon. Cserébe az utóbbi területre tervezett Pascal dizájnok több regiszterrel és gyorsítótárral rendelkezhetnek a felesleges komponensek által megspórolt tranzisztorok hatékonyabb felhasználásával. Úgy néz ki, hogy ez az egyetlen módja annak, hogy a HPC-piacra tervezett lapkák a korábbiaknál lényegesen hatékonyabbak legyenek, így bármennyire is fájó a megcélzott területeket már a tervezés során szétszakítani, a jövő szuperszámítógépei ebből sokat profitálhatnak.

A moduláris dizájn természetesen alkalmas arra, hogy ugyanazt az architektúrát, más tervezésű multiprocesszorokkal be lehessen vetni ott, ahol a grafikai igények szempontjából fontosak a HPC-piacra tervezett lapkából kiműtött komponensek.

Az aktuális pletykák alapján valószínű, hogy a Pascal architektúra szempontjából a csúcslapkát az NVIDIA már a tervezésnél is a HPC-piachoz igazította, így csak a Tesla modellekben kap majd helyet, míg a kisebb lapkák elérhetők lesznek a Tesla, Quadro és GeForce vonalon is. A fő különbség a grafika és a multimédia szempontjából fontos részegységek hiánya, illetve elérhetősége lesz. Többek között valószínű, hogy NVLINK-et csak a csúcslapka kap, mivel ezt úgy sem lehetne a PC-ben használni, tehát az ide szánt lapkákba egy sok tranzisztort igénylő vezérlőblokkot beépíteni teljesen felesleges.

Mindezek mellett az alapvető termékskála biztosítása után a csúcslapkából készíthető grafikára optimalizált dizájn is a kisebb lapkában bevetett multiprocesszorokból. Ez persze sok időbe telik, de úgy néz ki, hogy az aktuális piaci viszonyok mellett ez a tervezési irány tűnik kifizetődőnek, mivel a kritikus területeket célzott megoldásokkal lehet támadni.

Azóta történt

Előzmények

Hirdetés