Új technológiákkal érkezik az NVIDIA Pascal architektúrája

A jelenleg is zajló GTC rendezvény első komoly bejelentése az NVIDIA Pascal architektúrája volt, mely lényegében a Maxwell generációt leváltó termékcsalád, és a jelenlegi rendszerek szűk keresztmetszeteinek megoldására fókuszál.

A vállalat lényegében elmondta, amit manapság igen sok cég megtesz a GPGPU-val kapcsolatban. A dedikált hardver problémákkal küzd, mivel a fizikai összeköttetés tekintetében túl messze van a processzortól, illetve a kommunikációra szolgáló busz túl lassú. Jelenleg a PCI Express 3.0-s interfész sávonként 1 GB/s-os teljesítményt kínál, ami az elérhető legjobb csatoló esetén 16 GB/s-os tempóban tetőzik. Ez önmagában a CUDA 6-nak is egy óriási problémája, hiszen a platform bevezeti az egységes memóriakezelést, de ez elsődlegesen csak látszat, mivel a CPU és a GPU továbbra is két különálló fizikai memóriával rendelkezik, viszont a programozónak az adatmásolások manuális elvégzésével már nem kell törődnie. Ugyanakkor maguk a másolások ettől függetlenül még megtörténnek, tehát a sebesség nem javul, csupán a szoftver egyszerűbbé teszi a programozást.

Hirdetés

Az NVIDIA számára két koncepció létezik. Egyrészt nyilván követik amerre a piac megy, hiszen mindenki integrál, az IGP-ket a CPU utasításarchitektúrájához tervezik, és a zöldek számára is ott az ARMv8 licenc, ami természetesen bevethető az új generációs GPU-khoz is. Ez a Tegra esetében egy rendkívül életképes koncepció, hiszen eleve egy lapkában van a CPU és az IGP, illetve hardveresen is megoldható az egységes virtuális memória támogatása, ami nyilvánvalóan jobb a CUDA 6 szoftveres megoldásánál. Ugyanakkor a szuperszámítógépeknél talán nem árt egy alternatíva, így az NVIDIA az IBM közreműködésével kidolgozta az NVLink interfészt, ami a PCI Express összeköttetést nem váltja teljesen fel, de extra buszokat kínál a lapkák összekötésére, így a processzorral való kommunikáció tempója a fizikailag bekötött NVLinkek számától függően 80 és 200 GB/s között lehet.

Lényeges szempont, hogy az NVLink működéséhez be kell építeni a szükséges vezérlőt az adott processzorba is. Tekintve, hogy a fejlesztés egy részéért az IBM felelt, így valószínű, hogy az új generációs Power processzorok ezt a koncepciót támogatni fogják.

Az NVIDIA Pascal modul koncepciója
Az NVIDIA Pascal modul koncepciója

Az NVLink többféleképpen használható. Elsődlegesen az NVIDIA úgynevezett Pascal modulokban gondolkodik, melyeken az interfészek számára ki lesz alapítva a megfelelő összeköttetés. Ugyanakkor a rendszer működhet alaplapra integrálva is, és a legkisebb késleltetés elérése érdekében talán ez lesz a kedveltebb koncepció a szervergyártók körében. Az NVLink egyébként az egyes GPU-k összekötésére is alkalmas.

A Pascal másik érdekessége még, hogy kiváltja az előző évben leleplezett Volta nevű projektet, így ez lesz az első NVIDIA termék, amely bevezeti a stacked DRAM-ot. A koncepció annyira nem tekinthető újdonságnak. Gyakorlatilag a teljes iparág összes chipfejlesztője ezzel kísérletezik, lassan már évek óta. Az NVIDIA 2.5D interposer mellett implementálja, de ilyen komplexitás és fogyasztási karakterisztika esetén ez teljesen normális, ezt a konkurensek is így fogják megoldani. Azt viszont még nem tudni, hogy melyik memóriagyártó mellett törnek lándzsát. Jelenleg két reálisan bevethető opció létezik HMC és HMB néven. Előbbire a Samsung és a Micron kínál majd megoldást, míg utóbbira a Hynix. Az eddig ismert technikai paraméterek szempontjából a HMC lassabb, de kevesebbet fogyaszt, míg a HMB gyorsabb, de nagyobb az energiaigénye is.

Az NVIDIA friss útitervén a Pascal a 2016-os esztendőben szerepel, így a tényleges elérhetőségre még legalább két évet várni kell.

Azóta történt

Előzmények

Hirdetés