A jelenleg is zajló GTC rendezvény első komoly bejelentése az NVIDIA Pascal architektúrája volt, mely lényegében a Maxwell generációt leváltó termékcsalád, és a jelenlegi rendszerek szűk keresztmetszeteinek megoldására fókuszál.
A vállalat lényegében elmondta, amit manapság igen sok cég megtesz a GPGPU-val kapcsolatban. A dedikált hardver problémákkal küzd, mivel a fizikai összeköttetés tekintetében túl messze van a processzortól, illetve a kommunikációra szolgáló busz túl lassú. Jelenleg a PCI Express 3.0-s interfész sávonként 1 GB/s-os teljesítményt kínál, ami az elérhető legjobb csatoló esetén 16 GB/s-os tempóban tetőzik. Ez önmagában a CUDA 6-nak is egy óriási problémája, hiszen a platform bevezeti az egységes memóriakezelést, de ez elsődlegesen csak látszat, mivel a CPU és a GPU továbbra is két különálló fizikai memóriával rendelkezik, viszont a programozónak az adatmásolások manuális elvégzésével már nem kell törődnie. Ugyanakkor maguk a másolások ettől függetlenül még megtörténnek, tehát a sebesség nem javul, csupán a szoftver egyszerűbbé teszi a programozást.
Az NVIDIA számára két koncepció létezik. Egyrészt nyilván követik amerre a piac megy, hiszen mindenki integrál, az IGP-ket a CPU utasításarchitektúrájához tervezik, és a zöldek számára is ott az ARMv8 licenc, ami természetesen bevethető az új generációs GPU-khoz is. Ez a Tegra esetében egy rendkívül életképes koncepció, hiszen eleve egy lapkában van a CPU és az IGP, illetve hardveresen is megoldható az egységes virtuális memória támogatása, ami nyilvánvalóan jobb a CUDA 6 szoftveres megoldásánál. Ugyanakkor a szuperszámítógépeknél talán nem árt egy alternatíva, így az NVIDIA az IBM közreműködésével kidolgozta az NVLink interfészt, ami a PCI Express összeköttetést nem váltja teljesen fel, de extra buszokat kínál a lapkák összekötésére, így a processzorral való kommunikáció tempója a fizikailag bekötött NVLinkek számától függően 80 és 200 GB/s között lehet.
Lényeges szempont, hogy az NVLink működéséhez be kell építeni a szükséges vezérlőt az adott processzorba is. Tekintve, hogy a fejlesztés egy részéért az IBM felelt, így valószínű, hogy az új generációs Power processzorok ezt a koncepciót támogatni fogják.
Az NVIDIA Pascal modul koncepciója
Az NVLink többféleképpen használható. Elsődlegesen az NVIDIA úgynevezett Pascal modulokban gondolkodik, melyeken az interfészek számára ki lesz alapítva a megfelelő összeköttetés. Ugyanakkor a rendszer működhet alaplapra integrálva is, és a legkisebb késleltetés elérése érdekében talán ez lesz a kedveltebb koncepció a szervergyártók körében. Az NVLink egyébként az egyes GPU-k összekötésére is alkalmas.
A Pascal másik érdekessége még, hogy kiváltja az előző évben leleplezett Volta nevű projektet, így ez lesz az első NVIDIA termék, amely bevezeti a stacked DRAM-ot. A koncepció annyira nem tekinthető újdonságnak. Gyakorlatilag a teljes iparág összes chipfejlesztője ezzel kísérletezik, lassan már évek óta. Az NVIDIA 2.5D interposer mellett implementálja, de ilyen komplexitás és fogyasztási karakterisztika esetén ez teljesen normális, ezt a konkurensek is így fogják megoldani. Azt viszont még nem tudni, hogy melyik memóriagyártó mellett törnek lándzsát. Jelenleg két reálisan bevethető opció létezik HMC és HMB néven. Előbbire a Samsung és a Micron kínál majd megoldást, míg utóbbira a Hynix. Az eddig ismert technikai paraméterek szempontjából a HMC lassabb, de kevesebbet fogyaszt, míg a HMB gyorsabb, de nagyobb az energiaigénye is.
Az NVIDIA friss útitervén a Pascal a 2016-os esztendőben szerepel, így a tényleges elérhetőségre még legalább két évet várni kell.