Visszatért a Volta az NVIDIA útitervébe

Írta: Abu85
Forrás: PROHARDVER!
2015-03-18 12:00

A jelenleg is zajló GTC-n az NVIDIA nem csak a GeForce GTX Titan X-et mutatta be, hanem a legfrissebb útitervvel is előálltak. Ez nagyon érdekes volt ugyanis újra előkerült a Volta architektúra. Erről egy évvel korábban már megírtuk, hogy létezik még maga a projekt, csak a tervezett megjelenést pár évvel csúsztatták, de 2018-ban elvileg elérhetővé válik.

Természetesen idén a Pascal architektúra kapott fókuszt, amelyet az NVIDIA az elmúlt évben már leleplezett, de most több adat is kiderült róla. Az NVLink már nem újdonság, hiszen a linkelt hírben le van írva a lényeg, így erről a vállalat sem beszélt túl sokat. Annyit megtudtunk, hogy az IBM mutat érdeklődést iránta, így nem véletlen, hogy az NVIDIA a következő generációs fejlesztéseit az IBM Power8 processzorarchitektúrájához optimalizálja. Persze a Pascal architektúrára épülő fejlesztések más processzor mellett is feltűnhetnek, de NVLink nélkül, azaz a hagyományos PCI Express interfészt használva.

A stacked DRAM sem tekinthető új információnak, hiszen erről a vállalat már a múlt évben is beszélt. Az viszont új adat, hogy az NVIDIA a Hynix HBM memóriáját választotta ki, így erre épül majd a Pascal architektúrára alapozó GPU. A fedélzeti tár kapacitása egyébként 32 GB is lehet.

A Pascal architektúra esetében alapvetően új információnak számít a vegyes pontosság. Az NVIDIA azt nem véletlenül hozta fel, mivel az egész GTC a deep learningről szólt, vagyis ennek az irányzatnak a növekedési potenciáljáról, és a vállalat a Pascal architektúrát minden elemében erre a területre tervezi. Mint ismeretes a deep learning, vagyis a gépi tanulás a mesterséges intelligencia egyik ágának tekinthető. Alapvetően egy olyan koncepcióról van szó, ahol a számítógépek különböző előre megadott adatok és viselkedésminták alapján képes önállóan, vagy eleinte némi külső segítséggel felismerni bizonyos szabályrendszereket, amelyeket aztán megjegyez és reagál rájuk. Lényegében a számítógép tanításáról van szó, hogy aztán a rendszer egyes mintákra adott reakciója lehetőség szerint mindig optimális legyen.

A deep learning területének egyik sajátossága, hogy szükségszerűen nem igényel pontos adatfeldolgozást, így a vegyes pontosság nagyobb szerepet kap. Alapvetően itt arról van szó, hogy az NVIDIA a Pascal architektúrát nem a 32 bites lebegőpontos feldolgozáshoz optimalizálja, hanem a 16 bites lebegőpontoshoz és a 8 bites fixpontoshoz. Ez meglátszik majd a multiprocesszorok belső felépítésében is, hiszen az a cél, hogy a Pascal alapjaira épülő GPU minél energiahatékonyabb legyen a vegyes pontossággal, ezzel csökkentve a deep learningre tervezett szuperszámítógépek fogyasztását amellett, hogy a teljesítményük nő.

Mint ismeretes a Maxwell architektúrát az NVIDIA 32 bites lebegőpontos feldolgozáshoz optimalizálta, de a Tegra X1 SoC már egy olyan revíziót kapott, amelyen belül egy CUDA mag lebegőpontos skalárfeldolgozója képes kétkomponenses vektoroperációra, így egy órajel alatt elvégezhető két egymástól nem függő 16 bites lebegőpontos operáció. A Pascal architektúra az aktuális információink szerint még ennél is továbblép, így a CUDA magon belüli fixpontos skalárfeldolgozó is képes lesz két 16 bites lebegőpontos operációt futtatni, így az új CUDA mag egy órajel alatt összesen négy darab, egymástól nem függő 16 bites lebegőpontos operációra képes. Ezt egyébként két darab kétkomponenses vektoroperációval érné el a rendszer co-issue módban. A 8 bites fixpontos feldolgozás is hasonló előrelépést érne el, csak a CUDA mag fixpontos skalárfeldolgozója lenne képes négykomponenses 8 bites fixpontos vektoroperációra.

A fenti módosításokkal a Pascal architektúra négyszeres előnyt szerez a Maxwell architektúrához viszonyítva 16 bites lebegőpontos és 8 bites fixpontos feldolgozás mellett egy CUDA magra levetítve, ami tökéletes a deep learninghez. Az NVIDIA tízszeres előrelépést vár, amiről a vállalat persze kihangsúlyozta, hogy nagyon durva becslés, de a vegyes pontosság, a HBM memória, valamint az NVLink együttes hatása, illetve a célirányosan deep learningre kigyúrt működés hozhat ennyit.

Kapcsolódó cégek:
NVIDIA

Azóta történt

A Pascal lehet az NVIDIA első, VR-hez tervezett architektúrája

A finomszemcsés preempció a virtuális valóság egyik kritikus komponense, és ennek támogatásán dolgozik az NVIDIA.
Annyira késik az NVIDIA Volta, hogy igazából nem is késik

A vállalat legfrissebb útiterve nem mond ellent a januárinak, de persze ez nem lenne hír.
Az NVIDIA egyre többet árul el a Pascalról

A fejlesztés első körben a HPC-piacot célozza meg, és már megrendelések is vannak rá.
Az NVIDIA leleplezte a Tesla P100-at

A Pascal architektúrára épülő újdonság az év végén, illetve a következő év elején érkezik.

Előzmények

Bemutatkozott a GeForce GTX Titan X

Az újdonság a GM200-as GPU-ra épít, de elveszti a Titánok egyik sarkalatos képességét.
A Pascal architektúrában jön az NVIDIA egységes virtuális memóriája

A vállalat a rendszerét az IBM Power8 processzorarchitektúrájára optimalizálja.
Létezik még az NVIDIA Parker és Volta kódnevű fejlesztés

A készülő termékeket a vállalat nem törölte, csak az útiterv módosult egy picit.
Új technológiákkal érkezik az NVIDIA Pascal architektúrája

A vállalat a legnagyobb gondokat szeretné megoldani, így egy saját interfészt is kidolgoztak.