Hirdetés

Visszatért a Volta az NVIDIA útitervébe

A jelenleg is zajló GTC-n az NVIDIA nem csak a GeForce GTX Titan X-et mutatta be, hanem a legfrissebb útitervvel is előálltak. Ez nagyon érdekes volt ugyanis újra előkerült a Volta architektúra. Erről egy évvel korábban már megírtuk, hogy létezik még maga a projekt, csak a tervezett megjelenést pár évvel csúsztatták, de 2018-ban elvileg elérhetővé válik.

Természetesen idén a Pascal architektúra kapott fókuszt, amelyet az NVIDIA az elmúlt évben már leleplezett, de most több adat is kiderült róla. Az NVLink már nem újdonság, hiszen a linkelt hírben le van írva a lényeg, így erről a vállalat sem beszélt túl sokat. Annyit megtudtunk, hogy az IBM mutat érdeklődést iránta, így nem véletlen, hogy az NVIDIA a következő generációs fejlesztéseit az IBM Power8 processzorarchitektúrájához optimalizálja. Persze a Pascal architektúrára épülő fejlesztések más processzor mellett is feltűnhetnek, de NVLink nélkül, azaz a hagyományos PCI Express interfészt használva.

A stacked DRAM sem tekinthető új információnak, hiszen erről a vállalat már a múlt évben is beszélt. Az viszont új adat, hogy az NVIDIA a Hynix HBM memóriáját választotta ki, így erre épül majd a Pascal architektúrára alapozó GPU. A fedélzeti tár kapacitása egyébként 32 GB is lehet.

A Pascal architektúra esetében alapvetően új információnak számít a vegyes pontosság. Az NVIDIA azt nem véletlenül hozta fel, mivel az egész GTC a deep learningről szólt, vagyis ennek az irányzatnak a növekedési potenciáljáról, és a vállalat a Pascal architektúrát minden elemében erre a területre tervezi. Mint ismeretes a deep learning, vagyis a gépi tanulás a mesterséges intelligencia egyik ágának tekinthető. Alapvetően egy olyan koncepcióról van szó, ahol a számítógépek különböző előre megadott adatok és viselkedésminták alapján képes önállóan, vagy eleinte némi külső segítséggel felismerni bizonyos szabályrendszereket, amelyeket aztán megjegyez és reagál rájuk. Lényegében a számítógép tanításáról van szó, hogy aztán a rendszer egyes mintákra adott reakciója lehetőség szerint mindig optimális legyen.

A deep learning területének egyik sajátossága, hogy szükségszerűen nem igényel pontos adatfeldolgozást, így a vegyes pontosság nagyobb szerepet kap. Alapvetően itt arról van szó, hogy az NVIDIA a Pascal architektúrát nem a 32 bites lebegőpontos feldolgozáshoz optimalizálja, hanem a 16 bites lebegőpontoshoz és a 8 bites fixpontoshoz. Ez meglátszik majd a multiprocesszorok belső felépítésében is, hiszen az a cél, hogy a Pascal alapjaira épülő GPU minél energiahatékonyabb legyen a vegyes pontossággal, ezzel csökkentve a deep learningre tervezett szuperszámítógépek fogyasztását amellett, hogy a teljesítményük nő.

Mint ismeretes a Maxwell architektúrát az NVIDIA 32 bites lebegőpontos feldolgozáshoz optimalizálta, de a Tegra X1 SoC már egy olyan revíziót kapott, amelyen belül egy CUDA mag lebegőpontos skalárfeldolgozója képes kétkomponenses vektoroperációra, így egy órajel alatt elvégezhető két egymástól nem függő 16 bites lebegőpontos operáció. A Pascal architektúra az aktuális információink szerint még ennél is továbblép, így a CUDA magon belüli fixpontos skalárfeldolgozó is képes lesz két 16 bites lebegőpontos operációt futtatni, így az új CUDA mag egy órajel alatt összesen négy darab, egymástól nem függő 16 bites lebegőpontos operációra képes. Ezt egyébként két darab kétkomponenses vektoroperációval érné el a rendszer co-issue módban. A 8 bites fixpontos feldolgozás is hasonló előrelépést érne el, csak a CUDA mag fixpontos skalárfeldolgozója lenne képes négykomponenses 8 bites fixpontos vektoroperációra.

A fenti módosításokkal a Pascal architektúra négyszeres előnyt szerez a Maxwell architektúrához viszonyítva 16 bites lebegőpontos és 8 bites fixpontos feldolgozás mellett egy CUDA magra levetítve, ami tökéletes a deep learninghez. Az NVIDIA tízszeres előrelépést vár, amiről a vállalat persze kihangsúlyozta, hogy nagyon durva becslés, de a vegyes pontosság, a HBM memória, valamint az NVLink együttes hatása, illetve a célirányosan deep learningre kigyúrt működés hozhat ennyit.

Hirdetés

Azóta történt

Előzmények

Hirdetés