Interjú az NVIDIA elnök-vezérigazgatójával

Tegra K1 szuperchip

Kérdés: A kérdésem a Tegrával kapcsolatos: a Denver az optimálisnak elkönyvelt 3-utas 64 bites dizájn helyett egy nagyon széles, 7-utas szuperskalár felépítést kapott, ami az IBM Power szerverchipjeit idézi. El tudná mondani, hogy miért döntöttek ilyen rendhagyóan széles felépítés mellett, és hogyan érték el azt, hogy mindez hatékonyan is működjön?

Jen-Hsun Huang: Ez mély és részletes architekturális ismereteket igényel, amihez nagyjából 20 év tudása szükséges. A szuperskalár felépítés egyik nagy kihívása az issue rate értékének magasan tartása, ugyanakkor ezt nem lehet, vagy nagyon nehéz elérni, mivel a processzorarchitektúrák világában sok minden függ egymástól, ami kockázatossá teszi a tervezést. A 7-utas szuperskalár dizájnok nagy része kihasználatlan, működésük nem optimális, hacsak nincs egy nagyon komplikált rendszered mellé, mint a kérdésben is említett IBM Power esetében. Most, hogy mindketten értjük a probléma gyökerét, már csak az a kérdés, hogy mi a megoldás? Megengedi, hogy mintegy izgalmas meglepetésként még tartogassam önnek egy kicsit a választ? Erről még szeretnék beszélni a jövőben, mert ez a processzorok építésének egy nagyon szórakoztató része. Manapság a CPU-architektúrák tervezésének egyik legnagyobb kihívása az órajelenkénti utasítások kibocsátásának növelése, és ez egy rendkívül nehéz feladat. Mi is ugyanúgy küzdünk a fizikai törvényeivel, mint az összes többi tervezőcég, habár van néhány új technológia a tarsolyunkban, melyek itt is segíthetnek bennünket. Ahogy mondtam, mindenképpen szeretnék még beszélni erről, mert nagyon fontos nekünk ez a kérdéskör. Okkal került 5 évünkbe a Denver tervezése.

Kérdés: A szuperskalár architektúra esetén megvan a fejlesztők lehetősége, hogy egy megfelelően megírt kóddal optimálisan töltsék fel a futószalagot, ami büntetésekkel működik a sok funkcionális egység miatt. A Google dolgozik ezen, vagy esetleg a saját fejlesztőik készítenek egy Denver CPU-ra optimalizált verziót a megfelelő fordítóval?

Jen-Hsun Huang: Bármit is csinálunk az optimalizálás érdekében, szerintünk az a legjobb megoldás, ha mindez a Denver tokozásán belül marad. Kívülről nézve a statikus fordító vagy az operációs rendszer számára pedig mindez egy fekete doboz kell, hogy legyen, csak egy erős CPU magas IPC értékkel. Meglátásom szerint ez egy jobb, a partnerek részére egyszerűbb megközelítés annál, mintha elvárnánk, hogy kívülről, azaz a szoftverek oldaláról legyen megfelelően optimalizálva a processzor.

Kérdés: A K1-et a szuperchip jelzővel illette, valamint azt hallottam, hogy egyelőre nem állítják le a Tegra 4 forgalmazását. Mindez azt jelenti, hogy meglehetősen nagy a teljesítménybeli űr a két megoldás között?

Jen-Hsun Huang: Nos, valóban meglehetősen nagy különbség van a két chip között. Úgy gondolom, hogy a Tegra 4 egy nagyon jó processzor, de nem hasonlítható össze a Tegra K1-gyel. De ez rendben is van, hisz ez az innováció ára, haladnunk kell előre.

Kérdés: Mit gondol, miként fog reagálni erre a piac? Ezzel gyakorlatilag nem marad köztes termék, így a vásárlóknak majd magas árat kell fizetniük a K1-gyel szerelt termékekért?

Jen-Hsun Huang: Mindig van különbség a termék tulajdonságai és annak árazása között. Előbbiért keményen meg kell dolgozni, hisz nem könnyű új és hasznos képességeket kifejleszteni, míg az ár... nos azt egyszerűen csak el kell döntenünk.


[+]

Kérdés: A Tegra K1-gyel már egy teljes értékű GPU dizájnt kapunk egy mobil chipben. Mindez azt jelenti, hogy a jövő GPU dizájnjai inkább arra lesznek optimalizálva, hogy végül egy összetettebb termék részei legyenek? Mindennek van bármilyen hatása az asztali GPU-k fejlesztésére is?

Jen-Hsun Huang: Ahogy azt tudják, a Kepler az eddig piacra dobott leghatékonyabb GPU-nk, ez tette lehetővé számunkra, hogy megalkossuk a K1-et. Most, hogy már tudjuk hogyan készítsünk ennyire hatékony GPU-architektúrákat, a vállalatunknak még hatékonyabb rendszereket kell terveznie. Ezt pedig a Tegra igényei bontakoztatták ki, illetve vezérlik, és ennek köszönhetően ez a szemlélet vagy filozófia mindenre hatással lesz. A jövőben az energiahatékonyság jelentősége egyenrangú lesz a teljesítményével. Ezen képesség pedig fantasztikus. Egyelőre nem töltöttünk túl sok időt a teszteléssel, de amikor majd a kezükbe veszik, tapasztalhatják, hogy a K1 kedvezőbb értékkel rendelkezik hatékonyság terén bármelyik ma piacon lévő terméknél, miközben erősebb is azoknál. Ez elsőre furcsán, sőt talán őrülten hangzik, de az egész az architektúrának köszönhető – és most ezt a metodikát fogjuk végigvinni a teljes palettánkon, a PC-ktől kezdve a nagy szuperszámítógépekbe szánt processzorokig.

Kérdés: Tervben van a K1 telefonokban való szerepeltetése is?

Jen-Hsun Huang: Hiszem, hogy a K1 a telefonokban is szerepet kaphat.

Kérdés: De az 5 wattos maximális fogyasztás egy kicsit túl magas ehhez, nem?

Jen-Hsun Huang: Minden chip 5 wattot fogyaszt, ha minden egység aktív benne. Például az a chip is ami az épp mellettem lévő Samsung telefonban van. Nem kell ettől tartani, nem az 5 watton múlik, hanem sokkal inkább azon, hogy mekkora fogyasztással rendelkezik, ha csak az éppen szükséges egységek aktívak.

PROHARDVER!: A K1 támogatja az OpenGL 4.4-et és a CUDA-t. Ezek az API-k esetlegesen elérhetővé válnak egy későbbi Android verzióban?

Jen-Hsun Huang: Szerintem nem szükséges, hogy ezek az API-k elérhetőek legyenek Androidon is. Ami a legfontosabb, hogy a megfelelő motor legyen elérhető. Például a RenderScript vagy bármilyen motor GPGPU-hoz Androidra, ami megfelelően kihasználja a magokat. A CUDA-t nem kell közvetlenül elérhetővé tennünk, az OpenGL pedig nem egy igazán elterjedt API Androidon, mert a legtöbb játékfejlesztő inkább közvetlenül a motort használja. Például éppen most jelentettük be, hogy a Tegra K1 támogatni fogja az Unreal Engine 4-et. Ugyanazt a motort, amit az Xbox vagy a Playstation 3 esetében alkalmaznak. Csupán újra kell fordítani a megfelelő platformra, hogy ki lehessen használni a chip képességeit, így nem szükséges az OpenGL. Nagyon valószínű, hogy ebben az esetben ez a legjobb megközelítése a dolgoknak. Unreal Engine, Unity Engine, és természetesen még dolgoznunk kell a DICE-szal és a Frostbite-tal is, hogy az összes motor jól működjön a Tegrával.

Kérdés: A Tegra 4 esetében az NVIDIA előállt egy referencia tablettel. Az új Tegránál számíthatunk-e ugyanerre, illetve hány K1-re épülő tablet bejelentésével számolnak?

Jen-Hsun Huang: Nem mi jelentjük be a partnereink termékeit, ami egy bevett gyakorlat. A Tegra 4 megjelenését körülbelül 6 hónappal eltoltuk a K1 fejlesztésének érdekében. Úgy gondolom, hogy ez egy helyes döntés volt, mert a K1 egy nagyon fontos termék a részünkről, és minél hamarabb el tudjuk hozni a világnak, annál jobb. Egy rövidtávú áldozat – még ha pénzügyi következménye is van – a hosszútávú cél érdekében, illetve a teljes képet tekintve már nem bír akkora jelentőséggel. Az ilyen döntések hasznosak a cég életében: egy rövidtávú áldozat a hosszútávú siker érdekében. Azt hiszem mindenki egyet fog érteni abban, hogy az NVIDIA profitálni fog a Tegra K1-ből. Meglátásom szerint bármilyen platformban is kap majd helyet az új chip, legyen az konzol, mobil eszköz vagy tablet, a végleges terméknek piacformáló hatása lesz. Ennek fényében úgy döntöttünk, hogy megéri az áldozat, és inkább csúszunk a Tegra 4-gyel, hogy a K1-et időben piacra dobhassuk. Most pedig már azon kell dolgozzunk, hogy megnyerjük magunknak az OEM gyártókat.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

Előzmények

Hirdetés