Apróbb titkokat is rejt a Tegra K1

Az NVIDIA a tegnapi napon mutatta be a Tegra K1 nevű rendszerchipet, melyről írtunk is egy összefoglalót, de a szokásoknak megfelelően az érdekes információk később szivárognak. A vállalat az apróbb részletekről nem beszélt, de erre nem kellett sokat várni, így kiderült, hogy pontosan mit is rejt a lapka.

Az első körben érkező verzió a Cortex-A15-ös magokra épül, de ennek is a modernizált verzióira. Ez jobb energiahatékonyságot tesz lehetővé, ami természetesen előrelépésnek számít, de nem hoz majd annyira drámai változást. Ennél fontosabb adat, hogy a memóriavezérlő a Tegra 4-hez képest nem változott, így maradt 64 bit széles, és természetesen továbbra is az LPDDR3 szabványú memóriákat támogatja. Technikailag a DDR3L és az LPDDR2 is szóba jöhet, de utóbbi kettőre nem igazán építenek a gyártók a mobil eszközök piacán.

Az IGP szempontjából már kiderült, hogy Kepler architektúráról van szó, amit eleve a mobil irányt figyelembe véve terveztek a zöldeknél, hiszen a compute hatékonysága visszaesett a korábbi Fermi architektúrához viszonyítva. Nyilván erre jó oka volt a cégnek, mivel így nagyon könnyen tudták implementálni a rendszert mobil szintre. Ráadásul ebben a szegmensben kevés olyan kóddal találkozik majd az IGP, ami magas compute hatékonyságot igényelne. A Kepler tervezésénél meghozott, de az asztali VGA-k esetében kedvezőtlen döntés most fog kifizetődni igazán. Persze önmagában a Kepler aktuális SMX (streaming multiprocesszor) blokkján is lehet javítani, amit főleg a belső buszrendszer limitálásával lehet elérni. Mivel itt egy mobil termékről van szó, így nem kell figyelni a skálázásra, hiszen egynél több SMX úgy sem lesz beépítve a lapkába. Ennek eredménye, hogy a Tegrába szánt SMX modul kevesebbet fogyaszt, mint a PC-be szánt verziók megoldása, ami nyilván jótékony hatással lesz az üzemidőre, eközben persze a teljesítmény semmit sem romlott.

NVIDIA Tegra K1 SoC
NVIDIA Tegra K1 SoC [+]

A Tegra IGP-je azonban máshol is változott. Az SMX-en belül megmaradt 192 darab, úgynevezett CUDA mag, melyek tartalmaz két nagyobb csoportba rendeződnek, így az utasításszavak csoportonként 3 darab, 32 utas feldolgozón lesznek párhuzamosan végrehajtva. Mindegyik CUDA mag rendelkezik egy IEEE754-2008-as szabványnak megfelelő, 32 bites lebegőpontos végrehajtóval, melyek támogatják a MAD (Multiply-Add) és az FMA (Fused Multiply-Add) instrukciókat. A regiszterek szempontjából közös regiszterterületet használ egy streaming multiprocesszoron belül, melynek kapacitása 256 kB. A feladatirányító egységek (dispatch) száma is maradt nyolc, míg warp ütemezőből továbbra is néggyel lehet számolni.

Az SMX modulon belül a két feldolgozócsoport 16-16 darab, a speciális funkciókért felelő egysége (SFU) sem hiányzik, emellett 64 kB-os L1 gyorsítótár is megmaradt, mely a feladatnak megfelelően dinamikusan szétosztható egy 16 és egy 48 kB-os részre, illetve 32-32 kB-os szeletelés is lehetséges, attól függően, hogy mekkora megosztott memóriát igényelnek a CUDA magok. Mindemellett továbbra is egy 32 utas tömb fogható be dupla pontosságra, eközben pedig a modulon belüli további öt 32 utas tömb dolgozhat bármi máson. Eddig lényegében az asztali Kepler SMX-je köszön vissza, de a textúrázásért felelős részt lecserélte az NVIDIA. Ez modernizált textúrázókat jelent, így azok már támogatják az ARM ASTC textúratömörítési szabványát, viszont ezért cserébe a vállalat mérnökei elvették a textúrázók felét, így 16 helyett már csak 8 darab található egy modulban. Ez a zöldek szerint nem jelent majd gondot, mivel arra számítanak, hogy a jövőben jóval több számítást tartalmaznak majd az androidos játékok.

Az SMX-en kívül egy raszter motor található, mely két órajelenként 1 háromszöget, illetve órajelenként 8 pixelt képes feldolgozni. Utóbbi úgymond túleteti az egyetlen ROP blokk 4 blending egységét, de ez nem jelent gondot. A Z mintavételező egységek számáról és az L2 gyorsítótár pontos méretéről még nincs adat, de utóbbira vonatkozóan 128 kB-ot pletykálnak, ami az IGP képességeit figyelembe véve reálisnak tekinthető. Természetesen a PolyMorph motor sem maradt ki, amely egy tesszellátort kínál.

Az IGP támogatja az OpenGL 4.4-et, az OpenGL ES 3.0-t, a CUDA platformot és a DirectX 11-et is. A Kepler a 64 darab UAV-t továbbra sem képes kezelni, így a D3D_FEATURE_LEVEL_11_1 támogatása nem lehetséges, de ez nem probléma az Androidhoz tervezett Tegra K1 esetében. Lényeges adat, hogy az IGP maximális órajelének 950 MHz-et gondol az NVIDIA, legalábbis a vállalat 365 GFLOPS-os elméleti számítási teljesítményre vonatkozó paramétere csak ezzel az órajellel hozható.

Azóta történt

Előzmények

Hirdetés