Apróbb titkokat is rejt a Tegra K1

Az NVIDIA a tegnapi napon mutatta be a Tegra K1 nevű rendszerchipet, melyről írtunk is egy összefoglalót, de a szokásoknak megfelelően az érdekes információk később szivárognak. A vállalat az apróbb részletekről nem beszélt, de erre nem kellett sokat várni, így kiderült, hogy pontosan mit is rejt a lapka.

Hirdetés

Az első körben érkező verzió a Cortex-A15-ös magokra épül, de ennek is a modernizált verzióira. Ez jobb energiahatékonyságot tesz lehetővé, ami természetesen előrelépésnek számít, de nem hoz majd annyira drámai változást. Ennél fontosabb adat, hogy a memóriavezérlő a Tegra 4-hez képest nem változott, így maradt 64 bit széles, és természetesen továbbra is az LPDDR3 szabványú memóriákat támogatja. Technikailag a DDR3L és az LPDDR2 is szóba jöhet, de utóbbi kettőre nem igazán építenek a gyártók a mobil eszközök piacán.

Az IGP szempontjából már kiderült, hogy Kepler architektúráról van szó, amit eleve a mobil irányt figyelembe véve terveztek a zöldeknél, hiszen a compute hatékonysága visszaesett a korábbi Fermi architektúrához viszonyítva. Nyilván erre jó oka volt a cégnek, mivel így nagyon könnyen tudták implementálni a rendszert mobil szintre. Ráadásul ebben a szegmensben kevés olyan kóddal találkozik majd az IGP, ami magas compute hatékonyságot igényelne. A Kepler tervezésénél meghozott, de az asztali VGA-k esetében kedvezőtlen döntés most fog kifizetődni igazán. Persze önmagában a Kepler aktuális SMX (streaming multiprocesszor) blokkján is lehet javítani, amit főleg a belső buszrendszer limitálásával lehet elérni. Mivel itt egy mobil termékről van szó, így nem kell figyelni a skálázásra, hiszen egynél több SMX úgy sem lesz beépítve a lapkába. Ennek eredménye, hogy a Tegrába szánt SMX modul kevesebbet fogyaszt, mint a PC-be szánt verziók megoldása, ami nyilván jótékony hatással lesz az üzemidőre, eközben persze a teljesítmény semmit sem romlott.

NVIDIA Tegra K1 SoC
NVIDIA Tegra K1 SoC [+]

A Tegra IGP-je azonban máshol is változott. Az SMX-en belül megmaradt 192 darab, úgynevezett CUDA mag, melyek tartalmaz két nagyobb csoportba rendeződnek, így az utasításszavak csoportonként 3 darab, 32 utas feldolgozón lesznek párhuzamosan végrehajtva. Mindegyik CUDA mag rendelkezik egy IEEE754-2008-as szabványnak megfelelő, 32 bites lebegőpontos végrehajtóval, melyek támogatják a MAD (Multiply-Add) és az FMA (Fused Multiply-Add) instrukciókat. A regiszterek szempontjából közös regiszterterületet használ egy streaming multiprocesszoron belül, melynek kapacitása 256 kB. A feladatirányító egységek (dispatch) száma is maradt nyolc, míg warp ütemezőből továbbra is néggyel lehet számolni.

Az SMX modulon belül a két feldolgozócsoport 16-16 darab, a speciális funkciókért felelő egysége (SFU) sem hiányzik, emellett 64 kB-os L1 gyorsítótár is megmaradt, mely a feladatnak megfelelően dinamikusan szétosztható egy 16 és egy 48 kB-os részre, illetve 32-32 kB-os szeletelés is lehetséges, attól függően, hogy mekkora megosztott memóriát igényelnek a CUDA magok. Mindemellett továbbra is egy 32 utas tömb fogható be dupla pontosságra, eközben pedig a modulon belüli további öt 32 utas tömb dolgozhat bármi máson. Eddig lényegében az asztali Kepler SMX-je köszön vissza, de a textúrázásért felelős részt lecserélte az NVIDIA. Ez modernizált textúrázókat jelent, így azok már támogatják az ARM ASTC textúratömörítési szabványát, viszont ezért cserébe a vállalat mérnökei elvették a textúrázók felét, így 16 helyett már csak 8 darab található egy modulban. Ez a zöldek szerint nem jelent majd gondot, mivel arra számítanak, hogy a jövőben jóval több számítást tartalmaznak majd az androidos játékok.

Az SMX-en kívül egy raszter motor található, mely két órajelenként 1 háromszöget, illetve órajelenként 8 pixelt képes feldolgozni. Utóbbi úgymond túleteti az egyetlen ROP blokk 4 blending egységét, de ez nem jelent gondot. A Z mintavételező egységek számáról és az L2 gyorsítótár pontos méretéről még nincs adat, de utóbbira vonatkozóan 128 kB-ot pletykálnak, ami az IGP képességeit figyelembe véve reálisnak tekinthető. Természetesen a PolyMorph motor sem maradt ki, amely egy tesszellátort kínál.

Az IGP támogatja az OpenGL 4.4-et, az OpenGL ES 3.0-t, a CUDA platformot és a DirectX 11-et is. A Kepler a 64 darab UAV-t továbbra sem képes kezelni, így a D3D_FEATURE_LEVEL_11_1 támogatása nem lehetséges, de ez nem probléma az Androidhoz tervezett Tegra K1 esetében. Lényeges adat, hogy az IGP maximális órajelének 950 MHz-et gondol az NVIDIA, legalábbis a vállalat 365 GFLOPS-os elméleti számítási teljesítményre vonatkozó paramétere csak ezzel az órajellel hozható.

Hirdetés

Fotóznál vagy videóznál? Mutatjuk, melyik okostelefon mire való igazán!

PR Vásárlás előtt érdemes megnézni, mit kínálnak az aktuális telefonok, ha igazán ütős képeket vagy profi mozgóképeket szeretnénk készíteni.

Azóta történt

Előzmények