Kiderült a Skylake IGP titka!

Nemrég jelent meg a cikkünk a Skylake processzorokról, de sajnos az Intel nagyon szűkszavúan kezelte az integrált grafikus vezérlőt, így mi sem tudtunk minden információt átadni. Sok helyen még így is találgatásba fulladt az összefoglalónk, amiről a frissen kiadott dokumentumok birtokában örömmel jelenthetjük, hogy helytállóak voltak.

Mivel egy hete a lehetőségeink korlátozottak voltak, így számos információt inkább nem próbáltunk megfejteni, hiszen tudtuk, hogy az Intel ezeket előbb-utóbb elárulja. Ez szerencsére nem történt másképp, így most bepótoljuk az elmaradt adatokat. Jelen írásunkat a fenti cikkünkben található IGP-s elemzésre építjük, tehát nem fogunk minden korábban már közölt információt megismételni.

A Skylake lapka
A Skylake lapka [+]

Elsőként megemlítjük, hogy a teóriánk helyes volt a tesszellálásért és raszterizálásért felelős setup motorra vonatkozóan, az Intel ugyanis ezeket tényleg némileg elkülönítette az unslice részen belül, így minden shader tömbcsoport, vagy az Intel megfogalmazásával élve a slice elméletben megkaphatja a maga fixfunkciós blokkját. Ez azonban csak elmélet, a gyakorlatban nem lesz így, vagyis a GT2-es, GT3-as és a GT4-es dizájnnál is megmarad az egy setup motor, és ez rendre egy, kettő és három slice-ot lát majd el, slice-onként három shader tömbbel. Valószínűleg az Intel első körben csak ki akarja próbálni a setup motor skálázhatóságát egy házon belüli prototípussal, viszont mielőtt ennek előnyeiről nem kapnak gyakorlati eredményeket nem akarják pazarolni a tranzisztort.

Korábban említettük, hogy a gyorsítótárakról az Intel semmit sem árult el. A legtöbb gyorsítótár a Gen9-es architektúrán belül változatlan méretű és kialakítású, de az L3 gyorsítótár slice-onként 384 kB-ról 768 kB-ra duzzadt. Ez a GT2-es dizájnt használó aktuális Skylake lapkánál ténylegesen 768 kB-ot jelent, de a GT3-as és GT4-es a kettő és három slice miatt rendre 1,5 és 2,25 MB-os gyorsítótárat kap. Az LDS, vagyis a helyi adatmegosztás ezúttal is az L3 gyorsítótár egy lecsípett szeletére épül, ami továbbra sem szerencsés a korlátozott teljesítmény miatt, de ennyi gyorsítótárral már eleve nagyon tranzisztorpazarló dizájnról van szó, így az Intel valószínűleg nem akar még több gyorsítótárt beépíteni. Az LDS mérete egyébként megnőtt, így már slice-onként 256 kB-os tárról van szó. Ez azt jelenti, hogy az L3 gyorsítótár a gyakorlatban slice-onként 512 kB-os, hiszen a többi terület helyi adatmegosztásra van fenntartva.

A Skylake IGP-jének egyik lényeges extrája az úgynevezett a round robin ütemezés bevezetése, amely egy fontos lépés az Intel számára. A legtöbb mai grafikus vezérlő ezt az ütemezési formát használja, mert ilyen formában minden processzusnak ki van osztva egy időszelet, amely jellemzően nagy szokott lenni, hogy nőjön az utasításkésleltetés elfedésének hatékonysága. Persze ennek a modellnek vannak hátrányai is, de az adatpárhuzamosságra tervezett rendszereknél, vagyis a grafikus vezérlőknél ezek tipikusan olyan hátrányok, amelyek a rendszer funkcionális működésébe bőven beleférnek, ha az utasításkésleltetés elfedése hatékonyabb lesz, ami viszont óriási előny. Ebből a szempontból az Intel kezdi közelíteni a konkurens architektúrák működését, hiszen látják, hogy nem az a jó út, amit korábban jártak.

A Gen9-es architektúra másik hatalmas újításáról már korábban is elcsepegtettünk némi információt. Ezt az iparág sok néven emlegeti, mint például GPU grafika preempció vagy mid-wave preempció. Előbbi a HSA alapítvány, míg utóbbi jellemzően az AMD szóhasználata, hiszen a GCN3, azaz a Volcanic Islands architektúrára bevezették ezt az újítást. Az Intel követi ezt az utat, és a Skylake IGP-je is megkapta az említett képességet, amelyet egységes szinten a legtöbb érintett ma finomszemcsés preempciónak hív és a jövőben mi is így fogunk utalni rá, megelőzve az eltérő szóhasználatból eredő félreértéseket.

Igazából nem is az elnevezés a lényeg, hanem maga a funkció, ami lehetővé teszi, hogy a grafikus vezérlő képes legyen az egyes elkezdett feladatok futtatásának ideiglenes megszakítására annak érdekében, hogy egy kiemelt feladat azonnal elérje és teljes egészében felhasználhassa szükséges erőforrásokat. Ez kétségtelenül egy nagyon hasznos képesség, de az Intelnek el kell majd gondolkodnia azon, hogy miképpen használják ki, mivel a szabványos felületek jelenleg nem támogatják.

A Skylake IGP-jének fentebb részletezett változásaival – kiemelten utalva a finomszemcsés preempcióra – az Intel egy útelágazáshoz ért. Mivel mostantól a hardverük túlteljesíti mindazt, amit a szabványok megkövetelnek, ugyanolyan helyzetbe kerültek, mint az AMD pár éve. Utóbbi cég ezt a problémát a Mantle API-val oldotta meg, és most a Santa Clara-i óriáscégnek is el kell gondolkodnia egy saját grafikus és compute API bevezetésén, amivel ki lehetne használni a hardvereik képességeit. Nyilván ez egy olyan döntés, ami befektetést igényel, de lényegesen jobban jár az Intel azzal, ha a beépített új képességeket nem több évvel a hardver megjelenése után kezdik el kihasználni a fejlesztők. Tekintve a piacon végigfutó reformokat, gondolva itt a DirectX 12 és a Vulkan API-ra egy saját API-nak ma lenne is terepe, mivel alacsony és fix költség a beépítése a modern videojáték-motorokba, amelyeknek a struktúráját úgyis átalakítják a friss szabványokhoz. Ezeket a szempontokat a cégen belül mindenképpen mérlegelni kell, mert a PC-s szabványalkotás ma nagyon lassú és sérülékeny, amire egyre sürgetőbbé válik egy házon belüli rendszerrel reagálni.

  • Kapcsolódó cégek:
  • Intel

Azóta történt

Előzmények

Hirdetés