Intel Skylake, avagy a Core i7-6700K és i5-6600K

A Skylake és a grafika

A Skylake processzor IGP-jének vizsgálata nehézkes, mert egyrészt tudni, hogy viszonylag sok dolog változott, de ezekről az Intel rendkívül szűkszavúan beszél. Leginkább azért, mert az IDF-re tartogatják a bejelentést, ami kellemetlen dolognak tekinthető, hiszen a lapka már gyakorlatilag elérhető. Emiatt nem biztos, hogy minden egyes részletre ki tudunk térni; az Intel rendkívül korlátozott kommunikációja a teljes elemzést jelenleg nagyban akadályozza.

A grafikus számítások szempontjából az új Gen9 architektúra – elődeihez hasonlóan – továbbra is három jól elkülöníthető részre osztható. A setup motor a Haswell IGP-jéhez képest nem változott, míg a kalkulációkért a már megszokott shader tömb felelős, amelyből a Broadwell IGP-től örökölt új dizájn mellett maximum kilenc darab kaphat helyet; tulajdonképpen ez az egység a hagyományos értelemben vett multiprocesszor. Ebben most is maximum 8 darab Execution Unit lesz fellelhető, melyek továbbra is komplex feldolgozók, így megmarad bennük a két darab 128 bites vektormotor.

Hirdetés

Utóbbiak közül az egyik felel az általános operációk feldolgozásáért, míg a másik a speciális, trigonometrikus és transzcendens utasításokat támogatja, de mindkét vektoros egység kezeli az FMA-t, ami rögtön utat ad a 4+4 co-issue képességnek. Ezzel tehát az Execution Unitok továbbra is órajelenként nyolc darab, egymástól független FMA utasítást képesek végrehajtani. Természetesen a függőség kezelése kulcsfontosságú maradt, mivel az egymástól függő operációk párhuzamos feldolgozása nem lehetséges; erről ezúttal is a Thread Dispatch egység gondoskodik, amely igyekszik úgy etetni a vektormotorokat, hogy minél többször hasznosítható legyen a 4+4 co-issue feldolgozás. Mindemellett az alaparchitektúrát érintő finomítás, hogy javult a 32 bites integer műveletek feldolgozási sebessége.

Eddig kísérteties a hasonlóság Broadwell IGP-vel, de van egy fontos változás is, ugyanis a tesszellálásért és raszterizálásért felelős setup motor ugyan az úgynevezett unslice részben marad, de némileg elkülönítve, vagyis az Intel több setup motort is építhet az IGP-kbe. Itt leszögeznénk, hogy ez nem jelenti azt, hogy mostantól ez így is lesz, így bőven elképzelhető, hogy továbbra is marad az egy setup motor az összes multiprocesszorra, de a lehetőség mostantól adott arra, hogy akár két-három setup motor is legyen a lapkában. Mivel az Intel erre vonatkozóan nem árul el semmit, így ezt sajnos nem tudjuk specifikusabban elemezni, vagyis ki kell várni a végét, hogy mi fog történni. Annyit biztosan tudunk, hogy a most kiadott Skylake lapkában egyetlen egy setup motor jutott a három darab multiprocesszorra.


[+]

Strukturális szempontból itt a skálázhatóság számíthatott, mivel a Skylake esetében lesz GT2-es, GT3-as és GT4-es dizájn. Lesz GT1-es is, de ez hardveres szinten nem tartalmaz eltérést, tehát pusztán a GT2-es dizájnban lévő részegységek firmware-ből történő letiltására koncentrál. A széles spektrumon skálázható dizájnok egyik legnagyobb problémájának tekinthető, hogy minden területen kiegyensúlyozottak legyenek. Ez az, ami máig egyetlen Intel IGP-re sem volt igaz, mert a setup motort nem lehetett skálázni, így egyes dizájnoknál hiába is nőtt például a ROP blokkok teljesítménye, a raszterizálás teljesen lekorlátozta ezek kihasználását.

Pusztán elméleti szinten gondolkodva az unslice rész mindegyik Skylake IGP dizájnban megmarad, de a shader tömök vagy multiprocesszorok skálázása már megváltozik. A GT2-es dizájn esetén három, a GT3-as mellett hat, míg a GT4-esnél kilenc shader tömb lesz beépítve a lapkába, és így rendre 24, 48 és 72 feldolgozó kerül az egyes IGP-kbe. Ezzel egyetemben változik a render tömb is, és meg nem erősített információink szerint ezekhez idomulhat majd a setup motor. Ez azt jelenti, hogy a GT2-es, GT3-as és GT4-es dizájnnál egy, kettő és három render tömb, illetve setup motor lehet a lapkában, és az így kialakult struktúrával a raszterizáló mindig ugyanannyi képpontot dolgozna fel másodpercenként, mint amennyi blending egység található összesen a render tömbben vagy tömbökben. Ez persze lehet, hogy nem alakul így, hiszen túlzottan sok tranzisztorba kerülne, de elvi szinten ez a logikus irány.

Természetesen a mostani, asztali piacra szánt Skylake lapka esetében GT2-es dizájnról beszélünk, így a három shader tömb mellé egy render tömb és egy setup motor társul. A shader tömbökben egyébként úgy tudjuk, hogy marad a két darab megosztott textúrázó blokk, amelyek egyenként négy darab Gather4-kompatibilis textúrázó csatornát alkalmaznak, illetve egy render tömbben is marad a négy blending és négy Z mintavételező egység. Ezeket az információkat az Intel nem, de a gyártópartnerek megerősítették, ugyanakkor a gyorsítótárakra vonatkozó adatokat sajnos nem tudták megadni, így ezeket mi sem tudjuk leírni.

Kiegészítés: A cikkünk megjelenését követően az Intel tisztázta a Gen9-es architektúrával kapcsolatos kérdéseket, így az alábbi oldalon további elemzés olvasható a Skylake IGP-jének titkairól.

A cikk még nem ért véget, kérlek, lapozz!

  • Kapcsolódó cégek:
  • Intel

Azóta történt

Előzmények

Hirdetés