Az utolsó takk-tus?
Legutóbb éppen a múlt hét során megjelent Broadwell tesztünkben beszéltünk az Intel tikk-takk elnevezésen futó stratégiájáról, amit most jó eséllyel utoljára ismétlünk meg. Tehát a rend kedvéért még egyszer elevenítsük, fel pontosan miről is van szó! Az Intel az elmúlt nagyjából 10 esztendő során kétévente egy számottevően megújult mikroarchitektúrát mutatott be, a köztes években pedig új gyártástechnológiára álltak át.
Utóbbi bevezetésekor először a már meglévő, aktuális (vagy csak minimálisan módosított) mikroarchitektúrára alkalmazzák azt, ami elsősorban gazdaságosabb gyártást, illetve alacsonyabb fogyasztást eredményezett. Ezen termékvonal felfuttatása elegendő időt biztosított a tervezőcsapat(ok) számára, hogy a csíkszélesség csökkentésével előálló, a gazdaságosan gyártható lapkaméretbe kényelmesen beleférő többlet tranzisztormennyiséget a következő mikroarchitektúrában átgondoltan költsék el.
A tavalyi évig kvázi óraműpontossággal működő tikk-takk (vagy angolul tick-tock) stratégiától, úgy fest, búcsút kell vennünk. Ennek okát a már említett tesztünkben pedzegettük, mégpedig az egyre költségesebb és komolyabb kihívást jelentő csíkszélességváltást. Már a 14 nanométerrel is meggyűlt az Intel baja, és ezek alapján a 10 nanométer sem lesz olyan egyszerű menet, mint azt talán korábban remélték, az egyre csak növekvő költségekről nem is beszélve. Ebből fakadóan a következő "tikk" csak 2017-re várható, ami az előzetes hírek szerint már inkább egy "takk" lesz. Egy szó mint száz, több mint valószínű, hogy a Skylake a tikk-takk utolsó szülöttje, hisz az Intelnek is alkalmazkodnia kell a körülményekhez, ergo új stratégiára van szükség.
A titokzatos Skylake
Rendhagyó balladai homályba burkolta a Skylake megjelenését az Intel. A korábbi években megszoktuk, hogy a vállalat részletes leírást, illetve előadást tart szinte minden részletre kiterjedően, ami most nem történt meg. Valószínűleg a múlt héten lezajló Gamescom, illetve a közelgő IDF okán alakult így, mindenesetre ennek okán (egyelőre) jóval kevesebb információ áll rendelkezésünkre, mint korábban. A lapkáról szinte alig tudni valamit, így annak pontos mérete, felépítése, illetve a benne található tranzisztorok száma is rejtély, a "takk" lépcső esetében megszokott komolyabb mikroarchitektúrális módosítások részleteiről már nem is beszélve.
Amit egészen biztosan tudunk, hogy a Skylake processzorok is a legutóbbi cikkünkben részletezett 14 nanométeres Tri-Gate gyártástechnológiára épülnek. További érdekesség, hogy a Haswell esetében debütált integrált feszültségszabályzó (FiVR) kikerült a lapkából, és visszaköltözött korábbi helyére, az alaplapra. Ezt anno az energiatakarékosság és a költséghatékonyság jegyében vezették be, ami elsősorban a mobil gépek esetében jött igazán kapóra.
Hirdetés
Mint mindennek, úgy ennek is volt hátulütője, hisz természetesen ez az áramkör is növelte disszipációt, ami a Skylake esetében úgy néz ki, már nem fért bele a keretbe. Mindez az asztali rendszerek esetében inkább jót jelent, míg a mobil gépeknél valószínűleg kisebb visszalépést eredményezett, ugyanakkor ezt a hírek szerint több más újítással bőven kompenzálni tudták a mérnökök, így várhatóan az üzemidő tovább javult. Érdekesség, hogy információnk szerint a FiVR egység csak ideiglenesen került ki a processzor lapkájából, ugyanis a 10 nanométeres processzorok ismét tartalmazni fogják az integrált feszültségszabályzót.
| Típus | Órajel/Turbo Boost órajel | Hyper-Threading | L3 cache | Fogyasztás | HD Graphics 530 alap/turbo órajel | Listaár (dollár) |
|---|---|---|---|---|---|---|
| i7-6700K (4 mag) | 4/4,2 GHz | van | 8 MB | 91 W | 350/1150 MHz | 350 |
| i5-6600K (4 mag) | 3,5/3,9 GHz | nincs | 6 MB | 91 W | 350/1150 MHz | 243 |
Az Intel első körben csupán két darab erősebb, négymagos asztali Skylake modellt dobott piacra, melyek egyaránt szorzózármentesek.
A Skylake és a grafika
A Skylake processzor IGP-jének vizsgálata nehézkes, mert egyrészt tudni, hogy viszonylag sok dolog változott, de ezekről az Intel rendkívül szűkszavúan beszél. Leginkább azért, mert az IDF-re tartogatják a bejelentést, ami kellemetlen dolognak tekinthető, hiszen a lapka már gyakorlatilag elérhető. Emiatt nem biztos, hogy minden egyes részletre ki tudunk térni; az Intel rendkívül korlátozott kommunikációja a teljes elemzést jelenleg nagyban akadályozza.
A grafikus számítások szempontjából az új Gen9 architektúra – elődeihez hasonlóan – továbbra is három jól elkülöníthető részre osztható. A setup motor a Haswell IGP-jéhez képest nem változott, míg a kalkulációkért a már megszokott shader tömb felelős, amelyből a Broadwell IGP-től örökölt új dizájn mellett maximum kilenc darab kaphat helyet; tulajdonképpen ez az egység a hagyományos értelemben vett multiprocesszor. Ebben most is maximum 8 darab Execution Unit lesz fellelhető, melyek továbbra is komplex feldolgozók, így megmarad bennük a két darab 128 bites vektormotor.
Utóbbiak közül az egyik felel az általános operációk feldolgozásáért, míg a másik a speciális, trigonometrikus és transzcendens utasításokat támogatja, de mindkét vektoros egység kezeli az FMA-t, ami rögtön utat ad a 4+4 co-issue képességnek. Ezzel tehát az Execution Unitok továbbra is órajelenként nyolc darab, egymástól független FMA utasítást képesek végrehajtani. Természetesen a függőség kezelése kulcsfontosságú maradt, mivel az egymástól függő operációk párhuzamos feldolgozása nem lehetséges; erről ezúttal is a Thread Dispatch egység gondoskodik, amely igyekszik úgy etetni a vektormotorokat, hogy minél többször hasznosítható legyen a 4+4 co-issue feldolgozás. Mindemellett az alaparchitektúrát érintő finomítás, hogy javult a 32 bites integer műveletek feldolgozási sebessége.
Eddig kísérteties a hasonlóság Broadwell IGP-vel, de van egy fontos változás is, ugyanis a tesszellálásért és raszterizálásért felelős setup motor ugyan az úgynevezett unslice részben marad, de némileg elkülönítve, vagyis az Intel több setup motort is építhet az IGP-kbe. Itt leszögeznénk, hogy ez nem jelenti azt, hogy mostantól ez így is lesz, így bőven elképzelhető, hogy továbbra is marad az egy setup motor az összes multiprocesszorra, de a lehetőség mostantól adott arra, hogy akár két-három setup motor is legyen a lapkában. Mivel az Intel erre vonatkozóan nem árul el semmit, így ezt sajnos nem tudjuk specifikusabban elemezni, vagyis ki kell várni a végét, hogy mi fog történni. Annyit biztosan tudunk, hogy a most kiadott Skylake lapkában egyetlen egy setup motor jutott a három darab multiprocesszorra.
Strukturális szempontból itt a skálázhatóság számíthatott, mivel a Skylake esetében lesz GT2-es, GT3-as és GT4-es dizájn. Lesz GT1-es is, de ez hardveres szinten nem tartalmaz eltérést, tehát pusztán a GT2-es dizájnban lévő részegységek firmware-ből történő letiltására koncentrál. A széles spektrumon skálázható dizájnok egyik legnagyobb problémájának tekinthető, hogy minden területen kiegyensúlyozottak legyenek. Ez az, ami máig egyetlen Intel IGP-re sem volt igaz, mert a setup motort nem lehetett skálázni, így egyes dizájnoknál hiába is nőtt például a ROP blokkok teljesítménye, a raszterizálás teljesen lekorlátozta ezek kihasználását.
Pusztán elméleti szinten gondolkodva az unslice rész mindegyik Skylake IGP dizájnban megmarad, de a shader tömök vagy multiprocesszorok skálázása már megváltozik. A GT2-es dizájn esetén három, a GT3-as mellett hat, míg a GT4-esnél kilenc shader tömb lesz beépítve a lapkába, és így rendre 24, 48 és 72 feldolgozó kerül az egyes IGP-kbe. Ezzel egyetemben változik a render tömb is, és meg nem erősített információink szerint ezekhez idomulhat majd a setup motor. Ez azt jelenti, hogy a GT2-es, GT3-as és GT4-es dizájnnál egy, kettő és három render tömb, illetve setup motor lehet a lapkában, és az így kialakult struktúrával a raszterizáló mindig ugyanannyi képpontot dolgozna fel másodpercenként, mint amennyi blending egység található összesen a render tömbben vagy tömbökben. Ez persze lehet, hogy nem alakul így, hiszen túlzottan sok tranzisztorba kerülne, de elvi szinten ez a logikus irány.
Természetesen a mostani, asztali piacra szánt Skylake lapka esetében GT2-es dizájnról beszélünk, így a három shader tömb mellé egy render tömb és egy setup motor társul. A shader tömbökben egyébként úgy tudjuk, hogy marad a két darab megosztott textúrázó blokk, amelyek egyenként négy darab Gather4-kompatibilis textúrázó csatornát alkalmaznak, illetve egy render tömbben is marad a négy blending és négy Z mintavételező egység. Ezeket az információkat az Intel nem, de a gyártópartnerek megerősítették, ugyanakkor a gyorsítótárakra vonatkozó adatokat sajnos nem tudták megadni, így ezeket mi sem tudjuk leírni.
Kiegészítés: A cikkünk megjelenését követően az Intel tisztázta a Gen9-es architektúrával kapcsolatos kérdéseket, így az alábbi oldalon további elemzés olvasható a Skylake IGP-jének titkairól.
A Skylake grafikus tudása és a multimédia
A Skylake Gen9-es architektúrájáról már az elejétől kezdve olyan pletykák születtek, hogy a tudásszintet növeli az Intel, és ezért is látszik úgy, hogy a Broadwell Gen8-as IGP-jéhez képest mintha nem lenne előrelépés, hiszen a számok tekintetében a Skylake IGP-jének GT2-es dizájnja pont ugyanannyi feldolgozót kínál, mint a Broadwell IGP-jének GT2-es dizájnja. Ugyanakkor már most leírjuk, hogy van különbség, ráadásul nem is kevés. A korábbi API-kra vonatkozóan a támogatás nem változik, de a DirectX 12-re az Intel nagyon rágyúrt. Ez az API olyan reformot képvisel, amire fel kell készíteni a hardvert, ugyanis ha ez nem történik meg, akkor bizonyos funkciókat emulálni kell. A Broadwell és a Haswell lapkák IGP-je sajnos az emulációs körbe tartozik, amin az Intel visszamenőleg nyilván nem tudott változtatni, de a Skylake IGP-je hatalmas előrelépésnek tekinthető.
A legnagyobb változás a régi bekötési modell eldobása, mivel ezt teljesen a DirectX 11-re szabta az Intel, így elég volt csupán 255 erőforrás bekötésének kezelése a hardveren belül. Sőt a DirectX 11 még ennyit sem írt elő, de a DirectX 12 egy teljesen új bekötési modellt használ, amely úgynevezett pure bindless elvű, vagyis a fejlesztőknek magába a shaderbe kell írni a memória-elérést, és a grafikus vezérlőnek meg kell oldani az adott erőforrás bekötését a processzormagok segítsége nélkül. Ez a TIER_3-as bekötési szint, amely konkrétan nem jár semmilyen többletterheléssel, és mivel minden programot kötelezően erre a szintre kell írni, így az a legcélszerűbb, ha minden új grafikus architektúra ennek a szintnek megfelelő tudást kínál. Az Intel is így gondolkodott, így a Gen9-es architektúrát már pure bindless elvűre tervezték.
A működés szempontjából úgy tudjuk, hogy az Intel megoldása nagyon hasonlít arra, amit az AMD alkalmaz a GCN architektúránál, vagyis memóriaalapú rendszerről van szó. Ugyanakkor a Gen9-es architektúra multiprocesszorai nem használnak teljes értékű skalárprocesszort, így csupán egy olyan részegység található bennük, amelyek segítik az erőforrások direkt bekötését. Ez persze így is tökéletes ahhoz, hogy az Intel teljesítse a DirectX 12 legfontosabb funkcióját, ezzel elérve a maximális hatékonyságot.
A Gen9-es IGP nem csak a DirectX 12 legfontosabb funkciójának tekintetében kiemelkedő, hanem abban is, hogy támogatja a Stencil referenciát a pixel shaderben, illetve a tiled resources, conservative rasterization, typed UAV loads és raster order views funkciókat a legmagasabb szinteken, valamint kezeli az ASTC textúratömörítési formátumot is, de a vállalat pechére ez az utolsó utáni pillanatban kikerült a DirectX 12 API-ból, ugyanakkor kiterjesztést bármikor lehet írni rá. Persze a PS-piacon a textúratömörítés nem kritikus probléma, így túl nagy jelentősége ennek nincs.
A DirectX 12 másik fontos funkciója, az aszinkron shader szempontjából a támogatás bizonyosan megoldott, hiszen ezt már a Broadwell IGP-je is kezelte a compute parancslistákra korlátozva, és valószínűleg ugyanez igaz a Skylake IGP-jére is, de konkrétumok még nincsenek, ahogy például arról sincs semmilyen adat, hogy van-e már két DMA motor a lapkán belül, amivel támogatható lenne az aszinkron DMA. Szintén nyitott kérdés még a parancsprocesszor teljesítménye, amely bizonyosan javult a Broadwell lapkához viszonyítva, de nem tudni, hogy mennyivel. Ez lenne az egyik kulcsfontosságú információ a Skylake IGP-je szempontjából, mert az eddigi DirectX 12-es mérések alapján ezen a ponton voltak a korábban megjelent Intel hardverek lemaradva.

Multimédiás szempontból a Gen9-es architektúra szintén javult az elődhöz képest, elsődlegesen a dekódolás szempontjából, mivel elérhetővé vált HEVC videók dekódolásának teljesen fixfunkciós hardverrel történő gyorsítása. A VP9-es formátum támogatása is megjelenik, de nem fixfunkciós, hanem GPGPU-s megoldás formájában. Megjegyzendő, hogy a Haswell és a Broadwell lapkákhoz képest a Skylake JPEG és MJPEG dekódolásért felelős fixfunkciós egysége már kódolni is tud. Arról azonban még mindig nincs adat, hogy ezt a dekódoló és kódoló motort mikor lehet majd kihasználni a programokban.
A Skylake esetében az Intel beszélt a HDMI 2.0-ról is. A vállalat natívan ezt a lehetőséget nem kínálja fel, tehát HDMI 1.4-es kimeneteket kapnak a termékek, de a cég elárulta, hogy a HDMI 2.0-s kijelzők használata így is megoldható lesz a DisplayPort 1.2 interfészen keresztül, ugyanis jönnek majd ehhez megfelelő átalakítók. Ennek egyik alternatívája lehet az Alpine Ridge kódnevű Thunderbolt 3 kontroller, mely többek között képes lesz DisplayPort 1.2-ből HDMI 2.0-t előállítani.
A jelentősen megújult LGA1151-es platform
Az Intel a P55-ös chipkészlet megjelenése óta, azaz több mint 5 éven át csak tyúklépésekben haladt a chipkészletek fejlesztése terén. Erre jó példa, hogy két éve, a Haswell processzorokkal párhuzamosan megjelent, 8-assal kezdődő lapkakészletcsalád esetében vált először elérhetővé kettőnél több porton a SATA 6 Gbps támogatása. Ezzel szemben a Skylake processzorok mellé készített PCH-k esetében végre egy nagyobb, határozott lépést tettek előre.
Mindenekelőtt vessünk egy pillantást az Intel legújabb asztali foglalatára, mely az LGA1151 elnevezést kapta. Az új foglalat első ránézésre kiköpött mása az LGA1150-nek, ami nem is csoda, hisz az alapvető kialakítás megmaradt, a processzorok fizikai mérete sem változott, csupán 1 érintkezővel többet számolhatunk az újakon. Mindez kvázi magától értetődően azt is jelenti, hogy semmiféle átjárhatóság nincs a korábbi processzorok és alaplapok között, ugyanakkor jelen esetben legalább nem veszítettük el teljesen alaptalanul a kompatibilitást.

Egy LGA1151 processzor érintkezői [+]
A Skylake a tavaly debütált Haswell-E után a második olyan platform, mely DDR4 memóriát támogat, és az első, ami emellett még DDR3-at is kezel. Előbbiből hivatalosan a kétcsatornás DDR4-2133, míg utóbbiból a DDR3-1600L a támogatott, szintén dual channel üzemmódban. Ezt a gyártók tetszés szerint kombinálhatják, amire jó példa a korábban általunk is lencsevégre kapott kombó Biostar alaplap.

A processzorba integrált PCI Express sávok száma nem változott, így megmaradt a 16+4, melyből az utóbbi négyes továbbra is a DMI névre elkeresztelt buszban manifesztálódik, ami a PCH-val való összeköttetésért felelős. Itt szintén előrelépésről beszélhetünk, ugyanis a DMI megkapta a 3.0-s verziót, ami gyakorlatilag a PCIe 3.0 szabványra utal, ezzel pedig az összeköttetés sebessége 5.0 GT/s-ről (2 GB/s) 8.0 GT/s-re (~3,93 GB/s) emelkedett.
Utóbbinál jóval nagyobb jelentőségű, hogy a Z170-es PCH nem kevesebb mint 20 darab PCI Express sávot tartalmaz, ráadásul ezek már szintén megfelelnek a 3.0-s szabványnak. Összevetés gyanánt, a Z97-es PCH még csak 8 darab 2.0-s sávot vonultatott fel, ergo itt elég nagy előrelépésről beszélhetünk. Persze mindez nem véletlen, hisz lassan kezdenek elterjedni az M.2 szabványú SSD-k, melyek közül a leggyorsabbak 4 darab 3.0-s sávot használnak, így a jövőben szükség is lesz az extra sávokra. Ezen felül az alaplapok gyártói kvázi bármire felhasználhatják ezeket, legyen szó extra SATA, hálózati, esetleg Thunderbolt vezérlőkről, vagy akár USB 3.1-es kontrollerről, amit például még nem tartalmaz integrálva a chipset. Visszakanyarodva az SSD-kre, a Rapid Storage Technology (RST) legújabb, 14-es verziójának hála már a RAID mód is támogatott a PCIe felületű meghajtók esetében, mégpedig egyidőben legfeljebb három SSD mellett. Apró, ugyanakkor nem elhanyagolható módosítás, hogy az összesen 14 darab USB portból mostantól 10 darab felel meg a 3.0-s, míg 4 darab a 2.0-s szabványnak.
Szintén említésre méltó, hogy a még a Clarkdale és a H55-ös PCH esetében bevezetett FDI (Flexibe Display Port) teljesen kikerült a képből. Ennek kitelepítését már a Haswell esetében megkezdték, a Skylake processzorokkal pedig teljesen meg is szűnt az FDI, mely a felhasználók számára leginkább annyiban lehet fontos, hogy az analóg VGA-kimenet natív támogatása eltűnt, ami 2015 derekán talán már nem olyan nagy érvágás.
A fenti blokkdiagramon a tesztekhez általunk használt Asus Z170-Deluxe alaplap felépítése látható, amelyen jól kivehető, hogy a vállalat mérnökei pontosan hogyan használták fel a Z170-es lapkakészlet által nyújtott lehetőségeket.
Tesztkonfig, fogyasztás, specifikációk
2013 őszén debütált Windows 8-as tesztrendszerünk, mely többek között az általunk korábban használt alkalmazások legújabb verzióit tartalmazza. Szokásunkhoz híven a különféle szintetikus tesztprogramokat továbbra is háttérbe szorítva, a valós felhasználásra fókuszálva állt össze a csomag. Mindez összesen 18 különféle alkalmazást és 2 játékot takar, melyek listája a következőképpen alakul:
- WinRAR 5.00 b8 (64-bit)
- 7-Zip 9.25 (64-bit)
- Cinebench R11.5 (64-bit)
- Autodesk 3ds Max 2014 (64-bit)
- Indigo Renderer v3.4.16 (64-bit)
- Adobe After Effects CC (64-bit)
- Adobe Premiere Pro CC (64-bit)
- Adobe Photoshop CC (64 Bit)
- Sony Vegas Pro 12 (64-bit)
- CyberLink PowerDirector 11 (64-bit)
- Sorenson Squeeze 9 (32-bit)
- DivX Encoder 6.9.2 (32-bit)
- XviD Encoder 1.3.2 (64-bit)
- x264 build 2334 (64-bit)
- LameXP 4.07 b1286 (32-bit)
- Cockos REAPER v4.402 (64-bit)
- Apache 2.2.25 (32-bit)
- AVG AntiVirus Free 2013.0.3392 (64-bit)
A szoftverek döntő többsége már képes 4-8 vagy akár több magot/szálat is kihasználni, ugyanakkor továbbra is akad néhány kivétel.
- Tomb Raider (CPU)
- Grid 2 (CPU)
- Batman: Arkham Origins (DirectX 11) – motor: Unreal Engine 3 / műfaj: TPS
- Company of Heroes 2 (DirectX 11) – motor: Essence Engine 3.0 / műfaj: stratégia
- DiRT Rally (DirectX 11) – motor: EGO Engine 3.0 / műfaj: autóverseny
- GTA V (DirectX 11) – motor: EGO R.A.G.E. / műfaj: TPS/akció
- Thief (DirectX 11/Mantle) – motor: Unreal Engine 3 / műfaj: FPS/akció
- Tomb Raider (DirectX 11) – motor: Crystal Engine / műfaj: TPS/kaland
| LGA1151 tesztplatform | Intel Core i7-6700K (4,0 GHz) processzor Intel Core i5-6600K (3,5 GHz) processzor ASUS Z170-Deluxe alaplap (Z170 chipset, BIOS: 0504) 2 x 8 GB HyperX Fury DDR4-2666 HX426C15FBK4/32 memória DDR4-2133 beállítás, 12-14-14-28-2T időzítések |
|---|---|
| LGA1150 tesztplatform | Intel Core i7-5775C (3,3 GHz) processzor Intel Core i7-4790K (4,0 GHz) processzor Intel Core i7-4770K (3,5 GHz) processzor Intel Core i5-4670K (3,4 GHz) processzor Gigabyte Z97X-UD5H-BK alaplap (Z97 chipset, BIOS: F8a) 2 x 4 GB G.Skill RipjawsX DDR3-1866 F3-14900CL9Q-16GBXL memória DDR3-1600 beállítás, 9-10-9-28-1T időzítések |
| LGA2011-v3 tesztplatform | Intel Core i7-5960X (3,0 GHz) processzor ASUS X99-Deluxe alaplap (X99 chipset, BIOS: 4210) 4 x 8 GB Crucial DDR4-2133 CT4K8G4DFD8213 memória DDR4-2133 beállítás, 15-15-15-36-2T időzítések |
| LGA2011 tesztplatform | Intel Core i7-4960X (3,6 GHz) processzor ASUS P9X79 PRO alaplap (X79 chipset, BIOS: 4210) 4 x 4 GB G.Skill RipjawsX DDR3-1866 F3-14900CL9Q-16GBXL memória DDR3-1866 vagy DDR3-1600 beállítás, 9-10-9-28-1T időzítések |
| LGA1155 tesztplatform | Intel Core i7-3770K (3,5 GHz) processzor Intel Core i7-2600K (3,4 GHz) processzor MSI Z77 MPOWER alaplap (Z77 chipset, BIOS: V17.10) 2 x 4 GB G.Skill RipjawsX DDR3-1866 F3-14900CL9Q-16GBXL memória DDR3-1600 vagy DDR3-1333 beállítás, 9-10-9-28-1T/9-9-9-28-1T időzítések |
| FM2+ tesztplatform | AMD A10-7870K (3,9 GHz) processzor ASUS A88X-PRO alaplap (A88X chipset, BIOS: 2001) 2 x 4 GB G.Skill RipjawsX DDR3-1866 F3-14900CL9Q-16GBXL memória DDR3-2133 vagy DDR3-1866 beállítás, 11-12-11-30-2T/9-10-9-28-2T időzítések |
| AM3/AM3+ tesztplatform | AMD FX-9590 (4,7 GHz) processzor AMD FX-8350 (4,0 GHz) processzor AMD Phenom II X6 1100T (3,3 GHz) processzor ASUS Crosshair V Formula-Z alaplap (990FX chipset, BIOS: 1503) 2 x 4 GB G.Skill RipjawsX DDR3-1866 F3-14900CL9Q-16GBXL memória DDR3-1866 vagy DDR3-1333 beállítás, 9-10-9-28-2T/9-9-9-28-1T időzítések |
| Videokártya | AMD Radeon HD 7970 GHz Edition 3 GB GDDR5 – Catalyst 13.4 |
| Háttértárak | Intel SSD 510 250 GB SSDSC2MH250A2 (SATA 6 Gbps) SSD Seagate Barracuda 7200.12 500 GB (SATA, 7200 rpm, 16 MB cache) merevlemez |
| Processzorhűtő | Prolimatech Megahalems Rev.C |
| Tápegység | Seasonic Platinum Fanless 520 – 520 watt |
| Monitor | Acer B326HUL (32") |
| Operációs rendszer |
Windows 8 Pro és 8.1 64 bit |
A bevett procedúrának megfelelően most is mindent a gyári specifikációk alapján állítottunk be. A turbó funkciók kivétel nélkül az összes platform esetében be voltak kapcsolva.
Szokás szerint először a fogyasztást vettük górcső alá. Ennek mérését egy konnektorba dugható, digitális VOLTCRAFT Energy Logger 4000 készülékkel végeztük, és minden esetben a monitor nélküli teljes konfiguráció értékeit vizsgáltuk. Mivel lassan már az összes Intel processzor, illetve az AMD APU-k is tartalmaznak IGP-t, ezért ezen modellek fogyasztását kétféle módszerrel is megvizsgáltuk. Az első esetben egy diszkrét Radeon HD 7970 GHz Edition került a rendszerekbe, amivel a processzorba integrált GPU inaktívvá vált, majd később ezt kivettük, és nélküle is elvégeztük a méréseket. A platformokon be volt kapcsolva az összes lehetséges energiagazdálkodási funkció (EIST, C1E, C6 stb.).

Üresjáratban grafikus kártyával társítva most sem tudtunk számottevő különbséget kimutatni az elődökhöz képest.

Csupán az integrált grafikus vezérlő mellett már más volt a kép, ugyanis így már jó néhány wattal kevesebbet kért a Skylake, különösen hardveresen gyorsított filmlejátszás mellett.

Terhelés mellett érdekes képet kaptunk, ugyanis az azonos TDP ellenére az i5-6600K-nál jóval többet kért az i7-6700K, ami mindent bizonnyal a Hyper-Threading jelenlétére vezethető vissza.

Diszkrét VGA nélkül az i7-6700K összességében nagyjából a Haswell i7-4770K értékeit hozta. A DiRT Rally alatt a Skylake kért kevesebbet, míg Cinebench alatt a Haswell.
| Processzor típusa | Intel Core i7-6700K |
Intel Core i5-6600K |
Intel Core i7-5775C |
Intel Core i7-4790K |
|---|---|---|---|---|
| Kódnév (CPU-magok kódneve) |
Skylake | Broadwell | Haswell | |
| Tokozás | LGA1151 | LGA1150 | ||
| Alap magórajel | 4000 MHz | 3500 MHz | 3300 MHz | 4000 MHz |
| Magok / szálak | 4 / 8 | 4 / 4 | 4 / 8 | |
| Max. hivatalos memória-órajel |
DDR4-2133 (DC) vagy DDR3-1600L (DC) |
DDR3-1600 (DC) | ||
| Turbo Core (alap/max.) | 4,2 GHz | 3,6-3,9 GHz | 3,6-3,7 GHz | 4,1-4,4 GHz |
| L1D/L1I cache mérete | 4 x 32/32 kB | |||
| L2 cache mérete | 4 x 256 kB | |||
| L3 cache mérete | 8 MB | 6 MB | 8 MB | |
| L3/IMC órajele (uncore/NB) | 4000 MHz | 3500 MHz | 3300 MHz | 3800 MHz |
| Kommunikáció a chipsettel | DMI 3.0 (8 GT/s) | DMI 2.0 (5 GT/s) + FDI (az IGP-hez) | ||
| Integrált PCIe vezérlő | 16 sáv (3.0) | |||
| Utasításkészletek | MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, AES-NI, AVX, AVX2, FMA3 | |||
| Egyéb technológiák | EIST, C1E, C-states, Hyper-Threading, VT-x, VT-d, TSX-NI (Broadwell és Skylake) | |||
| Gyártástechnológia / feszültség | 14 nm Tri-Gate 1,233 V (rev. R0) |
14 nm Tri-Gate 1,245 V (rev. R0) |
14 nm Tri-Gate 1,08 V (rev. E0/G0) |
22 nm Tri-Gate 1,14 V (rev. C0) |
| TDP | max. 91 watt | max. 91 watt | max. 65 watt | max. 88 watt |
| Tranzisztorok száma Lapka mérete |
??? milliárd ??? mm2 |
??? milliárd ~172 mm2 |
1,40 milliárd 177 mm2 |
|
| Integrált GPU (IGP) | HD Graphics 530 | Iris Pro 6200 | HD Graphics 4600 | |
| Grafikus mag kódneve | Gen9 (GT2) | Gen8 (GT3e) | Gen7.5 (GT2) | |
| Végrehajtóegységek | 24 Execution Unit | 48 Execution Unit | 20 Execution Unit | |
| IGP magórajel | 350 MHz | 300 MHz | 650 MHz | |
| Turbo Boost v. Core órajel | 1150 | 1250 MHz | ||
| Max. elméleti memória-sávszélesség | 33,33 GB/s (DDR4), 25,6 GB/s (DDR3) | 25,6 GB/s (+eDRAM: 50 GB/s) | 25,6 GB/s | |
| Támogatott DirectX verzió | DirectX 12 | |||
| Támogatott OpenGL verzió | OpenGL 4.4 | OpenGL 4.3 | ||
| Támogatott OpenCL verzió | OpenCL 2.0 | OpenCL 1.2 | ||
| Multi-GPU opció | nincs | |||
| HD anyagok hardveres támogatása | Intel ClearVideo HD (HEVC, H.264, VC-1, MPEG-2) |
Intel ClearVideo HD (H.264, VC-1, MPEG-2) |
||
| HDMI Audio | Dolby TrueHD és DTS-HD Master | |||
| Extrák | QuickSync, JPEG enkóder | |||
Renderelés, tömörítés (CPU)



Korábbi tesztjeinkben már elmondtuk, hogy a renderelés tipikusan az a nagyon jól párhuzamosított, sok magot/szálat kihasználni képes folyamat, ami nem igazán húz hasznot sem a méretes L3 cache-ből, sem az esetlegesen nagyobb memória-sávszélességből. Az IPC, azaz az egységnyi órajel alatt végrehajtható műveletek számából, illetve a magasabb üzemi magfrekvenciából viszont annál inkább képesek profitálni ezek az alkalmazások. Cinebench és 3ds Max alatt nagyjából 10%-ot hozott a Skylake mikroarchitektúra, ugyanakkor ahogy látható is, Indigo alatt valami nagyon nem stimmelt. Végül többszöri újramérés után is a látható, gyanúsan alacsony értékeket kaptuk, aminek egyelőre nem tudjuk a pontos okát, de szerintünk itt valamiféle korai BIOS problémáról lehet szó.


A fájltömörítők a renderelő alkalmazásokkal ellentétben kedvelik a minél nagyobb memória-sávszélességet és az alacsony késleltetést, illetve a minél nagyobb, illetve gyorsabb L2 és L3 cache-t. RAR alatt minimális volt az előrelépés, ugyanakkor a 7-Zip tesztben szépet ment az i7-6700K.
Videóvágás, szerkesztés (CPU)



A különféle videóvágó és -konvertáló alkalmazások egyaránt profitálnak a gyorsabb memóriából és a minél több magból/szálból, illetve természetesen a magasabb IPC-ből.



A PowerDirector rendkívül kedveli a minél alacsonyabb memória-késleltetést, míg a Sorenson Squeeze-t leginkább az IPC és az órajel érdekli, akárcsak a Cockos Reapert.
Videókódolás, egyéb (CPU)



A DivX képes több szálon dolgozni, bár négy felett már egyiket sem terheli maximumra, míg az XviD csupán egyet képes kihasználni. Ezekkel ellentétben az x264 jóval fejlettebb, hisz a tizenkét vagy több szálat felvonultató processzorokon is képes 100%-os CPU-kihasználtságot mutatni, miközben még a legújabb utasításkészleteket is kihasználja. Utóbbinál kifejezetten jól muzsikált a Skylake, ugyanis a picivel magasabb turbó órajelű i7-4790K eredményére majd 20%-ot pakolt rá az i7-6700K, illetve az i5-6600K is igen közel került az i7-4770K-hoz.




Az Apache esetében ismét furcsa eredménybe futottunk, ugyanis az i7-6700K többszöri mérésre is siralmas produkciót mutatott, míg az i5-6600K esetében ezzel szemben már egy elfogadható számot kaptunk, bár az i5-4670K-tól még így is elmaradt az eredmény. Ebben az esetben is BIOS problémára tippelünk, különösen annak tükrében, hogy hasonlót az i7-4770K tesztjénél is láthattunk, majd néhány frissítéssel később a probléma egyszerűen megszűnt. Emellett az AVG esetében is lemaradást mértünk, bár itt nem volt olyan nagy mértékű az eltérés, hogy biztosan valami problémára gyanakodhassunk, ugyanakkor Z170-es alaplaptesztünkben még vissza fogunk térni erre is.
Játékok (CPU)
A Crysis 3 valamilyen ismeretlen okból olyannyira megmakacsolta magát a Skylake jelenlététől, hogy semmilyen módon nem volt hajlandó elindulni, így ezen tesztünkből sajnos kénytelenek voltunk kihagyni, ugyanakkor a jövőben ezt a hiányosságot majd megpróbáljuk pótolni.


A Radeon HD 7970 GHz Editionnel párosítva, egyjátékos (single player) módban játszott címek alatt most sem láttunk különösebb meglepetést, a Skylake processzorok jól szerepeltek.
Játékok IGP-vel (I. rész)
Néhány játékkal a processzorokba integrált, HD Graphics 530 elnevezésű grafikus vezérlő teljesítményét is megvizsgáltuk. Mivel az i7-6700K és az i5-6600K gyakorlatilag ugyanazt a GT2-es grafikus processzort tartalmazza, ezért a teszteket csak az előbbin futtattuk le.



DiRT Rally alatt alig láttunk előrelépést a Haswellhez képest, de hasonló volt a helyzet a GTA V esetében is. A Company of Heroes 2 ezzel szemben jobban kedvelte a Skylake újításait, mivel itt nagyobb volt az ugrás mértéke.
Játékok IGP-vel (II. rész)



Batman esetében a kisebbik, 1600x900-as felbontásban nagyobbat lépett előre a Skylake, ugyanakkor a Thiefről már nem mondható el ugyanez. Végül Tomb Raider alatt ismét nagyot ugrott a Skylake, ami bizakodásra adhat okot.
ComputeMark, LuxMark
Az GPU-k általános számítási feladatokra való használatának népszerűsödésével két, ezen képességet vizsgáló benchmark is bekerült méréseink közé. Mivel félig-meddig szintetikus tesztekről van szó, így messzemenő következtetéseket nem érdemes levonni ezek eredményeiből.


A ComputeMark egyszerűbb DirectCompute shaderekkel operál, melyekkel főleg a játékok alatt lehet találkozni. A Luxmark az egyik legelterjedtebb benchmark a ray-tracing tesztelésére. Utóbbi már a Haswell tesztjénél is feküdt az Intel IGP-jének, ami most a Skylake estében sem volt másképp.
Tuning
Szokás szerint most is megnéztük, hogy mekkora órajeltartalék lapul még a két tesztelt processzorban. Ez az i7-6700K, illetve az i5-6600K esetében is viszonylag könnyű feladat, hiszen a "K" jelölésből adódóan szorzózármentes processzorokról beszélhetünk.
Az Intel ezen a téren is végrehajtott némi változtatást. Az első és talán legfontosabb, hogy végre teljesen elszeparálták egymástól a processzor órajelének alapjául szolgáló BCLK-t, illetve a PCI Express frekvenciáját. Mindez annyit tesz, hogy mostantól szabadon variálhatjuk a BCLK-t is, ugyanakkor az előzetes hírek szerint mindez továbbra is csak a "K" jelzésű processzorok esetében lesz megengedett, ergo szó sincs arról, hogy az Intel kinyitná a néhány éve alaposan bezárt kiskaput.
A további kisebb változtatások listáját a fenti összehasonlító táblázatban szemlélteti a processzorgyártó.
Végül csak a szokásos módon, azaz a szorzó, illetve a feszültség emelésével próbáltuk kihozni a léghűtéssel még stabilan elérhető maximumot a két processzorból. Végül 1,3 voltnál állapodtunk meg, amivel az i7-6700K-ból 4700, míg az i5-6600K-ból 4600 MHz-et sikerült kipréselnünk. Mindez annyit is jelent, hogy ezen a téren továbbra is stagnálás tapasztalható, hisz ilyen órajeleket már a több mint 4 éve megjelent Sandy Bridge esetében is relatíve könnyen el lehetett érni. A hőmérsékleti értékek terhelés mellett most is 80-90 Celsius-fok körül alakultak, ami egyértelműen a gyengébb, pasztás hővezetésre utal a kupak alatt, amiért továbbra is nagy fekete pont jár az Intelnek.

Az órajel és a feszültség együttes emelésének hatására körülbelül 50%-kal ugrott meg a fogyasztás.
Végül a tuning hatását különböző alkalmazások alatt is megmértük.






Összegzés, konklúzió
Cikkünk végéhez közeledve szokás szerint térjünk rá az eredmények összesítésére!

Mivel az Indigo és az Apache abnormális eredményei minden bizonnyal valamiféle kezdetleges BIOS vagy mikrokód problémára vezethetőek vissza, így két összesítést is készítettünk, ahol is a másodikból kihagytuk a problémás teszteket.

Utóbbi verziót alapul véve az i7-4790K-nál nagyjából 6-7%-kal gyorsabb az i7-6700K, míg az i5-4670K-tól körülbelül 8%-kal húz el az i5-6600K. Két évvel ezelőtt nagyjából ennyit hozott a Haswell is az Ivy Bridge processzorokon, ergo az Intel nagyjából tartotta magát a korábbi tendenciához.

Teljesítmény/fogyasztás terén az i5-6600K jobban szerepel, ugyanakkor előnye nem túl nagy az i7-6700K-hoz képest.

A GPU által gyorsított, játékok alatti 3D-s megjelenítési teljesítményben már nagyobb az ugrás. Itt 25-30%-ról beszélhetünk a Haswellhez képest, ugyanakkor a kétszer annyi, 48 végrehajtót és eDRAM-ot felvonultató Broadwell i7-5775C-től még így is távol van a két asztali Skylake.

A GPU teljesítmény/fogyasztás mutatót tekintve szoros a verseny, itt a jóval fejlettebb gyártástechnológiának köszönhetően az Intel kicsivel az AMD előtt tudott maradni.
Nagy titkolózás övezte a Skylake rajtját, melyről még most, a megjelenés után sem lehet tudni fontos részleteket. Emiatt sokan (többek között mi is) valamiféle innovatívabb megoldásra és/vagy az elmúlt években megszokotthoz képest kicsivel nagyobb előrelépésre számítottunk, ám ez a tesztek alapján nem igazolódott be. Egy szó mint száz, a tűzijáték sajnos idén is elmaradt, így csupán az elmúlt években elhangzottakat tudjuk ismételni, miszerint csupán a teljesítmény szempontjából nem éri meg az előző két generációról (Haswell, Ivy Bridge) váltani. Meglátásunk szerint Sandy Bridge tulajdonosként már megérheti elgondolkozni a cserén, ugyanis az i7-2600K-hoz mérten 37%-os az i7-6700K előnye, ami ha nem is óriási, de legalább már érezhető különbség. Persze sokan vannak, akiknek Sandy Bridge-nél régebbi processzor lakik a gépükben, értelemszerűen számukra még nagyobb ugrást jelenthet a Skylake.
Emellett platformszinten per pillanat egyértelműen ez a legfejlettebb megoldás, gondoljunk csak a PCIe SSD-k RAID támogatására, az opcionális USB 3.1-re és Thunderbolt 3-ra vagy a DDR4-re. Mindezért persze most is alaposan a zsebbe kell nyúlni, ráadásul az utóbbi időben meglódult dollárárfolyam okán jobban, mint az elmúlt években bármikor, ugyanis az i5-6600K jelenleg 88 000 forint, míg az i7-6700K nagyjából 130 000 forint körül érhető el. Az árcédulák nem igazán nyerték el a tetszésünket, ugyanakkor a Skylake, illetve a platform tudása egyértelműen tetszett.

Intel Core i7-6700K processzor
Intel Core i5-6600K processzor
Oliverda és Abu85
Az Intel Core i7-6700K processzort az Intel bocsátotta rendelkezésünkre, míg a Core i5-6600K processzort és az ASUS Z170-Deluxe alaplapot az ASUS hazai képviseletétől kaptuk kölcsön.
















