Hirdetés

Core i7-5775C: Broadwell, a számkivetett

Az Intel botlása

Újabbnál újabb, Intel processzorokat bemutató írásainkat rendre a vállalat úgynevezett tikk-takk elnevezésen futó stratégiájának megemlítésével szoktuk kezdeni, mely régen volt már annyira szükségszerű, mint most. Ez röviden annyit tesz, hogy az Intel kétévente egy számottevően megújult mikroarchitektúrát mutat be, a köztes években pedig új gyártástechnológiára állnak át. Utóbbi bevezetésekor először a már meglévő, aktuális (vagy csak minimálisan módosított) mikroarchitektúrára alkalmazzák azt, mely elsősorban gazdaságosabb gyártást, illetve alacsonyabb fogyasztást eredményez. Ezen termékvonal felfuttatása elegendő időt biztosít a tervezőcsapat(ok) számára, hogy a csíkszélesség csökkentésével előálló, a gazdaságosan gyártható lapkaméretbe kényelmesen beleférő többlet tranzisztormennyiséget a következő mikroarchitektúrában átgondoltan költsék el.


[+]

A tikk-takk remekül működött nagyjából egészen a tavalyi évig, amikor is nyilvánvalóvá vált, hogy az Intel komoly problémákba ütközött legújabb, 14 nanométeres gyártástechnológiájának fejlesztése során, melynek okán borult az addig kvázi óramű pontossággal működő termékstratégia. Az elmúlt több mint 10 évben nem volt arra példa, hogy az Intel ennyire megakadjon egy fejlesztésen, ugyanis az utolsó, a vállalat számára ennyire komoly problémákat jelentő gyártástechnológia még az a 90 nanométeres node volt, amin a híres-hírhedt első Prescott kódnevű Pentium 4 is készült, valamikor 2004 elején.


[+]

A vadiúj, 14 nanométeres technológia esetében a kihozatalt (azaz a selejtarányt) érintette a probléma, ami jelentősen elmaradt az előd 22 nanométernél tapasztalt értékektől, ez pedig kvázi megakadályozta a nagyobb méretű lapkák gazdaságos gyártását. A Core M alapjául szolgáló apró, 82 mm²-es Broadwell-Y egységek tömegtermelését már tavaly elkezdte a cég, hisz az ilyen kisméretű lapkákat sokkal kevésbé érinti az ilyen probléma. Mindez végül kissé faramuci helyzetet teremtett, hisz az Intel a tikk-takk stratégiának megfelelően, bár előállt 14 nanométeres termékekkel a tavalyi év során, ugyanakkor az eredetileg tervezetthez, illetve a korábban megszokotthoz képest némileg foghíjas lett a termékskála, mivel a nagyobb méretű, négymagos lapkákra egészen idén júniusig várni kellett, már amelyik végül megjelent. Így szenvedett nagyjából egy éves csúszást az asztali Broadwell felhozatal is, aminek optimális esetben már tavaly ilyenkor a piacon kellett volna lennie.


[+]

Nem véletlen, hogy az Intel sokat szenvedett a 14 nanométeres gyártástechnológiával, ugyanis a mérnökök szerették volna tartani magukat a vállalat egyik alapítójának megállapításához, azaz a Moore-törvényhez. A technológia az Ivy Bridge processzorokkal bevezetett Tri-Gate (vagy FinFET) tranzisztorra alapoz, amit a mérnökök alaposan továbbfejlesztették. Csökkent a szubsztrátból kiemelkedő vezetékek száma, miközben azok közelebb kerültek egymáshoz, keskenyebbek lettek, a magasságuk nőtt. Mindezen változtatások hatására csökkent az ellenállás, illetve nőtt a teljesítmény és a tranzisztorsűrűség.


[+]

Konkrét számokat is közölt a vállalat, melyek alapján a processzorok cache memóriáinak építőeleméül szolgálaló SRAM cellák sűrűsége közel kétszeresére nőtt, azaz egységnyi SRAM majd feleakkora területet foglalhat, mint 22 nanométer esetében.


[+]

A lapkaterület skálázódása mellett természetesen továbbra is sarkalatos pont a teljesítmény (órajel), illetve a fogyasztás kérdése, melyek szorosan összefüggenek a szivárgási árammal. Ezen területeken végül szintén sikerült elérni a kitűzött célokat, ezzel tovább emelve az elérhető teljesítmény/fogyasztás mutatót.


[+]

A vállalat kalkulációi alapján 14 nanométeres megoldásuk 0,51-es skálázási szorzót kínál a 22 nanométerrel szemben, azaz például a Core i7-4770K alapjául szolgáló, 177 mm²-es áramkört az új eljárással legyártva egy nagyjából csupán 90 mm²-es lapkát kapnának. Ez elsőre elég jól hangzik, ugyanakkor az egységnyi négyzetméterre levetített költségek a korábbiakhoz képest némileg megugrottak, amit az Intel állítása szerint bizonyos módszerekkel képesek kompenzálni. Ennek egyik módja a szóban forgó gyártástechnológia meghosszabbított életciklusa lesz, mellyel gyakorlatilag megbomlik a feljebb ecsetelt tikk-takk stratégia, ugyanis jelen állás szerint 2017 előtt biztosan nem találkozhatunk majd 10 nanométeres Intel termékekkel a boltok polcain.

A CPU-magok újításai

A különféle Broadwell processzorok felépítésének alapját a megelőző generációs, 22 nm-es technológiával gyártott Haswell mikroarchitektúra adja, amelyet néhány ponton csiszoltak, kisebb módosításokat végeztek rajta:

  • 60-ról 64 eleműre bővül az out-of-order ütemező mérete;
  • másfélszeresére, azaz 1536 eleműre nő a másodszintű TLB (virtuális -> fizikai címfordítást végző/gyorsító egység) mérete a 4 kB-os és 2 MB-os lapokra, és új 16 elemű TLB-t kapnak az 1 GB-os lapok;
  • ugyancsak a címfordítást gyorsítja a bevetett második címfordító, melynek segítségével két címfordítás végezhető párhuzamosan, amennyiben azokra nincs találat gyorstárban;
  • az indirekt ugrások címét megjósoló prediktor munkaterülete nő.

A fenti változások mellett nagyobb mértékű fejlesztések érintik a lebegőpontos számítások végrehajtását:

  • a szorzások végrehajtási időidénye 5 órajelről 3 órajelre csökken, így immár ugyanannyi, mint a lebegőpontos összeadásé/kivonásé;
  • az osztások gyorsítását szolgálja az 1024 Radix osztómű, amely lehetővé teszi 2,5 órajelenként új egyszeres vagy 4 órajelenként új dupla pontosságú osztás kiszámításának elindítását.

Ugyancsak jelentős, körülbelül 60%-os sebességelőnyre tesznek szert a Haswellben bevezetett gather memóriaolvasások. Emlékeztetőül: a korábbi x86/x64 SIMD műveletek végrehajtásához előre kellett gondoskodni arról, hogy a vektorok elemei egymás után sorakozzanak a memóriában, mivel egy-egy vektor egy folyamatos memóriaterületet jelent. A Haswellben bemutatkozó "gather" típusú betöltési utasítás képes szétszórt elemekből önállóan összeállítani egy vektort, mivel paraméterként a kezdőcímet, valamint az elemek e címtől számított távolságát kapja meg. Bár technikailag ez a processzoron belül több külön memóriaolvasásként van megvalósítva, számottevően gyorsítja az ismétlődő minták szerinti memóriahozzáféréseket.

Fejlesztések történtek a titkosítási/biztonsági algoritmusokat érintően is:

  • az ADC (ADd with Carry: x=x+y+Carry Flag) és SBB (SuBtract with Borrow: x=x-y-Carry Flag) utasítások végrehajtása gyorsul;
  • új utasításként bemutatkozik az ADCX és ADOX, amelyek az ADC-hez eltérően csak 1 flaget (az előbbi a Carry-t, utóbbi az Overflow-t) módosít, ebből veszi, illetve ebbe helyezi a túlcsordulást, így párhuzamosan két utasításlánc hajtható végre belőlük;
  • gyorsult a számos hash/CRC algoritmusban használt PCLMULQDQ utasítás végrehajtása;
  • ugyancsak új utasítás a nem determinisztikus random számok generálására alkalmas RDSEED.

Újdonság továbbá az Ivy Bridge-ben bevezetett SMEP védelem párja, az SMAP (Supervisor Mode Access Protection): ennek aktiválásakor a kernel módban futó programkód nemcsak hogy nem hívhat meg felhasználói módú programrészt – ezt akadályozza meg az SMEP –, hanem felhasználó által hozzáférhető/módosítható adatterületről nem is olvashat be adatot.

A virtualizációs, valamint tranzakcionális memóriakezelést biztosító utasítások végrehajtását is módosították; utóbbi elsősorban nagyobb lehetséges tranzakcióméretben nyilvánul meg.

Hirdetés

A fenti fejlesztések az Intel szerint összességében nagyságrendileg 5%-os előrelépést jelentenek a Haswell teljesítményével összehasonlítva. Ilyen mértékű előrelépést láthattunk a Sandy Bridge és Ivy Bridge között is, így kijelenthető, hogy számítási kapacitásban a Broadwell a csíkszélességváltásokkor megszokott előrelépést kínálja.

A Broadwell és a grafika

Az Intel a Broadwell fejlesztése során igen sok erőforrást fektetett az integrált grafikus vezérlőbe. Ez még ugyan nem jelent radikálisan új architektúrát, de a Gen8-as rendszer így is alapos ráncfelvarrás a korábbi Gen7.5-ös verzióhoz viszonyítva.

A grafikus számítások szempontjából a Gen8 architektúra – elődeihez hasonlóan – továbbra is három jól elkülöníthető részre osztható. A setup motor a Haswell IGP-jéhez képest nem változott, míg a kalkulációkért a már megszokott shader tömb felelős, amelyből az új dizájn mellett maximum hat darab kaphat helyet; tulajdonképpen ez az egység a hagyományos értelemben vett multiprocesszor. Ebben mostantól maximum 8 darab Execution Unit lesz fellelhető, melyek továbbra is komplex feldolgozók, így megmarad bennük a két darab 128 bites vektormotor.

Utóbbiak közül az egyik felel az általános operációk feldolgozásáért, míg a másik a speciális, trigonometrikus és transzcendens utasításokat támogatja, de mindkét vektoros egység kezeli az FMA-t, ami rögtön utat ad a 4+4 co-issue képességnek. Ezzel tehát az Execution Unitok továbbra is órajelenként nyolc darab, egymástól független FMA utasítást képesek végrehajtani. Természetesen a függőség kezelése kulcsfontosságú maradt, mivel az egymástól függő operációk párhuzamos feldolgozása nem lehetséges; erről ezúttal is a Thread Dispatch egység gondoskodik, amely igyekszik úgy etetni a vektormotorokat, hogy minél többször hasznosítható legyen a 4+4 co-issue feldolgozás. Mindemellett az alaparchitektúrát érintő finomítás, hogy javult a 32 bites integer műveletek feldolgozási sebessége.

A 8 darab Execution Unit egy shader tömbön belül érdekes döntésnek tűnhet az előző generációs architektúrához képest, figyelembe véve azt is, hogy az Intel a Sandy Bridge megjelenése óta komoly utat járt be az IGP fejlesztése. A shader tömbben található feldolgozók száma gyakorlatilag minden generációban változott, ami egyetlen más, GPU-architektúrát tervező cégre sem jellemző. Maga a folyamatos módosítás azt jelzi, hogy a mérnökök egyszerűen nem találják az optimális konfigurációt. Az Ivy Bridge Gen7-es IGP-jében például egy shader tömb 16 feldolgozót használt, és ez a szám a Haswell Gen7.5-ös megoldásánál 10-re csökkent, majd ahogy említettük, ma már csak 8 darab Execution Unitról beszélhetünk.

Az elmúlt években azonban az Intel rájöhetett arra, hogy nem volt semmi gond az eredeti koncepciójukkal, nem ettől volt rossz a hardver kihasználhatósága, így a Broadwell fejlesztésénél visszatértek az alapokhoz, így új irányt vehetett a fejlesztés a jobb hatékonyság és a jobb skálázhatóság érdekében. A Gen8 architektúrában a feldolgozók helyett az L1 gyorsítótár mérete nőtt a shader tömbökön belül. Ezzel megnő az esélye annak, hogy az adott feladat számára szükséges adat ott lesz az L1 gyorsítótárban, amivel a rendszer dolgozhat addig, amíg a többi szál számára is befut a szükséges információ.


A Broadwell-H processzorok IGP-je [+]

A gyorsítótár növelése egyébként egy nagyon egyszerű módja a hatékonyság növelésének, de a cégek csak a legvégső esetben nyúlnak ehhez a megoldáshoz, mert érezhető hátránya a koncepciónak, hogy jóval méretesebb lesz maga a grafikus vezérlő, és ez a Broadwell esetében abszolút meglátszik.

A shader tömbökben szokás szerint megmarad a 256 kB-os kapacitást kínáló URB, azaz a Unified Return Buffer, mely egy gyorsan elérhető, írható és olvasható megosztott memória az Execution Unitok között. A textúrázás szempontjából sok változás nincs az elődhöz viszonyítva, azaz egy shader tömb két darab megosztott textúrázó blokkot tartalmaz, melyek egyenként négy darab Gather4-kompatibilis textúrázó csatornát alkalmaznak. Természetesen jelen van a blokkonkénti textúrázó gyorsítótár is, mely egy 4 kB-os elsődleges és egy 24 kB-os másodlagos szintből áll.

A shader tömbök mellett találhatók a render tömbök, amelyek a data porton keresztül érhetők el, utóbbi tartalmazza a ROP-blokkot is, melyben négy blending és négy Z mintavételező egység dolgozik. Ezen a ponton tehát nincs változás a korábbi IGP-khez képest, viszont nőtt a ROP blokkhoz tartozó gyorsítótárak mérete. Megmaradt az L3 gyorsítótár is, ami az IGP saját, szabadon felhasználható memóriája, és ide a processzormagok nem írhatnak semmit, ráadásul ennek mérete a Gen7.5 architektúrához képest 256 kB-ról 384 kB-ra nőtt. Ezzel kapcsolatban fontos még megjegyezni, hogy az L3 gyorsítótér felel a Local Data Share (LDS) funkció ellátásáért is. Mivel az asztali Broadwell lapka IGP-je hat shader tömb mellett két render tömböt használ, így összesen nyolc-nyolc darab blending és Z mintavételező egység található benne, illetve két darab 384 kB-os L3 gyorsítótárral rendelkezik. A teljesség kedvéért leírjuk az Execution Unitok összesített számát is, ami 48.

A Broadwell grafikus tudása és a multimédia

A Broadwell architektúrájából már látható, hogy a hardver tudása is javult, főleg az IGP szempontjából. A Haswellhez képes extra, hogy a rendszer támogatja a DirectX 11.2-ben bemutatott, de opcionális Tiled Resources funkciót, annak is a butább TIER_1 szintjét. Technikailag az OpenGL 4.5 támogatásával sem lehet probléma, de az Intel egyelőre OpenGL 4.3-at jelez, ami csupán azért alakult így, mert nem biztos, hogy az újabb verziókhoz készül grafikus meghajtó. Mindemellett az Intel kiemelte az OpenCL 2.0 támogatását is az első oldalon már részletezett egységes memóriával egyetemben.

A DirectX 12 szempontjából érdemes egy kicsit elemezni a helyzetet. A Gen8-as architektúra természetesen támogatja ezt az API-t is, de ami igazán fontos, hogy a WDDM 2.0-s felületből nem csak a GPUMMU, hanem az IOMMU címzést is kezeli a Broadwell. Ebben a formában a processzormagok és az integrált grafikus vezérlő egységes memóriaképet lát, vagyis a fejlesztők képesek lesznek számos, korábban processzormagok által végzett feladatot átadni az IGP-nek az adatmásolással kapcsolatos hátrányok nélkül. Aki esetleg nem értené, hogy mit keres egy ilyen processzorban ekkora IGP, nos erre a válasz az, hogy a körülmények megváltoztak, így a legtöbb teljesítményt már az IGP kihasználásával lehet elérni, hála az IOMMU címzési mód bevezetésének. Az Intel tehát nem véletlenül költi el a lapkaterület felét erre a részegységre.

A DirectX 12-nél maradva a Haswellhez képest a Broadwell lényeges extra képessége lesz a 16 bites lebegőpontos utasítások támogatása teljes értékű feldolgozás mellett, ami a játékosok számára nagyon lényeges szempont, hiszen számos feladat nem igényel 32 bites precizitást, így energiát lehet spórolni, miközben gyorsul is a hardver. Utóbbi egyébként opcionális DirectX 12-es követelmény, és az Intel nagyon erősen kardoskodik használatáért a fejlesztőknél.

Fontosabb technológiai változás még, hogy a Broadwell Gen8-as architektúrája már nem csak a négyszeres, hanem a kétszeres mintavételi módot is támogatja az MSAA aktiválásakor, ami azt jelenti, hogy a kétmintás (2x) opcióért már nem kell a négymintás (4x) MSAA sebességével fizetni. Ezt az Intel különálló blokkokkal oldja meg, vagyis a mérnökök beépítettek egy hardveres részegységet a kétmintás és egyet a négymintás MSAA-nak is. Ez technikailag tranzisztorpazarlás, de a végeredmény tekintetében abszolút működőképes megoldás. Mint ismeretes, a Haswell IGP-je ebből a szempontból furán működött. Mindemellett egy harmadik blokk képes a nyolcmintás MSAA-ra is.

Multimédiás szempontból a Gen8-as architektúra szintén javult az elődhöz képest. A Quick Sync Video szolgáltatásért felelős hardveres blokk például kétszer gyorsabb lett a Haswell IGP-jében található opcióhoz képest, tudása viszont nem változott, így a kódoló továbbra is a H.264, az MPEG2 és a VC-1 kodeket támogatja. A dekódolás szempontjából extraként emelhető ki a VP8 formátumú tartalmak fixfunkciós blokkal való gyorsítása, emellett újítás még a HEVC videók dekódolásának támogatása. Ugyanakkor utóbbi nem hardveres, hanem szoftveres, GPGPU-s megoldás, vagyis nem fixfunkciós blokk felel a feldolgozásért.

A Broadwell-K lapka egyik érdekessége, hogy ez az első olyan LGA tokozást alkalmazó processzor, amelynél a processzor lapkája mellett egy 128 MB-os eDRAM is található. Ez funkcionálisan egy L4 gyorsítótárként működik, és a belső gyűrűs adatbusszal van összekötve, ennek megfelelően a processzormagok és a grafikus vezérlő is írhat bele, illetve olvashat belőle. Ez a koncepció leginkább azokban a játékokban képes jól teljesíteni, ahol az alkalmazott videojáték-motor nem túl komplex, így reálisan kihasználható az eDRAM előnye. A modernebb videojáték-motorok már túl bonyolultan működnek, ráadásul memóriakímélő leképzőket használnak és ilyen esetben az eDRAM nem sokat segít.

Core i7-5775C, IGP-re gyúrva

Az első oldalon ecsetelt események okán végül nem több mint összesen kettő darab asztali Broadwell processzor került piacra idén júniusban. Már a kódnév is sokatmondó, ugyanis a "H" jelölésű lapkák a csúcs mobil modelleket jelölik, ergo az Intel nem csinált mást, mint egyszerűen a mobil vonalra tervezett megoldást átültette a 2013-ban bemutatott LGA1150 tokozásra.


A BGA tokozású Broadwell-H

Ahogy az előző oldal végén már utaltunk rá, a Broadwell-H kódnevű asztali modellek két lapkából állnak össze: a fenti képen látható nagyobbik darab maga a CPU, mely felett fekszik a 128 MB kapacitású eDRAM lapka. Előbbi a már taglalt 14 nanométeres gyártástechnológiával készül, területe pedig nagyjából 172 mm², míg utóbbi a 22 nm-es SoC-ra optimalizált gyártósorokról kerül le, körülbelül 81 mm²-es lapkamérettel. Az eDRAM (embedded DRAM) amolyan off die gyorsítótárként funkcionál, hisz az Intel a cache-hierarchiát tekintve az L3 után szúrta azt be, ezzel egy negyedik szinű, L4-es gyorsítótárat hozva létre. Mindez egyben azt is jelenti, hogy az eDRAM által nyújtott előnyöket a grafikus magon túl akár a processzormagok is kamatoztathatják.

Mivel jelen esetben DRAM-ról beszélünk, így bár tempóban nem várhatjuk el a processzorok lapkájába beépített SRAM cache sebességét, ugyanakkor, ahogy a fenti képen is látható, a rendszermemóriánál még így is gyorsabb tud lenni az Intel átmeneti tárolója. Az órajelet tekintve 1600 MHz-en ketyeg a lapka, maximális fogyasztása pedig nagyjából 4 watt.


A Broadwell-H lapka [+]

Átnyargalva a nagyobbik, fő lapka felépítésére azonnal szembetűnhet az óriási, nagyjából 85 mm²-es GT3e típusú grafikus mag, ami kicsivel több mint kétszer akkora területet foglal el, mint a négy processzormag és a 6 MB L3 cache együtt. Szintén sok helyet emészt fel az eDRAM vezérlője, ugyanakkor hála a 14 nanométeres gyártástechnológiának a teljes lapka mérete még ezzel együtt sem nagyobb, mint a jóval soványabb grafikus maggal szerelt, szintén négymagos i7-4770K-é.


[+]

Ahogy már említettük, maga a processzor LGA1150-es tokozást alkalmaz, így fizikailag bármilyen, erre a névre hallgató foglalattal kompatibilis, ugyanakkor az Intel hivatalosan csak a 9-essel kezdődő lapkakészletek mellett támogatja a Broadwell processzorokat.

Intel Broadwell-H: asztali Core generáció GT3e IGP-vel és LGA1150-es tokozással
Típus Órajel/Turbo Boost órajel Hyper-Threading L3 cache Fogyasztás Iris Pro Graphics 6200 alap/turbo órajel Listaár (dollár)
i7-5775C
(4 mag)
3,3/3,7 GHz van 6 MB 65 W 300/1150 MHz 366
i5-5675C
(4 mag)
3,1/3,6 GHz nincs 4 MB 65 W 300/1100 MHz 276

Az i7-5775C órajelei nem túl acélosak, hisz például az i7-4770K-hoz képest 200, míg az i7-4790K-hoz mérten már 700 MHz a hátránya. Öröm az ürömben, hogy szorzózármentes megoldásokról beszélhetünk, azaz a processzorok tuningolhatóak.

Tesztkonfig, fogyasztás, specifikációk

2013 őszén debütált Windows 8-as tesztrendszerünk, mely többek között az általunk korábban használt alkalmazások legújabb verzióit tartalmazza. Szokásunkhoz híven a különféle szintetikus tesztprogramokat továbbra is háttérbe szorítva, a valós felhasználásra fókuszálva állt össze a csomag. Mindez összesen 18 különféle alkalmazást és 2 játékot takar, melyek listája a következőképpen alakul:

  • WinRAR 5.00 b8 (64-bit)
  • 7-Zip 9.25 (64-bit)
  • Cinebench R11.5 (64-bit)
  • Autodesk 3ds Max 2014 (64-bit)
  • Indigo Renderer v3.4.16 (64-bit)
  • Adobe After Effects CC (64-bit)
  • Adobe Premiere Pro CC (64-bit)
  • Adobe Photoshop CC (64 Bit)
  • Sony Vegas Pro 12 (64-bit)
  • CyberLink PowerDirector 11 (64-bit)
  • Sorenson Squeeze 9 (32-bit)
  • DivX Encoder 6.9.2 (32-bit)
  • XviD Encoder 1.3.2 (64-bit)
  • x264 build 2334 (64-bit)
  • LameXP 4.07 b1286 (32-bit)
  • Cockos REAPER v4.402 (64-bit)
  • Apache 2.2.25 (32-bit)
  • AVG AntiVirus Free 2013.0.3392 (64-bit)

A szoftverek döntő többsége már képes 4-8 vagy akár több magot/szálat is kihasználni, ugyanakkor továbbra is akad néhány kivétel.

  • Crysis 3 (CPU)
  • Tomb Raider (CPU)
  • Grid 2 (CPU)
  • Batman: Arkham Origins (DirectX 11) – motor: Unreal Engine 3 / műfaj: TPS
  • Company of Heroes 2 (DirectX 11) – motor: Essence Engine 3.0 / műfaj: stratégia
  • DiRT Rally (DirectX 11) – motor: EGO Engine 3.0 / műfaj: autóverseny
  • GTA V (DirectX 11) – motor: EGO R.A.G.E. / műfaj: TPS/akció
  • Thief (DirectX 11/Mantle) – motor: Unreal Engine 3 / műfaj: FPS/akció
  • Tomb Raider (DirectX 11) – motor: Crystal Engine / műfaj: TPS/kaland
Tesztkörnyezet
LGA1150 tesztplatform Intel Core i7-5775C (3,3 GHz) processzor
Intel Core i7-4790K (4,0 GHz) processzor
Intel Core i7-4770K (3,5 GHz) processzor
Gigabyte Z97X-UD5H-BK alaplap (Z97 chipset, BIOS: F8a)
2 x 4 GB G.Skill RipjawsX DDR3-1866 F3-14900CL9Q-16GBXL memória
DDR3-1600 beállítás, 9-10-9-28-1T időzítések
LGA2011-v3 tesztplatform Intel Core i7-5960X (3,0 GHz) processzor
ASUS X99-Deluxe alaplap (X99 chipset, BIOS: 1601)
4 x 8 GB Crucial DDR4-2133 CT4K8G4DFD8213 memória
DDR4-2133 beállítás, 15-15-15-36-2T időzítések
LGA2011 tesztplatform Intel Core i7-4960X (3,6 GHz) processzor
ASUS P9X79 PRO alaplap (X79 chipset, BIOS: 4210)
4 x 4 GB G.Skill RipjawsX DDR3-1866 F3-14900CL9Q-16GBXL memória
DDR3-1866 vagy DDR3-1600 beállítás, 9-10-9-28-1T időzítések
LGA1155 tesztplatform Intel Core i7-3770K (3,5 GHz) processzor
Intel Core i7-2600K (3,4 GHz) processzor
MSI Z77 MPOWER alaplap (Z77 chipset, BIOS: V17.10)
2 x 4 GB G.Skill RipjawsX DDR3-1866 F3-14900CL9Q-16GBXL memória
DDR3-1600 vagy DDR3-1333 beállítás, 9-10-9-28-1T/9-9-9-28-1T időzítések
LGA1366 tesztplatform Intel Core i7-920 (2,66 GHz) processzor
ASUS P6T Deluxe alaplap (X58 chipset, BIOS: 2209)
3 x 4 GB G.Skill RipjawsX DDR3-1866 F3-14900CL9Q-16GBXL memória
DDR3-1066 beállítás, 7-7-7-21-1T időzítések
FM2+ tesztplatform AMD A10-7870K (3,9 GHz) processzor
ASUS A88X-PRO alaplap (A88X chipset, BIOS: 2001)
2 x 4 GB G.Skill RipjawsX DDR3-1866 F3-14900CL9Q-16GBXL memória
DDR3-2133 vagy DDR3-1866 beállítás, 11-12-11-30-2T/9-10-9-28-2T időzítések
AM3/AM3+ tesztplatform AMD FX-9590 (4,7 GHz) processzor
AMD FX-8350 (4,0 GHz) processzor
AMD Phenom II X4 980 (3,7 GHz) processzor
AMD Phenom II X6 1100T (3,3 GHz) processzor
ASUS Crosshair V Formula-Z alaplap (990FX chipset, BIOS: 1503)
2 x 4 GB G.Skill RipjawsX DDR3-1866 F3-14900CL9Q-16GBXL memória
DDR3-1866 vagy DDR3-1333 beállítás, 9-10-9-28-2T/9-9-9-28-1T időzítések
Videokártya AMD Radeon HD 7970 GHz Edition 3 GB GDDR5 – Catalyst 13.4
Háttértárak Intel SSD 510 250 GB SSDSC2MH250A2 (SATA 6 Gbps) SSD
Seagate Barracuda 7200.12 500 GB (SATA, 7200 rpm, 16 MB cache) merevlemez
Processzorhűtő Prolimatech Megahalems Rev.C
Tápegység Seasonic Platinum Fanless 520 – 520 watt
Monitor Acer B326HUL (32")
Operációs rendszer

Windows 8 Pro és 8.1 64 bit

A bevett procedúrának megfelelően most is mindent a gyári specifikációk alapján állítottunk be. A turbó funkciók kivétel nélkül az összes platform esetében be voltak kapcsolva.

Szokás szerint először a fogyasztást vettük górcső alá. Ennek mérését egy konnektorba dugható, digitális VOLTCRAFT Energy Logger 4000 készülékkel végeztük, és minden esetben a monitor nélküli teljes konfiguráció értékeit vizsgáltuk. Mivel lassan már az összes Intel processzor, illetve az AMD APU-k is tartalmaznak IGP-t, ezért ezen modellek fogyasztását kétféle módszerrel is megvizsgáltuk. Az első esetben egy diszkrét Radeon HD 7970 GHz Edition került a rendszerekbe, amivel a processzorba integrált GPU inaktívvá vált, majd később ezt kivettük, és nélküle is elvégeztük a méréseket. A platformokon be volt kapcsolva az összes lehetséges energiagazdálkodási funkció (EIST, C1E, C6 stb.).

Üresjáratban, grafikus kártyával társítva nem tudtunk számottevő különbséget kimutatni az elődökhöz képest.

Pusztán az integrált grafikát aktiválva változatlan maradt a helyzet.

Terhelés mellett a Haswell processzoroktól valamivel kevesebbett kért magának az i7-5775C, amivel nagyjából az i7-3770K típusú Ivy Bridge szintjére esett vissza a főszereplő.

A különbség diszkrét VGA nélkül is megmutatkozott, viszont érdekes módon játék alatt többet fogyasztott a Broadwell, ami valószínűleg a nagyobb méretű IGP-re, illetve a jobb kihasználtságra vezethető vissza.

Specifikációk
Processzor típusa Intel
Core i7-5775C
Intel
Core i7-4790K
Intel
Core i7-4770K
AMD A10-7870K
Kódnév
(CPU-magok kódneve)
Broadwell Haswell Godavari (Steamroller)
Tokozás LGA1150 FM2+
Alap magórajel 3300 MHz 4000 MHz 3500 MHz 3900 MHz
Magok / szálak 4 / 8 4 / 4
Max. hivatalos
memória-órajel
DDR3-1600 (DC) DDR3-2133 (DC)
Turbo Core (alap/max.) 3,6-3,7 GHz 4,1-4,4 GHz 3,7-3,9 GHz 4,1 GHz
L1D/L1I cache mérete 4 x 32/32 kB 4 x 16 kB /
2 x 96 kB
L2 cache mérete 4 x 256 kB 2 x 2 MB
L3 cache mérete 6 MB 8 MB nincs
L3/IMC órajele (uncore/NB) 3300 MHz 3800 MHz 3500 MHz 1800 MHz
Kommunikáció a chipsettel DMI 2.0 (5 GT/s) + FDI (az IGP-hez) UMI (5 GT/s)
Integrált PCIe vezérlő 16 sáv (3.0) 20 sáv (3.0)
Utasításkészletek MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, AES-NI,
AVX, AVX2, FMA3
MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, SSE4A, AES, AVX, XOP, FMA4, FMA(3), F16C, BMI, TBM
Egyéb technológiák EIST, C1E, C-states, Hyper-Threading, VT-x,
VT-d (4790K, 5775C), TSX-NI (5775C)
APM, HTC, C1E, C6, EVP, AMD-V, IOMMU v2, VCE 2
Gyártástechnológia / feszültség 14 nm Tri-Gate
1,08 V (rev. E0/G0)
22 nm Tri-Gate
1,14 V (rev. C0)
22 nm Tri-Gate
1,05 V (rev. C0)
28 nm HKMG
1,4875 V (rev. A1)
TDP max. 65 watt max. 88 watt max. 84 watt max. 95 watt
Tranzisztorok száma
Lapka mérete
??? milliárd
~172 mm2
1,40 milliárd
177 mm2
2,41 milliárd
245 mm2
Integrált GPU (IGP) Iris Pro 6200 HD Graphics 4600 Radeon R7 series
Grafikus mag kódneve Gen8 (GT3e) Gen7.5 (GT2) Spectre (GCN2)
Végrehajtóegységek 48 Execution Unit 20 Execution Unit 512 Radeon Core
IGP magórajel 300 MHz 650 MHz 866 MHz
Turbo Boost v. Core órajel 1150 1250 MHz nincs
Max. elméleti memória-sávszélesség 25,6 GB/s (+eDRAM: 50 GB/s) 25,6 GB/s 33,33 GB/s
Támogatott DirectX verzió DirectX 12
Támogatott OpenGL verzió OpenGL 4.4 OpenGL 4.3 OpenGL 4.4
Támogatott OpenCL verzió OpenCL 2.0 OpenCL 1.2 OpenCL 2.0
Multi-GPU opció nincs Dual Graphics
(R7 240, 250)
HD anyagok hardveres támogatása Intel ClearVideo HD (H.264, VC-1, MPEG-2) AVIVO HD (UVD4), (H.264, VC-1, MPEG-2, MPEG-4 ASP/DivX)
HDMI Audio Dolby TrueHD és DTS-HD Master
Extrák QuickSync FreeSync, TrueAudio, VCE 2, HSA, VSR

Renderelés, tömörítés (CPU)

Korábbi tesztjeinkben már elmondtuk, hogy a renderelés tipikusan az a nagyon jól párhuzamosított, sok magot/szálat kihasználni képes folyamat, ami nem igazán húz hasznot sem a méretes L3 cache-ből, sem az esetlegesen nagyobb memória-sávszélességből. Az IPC, azaz az egységnyi órajel alatt végrehajtható műveletek számából, illetve a magasabb üzemi magfrekvenciából viszont annál inkább képesek profitálni ezek az alkalmazások. Előbbinek hála az első két alkalmazásban még az alacsonyabb órajele ellenére is megelőzte a Haswell i7-4770K-t a főszereplő.

A fájltömörítők a renderelő alkalmazásokkal ellentétben kedvelik a minél nagyobb memória-sávszélességet és az alacsony késleltetést, illetve a minél nagyobb, illetve gyorsabb L2 és L3 cache-t. Mivel az i7-5775C-nek még L4 cache is jutott, így itt ezt kamatoztatva előkelő helyen végzett a Broadwell-H.

Videóvágás, szerkesztés (CPU)

A különféle videóvágó és -konvertáló alkalmazások egyaránt profitálnak a gyorsabb memóriából és a minél több magból/szálból, illetve természetesen a magasabb IPC-ből. Az L4 cache hatása itt leginkább Sony Vegas alatt mutatkozott meg, aminél a jóval magasabb órajelen ketyegő i7-4790K-t is megelőzte a tesztalany.

A PowerDirector alatt kisebb csodát láthattunk, amire ismét az L4 cache a magyarázat. Ez az alkalmazás rendkívül kedveli a minél alacsonyabb memória-késleltetést, amit az eDRAM 128 MB erejéig meg is adott neki, így az i7-5775C egészen az első helyig repült, 20(!) másodperccel megelőzve az i7-4790K-t, és eggyel a nyolcmagos csúcs i7-5960X-et. A Sorenson Squeeze-t leginkább az IPC és az órajel érdekli, akárcsak a Cockos Reapert.

Videókódolás, egyéb (CPU)

A DivX képes több szálon dolgozni, bár négy felett már egyiket sem terheli maximumra, míg az XviD csupán egyet képes kihasználni. Ezekkel ellentétben az x264 jóval fejlettebb, hisz a tizenkét vagy több szálat felvonultató processzorokon is képes 100%-os CPU-kihasználtságot mutatni, miközben még a legújabb utasításkészleteket is kihasználja. Utóbbi alatt a CPU-magok kisebb újításainak hála jól muzsikált az i7-5775C.

Játékok (CPU)

A Radeon HD 7970 GHz Editionnel párosítva, egyjátékos (single player) módban játszott címek alatt most sem láttunk különösebb meglepetést, az i7-5775C jól tartotta magát.

Játékok IGP-vel (I. rész)

Néhány játékkal a processzorokba integrált grafikus vezérlő teljesítményét is megvizsgáltuk, hisz papíron épp ezen a területen kínálja a legnagyobb előrelépést a Broadwell-H, azaz az i7-5775C.

Az új DiRT Rally alatt nem tudta beérni az A10-7870K APU-t az i7-5775C. GTA V alatt az átlag értékek szinte pontosan egyeztek az AMD eredményeivel, ugyanakkor a minimum többszöri mérés után is alulmaradt az APU-val szemben. A Company of Heroes 2 esetében először fordult a kocka, ugyanis Full HD felbontásban előzött az Intel Iris Pro 6200-a.

Játékok IGP-vel (II. rész)

Batman alatt jól szerepelt az i7-5775C IGP-je, gyorsabb is tudott lenni az A10-7870K-nál. A Thief ismét az Iris Prónak feküdt jobban, akárcsak a Tomb Raider, melyben már a Radeon R7 250-től is alig maradt el az Intel megoldása.

ComputeMark, LuxMark

Az GPU-k általános számítási feladatokra való használatának népszerűsödésével két, ezen képességet vizsgáló benchmark is bekerült méréseink közé. Mivel félig-meddig szintetikus tesztekről van szó, így messzemenő következtetéseket nem érdemes levonni ezek eredményeiből.

A ComputeMark egyszerűbb DirectCompute shaderekkel operál, melyekkel főleg a játékok alatt lehet találkozni. A Luxmark az egyik legelterjedtebb benchmark a ray-tracing tesztelésére. Utóbbi már a Haswell esetében is feküdt az Intel IGP-jének, ami az Iris Pro esetében sem történt másképp.

Tuning

Szokás szerint most is megnéztük, hogy mekkora órajeltartalék lapul még a főszereplő processzorban. Az i7-5775C esetében szerencsére viszonylag könnyű dolgunk volt, hisz a "K" helyetti rendhagyó "C" jelölésből adódóan a főszereplő szorzózármentes, azaz tuningolható.

Végül több próbálkozás után is csak 4300 MHz-et értünk el, ami a Sandy és Ivy Bridge, illetve a Haswell esetében látottaknál alacsonyabb, ergo ezen a téren nem muzsikált túl jól a tesztalany. Azt természetesen nem tudjuk, hogy csak a mi példányunk volt-e kevésbé tuningbarát vagy ez általános erre a szériára. A stabil órajelhez 1,4 voltos feszültség kellett, amivel maximális terhelés mellett 80 Celsius-fok környékén működtek a magok. Utóbbi a kupak alatt pasztás hővezetést sejtet.

Az órajel és a feszültség együttes emelésének hatására körülbelül 50%-kal ugrott meg a fogyasztás.

Végül a tuning hatását különböző alkalmazások alatt is megmértük.

Összegzés, konklúzió

Cikkünk végéhez közeledve szokás szerint térjünk rá az eredmények összesítésére!

Az átlagolt eredmények alapján a főszereplő 3,4%-kal gyorsabb az i7-4770K-nál, ami az alacsonyabb órajelek ellenére jónak számít.

Teljesítmény/fogyasztás terén egy kisebb mértékű előnnyel végzett a lista élén az i7-5775C.

A GPU által gyorsított, játékok alatti 3D-s megjelenítési teljesítményben szinte pont egálban végzett az Iris Pro 6200-zal szerelt i7-5775C és az AMD A10-7870K APU. A játékok egyik felében az Intel, míg a másikban az AMD megoldása volt a jobb.

A GPU teljesítmény/fogyasztás mutatóját tekintve az Intel nagyjából 12%-kal végzett az élen az AMD APU-ja előtt.

Az asztali Broadwell, ha tetemes késéssel is, de végül piacra került. A Core i7-5775C az első, Iris Pro grafikus megoldással szerelt asztali Intel processzor, mely a legtöbb végrehajtót felvonultató grafikus mag mellett még eDRAM gyorsítóval is rendelkezik. Mindez jelen állás szerint bizonyos esetekben elég, míg másokban kevés az AMD aktuálisan leggyorsabb A10-7870K nevű megoldása ellen. Sejtésünk szerint az Intel hátrányának oka a driverben keresendő, ahol a konkurens még mindig jobban áll ősi riválisánál. Ettől eltekintve saját magához mérten tetemeset lépett előre az Intel. Az x86-os CPU-teljesítményt szemlélve kisebb előrelépésről beszélhetünk, melynek mértéke olykor az eDRAM miatt kissé csalóka lehet. Mindent egybevéve ezen a téren nagyjából az i7-4770K tempójára számíthatunk.

Egy szó mint száz, a Broadwell asztali generációja számkivetett lett, hisz végül mindössze két i7-es modell került piacra. Ez csalódást jelenthet egyes, Z97-es alaplapokba befektetett felhasználóknak, akik tavaly a bővítés reményével vásároltak. Utóbbi alól kivétel lehet, aki erős IGP-re vágyott, hisz az Iris Pro 6200 az eddig látott leggyorsabb Intel grafikus vezérlő. Már csak az a kérdés, hogy ki tartja mindezért reálisnak a nagyjából 130 000 forintos árat, amiből kijöhet egy i7-4790K processzor R7 250X-szel vagy GTX 750-nel párosítva. Ettől függetlenül nekünk tetszett a Core i7-5775C, mely szerintünk végül inkább csak egy érdekességként fog bevonulni a processzortörténelembe.


Intel Core i7-5775C processzor

Oliverda és Abu85

Az Intel Core i7-5775C processzort az Intel bocsátotta rendelkezésünkre.

Hirdetés

  • Kapcsolódó cégek:
  • Intel

Azóta történt

Előzmények