Elérte a mobil piacot a Zen
Az AMD az idei évben alaposan felkavarta az állóvizet a Ryzen processzorokkal, ami lassan az Intel számára is problémát fog okozni, mivel a Zen processzormag egyre több piacot fed le. Egyelőre az asztali gépek területén a legnagyobb a nyomás, míg a szerverpiacon, illetve a mobil vonalon még nem indult be az igazi verseny. Utóbbi annak köszönhető, hogy a szervereknél a gyártópartnerek is komoly tényezőnek tekinthetők, tehát egy-egy termék az igazi hatását leginkább a megjelenése után fél-háromnegyed évvel tudja éreztetni, míg a mobil területeket az AMD még meg sem támadta.
Egészen mostanáig, ugyanis a Zen architektúra az asztali gépek és a szerverek után a mobil piacot is beveszi. Erre sokan vártak, mivel már nyári Ryzen tesztünk alapján is érdekes volt látni, hogy az AMD újdonsága a teljesítmény/fogyasztás mutatóban mennyivel jobb az Intel megoldásainál, de ennek valódi hatása leginkább az alacsony fogyasztású modelleken jön ki, amelyek máig hiányoztak a Ryzen termékskáláról.
Itt a Raven Ridge
A mobil piacra az AMD új lapkát fejlesztett Raven Ridge kódnéven, amelyet a GlobalFoundries gyárt, méghozzá a 14 nm-es LPP node-on. Ez egy SoC APU, vagyis gyakorlatilag minden benne van, ami egy számítógép működéséhez szükséges, ennek köszönhetően a platformdizájnja kicsi maradhat, hiszen extra vezérlőt nem igényel, és ez a notebookok esetében fontos kritérium. Ugyanakkor ez nem számít újdonságnak, hiszen már a jóval korábban megjelent Carrizo SoC APU is ilyen volt, ahogy frissítésnek tekinthető Bristol Ridge is.
Szokás szerint érdemes a processzorrésszel kezdeni, ami a Raven Ridge-ben egyszerűen elintézhető. Gyakorlatilag egyetlen úgynevezett CCX-et, azaz Core Complexet kapott, amiben négy darab, egyenként két szálat futtató Zen mag található, és ezekhez maximum 4 MB megosztott L3 gyorsítótár kapcsolódhat 32 bájtot továbbító buszon. Ez ráadásul úgynevezett victim cache, vagyis csak akkor kerülnek az L3 gyorsítótárba az adatok, ha a magonként 512 kB-os L2 gyorsítótár megtelik. Annak érdekében, hogy ez előnyös legyen a rendszerre nézve, az L3 gyorsítótár elérésének késleltetése nem csak az adott maghoz tartozó 1 MB-os szeletre levetítve alacsony, hanem konkrétan az egész CCX-en belül, vagyis nem sokkal nagyobb késleltetéssel tudja elérni az egyik mag a másik maghoz kapcsolódó, 1 MB-os szeletet.
A Raven Ridge CCX-e egyébként nem ugyanolyan, mint a Summit Ridge-é, ugyanis az L3 gyorsítótár kapacitását megfelezték a mérnökök, cserébe azonban ennek az elérése még alacsonyabb késleltetésű lett, tehát a hátrány mellett kapott előnyös fejlesztést is.
Hirdetés
Más szempontból nincs változás, így a pontos felépítés tekintetében csak korábbi elemzésünket tudnánk ismételni. Ehelyett inkább arra koncentrálnánk, ami módosult, ugyanis a Raven Ridge a Summit Ridge-nél precízebb órajel-beállítást tesz lehetővé. Ezt az AMD Precision Boost 2 névvel illeti, és annyiban más az első verzióhoz képest, hogy hatékonyabb a körülményekhez való alkalmazkodást biztosító algoritmusa. Tehát az asztali Ryzenben bevezetett, finomszemcsés P-State modell megmarad, ahogy a 25 MHz-es léptékenként megvalósítható, magfüggetlen órajelváltás is, ugyanakkor a magok terhelésétől függő turbó órajelek beállításánál az egyes hardveres szálak felszabadítása vagy lefoglalása jóval finomabb átmenetek mellett alakítja majd az adott pillanatra vonatkozó frekvenciát. Ez különösen hasznos fejlesztés egy mobil terméknél, ahol az esetek nagy többségében az számít igazán, hogy mennyire magas turbót tud beállítani az adott notebook a körülményeket figyelembe véve.
Végül újítás a mobil XFR is, ami – nem túl nagy meglepetésre – az asztali XFR, azaz Extended Frequency Range mód mobil változata. Itt annyi a különbség, hogy míg az asztali modelleknél ez egy specifikált paraméter, addig mobil szinten nincs egzakt érték megszabva, lényegében az adott notebook tervezőjén múlik, hogy mekkora automatikus tuningtartománnyal működhet a termék. Annyit persze érdemes tudni, hogy az AMD ezt nagyon komolyan veszi, így csak akkor aktiválható az mXFR funkció, ha az adott notebook megfelel a cég kritériumainak. Innentől kezdve viszont már csak a hűtőrendszeren múlik, hogy a processzor milyen mértékben megy a specifikált maximális paraméterek fölé, ugyanis a szolgáltatás teljesen automatikus, nem igényli a felhasználó beavatkozását sem.
Az mXFR azért lesz nagyon érdekes, mert a gyártók így lehetőséget kapnak a hűtésre vonatkozó innovációra, ugyanis korábban egy notebook hiába alkalmazott jobb hűtést egy másiknál, ugyanolyan processzor mellett ennek nem volt lényeges előnye. Leszámítva persze a burkolati hőmérsékletet, de a teljesítmény nem igazán változott. Az AMD viszont kimérte egy létező notebookdizájnon, hogy az mXFR aktiválása nagyjából 23%-os extra teljesítményt jelent ahhoz képest, mintha ez a funkció nem létezne a processzorban, vagyis mostantól egy jól átgondolt hűtéssel komoly tempóelőnyre tudnak szert tenni a gyártók a versenytársakkal szemben, még akár ugyanolyan processzor mellett is.
A Vega sem maradt le a lapkáról
A Raven Ridge nem csak a Zen magok tekintetében különleges, hanem azért is, mert az IGP is megkapta a legújabb Vega architektúrát. Ennek részletesebb elemzésével szintén foglalkoztunk már augusztusban, így érdemes elolvasni a Vega 10-es GPU-ról írt cikket, mivel képességek terén az integrált verzió is lényegében ugyanazt kínálja.
A fizikai felépítés tekintetében persze kevesebb részegységgel kell számolni, elvégre más piacot céloz meg a fejlesztés. A Raven Ridge IGP-jében 11 darab úgynevezett NCU (Next-Gen Compute Unit) lesz, és ezek egyenként tartalmaznak egy skalár feldolgozót, illetve négy darab, egymástól teljesen független, 16 utas, azaz 512 bites, multiprecíziós SIMD motort. Egy NCU-n belül 64 kB-os Local Data Share (LDS) található, melyen a négy darab, egyenként 64 kB-os regiszterterülettel rendelkező SIMD motor osztozik. A helyi adatmegosztás mellett természetesen egy 16 kB-os adat gyorsítótár is elérhető, melyet az NCU írhat és olvashat is.
A skalár feldolgozó – szokás szerint – némileg különc az NCU-n belül. Ez lényegében egy integer ALU, mely 4 kB-os dedikált regiszterterületet kapott. A textúrázást NCU-nként egy blokk oldja meg, mely négy darab, csak szűrt mintákkal visszatérő Gather4-kompatibilis textúrázó csatornát rejt. A lapkán belül maximum három NCU rendeződik egy tömbbe, és ehhez tartozik egy 16 kB-os skalár és egy 32 kB-os utasítás gyorsítótár. Előbbit csak a skalár feldolgozó éri el, míg utóbbit az NCU összes feldolgozója hasznosíthatja, és természetesen mindkét gyorsítótár írható és olvasható is.
Az új IGP 10 egy geometriai motort használ, aminek a része egy darab tizenharmadik generációs tesszellátor is, illetve a Polaris generációból megörökölt primitive discard accelerator blokk sem maradt le, ami kivágja a degeneratív háromszögeket (ezeknek az összes csúcsuk egy egyenesre esik). A geometriai motorhoz kapcsolódik egy új raszterizáló, ami képes hagyományos IMR módban is működni, de elérhető a DSBR, vagyis a draw-stream binning rasterizer mód, ami nem csak gyorsítja a feldolgozást azzal, hogy a lapkán belül tartja a számításokat, hanem még a fogyasztást is csökkenti a memóriabusz terhelésének visszafogásával. Utóbbi ráadásul nagyon lényeges a Raven Ridge esetében, mivel az APU-knál eléggé korlátozott szokott lenni a memória-sávszélesség, így a korábbi generációhoz képest a rendszer főleg itt szedi össze a legtöbb tempóelőnyt.
Sajnos nem tudni pontosan, hogy az IGP-ben mennyi ROP blokk található, ezt ugyanis a cég nem közölte. A híresztelések alapján 16 blending és 64 Z mintavételezőt kapott a fejlesztés, és az eredmények is ezt támasztják alá, viszont ezt az információt nem tudjuk megerősíteni. Biztosan elérhető viszont a Delta Color Compression technika, amely teljes mértékben támogatja a 2:1, a 4:1 és a 8:1 arányú, veszteségmentes tömörítést, így jelentősen lehet vele csökkenteni a memóriabuszra vonatkozó terhelést, ami egy APU-ban szintén nagyon sokat ér.
Az általános számítások terén is fontos változások vannak, ugyanis a Vega 10-es GPU-hoz hasonlóan egy nagy kombinált egység található az új IGP-ben, vagyis lényegében négy ACE dolgozik a hardverben, amelyek egy megújított HWS (Hardware Scheduler) fennhatósága alá tartoznak majd. A rendszer így összességében 32 compute parancslistát kezel egy grafikai parancslista mellett: utóbbi megszokott, de előbbi a korábbi Radeon IGP-k által kezelt mennyiség fele. Az oka ennek pontosan az, hogy az egyenként 8 compute parancslistát kezelő ACE egységekből feleannyi van a hardverben, mint korábban, viszont nem minden a szám, a hatékonyság is sokat számít. Az átalakítás hatására az újratervezett blokk már jobban dolgozik, amellett persze, hogy a megmaradt a finomszemcsés preempció és a QoS (Quality of Service) támogatása. Előbbi felel azért, hogy a kritikus fontosságú feladatok előnyt élvezzenek, míg utóbbi a többfelhasználós környezet hatékony kezelését teszi lehetővé. A dizájnváltással viszont a QoS-t kiterjesztette az AMD, így ez már nem csak magára a GPU feldolgozóira, hanem a teljes lapkára vonatkozik, vagyis a multimédiás blokk is virtualizálható, mindezt teljesen automatikus hardveres ütemezés mellett. Természetesen továbbra is a rendszer része a 64 kB-os globális adatmegosztás, vagy más néven Global Data Share (GDS), emellett megmaradt a két DMA motor.
Ha már a multimédiás blokk szóba került, akkor ki kell emelni, hogy az UVD és a VCE helyét átvette a VCN, ami egy egység formájában oldja meg a kódolás és a dekódolás feladatait. Ez a virtualizálás lehetőségén túl nyolc HD vagy egy 4K-s 60 Hz-es HEVC videó dekódolását tudja biztosítani, illetve 240 Hz-es Full HD vagy 60 Hz-es 4K-s videó kódolásával bánik el. Mindezek mellett a TrueAudio Next technológia is elérhető.
A kijelzőmotor és a multimédiás blokkok [+]
A friss kijelzőmotor is ugyanazt tudja, amit a Vega 10-es GPU megoldása, vagyis a legfőbb extrája, hogy lehetővé teszi két 120 Hz-es 4K-s és három 30 Hz-es 8K-s kijelző meghajtását, illetve a HDR megjelenítők szempontjából egy helyett már három 4K-s 60 Hz-es megoldás fogható be, valamint elérhetővé vált a 120 Hz-es 4K-s és a 60 Hz-es 5K-s HDR megjelenítő is.
Végül az API-kra vonatkozó kérdéskört el lehet intézni azzal, hogy lényegében minden API legmagasabb működési szintjét támogatja a Raven Ridge IGP-je.
Mire jó ez összerakva?
Az előbbi oldalakon részletezett blokkokat az AMD az új Infinity Fabric összeköttetéssel kapcsolja össze a lapkán belül, és innen érhető el az integrált déli vezérlőhíd, illetve a memóriavezérlő is. Utóbbi 128 bit széles, így kétcsatornás módban működik optimálisan, a támogatott memória tekintetében pedig maximum 2400 MHz-es effektív órajelű, DDR4 szabványú megoldások jöhetnek szóba, így a memória-sávszélesség elérheti a 38,4 GB/s-ot.
Az előbbi paramétert persze már az előző generációs Bristol Ridge is elérte, tehát ebből a szempontból a rendszer nem javult, így azt gondolhatnánk, hogy az IGP sem lett lényegesen tempósabb, dacára a beépített extra egységeknek. Ugyanakkor a Vega architektúra annyival kíméletesebben bánik a memóriabusszal, hogy a Raven Ridge IGP-je akár 128%-kal is gyorsabb lehet az előző generációs rendszernél, jelentősen túlteljesítve az AMD Computexen tett 40%-os ígéretét. A négy darab Zen mag sem csak az ígért 50%-kal gyorsult a Bristol Ridge-ben található két Excavator modulhoz képest, ugyanis az AMD az elkészült termékeken már akár 200%-os előrelépést is mért. Mindezeket úgy, hogy egy 15 wattos TDP keretre konfigurált Raven Ridge került összehasonlításra egy 35 wattos Bristol Ridge modellel, vagyis az ígért 50%-os fogyasztáscsökkentésből is 58%-os előrelépés lett.
Az AMD ígérete és ami lett belőle [+]
Az AMD első körben két darab sztenderd modellt tesz elérhetővé a partnerek számára, melyek paramétereit az alábbi táblázat részletezi:
Típus | Órajel / Turbó órajel | SMT | L2 cache | L3 cache | Radeon RX típusa | Radeon magok száma | IGP PowerTune órajel | Fogyasztás (cTDP) |
---|---|---|---|---|---|---|---|---|
7 2700U (4 mag) | 2,2/3,8 GHz | van | 4 x 512 kB | 4 MB | Vega 10 | 640 | 1300 MHz | 9-25 W |
5 2500U (4 mag) | 2/3,6 GHz | van | 4 x 512 kB | 4 MB | Vega 8 | 512 | 1100 MHz | 9-25 W |
Az újdonságok alapértelmezett TDP kerete 15 watt, vagyis a specifikációkat is ennek megfelelően állapítja meg az AMD, ugyanakkor a notebookgyártók számára opcionálisan lehetőség a fogyasztás konfigurálása 9 és 25 watt között. Az IGP szempontjából megjegyzendő, hogy a 11 darab beépített NCU-ból egy fenn van tartva a Windows 10 bizonyos funkcióinak, ugyanis a korábbi TrueAudio DSP kikerült a rendszerből, és ennek helyét lényegében egy multiprocesszor vette át. Ennek komoly jelentősége van, mivel ha nem így döntene az AMD, akkor például Cortana, a Microsoft digitális asszisztense a processzormagokat terhelné, ami lényegesen nagyobb fogyasztást eredményezne.
Az üzemidőben is érezhető előrelépés várható a korábbi generációhoz képest, illetve egy felhasználók számára kevésbé fontos, de a gyártóknak annál lényegesebb tekintetben is javult a Raven Ridge, ugyanis az FP5-ös tokozású lapkák magassága 24%-kal lett kisebb az FP4-es tokozású elődökhöz képest, ami sokat segít a partnereknek abban, hogy vékonyabb notebookokat tervezzenek.
Első körben egyébként a HP, az Acer és a Lenovo ad ki egy-egy mobil masinát az új platformra, és idén ennél lényegesen többre nem is igazán érdemes számítani. Az AMD az év elején megrendezendő CES-t jelölte meg a friss bejelentések színhelyéül, így a követező év első felében már sokkal nagyobb lesz a kínálat.
Trónfosztás történt?!
Az AMD a Ryzen 7 2700U pozicionálásával teljes támadásba kezd, ugyanis az Intel Core i7-8550U ellen szánja. Ez szándékos döntés, mivel a notebookgyártók jelentős része az ultramobil felsőházba szánt dizájnokba ezt a processzort rendeli. A Core i7-8550U sok szempontból összemérhető a Ryzen 7 2700U-val, mivel az alapértelmezett TDP kerete ugyanúgy 15 watt, ráadásul nagyjából hasonló tartományban konfigurálható, illetve ugyanúgy négy processzormagot tartalmaz a lapka, továbbá memóriatámogatás szempontjából egységes a kétcsatornás DDR4-es opció, ahogy a maximális 2400 MHz-es effektív órajel is.
Az Intel aktuálisan leginkább kedvelt, tempós ultramobil processzoránál jobb versenytársat tehát találni sem lehetne, és nem is igazán keres az AMD, mivel a Ryzen 7 2700U számos tesztben gyorsabb. Egyedül az egy szálra levetített tempóban tud csak jobb lenni a Core i7-8550U, de ott is csak marginális mértékben, szemben a többszálú környezettel, ahol már jobban lemarad. IGP terén ég és föld a két rendszer, a Ryzen 7 2700U sokkal inkább a belépőszintű dedikált GPU-k ligájában versenyez, teljesítménye nagyjából a NVIDIA GeForce MX150-nel mérhető össze, ami asztali mércével mérve a GeForce GT 1030-nak felel meg.
A Ryzen 7 2700U több szempontból is erős gyomros a piacnak, ugyanis a Computexen tett ígéretekhez képest végül sokkal gyorsabb lett. Ráadásul ez tipikusan kényes terület lesz a notebookgyártóknak is, ugyanis a Raven Ridge-re építve lényegében 15 watton belül tudnak olyan teljesítményt biztosítani, amit a megszokottnak mondható Intel és NVIDIA párossal csak 40 wattból tudnak megoldani, ráadásul utóbbi esetben nagyobb platformdizájn mellett, vagyis kisebb beépíthető akkumulátorral. Ez rendkívül váratlanul érhette a szegmenst, és valószínűleg az Intel sem számított rá, pedig az asztali Ryzenek hatékonyságából már sejthető volt, hogy ultramobil szinten nagyon erősek lehetnek.
A Raven Ridge fő ütőkártyájának a rendkívül jól működő turbó tűnik, ugyanis hiába szorítják 15 wattos keretbe magát az APU-t, sokszor így is képes a rendszer – akár az összes magon – viszonylag magas órajelet beállítani. Emiatt egy Ryzen 7 2700U processzorrészének a teljesítménye felérhet az asztali Intel Core i5-7600K-val, ami ugyanezt 91 wattból oldja meg. Ennek az oka az lehet, hogy az AMD igen sokáig tanyázott a 28 nm-es node-on a korábbi APU-kkal, amit a cég minden bizonnyal hátrányként élt meg, de az egész mára előnnyé változott, mivel arra kényszerítette mérnököket, hogy kutassanak bizonyos trükkök után, amivel a lehető legjobban le lehet dolgozni két teljes generációnyi gyártástechnológiai hátrányt a legfőbb konkurenssel szemben. Mára viszont az AMD már nincs hátrányban a csíkszélesség szempontjából, és emellett még a korábban kiötlött trükkök is beépítésre kerültek, természetesen frissített formában. Ehhez hasonló fejlesztésekre az Intel az elmúlt években szimplán nem kényszerült rá, így ebből a szempontból hátrányba kerültek.
Az egészben persze nyilván benne van az is, hogy az Intelnek már rég a Cannonlake-et kellene forgalmaznia, ha a pár évvel korábbi útitervekből indulunk ki, és nem bízhattak volna abban, hogy az időközi ráncfelvarrásokra az AMD úgy sem tud majd reagálni egy erősebb platformmal. Mára kiderült, hogy tudtak, és ez az Intel trónjába került az ultramobil fronton. A helyzetet bonyolítja, hogy a több tesztprogramot összesítő mérésből elég nagynak tűnik a Ryzen 7 2700U előnye a Core i7-8550U-hoz képest, amire az Intelnek nehéz lesz hirtelen reagálnia, már csak azért is, mert a 100 MHz-cel gyorsabb Core i7-8650U is kevésnek tűnik, és ez a modell a szükséges válogatás miatt jóval kisebb mennyiségben érhető el. Ergo egy 200 MHz-cel gyorsabb verzióval sem lennének kisegítve, mivel abból még kevesebbet tudnának biztosítani a megrendelők számára, ráadásul nem biztos, hogy elég lenne a teljesítménye.
A Raven Ridge trónfosztása tehát nem egyedül az AMD eredménye, kellett hozzá az is, hogy az Intel a fejlesztéseit folyamatosan csúsztassa. Talán még a csillagok együttállása is számított, ami viszont biztos, hogy ezt a lapkát is meg kellett tervezni, és ki kellett adni, aminek hála az ultramobil piac állóvize garantáltan fel lesz kavarva.
Abu85