Keresés

Hirdetés

Új hozzászólás Aktív témák

  • Petykemano

    veterán

    válasz hokuszpk #4 üzenetére

    Az AMD valójában már most is így állítja elő az _900X és _950X sku-kat (csak nem tiltja le az SMT-t)

    Találgatunk, aztán majd úgyis kiderül..

  • Petykemano

    veterán

    Ez a cikk sajnos nekem eléggé neszesemmifogdmegjól.
    Bár lehet, hogy ez azért van, mert pár nappal ezelőtt Charlie@S|A is írt cikket erről, hogy az AMD nem a big.LITTLE elgondolás alapján fog hybrid/heterogén magokat készíteni. Részleteket persze onnan sem tudok, mert azt nem tudtam elolvasni.

    Az korábbi patentből ismeretes lehetett már eddig is, hogy az AMD abba az irányba nézelődik, hogy egy CPU-n belül megvalósítani a "kismag" és "nagymag" funkciókat. Ezt high features-nek és low featuresnek nevezte asszem.
    Ez azt a benyomást keltette, hogy végső soron minden mag egyforma lesz, csak a különböző képességek nagyon finomszemcsés módon lesznek lekapcsolhatók és csak indokolt esetben kapcsolnak be, hogy így is csökkentsék a fogyaszást (a fogyasztást, viszont a tranzisztorköltséget nem)
    Ez a cikk viszont közös őssel rendelkező, de eltérő mag-designokról szól.

    Önmagában ezen kívül a cikkben megjelent részletek azt tartalmazták, hogy az AMD eltérő képességekkel rendelkező magokban gondolkodik (pl: integrált FPGA) és sugalmazta, hogy lehetnek eltérő cache mérettel rendelkező magok.

    Namost eltérő cache méretekkel az AMD eddig is játszott, csak épp nem egy designon belül. Ugye tudjuk, hogy az APU-k felezett méretű L3$-sel jönnek. És azt is tudjuk, hogy a Zen3D az originalhoz képest 3x annyi L3$-sel fog rendelkezni. Ebből aztán lehet sejteni, hogy a zen magok képesek lehetnek kisebb-nagyobb L2 vagy L3 mérettel is működni. De azért ez sem olyan hatalmas innováció, hiszen a gyári ARM magok esetén is meg van adva, hogy milyen L2$ méretekkel lehet tervezni. Ugyanazt az X1 magot pl a Samsung 512Kb L2$-sel, míg a Google 1MB L2$-sel tervezte.

    Itt halkan meg is jegyezném, hogy az ARM big.LITTLE is kétrétű. A klasszikus kis és nagy (ma már közepes) magok valóban nagymértékben eltérő architektúrával rendelkeznek. Viszont az X1 és az X2 inkább csak valamiféle kiterjesztése, bővítménye az ismert A7_ magoknak. Valószínűleg egy kicsit összetettebb kiterjesztés, mint az L2$ méretének tetszés szerinti megválasztása, de azért azt szerintem nyugodtan mondhatjuk, hogy az X_ mag a A7_ kiterjesztése, vagy hogy az X_ mag az A7_ mag spinoffja.

    Az lett volna izgalmas / igazán hír, hogy ezt a heterogenitást miképp tervezi az AMD megvalósítani? Merthogy eddig ugye alap koncepció volt, hogy a szerver és a desktop ugyanazt a lapkát használta és az L3$ méretétől eltekintve az APU is gyakorlatilag ugyanazt a core blokkot kapta.

    Tehát például különböző célokra különböző lapkákat fog készíteni az AMD, de lapkán (CCX-en) belül ugyanolyan magok lesznek? és akkor mondjuk lesz olyan 8 magos lapka,
    - ami erős AVX-512-ben és AMX-ben? (lásd ARM N1, V1, N2)
    - A másik típusú lapka erős v-cache-ben?
    - A harmadik típusban integrált FPGA van?
    - A negyedik típusban kifejezetten kicsik, cache-ek, de ez egyben pici lapkát és alacsony frekvencián működő magokat eredményez?

    És akkor ebből hogy fognak összeállni a termékek? Jó, persze, a nagyon nagy megrendelők majd maguk válogatnak, hogy milyen összetételt szeretnének, de azért csak kell legyen egy menü. És ebből hogy állhat össze a desktop kínálat? Persze ott nem lesznek speciális igények, de a desktoppal való közösködés lényege az, hogy oda lehet kiszórni a szart.

    Vagy: lapkán (CCD) belül valósulna meg a heterogenitás? 8 magból lesz 4, amiben erős az AVX512, lesz 4 normál (kicsi)? vagy lesz 2 mag, ami erős cache-ben, és 6 normál.
    Vagy: lapkán belül valósul meg, de különböző CCX-ek formájában? 4 brutál nagy mag, 8 normál?

    Utóbbi két lehetőséget csak felvetettem. Számomra legtisztábbnak az tűnik, hogy több eltérő feature-settel rendelkező, de lapkán belül homogén magokkal rendelkező CCD-t gyártanak és a heterogenitás akkor valósulhat meg, amikor ezeket összerakod.

    A cikk mondanivalójának egyébként szerintem épphogy ellentmond a Zen5 és a kissé módosított Zen4 (zen4D) felemlegetése a Strix pointban. Mike Clark épp most mondta el AT interjúban , hogy az Zen5-től el fogunk ájulni és hogy szélesíteni fogják a Zen magokat.
    Ez arról árulkodik, hogy a Zen4D és a Zen5 legalább olyan távolságban lesznek egymástól, mint egy alacsony L2$-sel tervezett A78 és az X1.

    És itt egy pillanatra visszatérnék a low-feature - high feature résznél tett megállapításomra. Ilyen homogén magok esetén ugye nem kérdés az, hogy az OS hogyan találja mag a szálaknak a megfelelő magot. Mert minden mag egyforma, bármelyik kismagból lehet hirtelen nagymag, ha a folyamat úgy kívánja.
    Viszont a cikk eltérő mag designokról szól. Mindenki azért szidja most az Intelt, hogy milyen szar lesz, hogy hogy találja mag az OS a folyamatoknak a megfelelő magot. Ugyanakkor most itt az AMD (pontosabban a cikkíró) sem mondta meg, hogy miképp lesz az megoldva, hogy a heterogén felépítésű CPU magok - jelentsen az kisebb-nagyobb cache méretet, vagy több feldolgozót, stb - közül az OS miképp fogja megtalálni az adott folyamat számára megfelelőt.

    Kivéve persze, ha arról van szó, hogy az AMD eltérő képességű magokkal gyárt CCD-ket, de egy SKU-ban mindig azonos felépítésű magok lesznek. Erről viszont épp a Strix point (zen5 + Zen4D) miatt nem lehet szó. Tehát ha a zen5 és a zen4D között nincs is 2x-es különbség, azért mondjuk az talán elvárható lenne, hogy egy hely és energiatakarékos Zen4D változathoz -hez képest 50, vagy akár 60%-kal tudjon gyorsabb lenni a Mike Clark szerint ámulatba ejtő zen5. Az meg már megint nem olyan kicsi különbség, hogy ne lehetne morogni azon, hogy az OS miképp választja meg megfelelően a szálakhoz a magokat.

    [ Szerkesztve ]

    Találgatunk, aztán majd úgyis kiderül..

  • Petykemano

    veterán

    válasz Petykemano #21 üzenetére

    "Zen 4 Dense are @AMD's >>little cores<< for Zen 5 in 2023!!!"
    MLiD

    Találgatunk, aztán majd úgyis kiderül..

  • Petykemano

    veterán

    válasz hokuszpk #25 üzenetére

    2-3 éve Coreteks csinált a témában egy videót
    Ott mutogat valami ML szoftvert, ami párhuzamosítja az egyébként szekvenciális kódot. Persze kell hozzá néhány futtatás, hogy kiismerje.
    És ott van az Intel által 2016-ba. Felvásárolt soft machines VISC.
    5 év telt el, lassan kiderül, hogy lufi volt-e.

    Találgatunk, aztán majd úgyis kiderül..

Új hozzászólás Aktív témák