Hirdetés

Keresés

Új hozzászólás Aktív témák

  • S_x96x_S

    addikt

    válasz Ueda #5949 üzenetére

    > "...1 Golden Cove helyigénye a becslések szerint
    > körülbelül 2 Milan(teljes Zen3) magnak felel meg.

    - A "Golden Cove" eléggé új architektúra;
    És ebben is benne van "Jim Keller"-nek a keze nyoma. ( mint a ZEN -nél )

    - Az AVX-512 és az új AMX kiterjesztés elég sok helyet elfoglal;
    és ezek mind hiányoznak a ZEN3-ból.
    (talán a kettő együtt - akár 1/3 is lehet helyfoglalásban a teljes magnak)
    És csak duplázzuk meg a vektor pipe-linekokat és .. és még több tranzisztort kell beálldozni. ...

    AVX512/AMX: Az AMD szerencséje, hogy a Desktop- AlderLake-en a Big-Little miatt ezt nagyrészt nem lehet elérni, de szerver szinten elég ütős tud lenni, hogyha a program ki tudja használni.

    Az én értelmezésemben az AVX-512 közelit a GPU-k sűrűségéhez;
    és nem könnyű hatékony és gyors magokat tervezni erre.
    Mert látott már valaki hatékony - 4.5 Ghz-en működő GPU-t ?
    - Az nVidia A100 -nak pl. a Boost Clock-ja ~1.41GHz !
    - Az RTX 3090 -nek meg 1.70 Ghz ..
    A korai Inteles AVX-512 implementációknál - annyira átmelegedett a chip; hogy az AVX-512 -es utasításoknál vissza kellett szabályozni magát .. csak, az volt a probléma, hogy a teljes rendszert lefolytotta.

    "So how does this affect you, if you mix a little AVX-512 with your real workload? We use the Xeon Silver 4116 CPUs, with a base frequency 2.1GHz, in a dual socket configuration. From a figure I found on wikichip it seems that running AVX-512 even just on one core on this CPU will reduce the base frequency to 1.8GHz. Running AVX-512 on all cores will reduce it to just 1.4GHz."
    https://blog.cloudflare.com/on-the-dangers-of-intels-frequency-scaling/

    ------------
    Szóval az AMD-nek egy jól implementált
    AVX-512 -öt kell kihoznia a ZEN4-ből - elsőre!

    A TSNC N5 - azért segíthet a megnövekedett tranzisztorigény kielégitésében.

  • HSM

    félisten

    válasz Ueda #5949 üzenetére

    Volt egy jó írás még a Renoir-ról, van benne magméret összehasonlítás a teljes L3-as verzióval: [link]

    Illetve szerintem érdekes, hogy egy ilyen Renoir 15W-os verzióban gyorsabb Cinebench-ben (2935 pont, forrás: [link] ), mint az új 12900K takarékos magjai (2572 pont, [link] forrás: [link] ).

    Illetve az is rendkívül érdekes lenne, illetve szerintem akár alternatív opció lehet AMD oldalon, hogy különbözőképpen paraméterezni firmware-ből a magjaikat. Pl. egy "szoftveres" takarékos mód, ahol néhány magot megjelölnek "takarékos" magnak, és az OS ide rakhatja a kis igényű dolgokat, és ezek a magok ilyenkor nem turbóznának, hanem egy hatékonyságra optimalizált órajelen működnének, mint a mobil csipek esetén is.
    Egyébként a jelenlegi magjaikon is lehet ilyesmit "buta" módon, én pl. előfordult, hogy kikapcsoltam a turbót a Ryzen 3600-asomon, mert kb. elfelezte a fogyasztást és bőven elég nagyon sok mindenre 3,6Ghz-en is, lásd mérésem [link] .
    Ha a hybrid magdizájn rákényszeríti a szoftvereket, hogy külön kezeljék az erős/hatékony magokat, így külön magdizájn (és ezzel járó hátrányok) nélkül is tudnának ebből profitálni.

    Az meg már csak hab lenne a tortán, ha pl. lenne egy magasabb és alacsonyabb cache méretű verziója a csipleteknek, amiket lehetne kombinálni. Pl. elvileg lesz egy speciális Zen4 verzió [link] , elég komoly számok a dupla sűrűség és energiahatékonyság, több, mint 1.25X-ös sebesség mellett, bár nyilván itt azért érdemes megvárni azért a tényleges eredményeket. :)

Új hozzászólás Aktív témák