Hirdetés

Új hozzászólás Aktív témák

  • Petykemano

    veterán

    Abu!

    Azt látjuk, hogy az apple 3Ghz-en hozza azt a teljesítményt, amit az AMD és az intel 5Ghz körül. Ez nyilván jótékony hatással van a fogyasztásra is, hiszen a szerver procik az intel és az AMD esetében is 3Ghz körül ketyegnek, ahol ideális a hatásfok.

    (Mellesleg valószínűleg épp ezért kereste meg Twitteren a Cloudflare CEO-ja Tim Cookot, hogy lenne-e kedve beszélni az M1 design szervercélú felhasználásáról.)

    Az alacsony órajel nyilván nem csupán a fogyasztásra van hatással, hanem arra is, hogy mennyire sűrű tud lenni egy design. A magas frekvenciát elérő designoknak nagyobb kiterjedés kell, hogy el tudjon szökni a hő.

    Arról ejtenél pár szót, hogy az Apple miért választott, vagy tudott választani ennyire széles designt? És az AMD és az Intel miért nem?

    "Mindemellett az OOO (sorrendtől független végrehajtás) logika működési ablaka is rendkívül mély, köszönhetően a 600-nál több bejegyzést is tároló ROB-nak (re-order buffer). Az integer és lebegőpontos rész is egészen erősnek tűnik a mobil szintre. Előbbiben két komplex és négy szimpla ALU található, míg utóbbi négy darab 128 bites NEON SIMD-et kínál, és ennyi feldolgozó bizony még asztali szinten is megsüvegelendő. A fentiekhez mérten a gyorsítótárak tekintetében is el van eresztve a fejlesztés: az L1 utasítás- és adatgyorsítótár rendre 192 és 128 kB, míg a megosztott L2 cache 12 MB."

    Az intel és az AMD (és a gyári ARM)
    - miért ragadt le 4 ALU-nál?
    - miért ragadt és töredék L1$ mellett? Az intel nemrég növelte 32KB-ről 48-ra, az AMD 64-ről csökkentette 32-re a zen2-ben. Nyilván okkal, de miért előnyös ez az Apple esetén és hogyan tudja kihasználni?
    - miért nem tud vagy akar elérni ilyen magas ILP-t? (4 v 8 decoder, meg ilyesmi)

    mi az igazság ebből a mondatból?
    "Other contemporary designs such as AMD’s Zen(1 through 3) and Intel’s µarch’s, x86 CPUs today still only feature a 4-wide decoder designs that is seemingly limited from going wider at this point in time due to the ISA’s inherent variable instruction length nature, making designing decoders that are able to deal with aspect of the architecture more difficult compared to the ARM ISA’s fixed-length instructions."
    [link]

    Vagyis hogy azért 4 a decoder az x86 esetén

    - Miért lenne előnytelen hasonló design azokon a felhasználási területeken, ahol az intel és az AMD dolgozik?

    Találgatunk, aztán majd úgyis kiderül..

Új hozzászólás Aktív témák