Új hozzászólás Aktív témák

  • Petykemano

    veterán

    DDR vs HBM latency
    Nagyon szépen megmagyarázza, hogy valójában miért nehéz kérdés a HBM, mint L4$.

    Ezt most persze nem úgy mondom, mintha mindig is ezt mondtam volna. Épp ellenkezőleg.
    Ezt érdemes pontosítani persze: nem érdemes cache célra használni, mert a rendszermemória elérését valószínűleg nem gyorsítja. Azt most nem tudom, hogy ez vajon valami belső mérés, vagy CPU-Memory késleltetés és a HBM késleltetési értékei annak ellenére ennyivel rosszabbak, hogy lényegesen közelebb van a feldolgozóhoz.

    Viszont a sávszélesség különbség durva. Az A64FX-ről mondta Coreteks, hogy a masszív párhuzamos - vagyis GPU-szerű - feldolgozási működést épp a brutális sávszélesség teszi lehetővé.

    Az a kérdés, van-e - jelenleg - olyan - jelenleg - cpu által végzett feladat, ami cpu-n masszívan párhuzamosan végzett, vagy azért nem végezhető cpu-n, mert a cpu által elérhető sávszélesség limitál?

    A hagyományos DDR memóriával szemben én versenyképes alternatívának látom - legalábbis bizonyos feladatokra - azt, hogy a DDR4/5-öt közeli nagy sávszélességet biztosító HBM-mel helyettesítik, ami viszont még mindig csak buffer, és a rendszermemória funkciót pedig DDR helyett DIMM foglalatokba helyezhető 3dXpoint-tal helyettesítik. a gyengülő késleltetést megnövelt L3$-sel igyekeznek enyhíteni, amit viszont majd kezelnek 3dstackinggel. A cache méret növelésével ugyanis nyilvánvalóan romlik a késleltetés. Ez feltételezésem szerint a címzés miatt van. De talán a L3$ harmadik dimenzióban való kiterjesztése ezen enyhíthet

    Tehát DDR helyett:
    1) HBM
    + lényegesen nagyobb sávszélesség
    - rosszabb késleltetés
    2) 3dXpoint
    + lényegesen nagyobb rendszermemória
    - rosszabb késleltetés
    3) L3$ növelése
    + jobb késleltés
    - nagyobb lapkaméret, nagyobb fogyasztás
    4) 3d stacking / L4$

    Ez nem biztos, hogy teljesen általános lesz. Ahogy leírtam, eléggé csereszavatos, hogy van-e fedélzeti HBM vagy nincs, és a DIMM foglalatba is lehet 3dXP vagy DDR4, vagy akár mindkettő. Ez ugye most is így van.

    Vajon a Milan/zen3 esetén épp azért írták, hogy a L3$ 32+MB (ami miatt szárnyra kaptak a 48MB-os pletykák), mert lesz olyan HPC-be szánt változat (válogatás), ami 48MB L3$-sel rendelkezik, hogy kompenzálja a mellette levő HBM késleltetését? De asztali verzióban letiltható a L3$ egy része?

Új hozzászólás Aktív témák