Hirdetés

Új hozzászólás Aktív témák

  • Petykemano

    veterán

    válasz Fiery #17806 üzenetére

    A xeonnál az l3 egy nagy tömb magonként szeletekre osztva amiket ringbus köt össze. Ha jól értettem.

    A zennél viszont 4 magonként lesz egy 8MB-os tömb. Több ccx esetén ezeket mi köti össze? Vagy a ccx -ek közötti koherencia a rendszermemórián keresztül fog megvalósulni?

    Elmélkedtem a témán kicsit. Ezzel a cache koherenciával még nem foglalkoztam, ha valahol tévednék, javíts ki.
    Úgy vélem, a cache koherencia minél magasabb (alacsony késleltetés, magas sávszél) szinten valósul meg, annál jobb. A bulldozernél felttételezem mivel magonként osztoztak a L2$-en, ezért ott is megvalósulhatott. Ha ez így van, akkor komoly kérdést jelenthetett - és nyilván nem volt optimális megoldás -, hogy a második - nem független - szálat melyik magra ossza az oprendszer. Ha ugyanazon modul második magjára osztja, akkor a magoknak osztozni kellett a modul erőforrásain. Ha új modulra osztotta, akkor pedig a cache koherencia csak a L3$-en valósulhatott meg, ami meglehetősen lassú volt.
    Ilyen dilemma a zennél nem lesz. Nemfüggetlen szálat mindenképp optimális lesz ugyanazon ccx új magjára osztani, mert a magok erőforráson nem osztoznak, de cache koherencia megvalósulhat L3$-n. Igaz?
    Ez azt jelenti, hogy 4 összefüggő szálnál kevesebbet használó programok esetén a ccx felépítés nem lesz korlátozó tényező

    Találgatunk, aztán majd úgyis kiderül..

Új hozzászólás Aktív témák