Hirdetés

Új hozzászólás Aktív témák

  • ukornel

    aktív tag

    válasz #06658560 #108 üzenetére

    "Esetleg azért, mert kevés a számítási kapacitás?"
    Ahha. Tehát oda lyukadunk ki, hogy a dGPU-s compute-nak mindig lesz létjogosultsága APU-k mellett is abban a szűk szegmensben, ahol nincs nagy memóriaigény, nincs intenzív adatmozgatás a kártya és a CPU/rendszermemória között, és a teljesítményigény a legerősebb APU teljesítménye és annak max. kétszerese között van. (Mert ugye ez alatt ott lenne az APU, fölötte meg úgyis klaszter kell, mert egy dGPU-nak nem lesz több, mint kétszer nagyobb számítási kapacitása, mint egy APU-nak - hasonló lapkaméret, architektúra, gyártástechnológia esetén). Ez elég szűk rétegnek tűnik - az a kérdés, hogy pont egy szűk réteg részére fejlesztenek-e majd az elefánt méretű GPU-kat?
    Ha tehát "kevés a számítási kapacitás", magad írtad, hogy "[...] akkor jön a HPC, render farm, stb. megoldások clusterekkel, minden egyéb mókával."

    "Honnan tudod, hogy nem kell? Játékprogramot akarunk HSA-val írni, Hello World szinten, vagy valami értelmeset is?"
    Lásd a föntieket.

    "Melyik LGA 2011 foglalatos i7 APU?"
    Hogy jön ide az LGA2011?? Eddig szó sem volt foglalatról, ne kezdjünk már el csúsztatgatni.
    Xeon szerverprocik között ott vannak az Iris Próval kitömött E3-12xxL v4 procik 1150-ös foglalatba.

    "Akkor nem fogalmaztál elég egyértelműen. Másik probléma, amint több APU-t raksz össze, máris kezd jönni a memóriamásolási probléma- minimum a Cachek szintjén, ami már négy egység esetén is jó kalamalkát okozhat a kód oldalán. Az erőforrás-menedzsment szempontjából meg pláne."
    Igazad van, nem fogalmaztam egyértelműen.
    Ha megnézed, onnan indult a történet, hogy egy szál APUt hasonlítottál össze egy komplett kétfoglalatos, quadGPUs rendszerrel. Ez így nem túl fair összevetés, viszont egyes genyó feladatokban, ahol a bika rendszered adatmásolgatásokkal tölti az idejét, az egy szál APUt még mindig nem tudja "agyonverni"!
    Az az érzésem, hogy az említett ipari szimulációk jelentős része (szó volt arról korábban, hogy az RTM algoritmusokat a fentiek miatt nem gyorsítják GPUval) pont ilyen genyó feladat -erősítsen vagy cáfoljon valaki, akinek van több tapasztalata- márpedig ezekben óriási pénz van.

    [ Szerkesztve ]

Új hozzászólás Aktív témák