Hirdetés

Új hozzászólás Aktív témák

  • sb

    veterán

    válasz arn #20 üzenetére

    Fantázia van, azt írtam, hogy nehezebb kihasználni. De ha sikerül akkor hatékonyabb a funkcionális specializáltság. A tök általános és a fixfunkciós felépítés között lenne.

    Viszont a cikk egyértelműen ilyen funkcionális különbségekről szólt nem arról amit írsz, hogy pl. órajelben lesz különbség. Az AVX már ilyen, ott kell is kódot és ütemezőt igazítani hozzá ha így lesz.

    @hokuszpk
    szóval hardveres megoldas kell.
    Mivan, ha a prociban nincsenek klasszikus magok, csak 120 vegrehajtoegyseg, amirol a biosban eldontheted, hogy ez hany virtualismagnak tunjon. ( 1,2,3,4,5,6,8,10,12,15, 20, 30, 40, 60 ? )
    ennek megfeleloen virtualis magonkent allokal 1-1 vegrehajtot, a tobbit pedig a terheles fuggvenyeben rendeli az egyes virtualis magokhoz.
    Ez szerintem nem működőképes. Legalábbis ugyanúgy sw oldali megoldás kíván.

    A compilerek adott architektúrára optimalizálnak. Az sem világos a "feldolgozó" az mi, de ahhoz még tartoznak más erőforrások magok/feldolgozók között elosztva, még a regiszterek használata is optimalizált kell legyen egy jó kódhoz. Szóval ha ezt az egész alól kihúzod akkor vagy szarul fog futni a kód vagy erre szintén sw kell ami megoldja... ráadásul csak egy bizonyos szintig, mert ha mondjuk dolgozol X regiszterrel és azt fizikailag lefelezed alatta akkor tök mindegy mit-hova optimalizálna a fordító, szar lesz a kód.

    Ez akkor jó, ha hw szinten az új architektúra "fedné" ilyen szempontból a régit. De akkor meg a jó hatékonysághoz kellene nagyon flexibilis erőforrás kiosztás. Az sem jó önmagában ha mindenből sok van mert ha pazarlóan osztod akkor elfogy szar hatékonysággal.
    Ebbe az irányba mutathatna a k*va sok cache amúgy, meg egy unified, gyors ramos architektúra. Nyilván az még mindig lassú a belső feldolgozáshoz képest, de így erőből, ha sok a cache és a gyors ram, akkor elég sok mindent el lehetne fedni.
    Ettől függetlenül az sw-s célirányos kihasználás még mindig sokkal többet nyújt ahogy az Apple-nél látható. Nem véletlenül ment erre az egész Fusion-APU szemlélet is. Szerintem ezt kéne erőltetni:
    - Talán változott annyit a hozzáállás sw oldalról egyébként is, meg most itt az M1 példa ami miatt azért vakarhatják a fejüket AMD/Intel oldalon.
    - Közben megdrágultak a hw-k plusz beszűkültek a fejlesztési lehetőségek. Tudsz venni csillió TFlops 400W gpu(ka)t és 32-64 magos cpu szörnyeket. Big/little-el sem arra mennek, hogy ebben felfelé tornázzák magukat. Inkább lefelé vagy hatékonyságban fel ugyanabból a keretből.
    - És a gyártás is rohadt drága. Ott sem várható, hogy ami nem fejlődik az majd kijön 2 év múlva jobb gyártással 1.5x gyorsabb kivitelben.

Új hozzászólás Aktív témák