Hirdetés

Új hozzászólás Aktív témák

  • MaUser

    addikt

    válasz lezso6 #17 üzenetére

    Nem az a kérdés, hogy mire kell több szál.

    De, pontosan ez a fő kérdés. Jelenleg ugyanis kép- és videofeldolgozáson kívül szinte semmihez nem kell. Amihez máshoz kellhet, az meg GPU függő volt eddig is. És innentől kezdve el is jutottunk oda, hogy miért tarolt az intel a semmire sem jó GMA-kkal anno. Mert egyszerűen ha már van youtube gyorsításod, az elég a vevők 99,99%-ának. A maradék 99%-a meg gamer, a többi meg úgyis valami ws-t használ. :U

    A probléma, hogy megírod a programot, de egy kalap kaki lesz, mert egy CPU szálon a sebessége egy kalap túró / nem energiahatékony.

    Én nem ezt látom. Egy 2500k-val évek óta elvagyok és nem érzem lassúnak. Ahol az, ott meg célhw kell(ene).

    Az egyszálas teljesítmény / fogyasztás arány (x86 vonalon) egy ideje alig javul, az utóbbi években igencsak lelassult.

    Felső kategóriában lassult, de hát ennek főleg a konkurencia hiánya az oka, illetve, hogy nincs motiváció a felhasználók felé. (És már vissza is értünk oda, amit az elején kérdeztem, hogy minek gpgpu. Nincs rá program.) Alsó kategóriában viszont iszonyat a gyorsulás, az új atomok már igen jók és rácáfolnak mindenre amit az ember x86-tól elvárt volna.

    Az újabb gyártástechnológiákkal is vannak problémák (lásd 20nm), örökké nem lehet csíkszélt csökkenteni.

    Ezt minden évben elmondják, sőt én még egyetemen azt tanultam, hogy 20nm alá nem lehet fizikailag bemenni, aztán már alatta vagyunk. :DDD

    A kérdés az, hogy hogyan lehetne sokkal jobb teljesítményt és energiahatékonyságot elérni?

    Nem, a kérdés, hogy PC szinten akarunk-e jobbat elérni. Jelenleg úgy néz ki nincs rá komoly igény egyszerűen.

    Vannak már jó ideje masszív többszálasításra tervezett architektúrák, melyek már bizonyítottak (mindenhol van GPU), s energiahatékonyságban is igencsak jók egy CPU-hoz viszonyítva.

    Igen, csak ezek az architektúrákat célhw-ek. A kérdés, hogy célhw-re miért akarunk nem általános programot írni? Minek futtassak egy sima progit gpu-n, amikor nulla párhuzamosítható rész van benne? :U .

    Ezekre kéne felhasználás terén is valahogy építeni, masszívan. Már amit lehet, már ha van értelme, már ha lehet.

    Igen, csak jelenleg úgy néz ki, hogy nincs, mivel nincs ami kihasználná. :U

    Így egyelőre még csak próféciák vannak, komoly eredmények nélkül, de jelenleg egyszerűen nincs más út. A FPGA alig valahol, a SIMD kiterjesztések a kutyának sem kellenek, stb., GPU viszont már szinte mindenhol van. Ezzel kell kezdeni valamit. Hacsak nem valaki hirtelen jön valami jobb ötlettel.

    Ó dehogy nincs más út. Pl. rengeteg kis fab van, akik pl. a saját cégüknek gyártanak cél-asic-et. Valahol ez éri meg. Egy gpu soha nem lesz 0.5€, egy cél asic viszont röhögve (autóipar pl.).

    SIMD egyébként baromi jó példa az igény hiányára. Ott a lehetőség (MMX-ek, stb.), elterjedtek és mégsem áll neki szinte senki. Jó esetben legalább a fordítónak engedélyezik a használatukat. Miért? Mert nincs rá igény és nem éri meg ráfordításban. Miért érne meg ez gpgpu-nál? Egyszerű pénzügyi kérdés. Egy jó swfejlesztő óránként 50-100€-ba fáj a cégnek, egy r&d-n dolgozó meg 100-500€-ba. Óránként. Ilyen árak mellett nagyon ritkán éri meg belemászni optimalizációba, ahelyett, hogy leakasztasz egy kész cuda-t vagy simán nem törődsz vele.

    De ha már törődni kell, akkor meg minek gpgpu? Van ezer féle különböző cpu/gpu kombó, az eredmény kiszámíthatatlan. Akkor sokkal inkább már fpga irány. Lesz egy fix méretű, szabadon programozható fpga tömböd procinként és máris ismeret sebességed van legalább generáción belül és valóban gyors lehetsz. Fpga-ra pedig idővel amúgy is a compiler fog fordítani. Lesz egy #pragma-d és az adott lib-et, kódrészletet majd szépen a fordító megoldja opcionális kódpath-ként ami futhat fpga-n ha van (és valóban gyors lesz) vagy marad cpu-n/gpu-n ha nincs fpga. Itt már valóban lenne gyorsulás. Nyilván tématerülettől függ, de a sajátomon azt látom, hogy egy nagyságrendet lehet nyerni cpu többszálúsításával, kb. ugyanennyit gpu-val (ha mindkettő van, akkor is csak egy nagyságrendnél vagyunk!), még fpga-nál 2-3 nagyságrendet. A vicc egyébként hogy nem csak én vagyok ilyen "okos", nem véletlenül vette meg az Intel az egyik nagy fpga gyártót és éppen vásárolják fel a másikat is.

    Egyébként fpga-cpu merge volt bőven korábban is, de az árak miatt buktak idővel (lsi, stb.). Egy xeon proci árázásába viszont bele fog ez már férni bőven. Idővel meg visszajtunk a transmeta-hoz, újrakonfigurálható perifériákkal. Ha kell jobb képfeldolgozás selfi-khez, kapsz rá egy fpga szeletet és kész. Ha kell jobb hang, akkor kapsz arra egyet, stb.

    Szerk: vagyis az intel megcsinál(hat)ja azt az alterával, amit az amd akart az ati-val. Csak hát egy fpga ezerszer szélesebb körben használható, mint egy erősen kötött gpu. Cserébe nehezebb is a feladat, de intelnél van pénz. Ráadásul az fpga-k ára ma a gyárás miatt magas. Házon belüli fabok esetén a sok millió akár milliárd dolláros költségek könnyebben faraghatóak lesznek, főleg ha immár lesz gyártási darabszám is.

    [ Szerkesztve ]

    ''A file-cserélés öli meg a filmipart? Inkább a filmipar öli meg a file-cserélést. 2 hónapja nincsen semmi értelmes film, amit érdemes lenne letölteni...''

Új hozzászólás Aktív témák