Keresés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz szabi80sz #16 üzenetére

    Az a baj, hogy egy külső buszra alapozni nagyon nem jó, mert a külső fizikai összeköttetés mindig lassú. Nem is a throughputban kapod a nagy büntit, hanem a késleltetésben. A fejlesztőknek figyelni kell arra, hogy a PCI Expressnek komoly határai vannak. Persze a GPU általi x86 virtuális memória támogatásának még ennél is nagyobb határa, hogy egyelőre nem támogatja egyetlen OS sem. A Win 8 lesz valamennyire erre felkészítve. 2012-ben nem sok esélyt látok, hogy ebből a konzumer szint profitáljon. 2013-ban is csak elvétve. 2014-ben már beindulhat a nagyüzem, és a PCI Express sem jelent hátrányt, mert az NV és az AMD is komoly integráláson dolgozik. Ezzel a CPU és a GPU rész lapkán belül kommunikál, ami minden külső linknél jelentősen gyorsabb. Ha minden jól megy, akkor 2015-re a Skylake-kel csatlakozik a bulihoz az Intel is, és az ARM is hasonló elképzeléssel fejleszt.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • dezz

    nagyúr

    válasz szabi80sz #12 üzenetére

    1.a.: Ha 5ms az egész, azt eleve nem érdemes GPU-ra ültetni... Hacsak nem sokszor fog lefutni, de akkor meg nem kell minden alkalommal fordítás, ami itt a lassú. Az egyes műveletek előtti inicializálás ehhez képest kvázi elhanyagolható. Nem tudom, mi ebben a butaság... Ha mégis úgy gondolod, írd le légyszi, miért.
    1.b.: Nem lehet, hogy valamit rosszul csináltál, hogy lassabb FirePron, mint Ionon?
    2.: Nem, maga az OpenCL-es számítások. Itt vannak pl. lenox OpenCL-es programjai. 1 mp-en belül megy is a ray-trace, stb. Ja, és teljesen jól fut mindkét platformon. Néztem az SDK programocskáit is, illetve az Nvidia programjait is, hasonló a helyzet.
    4. Ha kimondottan DP-re van szükség, ami speciális esetekben fordul elő (a hétköznapokban csak pl. mandelbrotnál jött volna jól nagyobb zoomokhoz), amúgy is érdemes megfelelő kártyát használni. Ha máshonnan ollózol át kódot, amiben van double, de nincs rá igazán szükség, le lehet cserélni floatra.
    5. Jó, akkor mondjuk úgy, hogy gyártó-függő. Csak Nvidia hw-en működik. (A platform-függetlenbe általában beleértik a gyártó- és hw-függetlenséget is.)
    +1: Ez nem feltétlen igaz. Pl. lenox Nvidián írt kódjai is teljesen jól futnak Radeonon is, különösebb időráfordítás nélkül.
    Ezt írta erről: "Ionon es firepro-n nem probaltam, nekem eddig ugy altalaban futottak mindenhol, beleertve intel procit es fusion aput az nv (geforce, quadro, tesla) es amd (radeon) videokartyak mellett. Probaltam az amd sdk-val is es az nv sdk-val is, eddig nem jott ki kulonbseg. Illetve olyan kulonbseg azert volt, hogy a work itemeket az nv driver mindig szepen kiosztotta, az amd meg neha elbaszta, ugyhogy azt explicite be kellett allitani, hogy multiprocesszoronkent mennyi thread legyen, es ugy mar ment mindketton."
    Ja, és 7.: a rekurzió amúgy is lassú, bár nyilván kényelmes.

    "X+: A PCI-E 3 rengeteget gyorsítana a rendszeren (még akkor is, ha nem függ a virtuális memória tőle)"

    Gyorsít, de közel sem annyit (legalábbis latencyben), mint amikor egymás mellett van a CPU és a GPU, tehát a PCIe teljesen kimarad és csak egy memcopy az egész. Nem beszélve arról, amikor erre sem lesz szükség.

    "márpedig az Amd nem nagyon foglalkozik a PCI-E 3-mal.."

    Nem-e? A GCN támogatja. A jövőre megjelenő Sepang és Terramar CPU-k is támogatják. Igaz, ezek Opteronok, de aki ugye "komolyan gondolja", annak belefér. Arról az AMD egyelőre nem beszél, hogy a Trinity támogatja-e, de ha a Sepang és a Terramar igen, akkor ez miért ne tenné? Az AM3+ marad 2.0 (2.1?). (Az eredeti tervek szerint ennek is átvette volna a helyét az FM2. Bár nincs kizárva, hogy 2012H2-ben erre is kijön egy 4+ modulos Piledriver, amikor az AM3+ már a végét járja).

    [ Szerkesztve ]

  • Pikari

    addikt

    válasz szabi80sz #7 üzenetére

    osztom a lesújtó véleményed.

    A Dunning−Kruger-hatás az a pszichológiai jelenség, amikor korlátozott tudású, kompetenciájú vagy képességű emberek rendkívül hozzáértőnek tartják magukat valamiben, amiben nyilvánvalóan nem azok.

  • dezz

    nagyúr

    válasz szabi80sz #7 üzenetére

    Egyelőre csak néhány ponthoz szólnék hozzá.
    1.: na ja, a 0 ms-nél minden lassabb, de egy kicsit kevés az adat. Hány ms a lényegi kód és mennyi az OpenCL inicializálás? De végülis mindegy is, nem olyan feladatokat szoktak OpenCL-be ültetni, amiknél az utóbbi több, mint az előbbi...
    És miért pont Ion? Szerintem egy CPU is gyorsabb annál, vagy nem?
    2.: Érdekes, találkoztam pár OpenCL alapú programmal (mármint nem pár soros), amik 1 mp-en belül indulnak. Hacsak nem néhány mp az egész művelet, ez nem gond...
    4., DP: ha fut is valahogy, nem megoldás...
    5.: Meg azért, mert az OpenCL platformfüggetlen! (A PCIe-s dologra Abu már reagált.)
    6.: Ez mondjuk nem csoda...

    [ Szerkesztve ]

  • Abu85

    HÁZIGAZDA

    válasz szabi80sz #7 üzenetére

    Nem kell a virtuális memóriához PCI Express 3.0. Jó az 1.0 is akár, csak nem gyors. A Keplernek I/O virtualizáció kell, mert az NV nem rendelkezik x86 licencel.
    Az AMD GCN is támogatja a virtuális memóriát:

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák