Keresés

Új hozzászólás Aktív témák

  • dezz

    nagyúr

    válasz szabi80sz #12 üzenetére

    1.a.: Ha 5ms az egész, azt eleve nem érdemes GPU-ra ültetni... Hacsak nem sokszor fog lefutni, de akkor meg nem kell minden alkalommal fordítás, ami itt a lassú. Az egyes műveletek előtti inicializálás ehhez képest kvázi elhanyagolható. Nem tudom, mi ebben a butaság... Ha mégis úgy gondolod, írd le légyszi, miért.
    1.b.: Nem lehet, hogy valamit rosszul csináltál, hogy lassabb FirePron, mint Ionon?
    2.: Nem, maga az OpenCL-es számítások. Itt vannak pl. lenox OpenCL-es programjai. 1 mp-en belül megy is a ray-trace, stb. Ja, és teljesen jól fut mindkét platformon. Néztem az SDK programocskáit is, illetve az Nvidia programjait is, hasonló a helyzet.
    4. Ha kimondottan DP-re van szükség, ami speciális esetekben fordul elő (a hétköznapokban csak pl. mandelbrotnál jött volna jól nagyobb zoomokhoz), amúgy is érdemes megfelelő kártyát használni. Ha máshonnan ollózol át kódot, amiben van double, de nincs rá igazán szükség, le lehet cserélni floatra.
    5. Jó, akkor mondjuk úgy, hogy gyártó-függő. Csak Nvidia hw-en működik. (A platform-függetlenbe általában beleértik a gyártó- és hw-függetlenséget is.)
    +1: Ez nem feltétlen igaz. Pl. lenox Nvidián írt kódjai is teljesen jól futnak Radeonon is, különösebb időráfordítás nélkül.
    Ezt írta erről: "Ionon es firepro-n nem probaltam, nekem eddig ugy altalaban futottak mindenhol, beleertve intel procit es fusion aput az nv (geforce, quadro, tesla) es amd (radeon) videokartyak mellett. Probaltam az amd sdk-val is es az nv sdk-val is, eddig nem jott ki kulonbseg. Illetve olyan kulonbseg azert volt, hogy a work itemeket az nv driver mindig szepen kiosztotta, az amd meg neha elbaszta, ugyhogy azt explicite be kellett allitani, hogy multiprocesszoronkent mennyi thread legyen, es ugy mar ment mindketton."
    Ja, és 7.: a rekurzió amúgy is lassú, bár nyilván kényelmes.

    "X+: A PCI-E 3 rengeteget gyorsítana a rendszeren (még akkor is, ha nem függ a virtuális memória tőle)"

    Gyorsít, de közel sem annyit (legalábbis latencyben), mint amikor egymás mellett van a CPU és a GPU, tehát a PCIe teljesen kimarad és csak egy memcopy az egész. Nem beszélve arról, amikor erre sem lesz szükség.

    "márpedig az Amd nem nagyon foglalkozik a PCI-E 3-mal.."

    Nem-e? A GCN támogatja. A jövőre megjelenő Sepang és Terramar CPU-k is támogatják. Igaz, ezek Opteronok, de aki ugye "komolyan gondolja", annak belefér. Arról az AMD egyelőre nem beszél, hogy a Trinity támogatja-e, de ha a Sepang és a Terramar igen, akkor ez miért ne tenné? Az AM3+ marad 2.0 (2.1?). (Az eredeti tervek szerint ennek is átvette volna a helyét az FM2. Bár nincs kizárva, hogy 2012H2-ben erre is kijön egy 4+ modulos Piledriver, amikor az AM3+ már a végét járja).

    [ Szerkesztve ]

Új hozzászólás Aktív témák