Keresés

Hirdetés

Új hozzászólás Aktív témák

  • Raymond

    félisten

    válasz Abu85 #31 üzenetére

    Valahogy mindig elszall a fejed felett amit a ket kollega probal magyarazni. Es az az, hogy hiaba van GPU es CPU alatt is OpenCL tamogatas, ha normalis sebesseget akarsz ugyis kulon kell optimalizalnod a kodot mindket kornyezetre. Ezen a heterogen futtatas se valtoztat semmit. Egy programon belul is ket utat kell jarnod. Futtatasnal vagy megnezi min fut es azt a kodot valasztja vagy eleve megmondod neki.

    Egyebkent ezen megy a siras az OpenCL-t tenyleg hasznalni akarok koreben per pillanat. Amit te ismetelgetsz itt az a vagyalom es a PR. A valosag pedig az ami eddig is megvolt a HPC kornyezetben es ezutan is meglesz. Hiaba van egy API/Framework ami tobb hardveren fut, a vegen ugyis kulon kell mindenre optimalizalnod ha sebesseget akarsz.

    Pelda - van egy X problema amit megoldasz OpenGL-ben. Egy vagy tobb kernel dolgoz fel egy vagy tobb adattombot. Ha maximalis sebesseget akarsz (es a HPC errol szol) akkor kulon kell hangolnod a kernelt az AMD es az NV chipjeire is. Ugyanugy ahogy a CPU-khoz kell egy harmadik es negyedik ut. Mindegyikre mas-mas a megfelelo adatmennyiseg, double vagy triple buffering az elerheto memoria alrendszerek elerheto sebessegebol kifolyolag (cache/mem savszel, kesleltetesek, mennyiseguk). Hiaba van a kod OpenCL alatt, ugyanugy kulon-kulon kell megirnod, hangoldon es tesztelned mindet mint eddig. A HPC alatt mindig is ez ment es ez is fog menni orokke. Itt nincsenek csodamegoldasok.

    Privat velemeny - keretik nem megkovezni...

Új hozzászólás Aktív témák