Keresés

Hirdetés

Új hozzászólás Aktív témák

  • flugi

    tag

    válasz flugi #50 üzenetére

    kicsit hadd kössem az ebet a karóhoz: a szoftveres oldal szerintem komoly változás előtt áll, és az APU hardverrel már elérhető a következő recept: a program vegyesen tartalmaz párhuzamos és soros szakaszokat, és ezeket a CPU-GPU részeken, mindet az annak megfelelőn futtat. Ennek jelenlegi legjobb implementációja az OpenCL, és azért nem használják, mert nagy a tranzakció költsége, mivel az adatokat PCI-E buszon utaztatják oda-vissza, ami komoly latency.

    Ehhez képest a Fusion CPU-GPU transzfer költség kábé egy cache ürítés, ha külön cache van a CPU-n. A párhuzamosítható feladatrészek zöme beletagozódik a soros feladatokba, ezért eddig a latency miatt sokszor egyáltalán nem érte meg GPU-n számolni, a Fusion viszont jónak tűnik. Ezért vetettem fel az olyan OpenCL teszt fontosságát, ami ilyen scenariot mér. Ez szerintem éveken belül általános lesz.

    És komolyan gondolom, hogy írok benchmark programot hozzá, ha nem találtok.

Új hozzászólás Aktív témák