Új hozzászólás Aktív témák

  • dezz

    nagyúr

    válasz lenox #80 üzenetére

    Ejj, ejj, mintha nem tudnád, hogy a GPU-k (maiak sem) nem igazán szeretik az ugrásokat, amik a CPU-knak viszont meg sem kottyannak... Ennek kihasználásához mindössze olyan feladatok kellenek, amiknek egyes lépései komplikáltabb algoritmusok, más lépései pedig egyszerűbb, de számításigényesebbek. Ne mondd már, hogy ez annyira egzotikus dolog lenne!

    Nem is kell messzire menni, vegyük pl. a a ray-tracinget: van benne rengeteg adaton, de egyszerűbb és jóval kisebb adathalmon, de jóval bonyolultabb számítási feladat is. (De szerintem ezt nem kell neked magyarázni. ;) Vagy ha mégis, később majd meglátod, ha továbbfejleszted esetleg azt a kis OpenCL-es ray-tracert...)

    Az AVX-ből, mint megbeszéltük, ilyen 200 GFLOPS körüli (vagy alatti) értékeket lehet kihozni SandyB-n és az IvyB sem lesz sokkal előrrébb. Ehhez képest a Llano IGP-je 4-500 GFLOPS-os, ami azért mégis csak 2-2,5x annyi. Bár még nem derült ki, milyen gyors lehet a kommunikáció a CPU és a GPU között.

    "ugyhogy pontosan akkor lehet majd ebbol igazi elonyt kovacsolni, amikor az integralt cpu es gpu kozos cache-sel fog rendelkezni. Az meg nem most van."

    Nocsak, nocsak! Eddig az egész APU koncepciót értelmetlennek mondtad (és még a mondat első fele alapján sem ilyen befejezésre számítana az ember :D ), ehhez képest előrelépés, hogy bizonyos feltétekkel már tulajdonítasz neki némi létjogosultságot. :)

    Mindegy, ezek csak az első lépések, a jövő a sokkal komolyabb integrálás, összegyúrás, közös regiszterkészlettel, stb.

Új hozzászólás Aktív témák