Hirdetés
- Itt a Microsoft szörnyprocesszora, ami 132 maggal tarolhatja le a felhőt
- Melyik tápegységet vegyem?
- ThinkPad (NEM IdeaPad)
- Milyen asztali (teljes vagy fél-) gépet vegyek?
- Egérpad topik
- NVIDIA GeForce RTX 5080 / 5090 (GB203 / 202)
- Milyen billentyűzetet vegyek?
- Milyen processzort vegyek?
- Hisense LCD és LED TV-k
- Milyen monitort vegyek?
Új hozzászólás Aktív témák
-
con_di_B
tag
"OpenCL maintains memory consistency in a coarse-grained fashion in regions of buffers. We
call this coarse-grained sharing. Many platforms such as those with integrated CPU-GPU
processors and ones using the SVM-related PCI-SIG IOMMU services can do better, and can
support sharing at a granularity smaller than a buffer. We call this fine-grained sharing. OpenCL
2.0 requires that the host and all OpenCL 2.0 devices support coarse-grained sharing at a
minimum." - OpenCL 2.0 Specification 5.6.1Szoval jah, az IOMMU csak egy pelda, hogy azzal pl lehet fine-grained-et csinalni. Viszont a coarse-grained meg kotelezo, ezert magyaraztam rola, hogy hogyan lehet rapatkolni IOMMU nelkuli, meg gyakorlatilag barmilyen hardverra. Csak ilyen szempontbol vizsgaltam a kerdest, maga a feature engem mindig is relative hidegen hagyott, es inkabb veszelyt latok benne, mert lehetove teszi a portolas "felgyorsitasat" legacy C/C++ kodokrol.
Az OpenCL 1.x az annyira kotott memoriamodellel jott ki, hogy igy is ugy is at kellett varialni az adatszerkezeteidet, hogy egyaltalan futtathato programot kapjal (amibol nem mellesleg az ezutan elert speed-up nem kis resze szarmazott), ezzel szemben ha rafogod, hogy te marpedig fine-grained APU-kat tamogatsz kizarolag, onnantol kezdve barmennyire kokany meglevo adatszerkezetet radobhatsz a GPU-ra a meglevo (90%, hogy mar eleve optimalizalatlan, trehany) kodbazisodbol, aztan meg majd lehet csodalkozni, hogy miert sokkal lassabb, mint CPU-n volt.
Aztan persze mondhatod, hogy ott van az az <1% az eseteknek, amikor valaki tenyleg valami ertelmes CPU-GPU ko-op funkciot irt, de mivel minimum ket kernel launchrol beszelunk, meg ket kulon device-rol, es a szinkronizacios primitivek meg nem lettek erosebbek a 2.x-ben sem, ezert a biztos mukodesert ugyanugy kenytelen leszel buffer-level szinkronizalni, ha van fine-grained support, ha nincs.
Ennel rosszabb mar csak az lesz, amikor jonnek a szemaforok meg a felteteles valtozok, hogy a multi-threaded sracok is ugy erezzek, hogy ertenek valamihez... (bocs-bocs-bocs
)
Új hozzászólás Aktív témák
- LEGO klub
- Itt a Microsoft szörnyprocesszora, ami 132 maggal tarolhatja le a felhőt
- Melyik tápegységet vegyem?
- Kutya topik
- ThinkPad (NEM IdeaPad)
- Battlefield 6
- Motorolaj, hajtóműolaj, hűtőfolyadék, adalékok és szűrők topikja
- sh4d0w: Kalózkodás. Kalózkodás?
- Milyen asztali (teljes vagy fél-) gépet vegyek?
- V.Milán: Lapdiffúzor nyomáseloszlása: gondoltad volna?
- További aktív témák...
- Telefon felvásárlás!! Xiaomi Redmi 9, Xiaomi Redmi 9AT, Xiaomi Redmi 10, Xiaomi Redmi 10 2022
- GYÖNYÖRŰ iPhone 12 mini 128GB Blue -1 ÉV GARANCIA - Kártyafüggetlen, MS3854, 100% Akkumulátor
- HIBÁTLAN iPhone 13 mini 128GB Starlight -1 ÉV GARANCIA -Kártyafüggetlen, MS3763, 100% Akksi
- HIBÁTLAN iPhone 14 256GB Purple -1 ÉV GARANCIA - Kártyafüggetlen, MS3535
- GYÖNYÖRŰ iPhone 14 Pro 128GB Deep Purple -1 ÉV GARANCIA -Kártyafüggetlen, MS3933, 100% Akkumulátor
Állásajánlatok
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest
Cég: Laptopműhely Bt.
Város: Budapest
)

