Hirdetés
- Nvidia GPU-k jövője - amit tudni vélünk
- Blu-ray lemez tapasztalatok
- Milyen TV-t vegyek?
- TCL LCD és LED TV-k
- AMD Ryzen 9 / 7 / 5 7***(X) "Zen 4" (AM5)
- Gaming notebook topik
- Azonnali notebookos kérdések órája
- Milyen széket vegyek?
- Azonnali informatikai kérdések órája
- AMD K6-III, és minden ami RETRO - Oldschool tuning
Új hozzászólás Aktív témák
-
Zoli0726
aktív tag
Már a 2.8as app sdk óta elérhető a bolt.
-
marcell991
tag
Épp a hétvégén futottam bele a Bolt Github oldalába [link], tényleg nyílt forrású
Developers, developers, developers, developers! http://youtu.be/KMU0tzLwhbE
-
bitblueduck
senior tag
A bolt-os példa egész értelmesen néz ki az elsőhöz képest, lehet én is kipróbálom holnap egy hello world-re
An open mind is like a fortress with its gates unbarred and unguarded.
-
petXYZW
tag
"Belekatekertem" a videóba. Azon rugózik, hogy az OpenCL kód milyen hosszú, a másik meg milyen rövid?
-
petXYZW
tag
Kedves Höh!
A második videóban, az első példakód estén, azt demonstrálja, hogy a gazdaeszközön futó kód, az OpenCL esetében milyen nagyon hosszú, tele van csúnyaságokkal context, program, bufferek stb., ráadásul runtime fordítja kernel kódot. (~120 sor) pfejj
A második példakód esetén, C++ wrapernek nevezi - kétségtelenül az, csak éppen semmi értelme - azt a vékony absztrakciós réteget amit ráhúztak az alap C-s openCL hívásokra, ami gyakorlatilag semmit nem változtat az egész logikáján. Én a magam részéről, ezt nem is szoktam használni. (~75 sor)
Olyan, mint a progi amit bemutat, a karakterkódokhoz hozzáadtak egyet...A harmadiknál (BOLT) ami már csak 35 sor - elsőnek, mint legfontosabb fícsör - már nincs semmi ami az OpenCL-ből maradt volna. Nincs inicializálás stb.
1. Tehát az alkalmazásod logikája semmit nem változott van egy rész ami a kvázi valamilyen előkészítés - a puffereket azért fel kell tölteni, nevezzük akárminek őket -, majd valamilyen függvény szerintem mindegy minek nevezzük kernel, funktor ahogy tetszik, ami a tényleges munkát végzi.
2. Egy szombat délelőtt összedobok egy C++ wrapert, ami nemcsak elfedi a csúnya OpenCL API-t, hanem hasonlóan lerövidíti a kódot.
3. A runtime fordítás adott esetben még előny is lehet. Arról a kis csúsztatásról meg ne is beszéljünk, hogy a kernel kód egy string-ben van. Lehet az külön fájlban is, miért kellene egy string belsejében highlight nélkül szopni vele, a KernelAnalyzer-ről nem is beszélve.
4. És a legfontosabb, a példák mindig ilyen semmittevő kernelekről, funktorokról szólnak. Mi van akkor, ha van BARRIER utasítás vagy a kernel is 120 sor?
-
Jack@l
veterán
Jé egy hozzáértő , osztom a vélemélnyt.
A hozzászólási jogosultságodat 2 hónap időtartamra korlátoztuk (1 hsz / 10 nap) a következő ok miatt: Az ÁSZF III 10/8. pontjának megsértése - trollkodás - miatt. Többször és többen is kértek már, hogy hozzászólás írásakor használd a linkelés funkciót, mert ennek elmaradása sokak számára zavaró.
-
Jack@l
veterán
Ha már c++ amp/opencl-ról is szó esett, itt egy real-life felhasználás:
http://totalcar.hu/magazin/hirek/2013/05/01/atvilagit_eson_es_havon_az_uj_csodafenyszoro/[ Szerkesztve ]
A hozzászólási jogosultságodat 2 hónap időtartamra korlátoztuk (1 hsz / 10 nap) a következő ok miatt: Az ÁSZF III 10/8. pontjának megsértése - trollkodás - miatt. Többször és többen is kértek már, hogy hozzászólás írásakor használd a linkelés funkciót, mert ennek elmaradása sokak számára zavaró.
-
MCBASSTION
aktív tag
szerintem itt az volt a lenyeg, hogy az egyszerubb dolgokat konnyen lehessen gyorsitani GPU-n, es ehhez a c++-hoz erto programozonak ne kelljen szopni az OpenCL apival. Mondjuk azert annyira nem szopas, es legalabb normalisan megtanulja, hogy hogyan is kell GPU-ra programozni, de mindegy. Szerintem AMD bacsi azt gondolja, hogy ahhoz, hogy a heterogen programozas elterjedjen ez szukseges.
Mondjuk teny, hogy azert igy sokkal egyszerubb. De egy bonyolultabb peldat en is megneznek
windows7sins.org
-
petXYZW
tag
válasz MCBASSTION #11 üzenetére
A BOLT jó dolog, csak nem értem ezzel, és a hasonló videókkal mit akarnak. Azoknak, akik értenek a C++, az OpenCL megtanulása, feldolgozása nem okozhat gondot.
"Mondjuk azert annyira nem szopas, es legalabb normalisan megtanulja, hogy hogyan is kell GPU-ra programozni, de mindegy."
Azt gondolom pont ez a lényeg!
-
lenox
veterán
Nem mindig olyan szerencses az ember, hogy van ideje elmelyedni egy temaban. Van amikor tobbet er egy nap alatt 5-szorosere gyorsitani valamilyen feladat megoldasat, mint egy het alatt 10-szeresere. Szoval van, hogy kompromisszumot kell kotni, ez is egy kompromisszum, ami az esetek egy reszeben hasznalhato.
Amugy ha jol ertem ez elvben megy intelen es nvidian is, ugye?
-
LordX
veterán
Ez mind szép és jó, de pl. egy scan, egy redukció vagy konvolúció jár úgy hat tonna host és kernel kóddal, úgy, hogy az elemi művelethez még egy bit kódot nem írtál. És ezek teljesen ugyanazok minden esetben. Nem nehézség, de a produktivitást brutálisan megdobja, ha nem kell a mechanikus lépésekkel foglalkozni.
-
petXYZW
tag
Igazad van, a produktivitás fontos. Magam részéről mindig próbálok mérlegelni, hogy mi tart tovább, egy számomra új, de már létező wraper-t megtanulni vagy egy sajátot készíteni. Úgy gondolom mindkét módszernek lehetnek további előnyei hátrányai. Amit a videón láttam az nem nyűgözött le.
Ettől függetlenül egy érdekes diasorozat a BOLT-ról - bár nem túl friss -, amiből számomra az is kiderült, eltérőek a "képességei" OpenCL és AMP mellett. Legalábbis akkor még eltérőek voltak.
http://www.slideshare.net/hsafoundation/bolt-for-hsa-by-ben-sanders
[ Szerkesztve ]
Új hozzászólás Aktív témák
- Nvidia GPU-k jövője - amit tudni vélünk
- Robot fűnyírók
- Samsung Galaxy Fit 3 - keveset, de jól
- Wise (ex-TransferWise)
- Honor Magic6 Pro - kör közepén számok
- Poco F3 - a mindenes, de nem mindenkinek
- Álláskeresés, interjú, önéletrajz
- Blu-ray lemez tapasztalatok
- Vodafone otthoni szolgáltatások (TV, internet, telefon)
- Horgász topik
- További aktív témák...