- 80% vs. 100% – Tönkreteszed az aksit, ha mindig feltöltöd? – Tech Percek #6
- Jóárasítja két Arrow Lake-S CPU-ját az Intel
- Milyen asztali (teljes vagy fél-) gépet vegyek?
- Azonnali informatikai kérdések órája
- HDD probléma (nem adatmentés)
- NVIDIA GeForce RTX 3080 / 3090 / Ti (GA102)
- Milyen billentyűzetet vegyek?
- Analóg fényképezés
- Akciókamerák
- Kódolás Qwen3-mal saját gépen, Cline AI-alapú autonóm kódolási ágenssel
Új hozzászólás Aktív témák
-
petXYZW
tag
Igazad van, a produktivitás fontos. Magam részéről mindig próbálok mérlegelni, hogy mi tart tovább, egy számomra új, de már létező wraper-t megtanulni vagy egy sajátot készíteni. Úgy gondolom mindkét módszernek lehetnek további előnyei hátrányai. Amit a videón láttam az nem nyűgözött le.
Ettől függetlenül egy érdekes diasorozat a BOLT-ról - bár nem túl friss -, amiből számomra az is kiderült, eltérőek a "képességei" OpenCL és AMP mellett. Legalábbis akkor még eltérőek voltak.
http://www.slideshare.net/hsafoundation/bolt-for-hsa-by-ben-sanders
-
LordX
veterán
Ez mind szép és jó, de pl. egy scan, egy redukció vagy konvolúció jár úgy hat tonna host és kernel kóddal, úgy, hogy az elemi művelethez még egy bit kódot nem írtál. És ezek teljesen ugyanazok minden esetben. Nem nehézség, de a produktivitást brutálisan megdobja, ha nem kell a mechanikus lépésekkel foglalkozni.
-
lenox
veterán
Nem mindig olyan szerencses az ember, hogy van ideje elmelyedni egy temaban. Van amikor tobbet er egy nap alatt 5-szorosere gyorsitani valamilyen feladat megoldasat, mint egy het alatt 10-szeresere. Szoval van, hogy kompromisszumot kell kotni, ez is egy kompromisszum, ami az esetek egy reszeben hasznalhato.
Amugy ha jol ertem ez elvben megy intelen es nvidian is, ugye?
-
petXYZW
tag
válasz
MCBASSTION #11 üzenetére
A BOLT jó dolog, csak nem értem ezzel, és a hasonló videókkal mit akarnak. Azoknak, akik értenek a C++, az OpenCL megtanulása, feldolgozása nem okozhat gondot.
"Mondjuk azert annyira nem szopas, es legalabb normalisan megtanulja, hogy hogyan is kell GPU-ra programozni, de mindegy."
Azt gondolom pont ez a lényeg!
-
MCBASSTION
aktív tag
szerintem itt az volt a lenyeg, hogy az egyszerubb dolgokat konnyen lehessen gyorsitani GPU-n, es ehhez a c++-hoz erto programozonak ne kelljen szopni az OpenCL apival. Mondjuk azert annyira nem szopas, es legalabb normalisan megtanulja, hogy hogyan is kell GPU-ra programozni, de mindegy. Szerintem AMD bacsi azt gondolja, hogy ahhoz, hogy a heterogen programozas elterjedjen ez szukseges.
Mondjuk teny, hogy azert igy sokkal egyszerubb. De egy bonyolultabb peldat en is megneznek
-
Jack@l
veterán
Ha már c++ amp/opencl-ról is szó esett, itt egy real-life felhasználás:
http://totalcar.hu/magazin/hirek/2013/05/01/atvilagit_eson_es_havon_az_uj_csodafenyszoro/ -
petXYZW
tag
Kedves Höh!
A második videóban, az első példakód estén, azt demonstrálja, hogy a gazdaeszközön futó kód, az OpenCL esetében milyen nagyon hosszú, tele van csúnyaságokkal context, program, bufferek stb., ráadásul runtime fordítja kernel kódot. (~120 sor) pfejj
A második példakód esetén, C++ wrapernek nevezi - kétségtelenül az, csak éppen semmi értelme - azt a vékony absztrakciós réteget amit ráhúztak az alap C-s openCL hívásokra, ami gyakorlatilag semmit nem változtat az egész logikáján. Én a magam részéről, ezt nem is szoktam használni. (~75 sor)
Olyan, mint a progi amit bemutat, a karakterkódokhoz hozzáadtak egyet...A harmadiknál (BOLT) ami már csak 35 sor - elsőnek, mint legfontosabb fícsör - már nincs semmi ami az OpenCL-ből maradt volna. Nincs inicializálás stb.
1. Tehát az alkalmazásod logikája semmit nem változott van egy rész ami a kvázi valamilyen előkészítés - a puffereket azért fel kell tölteni, nevezzük akárminek őket -, majd valamilyen függvény szerintem mindegy minek nevezzük kernel, funktor ahogy tetszik, ami a tényleges munkát végzi.
2. Egy szombat délelőtt összedobok egy C++ wrapert, ami nemcsak elfedi a csúnya OpenCL API-t, hanem hasonlóan lerövidíti a kódot.
3. A runtime fordítás adott esetben még előny is lehet. Arról a kis csúsztatásról meg ne is beszéljünk, hogy a kernel kód egy string-ben van. Lehet az külön fájlban is, miért kellene egy string belsejében highlight nélkül szopni vele, a KernelAnalyzer-ről nem is beszélve.
4. És a legfontosabb, a példák mindig ilyen semmittevő kernelekről, funktorokról szólnak. Mi van akkor, ha van BARRIER utasítás vagy a kernel is 120 sor?
-
petXYZW
tag
"Belekatekertem" a videóba. Azon rugózik, hogy az OpenCL kód milyen hosszú, a másik meg milyen rövid?
-
bitblueduck
senior tag
A bolt-os példa egész értelmesen néz ki az elsőhöz képest, lehet én is kipróbálom holnap egy hello world-re
-
marcell991
tag
Épp a hétvégén futottam bele a Bolt Github oldalába [link], tényleg nyílt forrású
-
Zoli0726
aktív tag
Már a 2.8as app sdk óta elérhető a bolt.
Új hozzászólás Aktív témák
Hirdetés
ph Az STL kompatibilis szabványos C++ sablonkönyvtár leegyszerűsíti a GPU-k általános számítási kapacitásának kihasználását.
- 80% vs. 100% – Tönkreteszed az aksit, ha mindig feltöltöd? – Tech Percek #6
- Tesla topik
- E-roller topik
- Clair Obscur: Expedition 33 teszt
- Háztartási gépek
- Jóárasítja két Arrow Lake-S CPU-ját az Intel
- Xbox tulajok OFF topicja
- Xiaomi 15 Ultra - kamera, telefon
- Nem állnak jól az Apple Watch számai
- Milyen asztali (teljes vagy fél-) gépet vegyek?
- További aktív témák...
- ASUS ROG Strix GeForce RTX 3090 24GB
- GIGABYTE GeForce RTX 2080 TURBO OC 8GB GDDR6 videokártya (használt)
- XFX AMD Radeon RX6700XT 12GB / Újszerű állapotban / 6 hónap jótállással
- 27% Számla! Sapphire RX 7900 XTX Vapor-X 24GB GDDR6 Nitro+ Videokártya! BeszámítOK
- ASUS GeForce RTX 4070 12GB Dual White OC Edition
Állásajánlatok
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest