Új hozzászólás Aktív témák
-
Fiery
veterán
Kicsit tulzas a par ezer mag. A legdurvabb Xeon Phi SKU-ban is csupan 61 db MIC mag van, max. 1.33 GHz-es orajelen, a Xeon Phi kartya igy 300W TDP-t ad ki. Ha ezt leosztjuk 100W-ra (Intel mainstream desktop/mobil CPU-nal a TDP ennel tobb nem nagyon lesz mar), es atrakjuk fejben 14 nanora, akkor sem igen kepzelheto el 20-25 MIC magnal tobb (kezdetben), hacsak nem nyomjak le az orajelet 1 GHz alá. Mas kerdes, hogy ennyi mag mire lesz eleg. 800-1000 GFLOPS kellene minimum, hogy kompetitiv legyen a cucc a Carrizo GCN iGPU-ja elleneben.
-
Abu85
HÁZIGAZDA
[link] - Vettek bizony hozzáértőket. Bár ez a ZiiLabs is egy agyonemulálós cucc. Meg is látszott a teljesítményén, vagy 100x lassabbak voltak mindenkinél, de futott az alkalmazás. Ez az emuláció valami fétish lehet az Intelnél szvsz.
Egyébként korábban is megvoltak a világszinten zseni embereik ... Michael Abrash, Andrew Richards, Atman Binstock, Tom Forsyth, Mike Sartain, John Gustafson. Csak ők nem voltak annyira lelkesek a koncepció láttán, mint az Intel vezetősége. Ez nyilván egy olyan érdekellentét, ami után ők húzták a rövidebbet. A sluszpoén, hogy a MIC végül nem lett binárisan kompatibilis az x86-tal, tehát nem a mérnököknek lett igazuk.
-
#25954560
törölt tag
sajnalom, de akarcsak Fiery, en is assemblyben (is) dolgozom. egy eve uj teruleten vagyok, de egy evvel ezelottig _kizarolag_ assembly volt.
multinal, nem kicsi garazscegnel. ha teljesitmeny kell, akkor tovabbra is nagyon ugy latszik h adott vason a gepi kod az, amivel a legtobbet ki tudsz belole hozni. idoigenyesebb, ez ketsegtelen. de megeri
szoval nem csak par oskovulet z80-on szuttyog asm-mel -
#06658560
törölt tag
-
Fiery
veterán
"csak a kritikus részekben vannak ASM utasítások"
Ez teljesen normalis. Mint ahogy az OpenCL-t hasznosito szoftverekben is csak a kritikus reszeken van OpenCL kod.
"Azért nincs ASM AMD kártyákra, mert minden 3. évben kijön egy gyökeresen új ISA, és dobhatnád ki az egész kódodat a francba"
Ettol me'g lehetne. Mindenki dontse el, hogy ilyen feltetelek mellett is megeri-e neki a fejlesztes assemblyben. Egyebkent a "minden 3. évben" es a "gyökeresen" egyutt eleg nagy tulzas. A VLIW5 architektura a Radeon HD 2900 XT-vel jelent meg 2007-ben. Azt facelifteltek, ugy szuletett a VLIW4 -- ami nem gyokeresen eltero architektura -- a Radeon HD 6970-nel 2010-ben. Az igazi uj generacio a GCN, ami 2012-ben jelent meg, tehat mondjuk 5 evente van gyokeresen uj architektura. A GCN2 (vagy mas neven GCN 1.1) sem gyokeresen uj architektura, csak faceliftelt, es velhetoen az is ki fog tartani cca. 2017-ig, kisebb-nagyobb patchelgetesekkel. Az nVIDIA-nal ugyanez a helyzet, a G80 (2006) ota, azzal egyutt is eddig 3 generacio volt, a Tesla, a Fermi meg a Kepler, de ez utobbi 2 vita targya lehetne, hogy mennyire gyokeresen ternek el.
-
#06658560
törölt tag
Márpedig mégis, ha a kommentem képtelen voltál értelmezni a sajátoddal kapcsolatosan- idézet tőled:
"Ilyen alacsony szinten ma már senki nem dolgozik komolyan."
Az, hogy te nem találkozol ilyennel, nem jelenti azt, hogy nincsenek ennyire elborultak-a maguk területén egyébként hihetetlen zsenik. -
Fiery
veterán
Koszonom az elismero szavakat
"Ha direkten szálakat futtatok, akkor nincs szinkronizáció? Annak nincs overheadje, akár kézzel történik (-> extra meló), akár az oprendszer csinálja (túl általános célú -> gyenge perf)? Nem véletlenül van context meg command queue - pontosan erre."
Miert kellene az oprendszer szalkezelesenek lassunak lennie? A Knights Landing be tud majd bootolni egy oprendszert, tehat valamilyen szinten az oprendszer fogja kezelni es utemezni a MIC magokat. Ha a Knights Landingnel ezt megoldjak, akkor miert ne oldhatnak meg a Skylake-nel vagy a Goldmont-nal is?
Az assembly hogyan mukodik x86-on? Yasm peldaul? No rocket science. GCN-re, Keplerre, az Intel GenAkarmennyijeire nincs assembly, pontosabban nem nyilt a rendszer. MIC-re -- ha az Intel egy kicsit is okosan csinalja -- lesz x86 assembler, jo esellyel a Yasm is tud majd forditani ra.
"Ilyen alacsony szinten ma már senki nem dolgozik komolyan"
Mi ennel alacsonyabb szinten is dolgozunk komolyan. Pl. kodgenerator, direkt gepi kodu programozas, stb. De persze tudom, hogy a fejlesztok 99%-a nem mereszkedik idaig, tudom hogy kisebbsegben vagyunk. Az extrem optimalizaciohoz azonban a legjobb megoldas mindig az, ha nem kell OpenCL, D3D, OpenGL es hasonlo overheadekkel vacakolni. A Mantle sem veletlenul szuletett, ott is az overheadet probaljak lekuzdeni.
-
#06658560
törölt tag
"És hogy írjak direkten ASM utasításokat? Mert a C++ fordító, OpenCL fordító nem ismeri őket, vagy mi? Ilyen alacsony szinten ma már senki nem dolgozik komolyan. Max egykét kritikus ponton optimizál kézzel, de ez pont azt jelenti, hogy nem dobják ki a magas szintű programnyelvet."
Bár nem programozó vagyok, de az élet egyéb területeiről szerzett tapasztalataim alapján DE.
#26 Lomha 8V: küldjem a számlaszámom? Direkt támogatással sikeresebb lennék, hamarabb érnék eredményt.
Új hozzászólás Aktív témák
Hirdetés
- Kaspersky, BitDefender, Avast és egyéb vírusírtó licencek a legolcsóbban, egyenesen a gyártóktól!
- Gamer PC-Számítógép! Csere-Beszámítás! I5 12400F / RTX 3060Ti / 32GB DDR4 / 512 M.2 SSD
- Vivo Y76 5G 128GB, Kártyafüggetlen, 1 Év Garanciával
- Xbox Game Pass Ultimate előfizetések kedvező áron
- GYÖNYÖRŰ iPhone 13 mini 128GB Midnight -1 ÉV GARANCIA - Kártyafüggetlen, MS3060, 94% Akkumulátor
Állásajánlatok
Cég: CAMERA-PRO Hungary Kft.
Város: Budapest