Legfrissebb anyagok

PROHARDVER! témák

Mobilarena témák

IT café témák

GAMEPOD.hu témák

LOGOUT.hu témák

Hirdetés

Az Apple megszerezné a klubvilágbajnokság közvetítési jogait

ph A vállalat ezért irgalmatlan pénzt fizetne a FIFA-nak, és ezzel rajzolná át az online streaming platformok háborújában a frontvonalakat.
Letartóztatták a bitcoin-Jézust

it Amerikai adókerülés vádjával, Spanyolországban tartóztatták le a bitcoin-Jézusként ismert Roger Vert.
Toyota Corolla Touring Sport 2.0 teszt és az autóipar

lo Némi autóipari kitekintés után egy középkategóriás autót mutatok be, ami az észszerűség műhelyében készül.

Új hozzászólás Aktív témák

#51 Fiery veterán Abu85 #48

Új Válasz 2015-03-30 16:38:48 #51
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz Abu85 #48 üzenetére

Mar megint jossz a zseni kifejezessel. Mibol szurted le, hogy Andrew Richards zseni? Volt egy olimpia a zseniknek, es ott o elodontos volt? Mibol derivaltad le, hogy epp ra kellene hallgatni, es nem mondjuk arra a par emberre, aki Intel reszvenyt vasarol, es ezzel tamogatja a KNL projektet? Ha a KNL egy borzalmas katasztrofanak nezne ki, akkor szerinted a reszvenyesek/igazgatotanacs nem kezdett volna el morgolodni, hogy miert pont abba a projektbe teszik a penzt az Intelnel, ahelyett, hogy mondjuk felvasarolnak az nVIDIA-t, es igy megszereznek mondjuk a CUDA-t? Miert pont Andrew Richards a legnagyobb koponya, akinek minden szavat el kellene hinni, es minden joslatat keszpenznek kellene venni?
"Ezek az emberek ugyanakkor eltávolodtak az Inteltől, amikor a cég nem fogadta meg a tanácsaikat. [...] Ezért a szerződésüket felbontották."
Aham, tehat bepoccentek, es most fikazzak az Intelt. Tehat amit ok mondanak, az 100%-ig objektiv. Vilagos.
"Ezek közül a legfőbb az volt, hogy dobják az x86-ot, mert nagyon öreg ISA, és nem is tervezték túl skálázódóra a memóriamodelljét."
Tehat tancsoltak valamit az Intelnek, ami nyilvanvaloan hulyeseg, hiszen Intel = x86, ergo sosem fogjak eldobni. Megprobaltak, nem kellett senkinek (Itanium), most miert gondolja barki is azt, hogy az x86 eldobhato? Aki meg ilyeneken gondolkozik (Intel minusz x86), annak en egyetlen szavat sem vennem komolyan, ugyanis eleve komolytalan (szak)emberrol van szo. Ennyi erovel probald meg a Microsoftot lebeszelni a Windowsrol, vagy a VW csoportot probald meg lebeszelni a Golf es Passat markanevekrol

[ Szerkesztve ]
#52 Abu85 HÁZIGAZDA Fiery #50

Új Válasz 2015-03-30 16:45:24 #52
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Fiery #50 üzenetére

Az x86 alapjait több éve rakták le. Természetes, hogy egy újabb tervezésű ISA jobb lehet nála. Ez egyszerűen csak a fejlődéssel megmagyarázható. Nem véletlenül cserélgetik a gyártók a GPU-architektúrák ISA-ját pár éves ciklusokban. Aki azt hiszi, hogy ez megkerülhető az előbb-utóbb belefut egy óriási falba.
Hogyan oldja meg a hardver? Ezek szerint a KNL csak emulálja az x86-ot? Van benne egy új ISA, amit már skálázásra terveztek hardveres szálkezeléssel és szinkronizálással? Ez nekem új információ.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#53 freeapro senior tag Fiery #30

Új Válasz 2015-03-30 16:45:56 #53
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

freeapro

senior tag

válasz Fiery #30 üzenetére

Egy nagyon specialis, nagyon vekony piaci reteg igenyt igyekeznek ezekkel kielegiteni a gyartok. Amikor pedig ennyire specialis termekrol van szo, hidd el, nem lesz problema a programozokkal megiratni a f*sza kodot. Mint ahogy arrol sem lehet sokat hallani, hogy a Tesla kapcsan problema lenne a programozas.
Ez butaság. Csak azért nem látod problémának mert a projektek és fejlesztők köre is igen limitált. Ezek egymást lassító tényezők. Azt kizártnak tartom, hogy az AMD azért lépjen be erre a piacra, hogy egy szűk szegmenst kiszolgáljon. Ezekre a masszívan párhuzamos rendszerek hamarosan nagy mennyiségben lesz szükség (egy területet mondok: önvzető járművek) és akkor ott lesz az igény a könnyű programozhatóságra. Ha erre a piacra a tömegeket tudsz átképezni meglévő rendzserek minimális módosításásval akkor nyertél.
#54 Abu85 HÁZIGAZDA Fiery #51

Új Válasz 2015-03-30 16:52:40 #54
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Fiery #51 üzenetére

Andrew Richards az iparág egyik legelismertebb koponyája a complier technológiák területén. Ha ő nem képes valamire, akkor nem sokan. Nem véletlenül szerződtette pont őt az Intel anno. Drágán dolgozik, de pontosan tudták, hogy szakmájában ő a legjobb.
Az Intel arra kérte őket, hogy tanáccsal lássák el a mérnökeiket. Ezek a szakemberek pedig megtették a legjobb tudásuk szerint. Az már az Intel saját döntése, hogy nem fogadták meg a tanácsaikat. Nyilván a vezetőség gazdaságilag vizsgálta a kérdést, míg a szakemberek technikailag írták le a helyzetet, hogy egyáltalán az, amit az Intel elgondolt működhet-e. Ők azt mondták, hogy nem, és az eddigi gyakorlati produkcióból is az derült ki, hogy igazuk volt. De nyilván a pénzügyi szakemberek jobbnak látták, ha nem hallgatnak a mérnökökre.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#55 Fiery veterán Abu85 #52

Új Válasz 2015-03-30 16:53:02 #55
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz Abu85 #52 üzenetére

Tok mindegy, mennyire archaikus az x86, az Intel akkor is ragaszkodik hozza. Ezt el kell fogadni, mint tenyt, nem erdemes ez ellen harcolni vagy ezzel a dontessel vitatkozni. Amugy meg, ha megnezed pl. az ultramobil piacot, az x86 kozel sem szerepel annyira rosszul, mint sokan szeretnek hinni
A megoldast arra ertettem, hogy ha nem akar valaki a szalkezelessel foglalkozni, akkor hasznalhat OpenCL-t. Nem hardveres megoldaskent gondoltam ezt, hanem nyilvan szoftvereskent. Es az, hogy mennyire lenyeges vagy sem a hardveres szalkezeles, az majd a gyakorlatban ki fog derulni. De az alapjan, hogy a mostani 2/4/8 utas Xeon E5/E7 prociknal nem hallani, hogy annyira nagy problema lenne a 72+ szal kezelese, nem gondolnam, hogy a KNL-en hirtelen ez most elobukkanna, mint megoldhatatlan problema. Hiszen a KNL vegeredmenyben nem mas, mint egy Xeon E5, csak tobb magja van, nagyobb cache-ei, 4x HTT, es AVX-512-t tamogat. Ezert sem ertem, miert kell allandoan a mostani Xeon Phi-hez hasonlitani. Sokkal-sokkal tobb koze van a Haswell-EP/EX vonalhoz, mint a Knights Corner-hez.

[ Szerkesztve ]
#56 Balala2007 tag Abu85 #13

Új Válasz 2015-03-30 16:57:10 #56
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Balala2007

tag

válasz Abu85 #13 üzenetére

szimuláción sem működött több feladatban 20 magnál jobban a skálázódás
Ez az AIDA64 ZLib tesztje egy 4 socketes Westmere-EX-en, 30MB L3-mal. Minden thread 32MB tomorites. En erre ra merem mondani, hogy az x64 legalabb 40 core-ig egesz jol skalazodik.
# 0 Pmask:0x0800000000000000:0000000000000000 T: 1 : 28.572 MiB/sec( 1.00000) # 1 Pmask:0x0a00000000000000:0000000000000000 T: 2 : 57.136 MiB/sec( 1.99970) # 2 Pmask:0x0a80000000000000:0000000000000000 T: 3 : 85.613 MiB/sec( 2.99642) # 3 Pmask:0x0aa0000000000000:0000000000000000 T: 4 : 114.029 MiB/sec( 3.99087) # 4 Pmask:0x0aa8000000000000:0000000000000000 T: 5 : 142.716 MiB/sec( 4.99490) # 5 Pmask:0x0aaa000000000000:0000000000000000 T: 6 : 171.148 MiB/sec( 5.98998) # 6 Pmask:0x0aaa800000000000:0000000000000000 T: 7 : 199.931 MiB/sec( 6.99735) # 7 Pmask:0x0aaaa00000000000:0000000000000000 T: 8 : 228.132 MiB/sec( 7.98436) # 8 Pmask:0x0aaaa80000000000:0000000000000000 T: 9 : 256.596 MiB/sec( 8.98057) # 9 Pmask:0x0aaaaa0000000000:0000000000000000 T: 10 : 285.006 MiB/sec( 9.97489) # 10 Pmask:0x0800008000000000:0000000000000000 T: 2 : 57.115 MiB/sec( 1.99896) # 11 Pmask:0x0a0000a000000000:0000000000000000 T: 4 : 114.222 MiB/sec( 3.99764) # 12 Pmask:0x0a8000a800000000:0000000000000000 T: 6 : 171.293 MiB/sec( 5.99506) # 13 Pmask:0x0aa000aa00000000:0000000000000000 T: 8 : 228.555 MiB/sec( 7.99927) # 14 Pmask:0x0aa800aa80000000:0000000000000000 T: 10 : 285.620 MiB/sec( 9.99653) # 15 Pmask:0x0aaa00aaa0000000:0000000000000000 T: 12 : 341.518 MiB/sec( 11.95272) # 16 Pmask:0x0aaa80aaa8000000:0000000000000000 T: 14 : 398.875 MiB/sec( 13.96017) # 17 Pmask:0x0aaaa0aaaa000000:0000000000000000 T: 16 : 455.253 MiB/sec( 15.93333) # 18 Pmask:0x0aaaa8aaaa800000:0000000000000000 T: 18 : 512.796 MiB/sec( 17.94727) # 19 Pmask:0x0aaaaaaaaaa00000:0000000000000000 T: 20 : 567.009 MiB/sec( 19.84465) # 20 Pmask:0x0800008000080000:0000000000000000 T: 3 : 85.326 MiB/sec( 2.98632) # 21 Pmask:0x0a0000a0000a0000:0000000000000000 T: 6 : 171.413 MiB/sec( 5.99927) # 22 Pmask:0x0a8000a8000a8000:0000000000000000 T: 9 : 257.052 MiB/sec( 8.99666) # 23 Pmask:0x0aa000aa000aa000:0000000000000000 T: 12 : 341.985 MiB/sec( 11.96908) # 24 Pmask:0x0aa800aa800aa800:0000000000000000 T: 15 : 427.328 MiB/sec( 14.95598) # 25 Pmask:0x0aaa00aaa00aaa00:0000000000000000 T: 18 : 511.770 MiB/sec( 17.91135) # 26 Pmask:0x0aaa80aaa80aaa80:0000000000000000 T: 21 : 595.182 MiB/sec( 20.83067) # 27 Pmask:0x0aaaa0aaaa0aaaa0:0000000000000000 T: 24 : 683.108 MiB/sec( 23.90797) # 28 Pmask:0x0aaaa8aaaa8aaaa8:0000000000000000 T: 27 : 762.421 MiB/sec( 26.68385) # 29 Pmask:0x0aaaaaaaaaaaaaaa:0000000000000000 T: 30 : 842.788 MiB/sec( 29.49659) # 30 Pmask:0x0800008000080000:0000000000080000 T: 4 : 113.341 MiB/sec( 3.96681) # 31 Pmask:0x0a0000a0000a0000:00000000000a0000 T: 8 : 228.124 MiB/sec( 7.98408) # 32 Pmask:0x0a8000a8000a8000:00000000000a8000 T: 12 : 342.240 MiB/sec( 11.97800) # 33 Pmask:0x0aa000aa000aa000:00000000000aa000 T: 16 : 456.621 MiB/sec( 15.98119) # 34 Pmask:0x0aa800aa800aa800:00000000000aa800 T: 20 : 568.893 MiB/sec( 19.91059) # 35 Pmask:0x0aaa00aaa00aaa00:00000000000aaa00 T: 24 : 681.146 MiB/sec( 23.83932) # 36 Pmask:0x0aaa80aaa80aaa80:00000000000aaa80 T: 28 : 790.318 MiB/sec( 27.66022) # 37 Pmask:0x0aaaa0aaaa0aaaa0:00000000000aaaa0 T: 32 : 898.272 MiB/sec( 31.43848) # 38 Pmask:0x0aaaa8aaaa8aaaa8:00000000000aaaa8 T: 36 : 1009.439 MiB/sec( 35.32917) # 39 Pmask:0x0aaaaaaaaaaaaaaa:00000000000aaaaa T: 40 : 1112.584 MiB/sec( 38.93913)

[ Szerkesztve ]

AIDA64.com
#57 Fiery veterán freeapro #53

Új Válasz 2015-03-30 16:58:12 #57
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz freeapro #53 üzenetére

Nem igazan ertem, pontosan mi a butasag? Az, hogy egy szuk kor szamara keszul a KNL es az AMD HPC APU? Jelen allas szerint pedig ez a helyzet. Az megint mas kerdes, ha hirtelen elobukkannak olyan uj piacok, ahova jol illeszkedne egy ilyen termek, pl. az emlitett onvezeto jarmuvek, vagy mondjuk VR vagy holografikus megjelenites vagy barmi mas trendi technologia, ami most me'g sci-finek tunik. Mindenesetre, tovabbra sem ertem, miert lenne a gond a KNL programozasa, amikor _egyarant_ tamogat SIMD x86-ot es OpenCL-t is. Ergo egy x86 programozo szamara sem lesz idegen, de egy mostani GPGPU programozo szamara sem. Hol itt a gond?
#58 Abu85 HÁZIGAZDA Balala2007 #56

Új Válasz 2015-03-30 17:03:23 #58
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Balala2007 #56 üzenetére

A kulcsszó a socket. Négyutas rendszerben nincs igazán gond. Egy lápkán belül jönnek elő a limitek. Ezek is kezelhetők a gyorsítótárak méretének extrém növelésével, csak ez nem feltétlenül kifizetődő, mert egy újabb ISA-val meg feldolgozókat is építhetsz ugyanarra a területre.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#59 Fiery veterán Abu85 #58

Új Válasz 2015-03-30 17:04:14 #59
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz Abu85 #58 üzenetére

Ha valami 4 socketre skalazodik, akkor 1 socketen belul miert ne skalazodna? Veletlenul nem a 4 socket a nagyobb kihivas? Snooping, NUMA, tudod.....
#60 Fiery veterán Abu85 #54

Új Válasz 2015-03-30 17:10:46 #60
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz Abu85 #54 üzenetére

Egyre viccesebb, amiket irsz. Lassuk csak, mi tortent. Az Intel megbizott egy ceget, hogy adjon tanacsokat GPU compiler temaban. Esetleg -- ezt nem tudjuk ugye -- megbizott me'g nehany ceget, plusz vannak ugye sajat mernokei is, akik biztos nem zsenik (szerinted), biztos nem nagy koponyak (szerinted). Mindegyik szakerto/szakember mond valamit, hogy szerintuk mi lenne a jo megoldas. Aztan az Intel ugy dont, hogy marad az egyik megoldasnal a sok kozul, es megkoszoni mindenkinek a munkat, a kulso szakertoket kifizeti, mindenki megy az utjara, mindenki orul. Ezutan az egyik kulso szakerto elkezdi fikazni az Intelt, mert nem az o megoldasat valasztotta a sokfele opcio kozul. Vilagos, csak ez az ember lehet a zseni a sok szakerto kozul Azert megneznem a CodePlay uzleti eredmenyet, es mondjuk melletennem az Intel uzleti eredmenyenek, es aztan csinaljuk meg ugyanezt 10 ev mulva, amikorra a KNL kapcsan hozott "rossz" dontes csodkozeli allapotba juttatja az Intelt, mikozben a CodePlay tobbtiz milliard dollaros eves forgalmat general
#61 freeapro senior tag Fiery #57

Új Válasz 2015-03-30 17:12:46 #61
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

freeapro

senior tag

válasz Fiery #57 üzenetére

Te azt írod, hogy ezen a területen nem számít a könnyű programozhatóság. Ha 10 zseni kódol rá akkor igazad van, ha mégis ipari méretekben kezdenek fejleszteni rá akkor hatalmas probléma lesz. Egyszerűen azért, mert sem a sem a felhasználási terület, sem az alakalmazni kívánt emberek tömege, sem a használt toolok nem teszik lehetővé, hogy ilyen alacsony szintű problémákkal foglalkozz. Pl mert nem assemblerben fognak fejhleszteni, hanem matlabból generálnak kódot.
#62 Fiery veterán freeapro #61

Új Válasz 2015-03-30 17:15:41 #62
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz freeapro #61 üzenetére

Hanyszor irjam me'g le, hogy SIMD x86-ot _es_ OpenCL-t is tamogat a KNL? Vagy az OpenCL 2.x is nehezen programozhatonak minosul?
Tovabbmegyek, sejtesem szerint az Intel elobb-utobb le fogja koppintani a HSA-t is, valamilyen formaban. Ha pedig a HSA sem eleg egyszeru, akkor mi lenne az?
#63 VaniliásRönk nagyúr Fiery #62

Új Válasz 2015-03-30 17:40:18 #63
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

VaniliásRönk

nagyúr

válasz Fiery #62 üzenetére

"...Intel elobb-utobb le fogja koppintani a HSA-t is, valamilyen formaban."
Azért arra kíváncsi vagyok hogy a Samsung és a Qualcomm ellenében is meg mer-e húzni egy sima koppintást az Intel.

[ Szerkesztve ]

"Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)
#64 velizare nagyúr Fiery #60

Új Válasz 2015-03-30 17:46:46 #64
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

velizare

nagyúr

válasz Fiery #60 üzenetére

mi két ok miatt szoktunk tanácsadót felkérni. az egyik, hogy a kirúgott felsővezetőket így tartsuk távol az álláspiactól (és a vetélytársaktól), amíg a céget illető naprakész ismereteik elviselehtő kockázati szintre esnek le.
a másik pedig amikor olyan tudást vagyunk kénytelenek importálni, amely nem érhető el a cégen bellül, illetve amelyet nem célszerű/lehetséges hosszabb távon megtartani.

Tudod, mit jelent az, hogy nemezis? Az érintett, erősebb fél kinyilatkoztatása a méltó büntetés mértékét illetően. Az érintett fél jelen esetben egy szadista állat... én.
#65 Fiery veterán VaniliásRönk #63

Új Válasz 2015-03-30 18:59:59 #65
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz VaniliásRönk #63 üzenetére

En nem tudok rola, hogy a HSA le lenne vedve barmilyen formaban. Ha a DX12-vel "lemasolhatta" a Microsoft a Mantle-t, akkor a HSA miert ne lenne megoldhato nagyon hasonlo formaban, mas neven, mas gyarto altal? Persze szigoruan zart formaban, a la Intel
#66 sayinpety tag Fiery #62

Új Válasz 2015-03-30 19:19:22 #66
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

sayinpety

tag

válasz Fiery #62 üzenetére

A HSAt? Hogyan lehet lemasolni? Nem ertem. Szerintem nem lehetseges. Ertelmet sem latom.
#67 VaniliásRönk nagyúr Fiery #65

Új Válasz 2015-03-30 19:23:27 #67
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

VaniliásRönk

nagyúr

válasz Fiery #65 üzenetére

Attol hogy nyilt es szabadon hasznalhato meg nem feltetlenul szabadon lophato.

"Only two things are infinite, the universe and human stupidity, and I'm not sure about the former." (Albert Einstein)
#68 sayinpety tag

Új Válasz 2015-03-30 19:29:02 #68
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

sayinpety

tag

Vegigolvastam par postot. Tudjatok egyaltalan mire valo a HSA?
#69 Vladi nagyúr Balala2007 #35

Új Válasz 2015-03-30 19:37:11 #69
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Vladi

nagyúr

válasz Balala2007 #35 üzenetére

az szerintem htop és 240 mag.

Nem félünk! Nem félünk! Itthon vagyunk e földön. Nem félünk! Nem félünk! Ez nem maradhat börtön!
#70 Fiery veterán sayinpety #66

Új Válasz 2015-03-30 19:46:58 #70
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz sayinpety #66 üzenetére

A HSA egy koncepcio, akarcsak az alacsonyszintu hardver eleres jatekokhoz (Mantle, DX12, Metal). Es ahogy a Mantle-t is le lehetett masolni, ugy a HSA-t is minden gond nelkul le lehet koppintani. A lenyeg, hogy ne HSA-nak hivjak.
#71 Fiery veterán VaniliásRönk #67

Új Válasz 2015-03-30 19:51:29 #71
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz VaniliásRönk #67 üzenetére

Olyan ertelemben nem szabadon lophato, hogy ha valaki pontrol pontra lemasolna az egeszet, az tamadhato lenne. De ha magat az otletet veszed csupan, es minden mast mogeteszel, sajat kutfobol, sajat specifikacioval, adott esetben kiegeszitve es feljavitva is az eredeti koncepciot, akkor senki nem szolhat egy szot sem.
Mondok nehany peldat. A C# es a Java eleg kozel allnak egymashoz, nyilvanvaloan a C#-ot alapvetoen a Javarol mintaztak, de feljavitottak, maskepp neveztek el szinte mindent, es igy nem lehetett a Microsoftot lopassal vadolni. De a koncepcio ugyanaz. Masik pelda: fogod az x86-ot (mondjuk amit most a Broadwell tamogat), lemasolod pontrol pontra, de mas mikrokodot hasznalsz, mashogy hivod az utasitasokat, kihajitod az elavult reszeit, es beraksz nehany ujdonsagot, fejlesztest is. Az Intel egy szot sem szolhat, holott a koncepcio ugyanaz
#72 sayinpety tag Fiery #70

Új Válasz 2015-03-30 19:58:24 #72
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

sayinpety

tag

válasz Fiery #70 üzenetére

Tevedes. Nincs mit lemasolni. Minden IHV hasznal specific QLt es virtual ISAt. Tobbet is. A HSA low-level egysegesitesrol szol. Az IHVk egyseges QLt es virtual ISAt hasznalhatnak a sajatjuk helyett. Csakis open formaban van ertelme.
#73 KAMELOT titán lenox #1

Új Válasz 2015-03-30 20:10:00 #73
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

KAMELOT

titán

válasz lenox #1 üzenetére

Majd ha megcsinálják és itt lesz többet fogunk róla tudni! Talán helyspórolás végett jobb megoldás az APU, ha ugyan azt a teljesítményt fogja nyújtani! Eddig az AMD le van maradva sajnos. Kár értük pedig mindig AMD kártyám volt!

V1200 - 18CORE - SUPRIMX
#74 Fiery veterán sayinpety #72

Új Válasz 2015-03-30 20:11:03 #74
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz sayinpety #72 üzenetére

Azert ennel tobbet is a HSA-hoz szoktak sorolni, legalabbis amikor az AMD-vel beszelsz a HSA-rol. Pl. szerintuk a Direct3D kikerulese (mi is annak a buzzwordje?) is a HSA stack resze. Plusz, en nem vagyok rola meggyozodve, hogy egy zart HSA-nak nincs ertelme. Nincs rola konkret infom, de pl. nem vagyok rola meggyozodve, hogy az Intel csak egyfele IL-t hasznal a CPU-n es a GPU-n. Ha pedig 2 fele IL van, akkor kapasbol kulon OpenCL compiler kell a CPU-hoz es GPU-hoz, mindket lepcsonel. Ezen lehetne egysegesiteni es racionalizalni egy "internal HSA"-val.
#75 LordX veterán Fiery #62

Új Válasz 2015-03-30 21:22:09 #75
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

LordX

veterán

válasz Fiery #62 üzenetére

Támogatja, csak ezzel a két apró problémával:
Recommendation: Avoid using Shared Local Memory on the Intel Xeon Phi coprocessor.
We recommend avoiding the use of barriers.
(OpenCL* Design and Programming Guide for the Intel® Xeon Phi™ Coprocessor)
Konkrétan egy redukciót nem csinálsz meg ezek nélkül. (Ja, de, atomics. Ha 240 szál futtat loopban LOCK CMPXCHG utasításokat, az egyszeri viccnek jó..) Nem az OpenCL programozás minősül nehéznek, hanem az olyan OpenCL kód írása, ami ennek a kettőnek megfelel. És bonyolultabb, mint egy hello world.
#76 LordX veterán Fiery #74

Új Válasz 2015-03-30 21:37:40 #76
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

LordX

veterán

válasz Fiery #74 üzenetére

SPIR? Ha csak OpenCL-ben gondolkozik valaki, nem sok értelme van feltalálni újra a meleg vizet..
#77 derive senior tag

Új Válasz 2015-03-30 22:59:45 #77
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

derive

senior tag

Abban igaza van Fierynak, hogy az OpenMPvel igen komoly fegyvertenyt tudhat maga mogott az Intel. Eleg nepszeru API, mert 1 sorbol megvan a tobbszalusitott program. Igaz nem hatekony de jobb orszagokban egy jo programozo eves bereert veszel meg 40-50 gyorsitot.

[ Szerkesztve ]
#78 Fiery veterán LordX #76

Új Válasz 2015-03-31 10:23:18 #78
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz LordX #76 üzenetére

A SPIR tudtommal csak akkor jo valasztas, ha OpenCL a kiindulasi alap. Lehet, hogy a HSA-hoz hasonloan, az Intel is meg akarja a jovoben adni a lehetoseget arra, hogy tobb nyelven is meg lehessen hajtani a KNL-et.
#79 Abu85 HÁZIGAZDA Fiery #59

Új Válasz 2015-03-31 10:45:17 #79
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Fiery #59 üzenetére

Li-Shiuan Peh professzornak volt egy előadása, ahol beszélt róla, hogy a cache-koherencia azonos szinten borzalmasan nehéz egy bizonyos magszám felett. A több socket azért működik, mert a cache-koherencia többszintű. Például, ha van négy processzorod, akkor két mag közötti kommunikációra a hardver szintjén kisajátítják a procimagok az összeköttetésre szolgáló buszt. Ezzel 8 mag közötti kommunikáció oldható meg 4 socket esetében egyszerre (socketenként 2-2 mag). De ha ugyanannyi mag csak egy foglalatban, egy processzorban van, akkor már 2 magra korlátozódik a busz kisajátítása. Ez limitálja a rendszert.
(#60) Fiery: Több céget és szakembert bíztak meg. Egyébként minden külsős ugyanazt ajánlotta, még Michael Abrash is. A pénzügyi szakemberek ezzel nem értettek egyet.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#80 Fiery veterán Abu85 #79

Új Válasz 2015-03-31 11:06:17 #80
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz Abu85 #79 üzenetére

Iszonyatosan leegyszerusited a dolgokat. Nem mennék bele a reszletekbe, de lenne egy fontos kerdesem: milyen osszekottetes van a CPU-tokon belul a magok kozott, es milyen osszekottetes van az alaplapon a CPU-foglalatok kozott? Ugyanaz a 2? Pont-pont mindegyik, vagy ring-bus mindegyik? Mert ha nem ugyanaz, akkor nem ertem, miert kellene oket egymassal szembeallitani. Raadasul, semmi garancia arra, hogy a snooping es cache koherencia pontosan ugyanugy mukodik a KNL-nel, mint manapsag mondjuk egy Xeon E5-nel. Siman lehet, hogy idovel le kell mondanunk az x86 platformokon (is) a teljes cache koherenciarol, a teljesitmeny novelese erdekeben. Onnantol pedig ertelmet veszti az a nyavalygas, amit csinalsz a core skalazas vs. cache koherencia problema miatt -- ami egyebkent sem feltetlenul okoz olyan oriasi problemat, lasd a fentebb idezett ZLib skalazodasi lista. A Westmere-EX egyszerre sokmagos (socketenkent 10 mag) es 4 socketes, tehat eleg sokretu a snooping, megis tud skalazodni. Es nem 4 vagy 8 magrol beszelunk, ugyebar.
"Több céget és szakembert bíztak meg. Egyébként minden külsős ugyanazt ajánlotta, még Michael Abrash is."
Es mindegyik cegrol pontosan tudjuk, hogy mit ajanlott? Ezek tok nyilvanosan mentek? Azt is tudjuk, az Intel mernokeinek mi volt az allaspontja? Azt is tudjuk, a felsovezetesnek mi volt az allaspontja? Azt is tudjuk, ahhoz kepest, amit ajanlottak, ill. ahhoz kepest, hogy milyen volt az elozo generacio, pontosan hol is helyezkedik el a KNL? Mert ugye ha azt vesszuk, hogy a javaslat az volt (bar kizart, hogy egyetlen javaslat lett volna), hogy csinaljanak egy klasszikus GPU-t (masoljak le a GCN-t, hiszen mindannyian tudjuk, hogy annal jobb nincs es nem is lesz ); es a Knights Corner-t hagyjak a francba, akkor nem lehet azt mondani, hogy a KNL-nel egyertelmuen erre vagy arra huzott az Intel. Akarhogy probalod beallitani annak, a KNL nem a Knights Corner pepitaban, hanem egy teljesen uj architektura, ami -- ahogy fentebb is irtam -- sokkal jobban hasonlit egy Xeon E5-re (Haswell-EP), mint egy Knights Cornerre. Ennyi erovel a Conroe-t is el lehetett volna asni elore, annak fenyeben, hogy a NetBurst mennyire nem jott ossze -- csak ugye tok mas architektura volt a Conroe, tehat ertelmes ember nem a NetBurst alapjan derivalta le a Conroe potencialis kepessegeit.
Azt sem igazan ertem, miert kellene mindenkinek GPU-t keszitenie. Mi van, ha valamilyen problemat, problema kort mas megoldassal is ugyanolyan jol meg lehet oldani? Tudtommal mar manapsag is vannak, akik inkabb egy sokmagos Xeon E5/E7-re szavaznak, Tesla helyett, mert mondjuk a Haswell-EP/EX architektura jobban fekszik az igenyeikhez (pl. ray-tracing).

[ Szerkesztve ]
#81 Abu85 HÁZIGAZDA Fiery #80

Új Válasz 2015-03-31 11:22:12 #81
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Fiery #80 üzenetére

Az összeköttetés típusa nem annyira lényeges, mert az csak a sebességre van hatással. A buszt így is ki kell sajátítani a szinkronizációra.
A KNL biztos nem snoopingot használ. Egyetlen Xeon Phi-re sem jó ez a megvalósítás. A directory protokollt alkalmazza az Intel bizonyos magszám felett. Ez lassabb, mint a snooping, illetve sokkal több tranyót visz el, de a snooping meg nem skálázódna ennyire sem.
Andrew Richards egyszer leírta a sztorit, csak az Intel annyira befenyítette, hogy mindenhonnan letörölték. De abban egyébként volt szó róla, hogy az Intel saját mérnökeivel és a többi külsős szakemberrel együtt ajánlották a vezetőségnek, hogy dobják az x86-ot, mert nem fog működni. A pénzügyi vezetők álláspontja az volt, hogy csinálják meg az eredeti tervet és majd lenyomják a piac torkán.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#82 #06658560 törölt tag Fiery #80

Új Válasz 2015-03-31 11:48:56 #82
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

#06658560

törölt tag

válasz Fiery #80 üzenetére

"masoljak le a GCN-t, hiszen mindannyian tudjuk, hogy annal jobb nincs es nem is lesz "
De lesz, a következő AMD újításnál azonnal. De csakis ott.
#83 Fiery veterán Abu85 #81

Új Válasz 2015-03-31 12:06:10 #83
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz Abu85 #81 üzenetére

Egy Haswell-EP-szeru dual ring-bus-nal nem tul valoszinu, hogy ki kellene sajatitani a teljes buszt 2 mag kozotti szinkronizacio eseten
"A KNL biztos nem snoopingot használ. Egyetlen Xeon Phi-re sem jó ez a megvalósítás"
Megint osszemosod a Knights Cornert es a Knights Landinget, holott mar tobbszor leirtam, hogy nem sok kozuk van egymashoz. De feladom, ha Te szakmailag ugy gondolod, hogy egy kartyara pakolt, dedikalt RAM-mal rendelkezo, nyakatekert Linux implementacioval meghajtott, sajat egyedi utasitaskeszlettel (LRBNI) biro, in-order P54C architektura kore epulo (GP)GPU-t egybemosol egy socketelt CPU-val, ami out-of-order Silvermont architekturara epul, a rendszermemoriat hasznalja, tekintelyes meretu es sebessegu near memory-val rendelkezik, es standard utasitaskeszlet architekturara (x86 + AVX-512) epul, akkor legyen ugy.
"De abban egyébként volt szó róla, hogy az Intel saját mérnökeivel és a többi külsős szakemberrel együtt ajánlották a vezetőségnek, hogy dobják az x86-ot, mert nem fog működni."
Mint ahogy fentebb leirtam, Intel = x86, es aki ilyet ajanl az Intelnek, annak elgurult a gyogyszere.
#84 sayinpety tag Fiery #74

Új Válasz 2015-03-31 23:03:35 #84
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

sayinpety

tag

válasz Fiery #74 üzenetére

Sosem hallottam rola. HSA nem tartalmaz graphics pipelinet.
En megvagyok. A HSA egyetlen elonye hogy nyilt.
Minden evben megteszi az Intel amit te irsz. Allandoan frissitik az ILt. Egyfele ILt hasznalnak es fejlesztenek.
#85 Fiery veterán sayinpety #84

Új Válasz 2015-03-31 23:26:43 #85
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz sayinpety #84 üzenetére

Arra gondolok, hogy a jelenlegi OpenCL implementaciokban az OpenCL kernelt elvileg a Direct3D-n (vagy legalabbis a videodriveren) keresztul lehet futtatni, azaz nem egy sajat kernel drivert hasznal az OpenCL API. A HSA-nal elvileg ezt megoldotta az AMD, persze ez siman lehet, hogy csak AMD-specifikus limitacio volt (ill. nem, mert lehet tudni, hogy a tobbi gyarto is ugyanigy -- ugyanilyen rosszul -- oldotta meg az OpenCL-t).
"Egyfele ILt hasznalnak es fejlesztenek."
Koszi, ez egy fontos info. En csak azzal szembesulok, hogy a folyamatos fejlesztes ellenere me'g mindig eleg sz** a forditojuk

[ Szerkesztve ]
#86 sayinpety tag Fiery #85

Új Válasz 2015-04-01 16:25:32 #86
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

sayinpety

tag

válasz Fiery #85 üzenetére

Ertem. HSA-Direct3D interoperability. A HSA low-level concept, kedvezobb interoperability lehetseges. Az AMD felelos programozoja a temaban Besar Wicaksono.
Minden IHV complier bajos. Ezert akarok sajatokat.
#87 Fiery veterán sayinpety #86

Új Válasz 2015-04-01 20:36:22 #87
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz sayinpety #86 üzenetére

"Minden IHV complier bajos"
Orulok, hogy nem csak en erzem (tapasztaltam) igy. Neha, amikor lepten-nyomon belefutottam egy compiler bugba, kezdtem mar azt hinni, hogy en vagyok a rohadt peches
#88 ukornel aktív tag

Új Válasz 2015-04-13 17:37:33 #88
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

ukornel

aktív tag

Talán EZ lenne a gigászi "HPC-APU"?
Néhány részlet: 16-core, 32-thread [...] total amount of L2 cache gets to a whopping 8MB, backed by 32MB of L3 cache [...] 16GB of HBM memory with 512GB/s speed packed on the interposer [...] 1/2 rate double precision compute, enhanced ECC and RAS and HSA support [...] 64 PCI express Gen 3 lanes [...] DDR4 memory controllers in 4x72 configuration [...] total capacity of 256GB per channel.
Szerk. Most látom, a hír fönt van az iponon is.

[ Szerkesztve ]