Hirdetés

Legfrissebb anyagok

PROHARDVER! témák

Mobilarena témák

IT café témák

GAMEPOD.hu témák

LOGOUT.hu témák

Keresés

Hirdetés

Ismét a vietnámi OLED-gyártásba fektet a Samsung

it További 1,8 milliárd dollárt fektet be Vietnámban a Samsung az OLED-kijelzők gyártása kapcsán.
Legújabb retró beszerzésem - 3Dfx Voodoo4 4500 32Mb

lo Kezdenek fogyi ezek a kártyák, pontosabban a 4 és 5 széria kártyái már lassacskán igen ritkának számítanak. A korábbi...
ATX 3.1-es Seasonic tápok a picit pénztárcabarátabb szegmensben

ph A felfrissült, teljesen moduláris Core GX sorozat két színben kínálja a 650-től 1000 wattig terjedő palettát.

Új hozzászólás Aktív témák

#5 Löncsi őstag killerjohn #4

Új Válasz 2012-02-07 10:14:54 #5
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Löncsi

őstag

válasz killerjohn #4 üzenetére

mert rengetek esetben lassabb 4 magon futtatni a kódot, mint 1 magon...
Doesn't matter, had massive-parallel computing.

Elvették a radírját, azt az egész élete egy nagy kompenzálás, hogy ő igenis kan és igenis 2 méteres a fallosza - by stranger28
#8 Löncsi őstag killerjohn #6

Új Válasz 2012-02-07 10:28:18 #8
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Löncsi

őstag

válasz killerjohn #6 üzenetére

Nem vagyok szál-szakértő, de több esetben is hallottam a "nagyoktól" nyilatkozatokat, hogy csak ott érdemes szálasítani ahol előnyösebb mint 1 szálon futtatni. Nyilván itt is ilyesmi lehet majd a dolog, ahol sok egyszerű, párhuzamosítható feladat van, arra jól jön a GPU, nyomsz egy restrict(amp)-t és mehet a buli.

[ Szerkesztve ]

Elvették a radírját, azt az egész élete egy nagy kompenzálás, hogy ő igenis kan és igenis 2 méteres a fallosza - by stranger28
#11 ddekany veterán killerjohn #10

Új Válasz 2012-02-07 12:16:12 #11
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

ddekany

veterán

válasz killerjohn #10 üzenetére

Ezek szerint mégiscsak meglett a bottleneck. Elvégre az intern lényege, hogy a VM-en belül minden, és így mind szál is, ugyan azt a példányt használja több egyforma tartalmú String helyett. Persze ha nem használsz internt, akkor meg meglehet azért lesz lassabb, elvégre az inten sem viccből van (pl. gyorsíthatja az összehasonlításokat). Azaz, a feladat esetleg eredendően nem párhuzamosítható hatékonyan.

[ Szerkesztve ]
#12 oO7 őstag killerjohn #6

Új Válasz 2012-02-07 12:20:48 #12
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

oO7

őstag

válasz killerjohn #6 üzenetére

"azt nem értem, miért nem építik be a .NET nyelvekbe. Pl C#-ban ez killer feature lenne. A task parallel library-t meg inkább hagyjuk, mert rengetek esetben lassabb 4 magon futtatni a kódot, mint 1 magon..."
a párhuzamosságnak két verziója van... a Task Parralell (amit a TPL lefed) és a Data Parallel (amit a C++ AMP nyújt)...
az egyik esetben teljesen különböző feladatokat futtatsz párhuzamosan jó esetben egymástól teljesen függetlenül, a másik esetben pedig egészen pontosan ugyanazt a műveletet futtatod rengeteg magon (GPGPU) csak épp mindegyik mag más adaton dolgozik...
másképpen megfogalmazva, az egyik csak egyszerűen több szál párhuzamos futtatása, lényegében a Thread utódja (a Task), a másik pedig egy SIMD működési elv...
a TPL-t használni DPL feladatokra nem mondom, hogy nem lehet, hiszen nem véletlenül van ott a PLINQ sem meg egy Parallel For / Foreach működésében már egészen hasonlít egy DPL-re, de a lényeg, hogy a szálkezelés költséges dolog és rengeteg overhead-el jár... ha nagyon pici számításod van, akkor lehet, hogy a szálkezeléssel járó feladatok több ideig fognak tartani mint a lényegi kód végrehajtása, és hiába dolgozod fel párhuzamosan a nagy adathalmazt, ha ennek az overheadnek a mértéke meghaladja a lényegi kód mértékét (időben / mennyiségben ha IL kódot nézegetsz)
#13 LordX veterán killerjohn #10

Új Válasz 2012-02-07 12:25:47 #13
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

LordX

veterán

válasz killerjohn #10 üzenetére

Err? (Java?) Most hülyéskedsz? Az intern függvény pont arról szól, hogy minden string ami a programban (package-ben) van közös poolt használjon - ha nincs benne, akkor belerakja, és visszaadja a referenciát a pool-beli okbjektumra. Innentől ez triviális, hogy globális zárolást okoz. Ha közös poolt használsz (bármire) párhuzamos kódból, akkor ne lepődj már meg, hogy szar lesz a teljesítmény..
#16 LordX veterán killerjohn #15

Új Válasz 2012-02-07 13:52:47 #16
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

LordX

veterán

válasz killerjohn #15 üzenetére

Most lehet hülye kérdés, de biztos, hogy stringeket akartok ti összehasonlítani? Van egy olyan érzésem, hogy valójában nem..
#17 oO7 őstag killerjohn #15

Új Válasz 2012-02-07 13:57:50 #17
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

oO7

őstag

válasz killerjohn #15 üzenetére

nem kell 100GB RAM mert valójában párhuzamosan (mondjuk géptől függően) a processzorok / processzormagok számának mondjuk 2-4x -ese mennyiségű szál fog futni egy időben... attól még, hogy van egy 10000 elemből álló adathalmazod amit párhuzamosan szeretnél feldolgzoni, a rendszer nem fog neked 10000 szálat indítani, hanem a hardver képességeihez igazítva, egy sima desktopon 2-4-8 vagy kb max 16 osával fog végigosonni párhuzamosan az adathalmazon...
#18 ddekany veterán killerjohn #15

Új Válasz 2012-02-07 14:10:06 #18
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

ddekany

veterán

válasz killerjohn #15 üzenetére

"de maga a linq, mint iteratorokra alapuló, lassú szemétkupac annyival lassabb, mint egy rendesen megírt kód"
Egy adatbázis csesztetésre készült cuccban az iterátorokon alapulás a szűk keresztmetszet (vagy bármi, ami a CLR-en belül fut)?
#19 lenox veterán killerjohn #15

Új Válasz 2012-02-07 14:11:17 #19
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

válasz killerjohn #15 üzenetére

Nem tudom, mit csinaltok pontosan, de nem lehetne olyan ojjektumot hasznalni, aminek nem kozos poolja van? Pl. threadenkent egy map-et?
#21 flugi tag killerjohn #6

Új Válasz 2012-02-07 15:17:42 #21
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

flugi

tag

válasz killerjohn #6 üzenetére

mégsem volt profi az átírás
Ezért szeretem azokat a nyelveket, amik dokumentáció nélkül is lekövethetőek, mint a C++, ahol nincs ilyen gond az STL esetében.

[ Szerkesztve ]
#23 flugi tag killerjohn #22

Új Válasz 2012-02-07 16:55:11 #23
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

flugi

tag

válasz killerjohn #22 üzenetére

ez nem bug, ez egy feature hiánya. Bug az lett volna, ha tönkrefagytok a le nem védett versenyhelyzetben.
#24 Alchemist addikt killerjohn #22

Új Válasz 2012-02-07 17:54:30 #24
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Alchemist

addikt

válasz killerjohn #22 üzenetére

Nekem is hasonló tapasztalataim vannak... vagy van egy eleve párhuzamos feldolgozásra optimális algoritmus, rendszerkörnyezettel támogatva... vagy lehet próbálkozni kőből vizet facsarni.

Éppen olvasok egy érdekes könyvet az antigravitációról... képtelen vagyok lerakni.
#34 Tybee000 aktív tag killerjohn #6

Új Válasz 2012-03-03 22:20:09 #34
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Tybee000

aktív tag

válasz killerjohn #6 üzenetére

profin átírtunk több ezer sor kódot, trükkös adatkezeléssel, stb, hogy alkalmas legyen a kód párhuzamosításra. 100x átnéztük, hogy ne legyenek deadlockok, sőt ha lehet akkor lockok se legyenek, minden szál saját maga melózik, stb stb stb. Na, szóval rászántuk az időt, nem csak egy for ciklust akartunk átírni paraller.for-rá..... ennek ellenére az eredmény annyira elkeserítő lett, hogy néztünk mint maci a moziban. Adtunk neki időd, rászántunk még egy hetet, finomítgattuk, próbálkoztunk "hátha most jobb lesz" alapon. Nope. Nothing. SVN revert. Aztán volt hogy 4 magon 50%-al volt gyorsabb 400% helyett.
Itt az utolsó mondatot tényleg komolyan gondoltad? Az 50% neked kevés? Amdahl törvényét ismered?
https://sites.google.com/site/szgarch/jegyzet/multiprocesszoros-rendszerek
3.2es fejezet