Hirdetés

Legfrissebb anyagok

PROHARDVER! témák

Mobilarena témák

IT café témák

GAMEPOD.hu témák

LOGOUT.hu témák

Keresés

Hirdetés

Olcsó és visszafogottan elegáns kompakt AIO jön az ID-Cooling berkeiből

ph Az előzetes tesztek alapján korrektül teljesítő modellnek nem kenyere a cicoma, és akár titkos favorit is válhat belőle a kategóriájában.
Destiny 2: The Final Shape - Befutott a fejlesztői videó második része

gp A minap kiadott videóban többek között a képességek kerülnek a középpontba.
Spyra: nagynyomású, akkus, automata vízipuska

lo Type-C port, egy töltéssel 2200 lövés, több, mint 2 kg-os súly, automata víz felszívás... Start the epic! :)

Új hozzászólás Aktív témák

#75 lenox veterán Abu85 #24

Új Válasz 2011-10-03 16:56:07 #75
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

válasz Abu85 #24 üzenetére

Az miert is lenne jo, ha a virtualis memoriat elerne a gpu? Szoval a kiswappelt lapokat probalna a gpu elerni, valahogy diskrol beolvasna, es azon processzalna? Ez eleg furanak tunik nekem.
A megatexturazashoz szerintem eleg a fizikai memoriat elerni, azt meg mar tobb eve lehet nvidian is, ha valamiert ugy akarnad, csak cudat kell hasznalni. Amennyire en ertem, ezt a Rage-nel meg nem csinaltak meg, de majd fogjak, vagy nem?
#84 lenox veterán Abu85 #79

Új Válasz 2011-10-03 17:32:35 #84
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

válasz Abu85 #79 üzenetére

A virtualis memoria elerese gyorsabb lenne a gpu-bol, mint a fizikai?
Nekem az a resze sem nyilvanvalo, hogy ez licenszkerdes lenne, magamtol azt gondolnam, hogy ez driver kerdes. Kuldenel erre egy linket? Csak mert mint mondtam, cudabol mar tok reg elerheto a gpu es a cpu memoria is, bar az igaz, hogy automatikusan nem transzferalgatja oket egymast kozt (nem cache-eli), de szerintem az amugy is inkabb hatranya lenne, ha nem tudhatna az ember, hogy amit el fog erni, az gyors lesz-e, vagy lassu.
#129 lenox veterán Abu85 #88

Új Válasz 2011-10-03 22:30:17 #129
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

válasz Abu85 #88 üzenetére

Nem tudom milyen elv szerint igen, szerintem ami a virtualis memoriaban van, az vagy a fizikai memoriaban van, akkor hasonlo gyors (valamivel lassabb a virtual/physycal cimforditas miatt), vagy ki van swappelve, akkor meg joval lassabb. Mitol lenne gyorsabb? Szerintem semmitol.
Ez azt jelenti, hogy a textura update egy hosszú szoftveres procedúra eredménye, amibe be kell vonni a processzort és a rendszermemóriát. Ha a GPU elérné a virtuális memóriát, akkor a teljes folyamat hardveres lehetne, vagyis a rendszermemória és a CPU kizárható a frissítési procedúrából.
Ez alatt nem tudom mit ertesz, szerintem ez teljes felreertes. Az, hogy melyik lapokat kell majd hasznalni, az mindenkepp egy szoftveres procedura eredmenye, es a rendszermemoriat is mindenkepp bele kell vonni. A video memoria virtualizalasa ezt nem oldja meg, csak annyira jo, hogy nem kell a lapokat explicite atnyomni a gpu memoriaba, mivel ha a gpu amugy is eleri a rendszermemoriat, akkor onnan is hasznalhatja az adatot, legalabbis ha jatekrol beszelunk, mert virtual gepeknel ennel tobbre is jo. Carmack meg arrol beszel, hogy ha egy lap helyett annak egy masik valtozatat kell hasznalni, akkor konzolon kb. atirjak a pointert, pc-n meg at is kell tolteni az uj lapot gpu memoriaba. Persze konzolon meg nem tudod elerni 1xx GB/sec-kel. Mindenesetre ha egy cuda (vagy opencl) kernelt hasznalnanak az update-hez, akkor azt is meg lehet csinalni egy kernellel, nem kell hozza 50 update, es mar evek ota mukodik.
#136 lenox veterán dezz #134

Új Válasz 2011-10-04 01:04:52 #136
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

válasz dezz #134 üzenetére

Es miert kene a kezdocime? Surface reference kell hozza, es maris lehet irni.
#141 lenox veterán dezz #140

Új Válasz 2011-10-04 09:31:20 #141
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

válasz dezz #140 üzenetére

Nem tudom mire gondolsz, a cuda vagy opencl kernelek futtatasa, de akar az opengl utasitasok mindig hasznalnak cpu-t. Akkor kell minimalis cpu, ha jo nagy dma transzfer van. De amugy van cpu, lehet hasznalni, miert erdekes ez?
#143 lenox veterán Abu85 #131

Új Válasz 2011-10-04 09:42:02 #143
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

válasz Abu85 #131 üzenetére

Carmack gondolom nem a kisujjából szopta ki, hogy a texture update PC-n tízezerszer lassabb, hanem kimérte.
Nyilvan nem onnan szopta, azt kell csak latni, hogy ugyanolyat csinalhatsz pc-n is (cudaval legalabbis igen), persze sok esetben lassabb lesz, mintha updatelned a lapokat a gpu memoriaban, ugyhogy kerdes, hogy jo-e ugy csinalni. Ha olyan apud van, ami supportalja, hogy a gfx membe kozvetlenul irj a cpu oldalrol, az nyilvan feleslegesse teszi ezt. En leginkabb azt a reszet nem latom, hogy milyen virtualizacios licensz kell ehhez gamer oldalon. Mert oke, hogy virtual gepeknel van haszna, de jatekoknal szerintem semmi haszna, hogy ki tudjon swappelodni a gfx memoria, a fizikai memoriat meg mar eddig is el lehetett erni. OpenGL-bol meg DirectX-bol talan nem, lehet hozzajuk uj drivert irni, de licensz nemigen kell hozza.
#144 lenox veterán 04ahgy #142

Új Válasz 2011-10-04 09:45:51 #144
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

válasz 04ahgy #142 üzenetére

Nem igy van, cudanal pinned memory mindig ramban van, illetve windows-on 'lock pages is memory privilege'-dzsel foglalhatsz ramba memoriat, es az nem fog kiswappelodni.
#150 lenox veterán 04ahgy #146

Új Válasz 2011-10-04 11:02:54 #150
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

válasz 04ahgy #146 üzenetére

Az en cudam?
Nem tudom, kulonben mire akarsz kilyukadni. Szoval akkor szerinted mar eddig is virtualis memoriaba irt a gpu, amikor pinned memoryt hasznalt, szoval nem kell x86 virtual mem licensz?
#153 lenox veterán dezz #152

Új Válasz 2011-10-04 12:23:51 #153
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

válasz dezz #152 üzenetére

Szerinted mennyivel lenne lassabb egy API-n keresztül CPU-val update-elgetni x ezer textúrát, mint ugyanezt hw-ből intézni?
Megatexturazasra gondolsz? Melyik scenario? Ami most pc-n van diszkret gpu-val, opengl-lel vagy directx-szel, vagy diszkret gpu-val pc-n cudaval, pc-n apuval, vagy konzolon? Nagyon nem mindegy.
Amúgy a textúrák ugye lehetnek a main ramban is (ami kívül esik a CUDA felségterületén)
Marmint ha pinned memory, akkor pont hogy eleri a cuda es a cpu is, ez a lenyege. Ha nem eri el, akkor meg nem lehet belole texturazni. Nyilvan gyorsabb buszon gyorsabb. Az egeszet egyben atmasolni a leheto leglassabb, legrosszabb megoldas. Ha van pl. gpu memoriaban 100 lapod, amik egyenkent 4 MB-osak, akkor ha az egeszet updatelned, az 400 MB, az mondjuk opengl-nel kb. 0.25 sec alatt menne fel, cudanal meg 0.1 sec alatt, mindkettonel tul lassu. De ha csak 5 lapot updatelnel, akkor ertelmetlen is lenne mindet feltolteni.
Ja, és szerintem előbb-utóbb a swappelési lehetőséget is ki fogják használni...
Szervereknel, virtual gepeknel biztos, jatekoknal nem nagyon hiszem, hogy ez barmit hozzatesz.
#156 lenox veterán dezz #155

Új Válasz 2011-10-04 14:50:33 #156
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

válasz dezz #155 üzenetére

Végülis bármelyik.
Hat pl. opengl diszkret gpuval az eleg bena pc-n pont erre, ugye Carmack is erre panaszkodik, azon gondolom egy hardverrel tamogatott megoldas segitene, a cudas diszkret gpus esethez szerintem kulon hardver mar nemigen gyorsit rajta.
De még mindig gyorsabb, mint sok-sok műveletben, textúrán belül is részletenként update-elgetni, nem?
Hat ha opengl-lel akar az ember kurvasok nem egybefuggo pixelt egyessevel modositani valamiert, akkor igen. De amugy az is elegge ossze van mosva, hogy valamilyen reszletet akar eppen az ember updatelni, vagy a megatexturanak akarja a megfelelo lapjait behozni, mert ez utobbihoz nem egy-egy pixelt kell updatelni, raadasul ha nincs kesz a kovetkezo frame-ig, az sem baj, mert rosszabb felbontasban ugyis megvan. Persze opengl-nel problemak vannak a multithreadingnel, ha esetleg a hatterben akarna az ember frissiteni, directx-nel nem tudom, opencl meg cuda az meg ok.
1,6-4 GB/s? Miért ilyen állati lassú?
Az opengl az ilyen lassu (1.5-2.0 GB/sec), szokott benne lenni egy plusz copy, leginkabb azert, a cuda pinned memorybol olyan 5.5, csak nem akartam 5 tizedesjegyik irni, csak a nagysagrendet, az meg amugy nem olyan lassu, cpu mem-en belul sem masolsz sokkal gyorsabban. Nyilvan ha nem kene masolni, az jobb lenne.
#161 lenox veterán arty #159

Új Válasz 2011-10-04 22:13:21 #161
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

válasz arty #159 üzenetére

Tenyleg, ez eleg jol osszejott .
#164 lenox veterán dezz #162

Új Válasz 2011-10-05 09:41:15 #164
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

válasz dezz #162 üzenetére

DMA-val.
Meg aztán nem csak a sustained rate számít, hanem ha sok kis írásról van szó.
Azt kerulni kell, amennyire csak lehet, ezert mondom, hogy en egy kernellel csinalnam az update-et, akkor csak egyszer van overhead. Nyilvan ha egy egysegben csak 1 pixel van, akkor ez sem fog mukodni, de a megatexturing azert nem errol szol.
Hááát, annak inkább 10+ GB/s kellene lennie.
Ha ezt is ugy szamolod, hogy 5.5 GB olvasas, 5.5 GB iras, akkor ez is 11.
#168 lenox veterán dezz #167

Új Válasz 2011-10-05 16:09:35 #168
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

válasz dezz #167 üzenetére

Nincs közben/előtte valami konverzió, GPU-val, vagy éppen CPU-val? Vagy véletlenül nem GPU-specifikus? Tehát, hogy adott GPU-n vacakul van megoldva a PCIe->GPU->VRAM átvitel.
Hat en ezt eleg sok nvidia (quadro 6000, quadro 4000, tesla 2050-2070, gtx 590, gtx 580 stb.) es par amd (5870, 5770 - ezek mac-en) kartyan neztem cudaval es opencl-lel, hp z800-on, mac pro-n, 6 GB/sec folotti atvitelt semmi nem produkalt, legtobbszor sajat koddal, de az nv-nek is van ilyen tesztprogramja, ez viszonylag jol van definialva, hogy hogyan lehet a leggyorsabb atvitelt elerni, mert amikor a kartyan belul mar majdnem 200 GB/sec van, akkor nyilvan erdekes, hogy mi a max sebesseg, hogy a leheto legkisebb legyen a bottleneck a fel-le toltesnel. Bevallom, nem neztem utana, hogy miert nem 8 GB/sec, orultem, hogy nem 1.5-2, mint amit opengl-lel el lehet erni.
Nos, lehet, hogy arról szól az egész, hogy játékokban bizonyos esetekben elkerülhetetlen, nem?
Hat ha a jelenlegi opengl-lel csinalnja az ember, akkor gondolom igen, en csak azt mondom, hogy ezen nem az x86 virtual mem licensz fog segiteni.
Nem úgy... Pl. a DDR3-1600 max. olvasási sebessége 12,8 GB/s és az irási sem sokkal kevesebb, és ez még procival is megközelíthető.
Jo, de ez nem olvasas vagy iras kulon, hanem masolas. Ott meg amikor kijon a 12 GB/s-es masolas, akkor az 6GB/s olvasast es 6 GB/s irast jelent, nem? Everest/Aida-nal tudtommal igen.
#180 lenox veterán dezz #177

Új Válasz 2011-10-06 02:18:47 #180
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

válasz dezz #177 üzenetére

Majd nezd meg jobban, aida64-ben gyakran a masolasnal nagyobb szam van, mint az olvasasnal, vagy az irasnal. Gondolod, hogy gyorsabban tud olvasni, ha ir is kozben? Nem, ott bizony a ket szam ossze van adva... Ha azt irja, 18, akkor 9-et olvasott es 9-et irt.
#184 lenox veterán dezz #181

Új Válasz 2011-10-06 13:34:23 #184
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

válasz dezz #181 üzenetére

Nem tudom mit akarunk kihozni belole, egy sb-s gepben ha gpu-ra feltoltesrol beszelunk egy gtx 580-nal pl, akkor legyen mondjuk 18 GB/sec savszel a cpu ram-nal, 192 GB/sec a gpu ram-nal, 8 GB/sec a buszon, ki tudja, milyen bottleneck van meg kozben itt-ott. Ki lehet valasztani, hogy akkor mehetne 18 GB/sec-kel, de akkor miert nem mindjart a 192 GB/sec-et valasztod? Nyilvan egyik sem jo semmire, hiszen a busz meg kozben 8-at tud. Csak mert ha ahhoz a scenariohoz hasonlitod, hogy apu van, es ott kell masolni a cpu es a gpu altal lefoglalt memoria kozott, akkor ott copy van, tehat nem lesz 18 GB/sec, csak 9. Persze ha meg ahhoz hasonlitanad, hogy idealis esetben nem is kene toltogetni, csak atirni a pointert, akkor annak meg nem is lesz ertelmezheto savszelessege.