Keresés

Hirdetés

Új hozzászólás Aktív témák

  • lenox

    veterán

    válasz Abu85 #15 üzenetére

    Es ezek kozul melyiknek kell tenylegesen cpu device is? Gondolom egyiknek sem, ennyit a heterogen kodrol :).

    [ Szerkesztve ]

  • lenox

    veterán

    válasz Abu85 #21 üzenetére

    Arra mondjuk kivancsi lennek, hogy cpu device kell nekik, vagy van cpu-s kod is. Pl. a mainconceptnek eleg husszu ideje van cpu-s kodja, szerintem a cpu-ra irt kodjuk gyorsabb a cpu device-on futtatott opencl kodnal, csak mert par eve mar van optimalizalva. Ez kulonben altalaban is igaz.

    Kulonben lassan egyre kezzelfoghatobban latszik, hogy dedikalt gyors memoria nelkul eleg gyenge teljesitmenyt nyujt a gpu vagy apu, ahogy egy paran mar mondogattuk jo ideje. Szoval opencl-ben megveri a llano az sb-t, de egy gyenge kozepes grafkartyatol mar kikap. Na mind1, mint egy masik topikban is irtam, lassuk a teljes palettat arakkal, meg legyenek tesztek, aztan kiderul, hogy minek hol a helye. Mindenesetre felrevezetesnek erzem, amikor az a mondas, hogy Llano-val verjuk az SB-t, de egy par eves olcso cpu+vga kombo veri mindkettot ugyanabban. Pl. vreveal, azt ugye nem irtak oda, hogy a cudat mar regota tamogatjak, es diszkret vga-val sokkal gyorsabb :).

    [ Szerkesztve ]

  • lenox

    veterán

    válasz Abu85 #32 üzenetére

    Igen, csak ez a gpu eladas csokkenes nyilvanvaloan nem a llano miatt van. Itt ertelmezed szerintem felre a szamokat, mert amugy azt szoktad mondani, hogy mennyire kell az opencl, meg mennyire jo a fusion, csak kozben mar opencl meg fusion nelkul se vesznek vga-t a nepek.

  • lenox

    veterán

    válasz Abu85 #38 üzenetére

    Marmint akkor mindegy, ha el akarunk siklani a tenyek felett :). Majd nezz vissza egy par topikot egyszer.
    Egyebkent szerintem megint felreertelmezed a dolgot. Haldoklik a piac, de az nem azt jelenti, hogy a mar kifejlesztett termekek holnap megszunnek. Egyelore meg sok ido, amig nem lesz diszkret vga, es az is sok ido, ha lesz egyaltalan, hogy apuval lenyomnak a diszkret vga-kat. Addig meg mindegy milyen procit veszel, mindben gyenge az integralt vga, elkel melle egy diszkret vga. Es kb. mindegy, hogy intel/amd/nvidia. Mezei felhasznalasra meg az integraltak is jok, bar az amd jobb. Kerdes, mennyit er a marketing, tapasztalat szerint sokat.

  • lenox

    veterán

    válasz Abu85 #46 üzenetére

    A 6570/6670 combosnak szamit?

    Felreertettel, legalabbis azt hiszem. Arra gondoltam, hogy hiaba jobb az amd igp, a nepek akkor is intelt fognak venni. Mondjuk az se segit rajta, hogy en pl. ennel azert valamivel erosebbre vartam a llanot.

  • lenox

    veterán

    válasz dezz #56 üzenetére

    ??? Igen, gondolom, miert, neked mit jelent az, hogy egy downclockolt ddr3-as 5570 teljesitmenyet hozza egy szintetikus tesztben? Nekem azt, hogy egy low end vga-val van egalban. Ugyhogy egy gyenge kozepestol (pl 6570/6670) mar kikap. Ez amugy benne van a korabban linkelt anandos vagy vreveal-es eredmenyekben is. Es ha jol emlekszem atlagban meg egy 6450 teljesitmenyet tudja, az meg 160 sp-s.

    És vannak olyan feladatok is, ahol a CPU és a GPU közötti gyors kapcsolat is kiemelten fontos.

    Erre mondj mar legyszi egy valos peldat, mert mindig felhozzatok, de a gyakorlatban valahogy en meg nem lattam ilyet, csak a fusion marketing szovegben.

  • lenox

    veterán

    válasz dezz #56 üzenetére

    Ha egy program fel van rá készítve, hogy több GPU device-t használjon

    Megy mar amd-n a tobb gpu device? Utoljara mikor neztem meg azon szomorkodtak, hogy barmelyik gpu device-t valasztod, mindig a 0-st hasznalja, vagyis nem megy tobb gpu-n egyszerre. Ez mondjuk ha jol emlekszem decemberben volt, szoval akar mehet is azota, de amugy erdekes, nvidian mar tobb mint 5 eve mennek a tobb gpu-s kodok.

  • lenox

    veterán

    válasz Pietrosz #68 üzenetére

    Probald meg mainconcepttel. Bar az interaktiv alkalmazasban nem tudom, mennyi lehetoseg van, a low level apiban ugyanazt lehet csinalni, mint az x86 verzioban.
    Az x264 amugy meg eleg jo, szoval minosegben jobb nemigen lesz, csak gyorsabb. A mainconcept 1080p-t 50 fps felett tud max minoseggel, de ossze meg sosem hasonlitottam.

    [ Szerkesztve ]

  • lenox

    veterán

    válasz dezz #79 üzenetére

    Nem hiszem, hogy ne tudnál elképzelni olyan helyzetet, amikor nem optimális a nagyobb csomagok cseréje a CPU és a GPU között, hanem kisebb csomagok jóval gyorsabb cseréjére van szükség.

    Ertem, hogy ez marketing bullshitnek jo, pont ezert kerdezem, hogy tudsz-e valos alkalmazasrol, mert gondolnam, hogy nem tudsz, pont azert, mert ezt marketing bullshitnek tartom. Mar tobbszor leirtam, hogy en max benchmarkot tudok elkepzelni, amiben ezzel villantani lehet, de nem feltetlenul jut eszembe minden problema a vilagon, szoval ha valaki tud ilyet, batran adja elo. Csak mert sarkitva vagy a kommunikacio a bottleneck, vagy a processing. Ha a kommunikacio, akkor az sse, avx regiszterek joval gyorsabban elerhetoek, ha a processing, akkor egy kozepes grafkartya joval nagyobb teljesitmenyre kepes, ugyhogy pontosan akkor lehet majd ebbol igazi elonyt kovacsolni, amikor az integralt cpu es gpu kozos cache-sel fog rendelkezni. Az meg nem most van.

    Előtte is, utána is láttam több-GPU-s eredményeket, szal szerintem átmeneti bug lehetett.

    En is, opengl-lel, cudaval meg cal-lal, de nem opencl-lel. Szoval tuti, hogy opencl volt?

  • lenox

    veterán

    válasz dezz #82 üzenetére

    Az elejet meg egyszer vegiggondolhatnad, mielott bennem keresed a hibat, leven hogy nem az a kerdes, hogy lehet-e cpu es gpu kozott feladatot megosztani, hanem az, hogy hol lenne ebben az apunak valos alkalmazasban az elonye egy hagyomanyos cpu - pcie bus - gpu megoldashoz kepest. A hatranyat (kozos memoriarendszer) latom, azt jo sok helyen ki lehet mutatni, de hol az elonye? Szerinted a raytracingnel? Akkor mutass peldat olyan tesztre, ahol Athlon x4 + 800 sp vga teljesitmenyet eleri a llano, mert akkor az kezzelfoghato elony. De amig annyi a magyarazkodas, hogy de hat kb akkora a teljesitmenye, mint az ugyanolyan orajelen mukodo ugyanannyi sp-t tartalmazo gpu-s renszere (lasd amit #79-ben irtal), akkor az pont azt jelenti, hogy semmilyen elonye nincs.

    Az avx-et ugye arra a helyzetre javasoltam, amikor az ido nagy resze kommunikaciora megy el, tehat nem fog az igp 500 GFLOP-ot nyomni masodpercenkent logikus modon.

    Ezt a cache dolgot mar korabban is leirtam mas topikban is, szerintem eleg konzisztensen. Nem ertetted ezek szerint, az apu koncepciot nem ertelmetlennek tartottam sosem, hanem azt allitottam, hogy a kommunikacio esetleges gyorsasagat nemigen fogja tudni semmi kihasznalni (mivel a cpu - pcie - gpu rendszerben is mindig probalja az ember elfedni), tehat csak az a hatrany fog kijonni, hogy a cpu es gpu kozos lassu memorian osztozik. Es lam a tesztek is pont ezt mutatjak, milyen meglepo. Ha javitod ezt a bottlenecket nagy savszelessegu memoriaval, vagy nagy cache-sel, egybol no az apu teljesitmenye. Ez meg ma nincs, ha majd lesz, jo lesz, nyilvan amugy egy gpu ha beindul, akkor rettento mennyisegben ontja az adatot, lasd sb level3 cache problemai, szoval ez nem trivialis feladat, de kb. ezen all vagy bukik a dolog, mert nem hinnem, hogy 200 GB/sec sebessegu memoriarendszert akarna valaki alaplapra integralni (mert ha igen, az akkor grafkartya).

    Ugyhogy lehet, hogy a marketing azt nyomatja, hogy vilagmegvaltas, de szerintem meg egy lapra integralt cpu+gpu, semmi kulonos, arazastol fuggoen jo vagy rossz vetel.

  • lenox

    veterán

    válasz Pietrosz #85 üzenetére

    Van sajat programjuk Reference neven, de pl. final cut pro, imovie, quictime pro, adobe premier pro, meg gondolom egy csomo mas. Amelyik program tud kulso codecet hasznalni, azzal gondolom hasznalhato. De a reference az jo kezdetnek szerintem.

  • lenox

    veterán

    válasz dezz #88 üzenetére

    Most viszont úgy próbálod beállítani, hogy mintha a Llanonál egész más lenne a helyzet (GPGPU-s felhasználást illetően is), pedig teszteredmény bizonyítja, hogy egálban lehet a neki megfelelő diszkrét változattal.

    Mirol beszelsz? Azt probalod bizonyitani, hogy van elonye a cpu es gpu kozotti gyors kommunikacionak. SP processing bottleneckes feladatnal egalban lehet a megfelelo diszkret valtozattal a llano, igen. Ebben az esetben semmi jelentosege, hogy gyorsabb-e a komminikacio, mint pcie eseteben. Tehat ezzel nem tudod bizonyitani, hogy elonye lenne, akkor miert erdekes ez az eset?

    adott esetben igen sokat dobhat a teljesítményen, ha egy sok-SP-s GPU mellé tesznek egy ilyen APU-t

    Hat igen, ha ket gpu van a rendszerben, az gyorsabb lehet, mint ha egy. Teljesen lenyegtelen, hogy abbol az egyik a cpu-val egy lapra van integralva, vagy nem, tehat lehet siman ket diszkret vga. Mint ahogy mar volt is, lasd physics tarskartya, vagy sli, vagy cf. Pont ezt mondom, semmi vilagmegvaltas, ilyen mar volt eddig is.

    Csak nem mindig sikerül...

    Legyszi ird le a peldakat, amikor vgaval nem megy, ellenben apuval igen.

    Egyelőre itt én hoztam fel teszteredményt, ami éppen hogy az ellenkezőjét mutatta.

    Melyik is volt az? Amikor a llano csak gpu-val kb. ugyananolyan eredmenyt ert el, mint cpu+gpu-val, de mindketto alatta volt az ugyanannyi sp-t tartalmazo, ugyanolyan sebesseggel jaro diszkret vga-s eredmenynek? Ezt nem inkabb neked kene tudomasul venni, hogy hoppa, semmilyen elonnyel nem jar, ha osszeintegralod oket?

  • lenox

    veterán

    válasz dezz #92 üzenetére

    Olyan feladatoknál

    Ird legyszi a konkret pelda alkalmazast. Ha nincs, akkor nincs. Amugy azt nem tudom hogy gondoltad, hogy diszkret gpu onmagaban. Bar ha a proci onmagaban reszt nezzuk azon is az latszik, hogy meg mindig nem erted, hogy az apu-nak egy diszkret vga + cpu parost kene lenyomnia ahhoz, hogy kideruljon, van elonye az elmeletben gyorsabb kommunikacionak.

    Nyilván nem ez volt a lényeg...

    Hanem mi? Az integraltsag elonyet akarod bizonyitani meg mindig. Nyilvan akkor olyan rendszerhez kell hasonlitani, ami hasonlo tulajdonsagu, csak nem integralt. Tehat ha az apu-s rendszerben 2 gpu van, akkor a nem apu-s rendszerben is 2 kell legyen, kulonben semmi ertelme az osszehasonlitasnak.

    Már többször is meghatároztam, milyen esetekben tud döntő tényező lenni és példát is írtam.

    Hol a pelda, melyik program, mik az eredmenyek?

    Már ha a 348,4 és 356 közötti 7,5 GFLOPS neked semmi...

    Amugy a cpu magaban 21.6 MPix/s-et tudott, de ebbol csak 7.6 maradt meg... Nekem ugy tunik gatoltak egymast, de akkor magyarazd meg, ha nem.

    1. Szerintem mosd ki a szemed, mert belement valami...

    Gondolom mindjart jon a hulyezes is...

    2. Miből gondolod, hogy ebben a tesztben olyan feladat van, aminél kulcsfontosságú a kettő közötti kommunikáció?

    Nem gondolom ezt, ha nem csak irnal, latnad, hogy ez a kozos memoria bottleneck tema, ami az integraltsag hatranya.

    3. A Llano csak az első lépés ebben az irányban, de te az egész APU koncepció létjogosultságát kérdőjelezted meg.

    Ez megint kepzelges, azt kerdojelezem meg, hogy a llano-ban az integraltsag gyakorlati teljesitmeny elonnyel jar a gyorsabb cpu-gpu kommunikacio okan, azt, hogy eddig nem lehetett heterogen programot irni, most meg lehet, ellenben allitom, hogy az integraltsag hatranya pl. a kozos memoriarendszeren valo osztozas.

  • lenox

    veterán

    válasz dezz #95 üzenetére

    Bocs, de egy ilyen 'felteve hogy valamire az apu a leggyorsabb, tagadod-e, hogy arra az apu a leggyorsabb' kerdest nem gondoltam, hogy komoly kerdesnek tartasz, most sem gondolom. Mondjuk a #94-ben erre valaszoltam, hogy nem ertetted...
    Ha jol ertem akkor nem tudsz peldat mondani, tehat akkor azt az allitast, hogy de te mar mondtal, azt minek nevezik? En tudom... Dezz ervelestechnika, masik fo motivum az ellenfel fikazasa mellet, lasd gerincesseg.

    Az utolsó bekezdésben önmagadnak mondasz ellent
    Ez megint valami dezz logika lehet, mert en nem latok ellentmondast, bar amugy megint nem ertetted, hogy nem az a lenyeg, hogy ossze van-e integralva a gpu a cpu-val, hanem hogy egy kozos lassu memoriarendszeren osztoznak-e.

    #97 Cal-t hasznalnak, nem opencl-t.

    [ Szerkesztve ]

  • lenox

    veterán

    válasz dezz #100 üzenetére

    Észrevetted már, hogy nagyon szereted kiforgatni a szavakat?

    Nem, azt vettem eszre, hogy ha valami kifogasolni valot csinalsz, akkor rogton az ellenfelre fogod, hogy o csinalta, pl. most ram. Mert ugye nekem nem 'jott ki hogy az apu automatikusan mindenben gyorsabb', csak te allitod, szoval te probalsz szavakat kiforgatni.

    példát is mondtam rá a ray-tracing képében

    Van par opencl raytracer, szoval ez eleg hamar ki fog derulni, hogy igaz-e. Nezzuk majd meg.

    Aham, csak kár, hogy ez hozzátartozik az összeintegráltsághoz, főleg ha még egy címterületen is dolgoznak majd... És mivel ez így van, amit te is jól tudsz, csak kibúvókat keresel, ezért tehát szerinted itt bukik az egész dolog. Én meg erre ugye azt mondom, már nem tudom, hányadszorra, hogy bizonyos feladatok esetén ez valóban bottlenecket képez, más feladatoknál meg nem.

    Hehe, teljesen komolytalan, gondolom te keresel valamire kibuvot, es ram akarod fogni, dezz ervelestechnika (lopod a szovegemet, nincs sajat? :) ). De abban legalabb egyetertunk, hogy a lassu memoriarendszer bottleneck, bar nyilvan igen nehez lenne tagadni, anandektol sem veletlenul kertek a ddr3-1866 teszteket.

  • lenox

    veterán

    válasz dezz #107 üzenetére

    Te most valamilyen inkvizitornak kepzeled magad? Bocs, de nyilvanvaloan csak belemkotni akarsz, a feluletes valaszok ezekre a kerdesekre tobbsegeben egyertelmuek, a maradek es a reszletek meg tulmutatnak azon a tudason, ami a fusion marketinganyagokbol megszerezheto, komolyabb gyakorlati tapasztalat meg nem mindenkinek all rendelkezesre... De ha megmutatod, hogy a kotozkodesen tul melyik miert erdekes egyaltalan, akkor esetleg lehet folytatni...

    Nézzük! (Csak ne állítsd be úgy, mintha ez egy kőbe vésettnek vélt szabály lenne -- ez egy vélemény és fenntartom a tévedés jogát.)

    Nekem eddig ugy tunt, hogy tenykent allitod, hogy az apu gyorsabb raytracingre, de ha velemeny, akkor oke.

    Nem, b@szod, ez nem lopás, ezt úgy hívják: tükör...

    En inkabb gyenge (mivel lopott) riposztnak hivnam...

  • lenox

    veterán

    válasz Abu85 #123 üzenetére

    Természetesen képes az OpenCL több GPU kihasználására.

    Nem tudom, ki hogy van vele, de szerintem valoszinuleg nem csak az a kerdes, hogy az OpenCL kezel-e tobb gpu-t, mert nyilvan ugy lett kitalalva, hogy kezel, hanem az a kerdes, hogy az implementaciok kezelnek-e. Szoval az nvidiat meg nem neztem, mert eleg, hogy a cuda kezel, az amd-t neztem, tavaly voltak gondok, most megneztem a forumokban, a dual gpu-s kartyak hivatalosan meg mindig csak egy gpu-val supportaljak az opencl-t, bar azt irtak, hogy sokminden megy rajtuk, a 2.4-es sdk-ban javitottak par dolgon, ha jol ertem, a single-gpu-s kartyak meg elvileg mukodnek.
    Errol az jut meg eszembe, hogy az amd-nek is van cuda driver api jellegu api-ja cal neven, bar ezt nem szoktatok fikazni ugy, mint a cuda-t (pedig ahogy en latom tok hasonloan van kezelve, cuda/cal mindent tud, opencl meg mindig hatrebb van feature-okben), mindenesetre azzal pl. nem voltak ilyen gondok, meg tobb feature-t is supportalt, pl. a dma-s kommunikacio mindig is mukodott rajta, mig az opencl-nel tavaly ev vegeig nem mukodott.

    #124: Csak azt szerettem volna elérni, hogy korrekt válaszokat adjál, de úgy látszik, képtelen vagy erre.

    Bocs, de a kerdeseid es a szandekod sem korrekt, a kotozkodesen tuli celjuk nem hinnem, hogy van, ugyhogy nem latom ertelmet foglalkozni veluk.

    Ha belenéznél abba a bizonyos tükörbe, meglátnád a gerendát a saját szemedben...

    Bagoly mondja...

  • lenox

    veterán

    válasz dezz #129 üzenetére

    Mi azon az inkorrekt, hogy egyenes válaszokat próbálok kicsikarni belőled? :W

    A szandek, hogy csak belemkotni akarsz. De mondtam, ha megmondod, hogy a kotozkodesen tul mi a celja, szivesen folytatom. De ha csak az a celja (es szerintem az), akkor bocs...

    Rég rossz, ha valaki ennyire nem tudja elismerni a tévedését... Vitaképtelen.

    Itt nyilvan a sajat tevedeseidre gondolsz :). En amugy meg azert is gondolnam, hogy nem korrekten vitazol, mert pl. tobbszor elofordul, hogy olyat allitasz, ami nem ugy, vagy mashogy volt, vagy egyaltalan nem is igaz, es az ellenfelet szidod erveles helyett. Nyilvan van, akinel mukodik.

    Baglyozz csak, de hiába nem nézel bele a tükörbe, attól mások még látnak.

    Nem tudom miert olyan fontos neked 'masok' velemenye (itt a ph forumozokra gondolsz, feltetelezem), nekem van ennel sokkal erosebb terep szakmai elismeres kivivasara, nem olyan nagy problema, ha par sertodott forumozo hulyenek probal beallitani.

  • lenox

    veterán

    válasz vtechun #135 üzenetére

    Miben lehet milyen szintet elerni? 5450 az nagyon alap kartya, lasd itt. Tul sokat nem kell varni tole.

Új hozzászólás Aktív témák