Keresés

Hirdetés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz lenox #20 üzenetére

    A felsorolt programok mind Fusion optimalizációt kapnak, így a leggyorsabb feldolgozáshoz kell nekik a CPU device. Ezt mutogatják éppen az AFDS-en, hogy mennyit gyorsít rajtuk a heterogén mód a csak GPU-s kódhoz képest.
    Természetesen ahol nem érhető el a CPU-s OpenCL device ott is fut majd a program, csak nem heterogén módban.

    Lesz olyan OpenCL program is, ami csak GPU-s OpenCL. Például a vReveal MotionDSP 3 is kint van, csak az nincs benne az AMD listájában, mert nem heterogén módon dolgozik. Hivatalosan nem is volt róla bemutató, csak megjegyezték, hogy létezik, GPU-s OpenCL és kész. [link] - szimplán ennyi volt a lényeg, hogy a Llano az SB-nél sokkal gyorsabb. Semmi extra.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz lenox #31 üzenetére

    Igazából a dedikált GPU teljesen lényegtelenné vált. A gyártóknak a VGA beépítése olyan költséges, hogy hallani sem akarnak róla. Ezt az elmúlt héten az AMD is ecsetelte, hogy májusban globálisan 30%-kal kevesebb GPU-t adtak el, mint áprilisban. Erről hoztam is egy kínai piacon mért felmérést, ahol a visszaesés 40-45%. [link] ... nyilván az AMD adata globális, így más országokban lehet, hogy kisebb volt a csökkenés, és így reális is a 30%. Egyszerűen a gyártók hozzáállása gáz. Látják, hogy egy dedikált VGA-t beépítve kisebb a terméken a haszon, és ezt elég nagy problémának élik meg.
    Mivel a PC is úgy alakul, hogy előtérbe kerülnek az előre összeszerelt gépek, így a vásárlások zömét nem a legózó vásárlók teszik ki, vagyis az OEM gyártók akarata nagymértékben kihat a piacra. Innentől kezdve nincs Sandy Bridge+GPU és Llano. Van Sandy Bridge és Llano, a GPU kizárva a versenyből.

    Most valami óriási reform kell a VGA-knál, mert a piac igényei így nem megfelelőek, vagyis felesleges fenntartani a piacot.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz lenox #36 üzenetére

    Teljesen mindegy, hogy mi miatt van. A baj az, hogy drasztikusan csökken, és a piac nem tudja eltartani magát. Az AMD-féle Dual Graphics sem valami elképesztően nagy ötlet arra, hogy az eladások legalább egy kis részét megtartsák. Ez a piac durván haldoklik sajnos. A Llano csak egy újabb tőr benne. Az AMD nyilván nem akarja a végét a VGA-piacnak, de ugyanakkor reagálniuk kell arra, hogy az OEM gyártók nem akarnak GPU-t építeni a termékekbe.
    Majd kiderül, hogy mi lesz a jövőben. Ha egy gyártótól kell mindenképpen választani, akkor egy dolgot tudok, hogy nem az Intel grafikát választom. :D

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz lenox #45 üzenetére

    Most éppen milyen tény felett akarunk elsiklani?
    Nem mondtam, hogy holnap fognak eltűnni. A gond azonban már most érezhető. A VGA-k előállítási költsége pengeélen táncol. Ha esik az eladás, akkor az anyagilag is nagyon fáj. Semmi gond azzal, hogy az IGP nem nyomja le a combos GPU-t. Az a gond, hogy a combos GPU beépítése aránytalanul drága.
    Igazából a PC-s piac már nem olyan, mint régen. Nem a legózás megy, hanem egyben vesznek az emberek notit, netbookot, nettopot, egybegépet, miközben elenyésző lett a kiskereskedelmi alkatrészekből összerakott termékek piaca. Pont azért gáz az OEM-ek hozzáállása. Ha raknának a fenti kelendőbb gépekbe VGA-t semmi gond nem lenne, de a mocskok nem raknak, inkább a saját hasznukat nézik, mint a júzer érdekét.

    Májusban a Sandy Bridge IGP-jétől esett 30%-ot az eladás. Nyilván értesz hozzá, és tudod, hogy a rendszer hány sebből vérzik egy Radeonhoz vagy egy GeForce-hoz képest, de mit csináljanak az emberek, amikor ott vannak az üzletekben az összerakott gépek Radeon és GeForce nélkül. :U Itt nem a marketing segít. Itt arról van szó, hogy a kelendő gépek esetében fel sincs kínálva a Radeon vagy a GeForce. Ezen csak az segít, ha integrálsz és felkínálod, mert arra várhatsz, hogy az OEM-ek beépítsék a VGA-t. Nyilván az NV sem viccből döntött saját processzor tervezése mellett, nagyon kockázatos projekt és messze nem olcsó, de integrálni kell, különben csak a jelentéktelen rétegpiacokat szerezheted meg.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz lenox #51 üzenetére

    A Llanohoz viszonyítva nem számítanak combosnak. A Sandy Bridge IGP-jéhez képest combosak. Persze a beépítés extra költsége még az SB-hez képest sem érné meg sajna.

    Akkor a nép majd Intelt vesz Intel IGP-vel. Idővel majd rájönnek, hogy mit jelent egy GeForce vagy egy Radeon. Az AMD és az NV itt lesz egy-egy új generációs APU-val. :) Addig abból lehet kiindulni, hogy ezen a fórumon, én vagy te, vagy más vajon miért nem használ Intel GPU-t. ;]

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • dezz

    nagyúr

    válasz lenox #63 üzenetére

    +Raymond:

    1. Az A8-3500M egy mobil chip, 1,5 GHz CPU és 444 MHz GPU órajellel. Így talán nem csoda, hogy az ugyanannyi s.p.-vel rendelkező HD5570 444 MHz-en van egálban vele... Később majd lesznek tesztek desktop A8-3800/3850-nel is, szerintem igen közel lesz az 5570-hez OpenCL-ben.

    2. Tisztázni kellene, mi a gyenge közepes. Szerintem nem kapásból HD5xxx-en belül kellene nézni, mert a piacon van még rengeteg korábbi generációs kártya is, ahol is a középosztály alja lejjebb volt még.

    "Erre mondj mar legyszi egy valos peldat, mert mindig felhozzatok, de a gyakorlatban valahogy en meg nem lattam ilyet, csak a fusion marketing szovegben."

    Nem hiszem, hogy ne tudnál elképzelni olyan helyzetet, amikor nem optimális a nagyobb csomagok cseréje a CPU és a GPU között, hanem kisebb csomagok jóval gyorsabb cseréjére van szükség.

    (#64): Előtte is, utána is láttam több-GPU-s eredményeket, szal szerintem átmeneti bug lehetett.

  • hugo chávez

    aktív tag

    válasz lenox #80 üzenetére

    "ugyhogy pontosan akkor lehet majd ebbol igazi elonyt kovacsolni, amikor az integralt cpu es gpu kozos cache-sel fog rendelkezni. Az meg nem most van."

    Hát, a Sandy Bridge-nél közösen használhatják az L3 cache-t a procimagok és az IGP, de, tudomásom szerint, ott meg pont az a gond, hogy, ha az IGP "teleszemeteli", akkor ezzel a CPU részt lassítja.

    "sajnos ez a beszélgetés olyan alacsony szintre jutott, hogy a továbbiakban már nem méltó hozzám" - by Pikari

  • dezz

    nagyúr

    válasz lenox #80 üzenetére

    Ejj, ejj, mintha nem tudnád, hogy a GPU-k (maiak sem) nem igazán szeretik az ugrásokat, amik a CPU-knak viszont meg sem kottyannak... Ennek kihasználásához mindössze olyan feladatok kellenek, amiknek egyes lépései komplikáltabb algoritmusok, más lépései pedig egyszerűbb, de számításigényesebbek. Ne mondd már, hogy ez annyira egzotikus dolog lenne!

    Nem is kell messzire menni, vegyük pl. a a ray-tracinget: van benne rengeteg adaton, de egyszerűbb és jóval kisebb adathalmon, de jóval bonyolultabb számítási feladat is. (De szerintem ezt nem kell neked magyarázni. ;) Vagy ha mégis, később majd meglátod, ha továbbfejleszted esetleg azt a kis OpenCL-es ray-tracert...)

    Az AVX-ből, mint megbeszéltük, ilyen 200 GFLOPS körüli (vagy alatti) értékeket lehet kihozni SandyB-n és az IvyB sem lesz sokkal előrrébb. Ehhez képest a Llano IGP-je 4-500 GFLOPS-os, ami azért mégis csak 2-2,5x annyi. Bár még nem derült ki, milyen gyors lehet a kommunikáció a CPU és a GPU között.

    "ugyhogy pontosan akkor lehet majd ebbol igazi elonyt kovacsolni, amikor az integralt cpu es gpu kozos cache-sel fog rendelkezni. Az meg nem most van."

    Nocsak, nocsak! Eddig az egész APU koncepciót értelmetlennek mondtad (és még a mondat első fele alapján sem ilyen befejezésre számítana az ember :D ), ehhez képest előrelépés, hogy bizonyos feltétekkel már tulajdonítasz neki némi létjogosultságot. :)

    Mindegy, ezek csak az első lépések, a jövő a sokkal komolyabb integrálás, összegyúrás, közös regiszterkészlettel, stb.

  • Pietrosz

    addikt

    válasz lenox #69 üzenetére

    Gondolom erre gondoltál:
    [link]
    Viszont nem találom sehol sem, vagy hogy milyen progi használja.

    [ Szerkesztve ]

  • Pietrosz

    addikt

    válasz lenox #86 üzenetére

    Értem és köszi, de nekem kifejezetten a mainconcept opencl h264 encodere kellene :D
    A reference-ben még csak cuda support van. x264-re jó nekem a MediaCoder, azt már megszoktam. Úgy látom ez az opencl még beta, ill. sdk van csak. Majd később várható használható verzió.

    [ Szerkesztve ]

  • dezz

    nagyúr

    válasz lenox #84 üzenetére

    Nézd, a SandyB esetén én fejeztem ki kételyemet a számítási teljesítményhez képesti fele olvasási és negyede írási L1D sávszélességgel kapcsolatban, akkor ti gyorsan megmagyaráztátok és végülis bizonyítottátok (legalábbis az olvasást illetően), hogy ez nem gond.

    Most viszont úgy próbálod beállítani, hogy mintha a Llanonál egész más lenne a helyzet (GPGPU-s felhasználást illetően is), pedig teszteredmény bizonyítja, hogy egálban lehet a neki megfelelő diszkrét változattal. (Figyelmedbe ajánlanám, hogy az IGP-ben lévő cache ugyanolyan sávszélekkel rendelkezik, mint a diszkrét változat esetén.)

    Az lehetséges, hogy egy jóval több SP-s GPU-val nem tud versenyre kelni, azonban adott esetben igen sokat dobhat a teljesítményen, ha egy sok-SP-s GPU mellé tesznek egy ilyen APU-t, ami bizonyos feladatokon a CPU-val közelebbi együttműködésben dolgozik.

    Mindez desktopon -- mobil volalon nagyon sok esetben nem lesz diszkrét GPU.

    "azt allitottam, hogy a kommunikacio esetleges gyorsasagat nemigen fogja tudni semmi kihasznalni (mivel a cpu - pcie - gpu rendszerben is mindig probalja az ember elfedni)"

    Csak nem mindig sikerül...

    "tehat csak az a hatrany fog kijonni, hogy a cpu es gpu kozos lassu memorian osztozik. Es lam a tesztek is pont ezt mutatjak, milyen meglepo."

    Egyelőre itt én hoztam fel teszteredményt, ami éppen hogy az ellenkezőjét mutatta. A meglepő az, hogy nem veszed tudomásul... :))

  • dezz

    nagyúr

    válasz lenox #91 üzenetére

    Olyan feladatoknál, ahol a CPU és a GPU gyors interakciója és a kellő számítási teljesítmény ugyanolyan fontos, előnyösebb egy APU, mint egy diszkrét GPU vagy a proci önmagában, AVX-es kóddal. Ezt csak nem tagadod...!? Az már más kérdés, hogy milyen alkalmazásban fordul elő ilyen feladat.

    "Hat igen, ha ket gpu van a rendszerben, az gyorsabb lehet, mint ha egy."

    Nyilván nem ez volt a lényeg...

    "Teljesen lenyegtelen, hogy abbol az egyik a cpu-val egy lapra van integralva"

    A fenti esetben nem -- ha kellően gyors (kis késleltetésű és elegendő sávszélességű) a CPU és a GPU közötti kommunikáció.

    "Legyszi ird le a peldakat, amikor vgaval nem megy, ellenben apuval igen."

    Már többször is meghatároztam, milyen esetekben tud döntő tényező lenni és példát is írtam.

    "Melyik is volt az?"

    #56?

    "Amikor a llano csak gpu-val kb. ugyananolyan eredmenyt ert el, mint cpu+gpu-val"

    Már ha a 348,4 és 356 közötti 7,5 GFLOPS neked semmi...

    "de mindketto alatta volt az ugyanannyi sp-t tartalmazo, ugyanolyan sebesseggel jaro diszkret vga-s eredmenynek?"

    Milyen érdekes, hogy az előzővel ellentétben a 356 és 359,9 közötti 3,9 GFLOPS itt mekkora jelentőségűvé válik... Hát tudod, itt most számszerűen kijött, hogy nem ugyanazzal a mérleggel méred a neked tetsző és nem tetsző dolgokat... ;)

    BTW, a 348,4 és 359,9 közötti, ~3%-os különbség sem nevezhető éppen egetrengetőnek...

    "Ezt nem inkabb neked kene tudomasul venni, hogy hoppa, semmilyen elonnyel nem jar, ha osszeintegralod oket?"

    1. Szerintem mosd ki a szemed, mert belement valami...
    2. Miből gondolod, hogy ebben a tesztben olyan feladat van, aminél kulcsfontosságú a kettő közötti kommunikáció?
    3. A Llano csak az első lépés ebben az irányban, de te az egész APU koncepció létjogosultságát kérdőjelezted meg.

    [ Szerkesztve ]

  • dezz

    nagyúr

    válasz lenox #80 üzenetére

    Ja, ezt elfelejtettem betenni:

    Év eleje táján írták, hogy visszamenőleg 2-3 Catalyst verzióval nem működik két GPU-val.

    (#96) LordX: Csak az a kérdés, működik-e OpenCL környezetben az, hogy más drivere van a CPU-nak és a GPU-(k)nak...

    [ Szerkesztve ]

  • dezz

    nagyúr

    válasz lenox #105 üzenetére

    Erm, bocs, ebben a sok félrebeszélésben valahogy elsiklottam a #99 aposztrofos részében az arra szócskán. Akkor nézzük így:
    - Tagadod-e, hogy a CPU optimálisabb a komplikált, sok feltételes ugrást és random memóriaműveletet tartalmazó algoritmusok végrehajtására?
    - Tagadod-e, hogy a GPU ezzel ellentétben kevésbé tolerálja az ugrásokat és a random memóriaműveleteket (könnyen elveszítheti ilyen körülmények között a számítási teljesítmény fölényét), így inkább a stream-feldolgozás jellegű feladatokra igazán alkalmas?
    - Tagadod-e, hogy mindkét féle feladatot tartalmazó alkalmazásoknál előnyös lehet mind a CPU-t, mind a GPU-t igénybe venni?
    - Tagadod-e, hogy lehet olyan eset, amikor ezek gyors egymásutánban követik egymást vagy akár teljesen összekeverednek, ami kulcsfontosságúvá teszi a kettő közötti gyors (kis késleltetésű és kellően sávszélességű) kommunikációt?
    - Tagadod-e, hogy GPGPU-s alkalmazásnál jóval kisebb lehet a memóriasávszéligény, mint a megszokott grafikai műveleteknél és hogy ez általában így is van?

    "Nezzuk majd meg."

    Nézzük! (Csak ne állítsd be úgy, mintha ez egy kőbe vésettnek vélt szabály lenne -- ez egy vélemény és fenntartom a tévedés jogát.)

    "(lopod a szovegemet, nincs sajat? )."

    Nem, b@szod, ez nem lopás, ezt úgy hívják: tükör...

    "abban legalabb egyetertunk, hogy a lassu memoriarendszer bottleneck"

    Már megint csak kiforgatod a szavakat a korrekt válasz helyett, mert éppen, hogy azt írtam, bizonyos esetekben az lehet, más esetekben meg NEM!

    [ Szerkesztve ]

  • dezz

    nagyúr

    válasz lenox #122 üzenetére

    Csak azt szerettem volna elérni, hogy korrekt válaszokat adjál, de úgy látszik, képtelen vagy erre.

    Tényként csak annyit állítottam, hogy pl. a ray-tracingben vannak olyan feladatok, amik jobban fekszenek egy CPU-nak és olyan is, amik megfelelőek egy GPU-nak is. Nyilván egy high-end GPU belassulás fennforgása esetén is nagy eséllyel lenyom bármilyen CPU-t -- csak pl. nem mindegy, mennyi áramot fogyaszt el közben.

    Ha belenéznél abba a bizonyos tükörbe, meglátnád a gerendát a saját szemedben...

    [ Szerkesztve ]

  • Abu85

    HÁZIGAZDA

    válasz lenox #127 üzenetére

    Értem én ezt, de a kérdés az OpenCL-re vonatkozott. De köszi a kiegészítést. :)
    Az AMD csak oda használja a CAL felületet, ahol nem oldható meg a probléma az OpenCL-lel. Nyilván az AMD is tudja, hogy a CAL csak a saját hardverein megy, így a jövőben halálra van ítélve.
    Szvsz a Shogun 2 AI-ját is rossz ötlet volt CAL-ra írni, de OpenCL-ben nem volt megvalósítható. Mindenesetre az AMD nem is reklámozza, hogy a GPU-s AI számítás csak az aktuális Fusion APU-kon érhető el. Illetve a reklám csak annyit, hogy "extra scaling" a Fusion APU-ra, de nyilván nem lenne célszerű, ha elterjedne, hogy ez nem OpenCL, mivel a CAL az egy zárt szabvány. Az AMD open kommunikációja mellett ez nem a legjobb. ;]

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • dezz

    nagyúr

    válasz lenox #127 üzenetére

    Mi azon az inkorrekt, hogy egyenes válaszokat próbálok kicsikarni belőled? :W

    Rég rossz, ha valaki ennyire nem tudja elismerni a tévedését... Vitaképtelen.

    Baglyozz csak, de hiába nem nézel bele a tükörbe, attól mások még látnak.

  • dezz

    nagyúr

    válasz lenox #130 üzenetére

    Én nem beléd kötöttem, hanem egy szakmai kérdést próbáltam megvitatni, és éppen, hogy tőled nem telt többre, mint kötekedésre, állandó félrebeszélésre, korrekt válaszok helyett.

    Egy esetben volt olyan, hogy egy szócska elnézése miatt félreértettelek, amiért elnézést is kértem.

    Csak olyankor "szídtalak", amikor korrekt válasz helyett süketelést kaptam. Tudod, arra nehéz észérvekkel reagálni.

Új hozzászólás Aktív témák