Hirdetés

Keresés

Új hozzászólás Aktív témák

  • gbors

    nagyúr

    válasz namaste #211 üzenetére

    Tudnál olyan példát mondani, ahol nincs grafikus primitív (pont, vonal, háromszög), nincs raszterizálás, de van pixel shader és ROP művelet?

    A lentiek alapján nehezen. Nekem erre az MSAA és a pixel shaderes post process effektek voltak a tippjeim, de ha az előbbinél a fedettségvizsgálatot a raszterizáló csinálja, az utóbbiak pedig egy bazi nagy háromszögön keresztül dolgoznak, akkor egyik sem nyert.
    Még egy tippnek ott van a screen space-ben csinált részecske-effekt - ha van ilyen egyáltalán :)

    Az a kérdés, milyen gyakran használják az INT8-tól eltérő képformátumokat színkeveréssel.

    Ezt én is nagyon szeretném tudni...

    A GTX 1060 több ROP egysége inkább kivétel, mint szabály.

    Most már igen - anno a Fermi és a Kepler generációban a legnagyobb chipekben kevesebb volt a raszter, mint a ROP.

    Ha a GT 1030 egy felezett GTX 1050 Ti, akkor van 1 GPC órajelenként 16 pixelre képes raszterizálóval és két darab órajelenként 8 pixel sebességű ROP blokk.

    Persze - a kérdés csak az, hogy nem buheráltak-e rajta valamit. Valahonnan jönni kellett a konfúziónak, hogy 8 vagy 16 ROP. Abu emlegetett pixel throughput tesztje ugyan nem bizonyíték semmire, de jelezni az is jelez valamit.

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

  • gbors

    nagyúr

    válasz namaste #207 üzenetére

    Ezeket textúrával, pontokkal, apró háromszögekkel is meg lehet valósítani.
    Persze, anno rövid ideig divatos volt ilyeneket geometry shaderrel csinálni, viszont ha rögtön screen space-be dolgoznak, akkor szvsz nem kell hozzájuk raszter - ROP viszont igen.

    MSAA
    Hmmm, igazad lehet - én a coverage vizsgálatot máshová képzeltem.

    Minden megoldható, de ahhoz tárolók kellenének, vagy cache, vagy memóriába kiírni. De hát ezt csinálja a ROP is ...
    Pont ide akarok kilyukadni - nekem az tűnik logikusnak, hogy a "bonyolultabb" pontokon több ROP-művelet van, mert egy pass-ban nem tud minden shader lefutni rajtuk.

    Postprocess
    OK, de gondolom, ha compute shader csinálja, akkor nem kell sem raszterizáció, sem ROP.

    Összességében oda lyukadtam ki, hogy jóval kevesebb helyen lehet több ROP / pixel művelet, mint eddig gondoltam, de valamennyit továbbra is látok. Nyilván ez a kérdés egyre inkább akadémikus, mert ha a raszter : ROP arány mondjuk 1:1.07, akkor ugyanúgy egyenlú számú kell belőlük, mintha 1:1 lenne. nVidiáéknál meg ettől függetlenül lehet értelme a több ROP-nak, mert a blending az INT8 formátum kivételével felezett sebességű, így pl. FP16-tal szélső esetben egy 8-as raszter 16 ROP-ot tud etetni.

    Ja, és közben az jutott eszembe, hogy az nVidiának kellene, hogy legyen olyan unitja, ami órajelenként 8 pixelt raszterizál, mert a Kepler GPC-kben olyan volt.

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

  • gbors

    nagyúr

    válasz namaste #205 üzenetére

    OK, akkor még egy adag kérdés :)

    A kép rajzolás képbuffer törléssel kezdődik: (...) nem kell ROP hozzá. Amely pixelre nem kerül háromszög, az marad háttérszínű.

    Nem elsősorban erre gondoltam. Mi a helyzet a GPU által generált részecske-effektekkel - köd, füst, stb.?

    Ha a kirajzolandó háromszög pixele
    - takarja a már kirajzoltat, akkor felülírja, vagy ha átlátszó akkor színkeverés történik,
    - takarásban van, akkor nem lesz új ROP művelet.

    No de akkor mit csinál tulajdonképpen a ROP? Ebből a szakaszból úgy tűnik, hogy a Z-tesztet sem ő végzi, akkor gyakorlatilag csak színez, szükség esetén blendinggel együtt?

    MSAA

    Nagyon meglep, amit írsz, ahol eddig foglalkoztak a raszter : ROP aránnyal, mindenhol az MSAA-t emelték ki, mint a több ROP haszonélvezőjét. Ez biztosan így van?

    Miután lefut a pixel shader, minél hamarabb.

    Egy komplexebb motorban, jelenetben jópár shader lefut egy pixelre. Szerinted megoldható az, hogy az összes shader lefut egy pixelre, és csak utána van ROP-művelet?

    Postprocess

    OK, értem. Ez akkor egy teljesen külön kör, amiben a képet végigzavarja a teljes pipeline-on?

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

  • gbors

    nagyúr

    válasz namaste #189 üzenetére

    Ebbe másszunk bele kicsit jobban, mert az én fejemben van több kérdéses pont ezzel kapcsolatban. Szerintem az alábbi állítás a gyakorlatban lehet jellemzően igaz, de egyáltalán nem szükségszerű:
    "Ami felül bemegy, annál több nem jöhet ki alul."

    Ahogy én értem a folyamatot nagy vonalakban: a raszterizáló fogja az összes háromszöget, ami a tesszeláció és a láthatósági szűrés után megmarad, és a célfelbontásnak megfelelően pixelekre képzi őket, azaz a raszterizáló teljes munkája a megmaradó háromszögek összes pixele. Ezután futnak a shaderek, amiknek az eredménye lesz ROP-művelet. Amiért a fenti állítás nem szükségszerű:
    - Nem minden pixelt fog fedni háromszög, viszont azokhoz is tartozik legalább egy ROP-művelet (= több jön ki, mint ami bemegy)
    - Lesz olyan pixel, amit több háromszög is fed (= kevesebb jön ki, mint ami bemegy)
    - Lehet MSAA is, ami többször "megtapogatja" a pixeleket (= több jön ki, mint ami bemegy)
    Ezeknek az átlaga akár lehet 1:1 is, de nyilván számos dologtól függ.

    A kérdések, amik a fenti egyensúlyt nagyban befolyásolják:
    - Biztosított-e, hogy a raszterizáló minden háromszögön csak egyszer megy keresztül?
    - Mikor történik a ROP művelet? Minden shader lefutása után egyszer? (ezt nehezen hiszem, mert akkor a világ összes ROP-ja nem lenne elég egy komplex motorban) Az összes shader lefutása után minden pixelre egyszer? (ezt is nehezen hiszem, itt a cache / memória lenne a gond) Ha a kettő között, akkor jellemzően hányszor nyúl a motor egy pixelhez? Ebből milyen arányban van a színezés és a blending? (nVidia oldalon a blending az INT8 kivételével felezett sebességgel megy)
    - Vannak olyan postprocess műveletek, amik totálisan a shaderes fázis mögé vannak rakva, újabb ROP-műveletet generálva minden pixelre? Az FXAA / SMAA szerintem ilyen, van-e további?

    Ha ezekre a kérdésekre van válaszod (vagy bárkinek, aki olvassa), azt nagy örömmel venném. Az 1060-asnál pedig olyan teszteket kellene látni, ahol nehezen magyarázható módon lemarad a 980-tól.

    (#187) Abu85: ha ugyanaz a képminőség jön ki, akkor felőlem tizedannyi munkával is dolgozhat az AMD, összehasonlítható lesz az eredmény.

    [ Szerkesztve ]

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

  • gbors

    nagyúr

    válasz Raymond #185 üzenetére

    Pontosabb lenne úgy fogalmazni, hogy a BF1 érzékenyebb a shader-teljesítményre - nem nagyon van olyan motor / játék, ami sarkosan egy terület tudásától függ, és a többiben akár jelentős deficitet is elvisel. De ez sajnos csak két game, kellene legalább 6-8, hogy valami általánosabbat le lehessen vonni.

    Amúgy megfordítva a dolgot, ha az 1030 4 pixel / clock raszterizációval az esetek többségében hozza az 1050 több, mint a felét, akkor az azt jelenti, hogy a raszterizációs kapacitásnak messze nem kell elérni a ROP-ok tudását, és bőven elég lenne a kártyákat 1:2-es aránnyal szerelni. Ehhez képest mindkét gyártó igyekszik tartani az 1:1-et, az AMD-nél talán egyáltalán nincs kivétel, az nVidiánál pedig az utóbbi időből csak az 1060 lógott ki, ott is 2:3 volt csak az arány, messze nem 1:4.

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

  • gbors

    nagyúr

    válasz Abu85 #182 üzenetére

    Nehéz ügy ez, legalábbis az eddig rendelkezésre álló mérések alapján. A raszterizációs kapacitás elég jól el van dugva a folyamat mélyén, elvileg akkor okoz gondot, ha túl sok / nagy a háromszög a pixelek számához képest. Ez az eSport játékokban nem lesz jelentős gond, viszont amikor azzá válik, akkor aligha csak a minimumokban jelenik meg - a minimumok jellemzően a határhelyzeti állapot környékén romlanak jelentősen az átlagokhoz képest. Nekem az 1:4-es arány a ROP-okhoz képest nagyon extrémnek tűnik.

    A tréfa egyébként az az egészben, hogy a kevés mérés között találtam egyet, ami az általad jelzett viselkedést mutatja - a computerbase Witcher 3 tesztjében a minimum nagyon lemegy kutyába. Ugyanakkor a BF1 meg nem. Kellene egy szélesebb teszt - a pH! tervez ilyet?

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

  • gbors

    nagyúr

    válasz Abu85 #179 üzenetére

    Ezek érdekes infok, köszi! Itt setup alatt a raszterizációra gondolsz, ugye?
    Ill. a 4 az biztos? Az eddig látottak alapján a 8 hihetőbb lenne - 4 mellett a szintetikus teszt sem ment volna 6-7 GPix fölé, ill. a real life teszteknél is lett volna 1-2 durva anomália.

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

  • gbors

    nagyúr

    válasz Raymond #162 üzenetére

    A <10GPix- nek sokféle oka lehet, mind a kártyában, mind a tesztmódszerben. A legegyszerűbb, ha a pixel teszt sávszélesség-limitre fut, amiből az 1030-asnak túlzottan sok nincsen.

    Ilyen kis chipeknél tök más szempontok is bejöhetnek, nehéz jósolni, mi van tényleg benne. Ha tudnánk a chip méretét, abból kiderülhetne, hogy van-e 4. SM letiltva, de arról is nagy a csend.

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

  • gbors

    nagyúr

    válasz Csupingo #153 üzenetére

    Itt azt hozza minden, amire lehetett számítani - ha valaki 16 ROP-ban gondolkodott az 1030 kapcsán. Engem egyedül a fogyasztás lep meg, a Maxwellnél az volt a fő gond, hogy a 970 alatti szintre nagyon rosszul skálázódott lefelé, itt meg simán megoldottak további 3 lépést.

    (#157) AxBattler: nem tudjuk, mekkora a chip, simán lehet, hogy már pad-limitált, azaz nem fért volna el rajta a 128-bites busz. Meg amúgy van logika ebben a felállásban, ha 16 a ROP, akkor az GP107 / 2.

    (#159) Raymond: azért engem nem lep meg, hogy az nVidia nem szívesen beszél ROP-okról ;] Remélem, a hardware.fr eljut odáig egyszer, az 1050Ti / RX 460 teszt is 3 hónappal később bukkant fel.

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

  • gbors

    nagyúr

    Felbukkant végre egy komolyabb teszt. Nem ugrál össze-vissza az 550 teljesítménye, viszont érdekes, hogy az 1030-ra itt is 16 ROP-ot írnak.

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

  • gbors

    nagyúr

    válasz Raymond #133 üzenetére

    De, az az nVidia által megadott limitáció, az extra tápcsati nélküli 1050-eseknél elég szigorúan be is van tartva - és így az igaz, amit az 1050 és az 1050Ti viszonyáról írtál, csak 15W-tal lejjebb.
    Amúgy a PCIE limit VGA-k esetén csak 66-68W, mert gyakorlatilag a teljes áramfelvétel a 12V-os ágon jön, amire 5.5A a limit - ezért ott nem is lehet nagyon engedékenykedni. Az 1030-nál egyszerűbb pár W-tal továbbengedni bármelyik custom kártyát, mert nem fog semmibe beleütközni.

    (#134) DraXoN: 75-ig nem, de 60-ig nagyjából igen.

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

  • gbors

    nagyúr

    válasz Raymond #131 üzenetére

    Valószínűleg így van, bár nekem a 30W-os limitáció szigorúbbnak tűnik, mint az 1050-eseknél a 60W. A GPU ugyan kb. a fele az 1050-nek, a memória fogyasztását viszont aligha tudták felezni.
    Persze, ha a custom kártyák pár W-tal eleresztik a fogyasztást, azt ki veszi észre? Hmmmm....

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

  • gbors

    nagyúr

    válasz b. #127 üzenetére

    Itt több dolog is érdekes.

    Egyrészt több tesztből azt látom, hogy a 750Ti 80%-át hozza az 1030. Ehhez vagy az kell, hogy mégis 16 ROP legyen benne, vagy az, hogy a valódi órajele az 1050-esekhez hasonlóan 1700 fölé menjen - látott valaki olyan tesztet, ahol ezt monitorozták?

    Másrészt az 550 sebessége meglepően alacsony, és rettentően hektikus. Egyes esetekben fele a 460-énak, amit igazából semmi nem indokol. Driveresen lehet béna szegény, vagy ott is lehet valami disznóság? :F

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

  • gbors

    nagyúr

    válasz zoltanz #95 üzenetére

    Pont az APU-khoz képest nagyon jó ár / teljesítményben - mellédobsz egy G4560-at, és magasan veri az összes APU-t ilyen téren, plusz a legtöbbnél a fogyasztása is kedvezőbb.

    Olyan kategória nincs, hogy "vicc". Ez a kártya hoz egy bizonyos teljesítményszintet, akinek ez nem elég, az vegyen erősebbet. Nekem az esetek 80-90%-ában elég lenne. A maradék 10-20% miatt jobban megéri a GP107 alapú kártyám, de ha valaki ezt a GPU-t belerakná pl. egy GB BRIX-be (a 10x10x6-osba), akkor átgondolnám :)

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

  • gbors

    nagyúr

    válasz arabus #86 üzenetére

    A böngészés nekem nem tűnt fel jópár hét HD530 közben, a 4K@60Hz meg a néhány új feature nyilván el tudja adni annak, akinek ezek számítanak. A kérdés csak annyi, hogy ez mennyire széles kör.

    (#89) zoltanz: értelme abszolút van, műszakilag teljesen jó termék, csak a 70 USD-s ár nagyon leszűkíti, kinek érdemes ilyenben gondolkodni. 55-60 USD-ért univerzálisan is versenyképes lenne.

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

  • gbors

    nagyúr

    válasz arabus #67 üzenetére

    Hová szánják? Hová kell olyan megoldás, ahol fontos a fogyasztás, de nem elég az IGP, ugyanakkor az ár / teljesítmény kevésbé fontos? Komolyan érdekel.

    Megjegyzem, bármi is a válasz a fentire, ez akkor is egy niche termék (még ha jó vásárlóerővel rendelkező niche-ről is van szó - ennek szól a fenti kérdés). Az én egy darabomnak meg végképp semmi köze a témához, mert a termék piaci elhelyezkedéséről írtam, nem pedig a személyes preferenciáimról.

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

  • gbors

    nagyúr

    válasz ivarg #57 üzenetére

    Háborogni valóban semmi értelme egy áron, de minősíteni, értékelni attól még lehet. Ez a kártya 70 USD körüli áron indul. 15%-kal drágábban van 40-50%-kal nagyobb teljesítmény (RX 550), 50%-kal drágábban pedig dupla (RX 460, GTX 1050). Ezért ez a teljesítmény ezzel az árazással általánosan nem versenyképes, csak niche esetekben.

    Legyártani egy bármilyen kártyát és kirakni a polcra 12-15eft

    Dehogy. Kifutott memóriával és GPU-val kb. a 15-20%-a. Erre építsd rá a gDDR5 és a GPU árát.

    [ Szerkesztve ]

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

  • gbors

    nagyúr

    válasz Mans20 #48 üzenetére

    Lejjebb fejtegettem, hogy mire lehet számítani tőle, kb. a 650 és a 650Ti (nem boost) között lehet félúton. Ebből következően a tesztekben rendszeresen szereplő játékokhoz nem lesz az igazi, minden mással el fog ketyegni.

    (#47) b.: akár egy Intel Celeron, akár egy AMD A4 10e FT alatt megvehető, és azzal le van tudva a CPU és a video is. Feature-ben nyilván többet tud egy új VGA, de (nekem) nem annyival, és a helyigénye meg a hűtés is komolyabb kérdés. Ha meg valami BGA-s megoldást veszel, akkor még lejjebb lehet menni méretben és zajban.

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

  • gbors

    nagyúr

    válasz arabus #35 üzenetére

    + ÁFA ... Egyelőre még a humoros kategória.

    (#44) b.: játékra igen. médiacenterhez pont inkább IGP-t használnék. igazából az a baj, hogy ezeket a cuccokat nemigen lehet ilyen alaplapra integrált kivitelben kapni, csak notebookban. nekem pont jó lenne egy ilyen NUC méretben, kicsit visszafogott órajelekkel.

    [ Szerkesztve ]

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

  • gbors

    nagyúr

    válasz b. #25 üzenetére

    A számok alapján a kártya az 1050Ti-nek 35-40%-át tudhatja, a 750Ti-nek meg cca. 60-70%-át. Ez kb. a 7770 / R7 250X szintjének felel meg, ami azért érdekes, mert arról tudom, hogy kicsit több, mint a dupláját tudja a HD530-nak. Szóval a lenti grafikon kb. reális, sőt, még az is benne van, hogy a mixben nincs olyan játék, amitől az Intel IGP durván elhasal.

    A valódi fogyasztására kíváncsi lennék, de a 30W TDP nagyon jól hangzik. Ha egy kicsit épeszűbb lesz az ára, akkor ultrapici gépbe egész jó lehet.

    "We put all our politicians in prison as soon as they're elected." "Why?" "It saves time."

Új hozzászólás Aktív témák

Hirdetés