[Re:] Új csúcsmodell a DirectX 10-mezőnyben - PROHARDVER! Hozzászólások

Hirdetés

Legfrissebb anyagok

PROHARDVER! témák

Mobilarena témák

IT café témák

GAMEPOD témák

LOGOUT témák

Új hozzászólás Aktív témák

#147 dezz nagyúr gbors #146

Új Válasz 2007-05-08 11:47:40 #147
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

dezz

nagyúr

válasz gbors #146 üzenetére

''Én valahogy úgy képzelem, hogy az egy SIMD-be tartozó MIMD-ek (vagy mind a 16, vagy csak a fele, a jó ég tudja) egyidőben ugyanazokat a VLIW-eket hajtják végre más-más adatokon (na ez egy jó mondat lett).''
Igen, én is ezt próbáltam leírni az egy oszlopba tartozós szöveggel.
#146 gbors nagyúr dezz #145

Új Válasz 2007-05-08 08:28:34 #146
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

gbors

nagyúr

válasz dezz #145 üzenetére

Én valahogy úgy képzelem, hogy az egy SIMD-be tartozó MIMD-ek (vagy mind a 16, vagy csak a fele, a jó ég tudja) egyidőben ugyanazokat a VLIW-eket hajtják végre más-más adatokon (na ez egy jó mondat lett). Ez ügyesen programozva állati nagy rugalmasságot jelent - de tényleg ügyesen kell programozni. Lehet egyébként, hogy itt vannak elásva a szellőztetett performancia-gondok - új a dolog, sokat kell még hangolni a dispatch stratégián (ez biztos), ill. a shader fordítón (ez ''csak'' valószínű). Az nVidiának azért sokkal több ideje volt ezekre - abban pl. majdnem biztos vagyok, hogy az irdatlan shader órajel nem volt az eredeti design része

Btw. nem ismerem a konkrét műszaki hátteret, de az eredmény szempontjából ugyanezt játszotta el az ATI az X1-es szériával is.

Na asszem ezt sírba tettük. Már csak meg kellene jelenni a kártyának

gbors
#145 dezz nagyúr gbors #144

Új Válasz 2007-05-08 00:56:46 #145
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

dezz

nagyúr

válasz gbors #144 üzenetére

Jahh, már értelek. Néztem én azt a 4-es lapot már, de ott is egy-egy sort vettem egybetartozónak. De valószínű, hogy tényleg inkább dupla-oszloponként kell nézni.

Bár ettől még kérdéses a számomra, miért nevezi ezeket a blokkokat az AMD SIMD-nek. Végülis minden MAD egységen más-más műveletet végezhet, így ez az egész egy ''super-MIMD'' cucc. Mondjuk valószínű, hogy úgy túl bonyolult lenne a kezelésük, így az egy oszlopba tartozó, azon belül ugyanolyan sorszámú (magyarán egymás alatti) MAD egységekkel ugyanazt a műveletet végezteti a belső scheduler (Ultra-Threaded Dispatch Processor).

Érdekes. Más kialakítás, de lényegében hasonló működtetés... (R600/G80.)
#144 gbors nagyúr dezz #143

Új Válasz 2007-05-07 21:36:12 #144
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

gbors

nagyúr

válasz dezz #143 üzenetére

De jót röhögtem most - azon vitatkozunk már több lépésben, hogy másképp csoportosít a látásunk De végre leesett.

Nekem egy SIMD azt a 2 oszlopnyi (8+8) 5-way MIMD egységet jelenti, amik 0 pixel távolsággal össze vannak zsúfolva, innen a 16 egység / SIMD, és 4 ilyen SIMD van. Nézd meg amúgy a 4-es sorszámú ábrát (azt, amin nincs belinkelve az eredeti linken a fórumba - tréfás fiúk), ezen a HD2600 és a HD2400 látszik, és ott 3 (egyenként 8 elemű) és 2 (egyenként 4 elemű) SIMD-ről beszélnek.
#143 dezz nagyúr gbors #142

Új Válasz 2007-05-07 19:43:16 #143
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

dezz

nagyúr

válasz gbors #142 üzenetére

Nézd a képet: [link]
Egy unitban 2x 5(+1 branch, de azt most hagyjuk) egység van, te honnan szeded ezt a 16-os számot? (16*4*8(sor) = 512!)

Naszóval, azt tudjuk, hogy egy ilyen 5-way blokk az itt MIMD, azaz mind más műveletet végezhet. Aztán valamilyen oknál fogva 2-2 ilyen van egy unitban. Most hogy miért nevez az AMD egy ilyen 4 unitból álló sort SIMD-nek, azt nem tudom. Talán úgy értik, egy-egy sor egy adott shaderkódot futtat.

A G80 shader tömbje 16db 8-way SIMD MAD egységből áll (plusz ott vannak az interpolátor és spec. funct. egységek), amik szintén párosával vannak rendezve, 8db unitba. De úgy alakul a végrehajtás, hogy minden ilyen unit más-más kódot futtathat, szép egymás utánban az utasításokat, csak éppen egyszerre 16 pixelen.
#142 gbors nagyúr dezz #140

Új Válasz 2007-05-07 17:01:38 #142
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

gbors

nagyúr

válasz dezz #140 üzenetére

asszem elvesztettem a fonalat

az ATIs (bocsánat, AMDs) prezentáció 4 unitról (SIMD Arrays) beszél, ezek mindegyike 16 feldolgozó egységet tartalmaz (ezek az 5+1-es MIMD-ek, vagy ahogy a prezentáció írja, VLIW végrehajtók). Én azt vettem ki belőle, hogy a 4 unit egy-egy SIMD egységként működik, igen hasonlóan ahhoz, ahogy a G80-ban 8 SIMD egységbe van szervezve a 128 stream processor.
#141 Csabahun senior tag rolko #134

Új Válasz 2007-05-07 15:34:19 #141
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Csabahun

senior tag

válasz rolko #134 üzenetére

Na igen,de itt sok kamu hir van az R600-ról én majd akkor hiszek ha majd lehet kapni és egy rendes teszt is lesz róla..
#140 dezz nagyúr gbors #139

Új Válasz 2007-05-07 13:47:03 #140
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

dezz

nagyúr

válasz gbors #139 üzenetére

4x16? Hmm, esetleg 4x10, nem? És hogy pontosak legyünk, nem ugyanaz (MIMD vs. SIMD), és 2x5.
#139 gbors nagyúr dezz #138

Új Válasz 2007-05-07 12:38:11 #139
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

gbors

nagyúr

válasz dezz #138 üzenetére

1. na ja. nem ez volt az első dolog, ami a válaszüzenet írása közben állt össze a fejemben
2. Bárki másnak ötlete, hogy miért fogyaszt ennyit az R600?
3. igen, így, bár az ATIs preziben 4x16-ról van szó - de talán ott is él ugyanaz a 8x2-es megoldás, amit a G80-ról írtál.
#138 dezz nagyúr gbors #137

Új Válasz 2007-05-07 09:48:57 #138
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

dezz

nagyúr

válasz gbors #137 üzenetére

1. A ''most'' jelen idő kifejezésének tűnt.
3. Ja, oké. Viszont, az a SIMD megjelölés szerintem csak egy sorra vonatkozik a 8x8-as mátrixban, és az egyes sorok mást csinálhatnak. Másként nem igazán lenne értelme.
#137 gbors nagyúr dezz #136

Új Válasz 2007-05-07 09:26:01 #137
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

gbors

nagyúr

válasz dezz #136 üzenetére

1. eddig nem állt össze, a fenti kettővel már értem
3. nem a 64 egységen belüli szervezésről beszélek, hanem a 64 egység szervezéséről
#136 dezz nagyúr gbors #135

Új Válasz 2007-05-07 09:16:28 #136
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

dezz

nagyúr

válasz gbors #135 üzenetére

1. T&L-re és geom.-ra kell a pontos trigo., akkor most mi nem áll össze?
2. -
3. Már mondtam: 64x 5-way MIMD (+1 branch).
#135 gbors nagyúr dezz #132

Új Válasz 2007-05-07 08:10:40 #135
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

gbors

nagyúr

válasz dezz #132 üzenetére

Persze, sokmindenhez kell szögfüggvény, csak az nem állt össze a fejemben, hogy mitől kell most hozzá hirtelen ilyen HW támogatás. De a T&L változása jó érvnek tűnik, meg az előbb említett geometry shaderek is.

A füstölésről. Egyik oka biztosan az, hogy amíg az nVidia-nál már egy ideje szempont a fogyasztás (nyilván nem utolsósorban a hűtés miatt, de ez most mindegy), addig az ATI erre nagy ívben sz**ni tűnik. De hogy ez önmagában megmagyarázza a 1.5-szeres / tranzisztor fogyasztást, azt még én sem hiszem

SIMD-ek és MIMD-ek: a cikkbe belenéztem, alkalomadtán végig elolvasom, thx. Ami még érdekes, hogy az R600 is hasonlóan van szervezve, ott a 64 processing unit van 4 SIMD-be szétpakolva, bár azt nem tudom, hogy azokon belül van-e további olyan bontási lehetőség, ami a G80-nál (logikus lenne, hogy legyen).
#134 rolko őstag Csabahun #128

Új Válasz 2007-05-07 07:38:53 #134
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

rolko

őstag

válasz Csabahun #128 üzenetére

Szvsz ez a kari azért készült hogy harcba száljon majd a HD2900XTX-el, csak ugye az még nem jön, és a bejelentés alapján gyengébb lett a GTX-nél, így csak korlátozott számban adják ki
#133 dezz nagyúr

Új Válasz 2007-05-07 02:23:20 #133
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

dezz

nagyúr

Egyébként asszem mégis ''kőbe lehet vésni'' azt a (2x)8-way SIMD működést G80-nál:
''There are 128 such processors (called SPs by NVIDIA) in a full G80, grouped in clusters of 16, giving the outward appearance of an 8-way MIMD setup of 16-way SIMD SP clusters. Inwardly, each 16 SP cluster is further organised in two pairs of 8 (let's call that 8x2) and the scheduler will effectively run the same instruction on each half cluster across a number of cycles, depending on thread type.'' [link] (Tudom, már nem mai.)
(A ''8-way MIMD'' a 8db clusterre vonatkozik, azok külön-külön legalább mást csinálhatnak.)

Szó van egyébként az elemzésben arról, hogy elvileg a shader procik tudnak ilyet, hogy dual-issue a MADD and MUL, viszont a szerzők, és mások ennek semmi jelét nem látták.

Még valami: itt is vannak ám trigonometriai utasítások, a special function egységek leple alatt. Ezek számát tekintve ellentmondás van eme elemzés, és a korábban linkelt tábla között.
#132 dezz nagyúr gbors #131

Új Válasz 2007-05-07 01:00:54 #132
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

dezz

nagyúr

válasz gbors #131 üzenetére

Nos eddig volt jó kis bedrótozott T&L, ezt most már szépen shader-programokkal kell csinálni. Talán nem kell hozzá szögfüggvény?

Nem vagyok túlzottan otthon a shaderprogramozásban, de mintha eddig is használatosak lettek volna szögfüggvények egyébre is. Nem tudom, be volt-e ilyen építve, de ha így nem, akkor textúrás táblázattal volt megoldva. Csak az ugye nem olyan pontos.

Jahh, az a 730M-s adat. Tudtommal az egy becslés, ami a die méretből és a 80nm (vs. 90nm) vonalszélességből indul ki.

Viszont valaminek el kell füstölnie a wattokat... Szerinted mi?
#131 gbors nagyúr dezz #129

Új Válasz 2007-05-06 22:40:48 #131
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

gbors

nagyúr

válasz dezz #129 üzenetére

A crossbar vezérlő nekem is eszembe jutott, biztosan költségesebb a ring bus-nál, de szerintem nem ez a nagyságrend.

Igen, sok mindenre lehet használni kedvenc szögfüggvényeinket, de eddig megvoltunk ilyen egységek nélkül - miért kellett pont most bedobni? (...) Egy tippem mondjuk támadt közben, a geometry shadingben lehet hasznuk.

Jót derültem a tranzisztorszámos eszmefuttatáson - végül is miért ne lehetne hamis a 730M-s adat? Tartok tőle viszont, hogy a fogyasztás tényleg annyi sok lesz...
#130 dezz nagyúr dezz #129

Új Válasz 2007-05-06 21:08:58 #130
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

dezz

nagyúr

válasz dezz #129 üzenetére

De egyébként honnan is tudjuk az R600-ban mennyi tranyó van? Valami csak elfűti azt a rengeteg wattot (hacsak nem kamu az is).
#129 dezz nagyúr gbors #124

Új Válasz 2007-05-06 14:47:25 #129
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

dezz

nagyúr

válasz gbors #124 üzenetére

A crossbaros memvezérlő is elég sok tranyóba kerülhet a G80-ban. Meg gondolom, az is, hogy G80-on külön vannak a MAD és interpolator/INT/spec. funct. egységek.

Nem 64 transcendens egység, hanem a 320-ból 64 tud ilyet is. Hogy érted, hogy mi szükség sin, cos, stb.-ra? Ha elég gyors, szükségtelenné teszi a textúrába tett táblázatokat, memóriahozzáféréseket spórolva.

Ez a ROP-os dolog szerintem inkább csak FUD.

[Szerkesztve]
#128 Csabahun senior tag

Új Válasz 2007-05-06 14:28:22 #128
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Csabahun

senior tag

Ez kb olyan eset mint anno a 6800GT Vs 6800 Ultra.
50Mhz különbség volt a kettő között ami a 6800 Gt részéről 5 mp-volt és elérted az ultra szintet.
TELJESEN FELESLEGES VOLT EZ A KÁRTYA AZ NVIDIA RÉSZÉRŐL!!!
Szegény már szenved magától és nem birta ki,hogy ne adja ki ezt a kártyát!
Jobb lett volna novemberben egy 8900GTX.
#127 he7edik. addikt

Új Válasz 2007-05-06 13:33:24 #127
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

he7edik.

addikt

Azért az Ultra coolere nagyon bejövős
#126 Vistaboy veterán RI/OS #121

Új Válasz 2007-05-06 13:14:55 #126
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Vistaboy

veterán

válasz RI/OS #121 üzenetére

Nekem 7800GTX van, de még Én sem venném meg, még ha lenne is rá pénzem. Egyenlőre beérem ezzel is. Max. ha nyerek a lottón, akkor veszek egy GTS-t és azzal kihúzok még egy évet...
#125 RI/OS addikt Raymond #123

Új Válasz 2007-05-06 13:06:33 #125
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

RI/OS

addikt

válasz Raymond #123 üzenetére

pontosan .
leteszteltem

egy 630/1450/2000 es oc2 kártya odavágja a 612/1500/2160at
#124 gbors nagyúr dezz #112

Új Válasz 2007-05-06 13:05:28 #124
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

gbors

nagyúr

válasz dezz #112 üzenetére

Igen, a nyers lóerő összehasonlítható, kérdés, hogyan veszi ennek hasznát a vezérlés. Agyaltam a dolgon, igazából azért piszkálja a csőrömet ennyire ez a 64 transzcendens egység, mert nem látom, mi szükség van rájuk

Jawohl, csak shaderről beszélünk, részemről azért, mert az R600 memóriavezérlője annyival fejlettebb, mint a G80-é, hogy eszembe sem jutott, hogy azon a fertályon lehet szűk keresztmetszet. Azt mondod, az ATI alulkalkulálta a ROP-okat? Azzal megnyernék a 2007-es év balekja díjat Mondjuk egy ilyen bakit akár egy 2950-esben tudnak korrigálni.

Itt a teszt, ill. egy prezentáció, amiben tesztadatok is vannak: [link]

És akkor már csak egy kérdés: ha az R600 nemtranszcendens MAD-jai egyenértékűek G80 stream processzoraival, akkor hogy lehet a <10% különbség a két chip tranzisztorszáma között?

gbors
#123 Raymond titán rolko #122

Új Válasz 2007-05-06 13:04:27 #123
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Raymond

titán

válasz rolko #122 üzenetére

Attol meg mindig nem lesz semmi ertelme. Mar most kapsz tobb gyartotol kevesebb penzert nagyobb teljesitmenyt.
#122 rolko őstag RI/OS #121

Új Válasz 2007-05-06 12:55:39 #122
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

rolko

őstag

válasz RI/OS #121 üzenetére

majd lesz ez olcsóbb is
#121 RI/OS addikt Vistaboy #120

Új Válasz 2007-05-06 12:51:34 #121
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

RI/OS

addikt

válasz Vistaboy #120 üzenetére

meg tök felesleges megvenni akinek gtxe van. Rárakja a biost, mint én, és megspórol 80k-t.
Tuningolni meg ugyse nagyon szokott vidkarit az ember ilyen 700as gpu szintre max csak 3dmark erejéig
#120 Vistaboy veterán

Új Válasz 2007-05-06 12:47:51 #120
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Vistaboy

veterán

A GeForce 8800 Ultra várható ára 190K. [link]
Hát ez nem az Én pénztárcámhoz illő ár...
#119 dezz nagyúr kovi #114

Új Válasz 2007-05-06 12:13:13 #119
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

dezz

nagyúr

válasz kovi #114 üzenetére

Nem az XTX-ről volt ott szó, hanem az XT-ről.
#118 Vigneau félisten kovi #117

Új Válasz 2007-05-06 11:25:25 #118
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Vigneau

félisten

válasz kovi #117 üzenetére

Ez egy szükséges lépés volt az AMD részéről...
#117 kovi senior tag he7edik. #115

Új Válasz 2007-05-06 11:11:58 #117
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

kovi

senior tag

válasz he7edik. #115 üzenetére

Igen, ez igaz. Nagyon meglepődtem amikor az Amd hogyan árazott...
110k-s nyitóárra készültem az XT-nél.
#116 he7edik. addikt kovi #114

Új Válasz 2007-05-06 11:11:06 #116
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

he7edik.

addikt

válasz kovi #114 üzenetére

DX9-ben?
#115 he7edik. addikt

Új Válasz 2007-05-06 11:08:35 #115
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

he7edik.

addikt

Ha az XT 85K-ért 15-20%-al lasabb a 125K-s GTX-nél akkor bőven best-buy

[Szerkesztve]
#114 kovi senior tag Vistaboy #113

Új Válasz 2007-05-06 08:49:18 #114
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

kovi

senior tag

válasz Vistaboy #113 üzenetére

Azt azért ne felejtsük el, hogy az AMD elismerte, hogy bizony az XTX-el csak és kizáróan a GTS-t tudják elverni. A GTX-et nem. Na most erre dob egy lapáttal rá az Ultra. Biztos ami biztos alapon.
#113 Vistaboy veterán RI/OS #108

Új Válasz 2007-05-06 06:45:40 #113
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Vistaboy

veterán

válasz RI/OS #108 üzenetére

Szerintem is az a helyzet hogy az előzetes tesztek alapján látták hogy a Radeon HD 2900XT nem teljesít olyan jól, mint az elvárható lenne. De nem szeretnék azt sem hogy lemaradjanak véletlenül 1-2 FPS-t a 8800GTX-el. Így kiadták az Ultra-t, ezzel már biztosan megverik az XT-t. Hacsak az XTX nem veri meg a szokásos 1-2 FPS-el...
#112 dezz nagyúr gbors #111

Új Válasz 2007-05-05 23:58:38 #112
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

dezz

nagyúr

válasz gbors #111 üzenetére

Persze, a pontos teljesítmény mindig az adott alkalmazástól fog függeni. De azt akartam mondani, hogy a MAD (valahol MADD-nak írják) egységek száma, és az általuk pl. mp-enként végrehajtható utasítások száma azért összemérhető.

Nem tudom, mennyire gyakorlati v. elméleti az az összehasonlító tábla, szal azért még ne véssük kőbe ezt a 8-way SIMD dologot G80-nál.

Az R600-zal kapcsolatban 4+1 egységről beszélni félrevezető lehet, mert a korábbi genek voltak 4+1-esek (vec4+1 scalar), most meg 5 scalar egység van (+1 külön branch), amik fp MAD-ot, és int műveleteket tudnak, és egy tud transcendentalt is, de emiatt nem szokás külön venni.

Itt a shader teljesítményről van szó, hogy összességében hogy teljesítenek, az ugye függ egyéb dolgoktól is, mint pl. a ROP egységek száma. R600-ban állítólag ebből nincs túl sok, talán ezért volt ő is ''csak'' 2x gyorsabb, mint az X1950XTX. Meg tudnád egyébként osztani azt a tesztet?
#111 gbors nagyúr dezz #107

Új Válasz 2007-05-05 22:03:24 #111
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

gbors

nagyúr

válasz dezz #107 üzenetére

Hmmm, köszönöm a részletes magyarázatot, némileg szakszerűbb volt, mint az egyszerű meg a bonyolult unit

Viszont a magyarázatod megerősített abban, hogy a két architektúra általánosan csak nehézkesen összehasonlítható:

Bár elsőre kissé elhűltem a nyolcutas SIMD-ek láttán, igazából ennek óriási jelentősége nincsen - a feldolgozandó adatok jellege miatt megfelelő munkaszervezés esetén a 8-way SIMD a gyakorlati esetek túlnyomó részében jól fogja közelíti a 8 önálló egységet (nyilván nem 100%-osan, ellentétben az előző üzenetemben írtakkal). Feltételezem, hogy ezzel a megoldással egy rakás tranzisztort spóroltak.

Az R600 miatt azért vakarom a fejem, mert a 4+1 egység alapú szervezés mögött (ami ráadásul a fentiek alapján MIMD) makacsul valamilyen funkcionális célt sejtek, tipikusan bizonyos műveletsorok ''olcsóbb'' végrehajtását - ezért is beszéltem összetartozó műveletről. Viszont ez a megközelítés egy lényegesen nagyobb tudású feladatvégrehajtót feltételez, aminek a hatékonysága (különösen az életciklusa elején) a bemenő adatok függvényében erősen szórhat.

És igen, a számok alapján valóban 50%-kal gyorsabb kellene legyen az R600 - de nekem sincs jó érzésem. Láttam egy állítólag ATI-tól kiszivárgott tesztet, itt szélsőséges körülmények között 2x gyorsabb volt, mint az X1950XTX - pont ott, ahol már a 8800 Ultra is kb. 2x gyorsabb a volt királynál.

gbors
#110 dezz nagyúr RI/OS #108

Új Válasz 2007-05-05 21:42:14 #110
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

dezz

nagyúr

válasz RI/OS #108 üzenetére

Az ATI tudja, hogy 2 DX10-es játék miatt nem fizetnének érte többet.
#109 RI/OS addikt dezz #104

Új Válasz 2007-05-05 19:19:23 #109
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

RI/OS

addikt

válasz dezz #104 üzenetére

Ez nálam default, de azért látom téged sem kell félteni

[Szerkesztve]
#108 RI/OS addikt he7edik. #105

Új Válasz 2007-05-05 19:17:48 #108
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

RI/OS

addikt

válasz he7edik. #105 üzenetére

,,Az Ultrának nagyon ''még húzzunk le egy uccsó bőrt a 8800 sorozatról'' amíg ki nem jönnek az új ATI-k szaga van. ( max a tuningos NV legenda életbentartása végett ....,,

pont ezt mondom én is. De ezt csak azért teheti meg mert az R600 nem fog nagyot szólni

,,mert az látható hogy az ATI kártyák nagyon alá lesznek árazva az nvidiáknak ( most térülmeg igazán az R500 amit Bill bácsinak fejlesztettek ),,

szerinted ha jobb lenne nem lenne drágább?

az ati sem a pénze ellensége. Egy jobb kártyáért többet kérne, mint az nv kártyái. Szerintem elég egyértelmü a dolog.
#107 dezz nagyúr gbors #106

Új Válasz 2007-05-05 14:33:25 #107
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

dezz

nagyúr

válasz gbors #106 üzenetére

Hát nem egészen.

Amit te ''egyszerű''-nek írsz, az a legtöbbet használt, fullos floating point MAD egység, integer supporttal (bitwise ops is). A ''bonyolultabb'' csak abban különbözik, hogy transcendentális (sin, cos, stb.) függvényeket is tud. Mindez úgy csoportosul, mintha 64db 5(+1)-way MIMD egység lenne, amiben az 5 független utasítás superscalarban hajtódik végre, azzal a kitétellel, hogy transcend. op csak egy lehet ebből. (A +1 az ugrás lehet.)

A G80 meg nem 128-way superscalar, hanem 16db 8-way SIMD MAD egység, plusz 16db 2-way SIMD interpolátor és spec. funct. egység (4 clk/op) van van. Azaz egy MAD egység ugyanazt az 1 utasítást hajtja végre 8 adaton. Azonban ha nem tudsz összeszedni 8 adatot 1-1 utasításra, akkor csökken a kihasználtság.

Szóval simán összehasonlítható pl. MAD ops/s szempontból, de más szempontból is.

Nézd csak meg ezt: [link]
Órajeleket is figyelembe véve, kevert MAD, MUL, és ADD utasításokat véve az R600 másfélszer gyorsabb, 100%-os G80 MAD egyéség kihasználtságot feltételezve. Mi van, ha nem jön össze a 100%...?

[Szerkesztve]
#106 gbors nagyúr dezz #104

Új Válasz 2007-05-05 13:50:50 #106
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

gbors

nagyúr

válasz dezz #104 üzenetére

Pedig tényleg nem hasonlítható direktbe össze - többek között azért sem, mert a 320-ból 256 ilyen fajta (egyszerű), 64 meg olyan (bonyolult(abb)). Célszerűbb úgy nézni az R600-at, hogy 64 általános processzora van, amelyek 1 órajel alatt több összetartozó műveletet is el tudnak végezni. Ezzel áll szemben az nVidia iszonyúan megpörgetett 128 stream processzora, 1 művelet / ciklussal. Szerintem csak konkrét esetre nézve lehet összevetni, általánosan elég nehéz.

Btw. míg a 8800 Ultráról feltételezhető, hogy GPU limitált esetben 0 stream processzor lógatja a lábát, az R600-nál a 320 unitot nézve ebben egyáltalán nem vagyok biztos.

gbors
#105 he7edik. addikt RI/OS #102

Új Válasz 2007-05-05 13:41:33 #105
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

he7edik.

addikt

válasz RI/OS #102 üzenetére

Azt elöbb is megtehették volna, minek vártak volna fél évet?

Az Ultrának nagyon ''még húzzunk le egy uccsó bőrt a 8800 sorozatról'' amíg ki nem jönnek az új ATI-k szaga van. ( max a tuningos NV legenda életbentartása végett )
mert az látható hogy az ATI kártyák nagyon alá lesznek árazva az nvidiáknak ( most térülmeg igazán az R500 amit Bill bácsinak fejlesztettek )
#104 dezz nagyúr RI/OS #102

Új Válasz 2007-05-05 12:50:10 #104
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

dezz

nagyúr

válasz RI/OS #102 üzenetére

''#98: ja tudom az X1950XTX is jobb a gtxnél csak dx6ban kell nézni''
Szókiforgatós hangulatban vagy, vagy ez default?

''a 320stream meg nem hasonlitható össze az nvidia 128ával ezt már sokan elmondták!''
De igen, nagyon is összehasonlítható! Csak az órajel is számít persze, de ezt oda is írtam. Meg azt is, hogy milyen a kihasználtsága, de ezt is odaírtam. Vagy neked így már túl bonyolult volt?
#103 #64791808 törölt tag

Új Válasz 2007-05-05 12:13:27 #103
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#64791808

törölt tag

Szerintem meg ha látok PH tesztet, helyi módra a két csúcs kártyáról, akkor alkotok véleményt, hogy melyik jobb.

Addig megint megy a találgatás, senki nem tud semmi, külföldi, isten tudja, mennyire kamu tesztek homályos számadataival megy a dobálózás.

Srácok megint a ''kinek-a-pöcse-hosszabb'' szintű eszmecsere van?
#102 RI/OS addikt he7edik. #100

Új Válasz 2007-05-05 11:29:29 #102
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

RI/OS

addikt

válasz he7edik. #100 üzenetére

minek hozták ki az ultrát?

Azért hogy az fanatikusokról akik azzal villognak hogy nekik van a csucs vgajuk,
megint lehuzzanak egy rakat pénzt körülbelül azért

#98: ja tudom az X1950XTX is jobb a gtxnél csak dx6ban kell nézni
a 320stream meg nem hasonlitható össze az nvidia 128ával ezt már sokan elmondták!

[Szerkesztve]

[Szerkesztve]
#101 he7edik. addikt dezz #98

Új Válasz 2007-05-05 10:03:17 #101
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

he7edik.

addikt

válasz dezz #98 üzenetére

Nem is beszélve a Vista penetrációról...
Igazából a DX10-es kártyáknak az XP alatti tesztelése jó dolog csak kevés az értelme

( az fog nyerni aki hamarabb ír jó drivert a kártyájához Vista alá )

[Szerkesztve]