- Kiemelkedően csendes ASUS VGA jött a Noctua közreműködésével
- Mini kijelzős SSD-hűtő a Thermalright névjegyével
- Windows: mi történik valójában Leállításkor, Alvó módban és Újraindításkor?
- Gyenge Wi-Fi otthon? – a leggyakoribb hibák és megoldások
- Korábbi vezetője szerint 40 milliárd dollár kell az Intel versenyképességéhez
- Kiemelkedően csendes ASUS VGA jött a Noctua közreműködésével
- Új, belépő szintű Radeont kapnak az OEM-ek
- AMD Ryzen 9 / 7 / 5 9***(X) "Zen 5" (AM5)
- Vezetékes FÜLhallgatók
- Milyen CPU léghűtést vegyek?
- TCL LCD és LED TV-k
- NVIDIA GeForce RTX 5080 / 5090 (GB203 / 202)
- Változatos hardverbokréta
- Milyen asztali (teljes vagy fél-) gépet vegyek?
- Milyen belső merevlemezt vegyek?
Hirdetés
Új hozzászólás Aktív témák
-
dezz
nagyúr
''Én valahogy úgy képzelem, hogy az egy SIMD-be tartozó MIMD-ek (vagy mind a 16, vagy csak a fele, a jó ég tudja) egyidőben ugyanazokat a VLIW-eket hajtják végre más-más adatokon (na ez egy jó mondat lett).''
Igen, én is ezt próbáltam leírni az egy oszlopba tartozós szöveggel. -
Én valahogy úgy képzelem, hogy az egy SIMD-be tartozó MIMD-ek (vagy mind a 16, vagy csak a fele, a jó ég tudja) egyidőben ugyanazokat a VLIW-eket hajtják végre más-más adatokon (na ez egy jó mondat lett). Ez ügyesen programozva állati nagy rugalmasságot jelent - de tényleg ügyesen kell programozni. Lehet egyébként, hogy itt vannak elásva a szellőztetett performancia-gondok - új a dolog, sokat kell még hangolni a dispatch stratégián (ez biztos), ill. a shader fordítón (ez ''csak'' valószínű). Az nVidiának azért sokkal több ideje volt ezekre - abban pl. majdnem biztos vagyok, hogy az irdatlan shader órajel nem volt az eredeti design része
Btw. nem ismerem a konkrét műszaki hátteret, de az eredmény szempontjából ugyanezt játszotta el az ATI az X1-es szériával is.
Na asszem ezt sírba tettük. Már csak meg kellene jelenni a kártyának
gbors -
dezz
nagyúr
Jahh, már értelek.
Néztem én azt a 4-es lapot már, de ott is egy-egy sort vettem egybetartozónak. De valószínű, hogy tényleg inkább dupla-oszloponként kell nézni.
Bár ettől még kérdéses a számomra, miért nevezi ezeket a blokkokat az AMD SIMD-nek. Végülis minden MAD egységen más-más műveletet végezhet, így ez az egész egy ''super-MIMD'' cucc. Mondjuk valószínű, hogy úgy túl bonyolult lenne a kezelésük, így az egy oszlopba tartozó, azon belül ugyanolyan sorszámú (magyarán egymás alatti) MAD egységekkel ugyanazt a műveletet végezteti a belső scheduler (Ultra-Threaded Dispatch Processor).
Érdekes. Más kialakítás, de lényegében hasonló működtetés... (R600/G80.) -
De jót röhögtem most - azon vitatkozunk már több lépésben, hogy másképp csoportosít a látásunk
De végre leesett.
Nekem egy SIMD azt a 2 oszlopnyi (8+8) 5-way MIMD egységet jelenti, amik 0 pixel távolsággal össze vannak zsúfolva, innen a 16 egység / SIMD, és 4 ilyen SIMD van. Nézd meg amúgy a 4-es sorszámú ábrát (azt, amin nincs belinkelve az eredeti linken a fórumba - tréfás fiúk), ezen a HD2600 és a HD2400 látszik, és ott 3 (egyenként 8 elemű) és 2 (egyenként 4 elemű) SIMD-ről beszélnek. -
dezz
nagyúr
Nézd a képet: [link]
Egy unitban 2x 5(+1 branch, de azt most hagyjuk) egység van, te honnan szeded ezt a 16-os számot? (16*4*8(sor) = 512!)
Naszóval, azt tudjuk, hogy egy ilyen 5-way blokk az itt MIMD, azaz mind más műveletet végezhet. Aztán valamilyen oknál fogva 2-2 ilyen van egy unitban. Most hogy miért nevez az AMD egy ilyen 4 unitból álló sort SIMD-nek, azt nem tudom. Talán úgy értik, egy-egy sor egy adott shaderkódot futtat.
A G80 shader tömbje 16db 8-way SIMD MAD egységből áll (plusz ott vannak az interpolátor és spec. funct. egységek), amik szintén párosával vannak rendezve, 8db unitba. De úgy alakul a végrehajtás, hogy minden ilyen unit más-más kódot futtathat, szép egymás utánban az utasításokat, csak éppen egyszerre 16 pixelen. -
asszem elvesztettem a fonalat
az ATIs (bocsánat, AMDs) prezentáció 4 unitról (SIMD Arrays) beszél, ezek mindegyike 16 feldolgozó egységet tartalmaz (ezek az 5+1-es MIMD-ek, vagy ahogy a prezentáció írja, VLIW végrehajtók). Én azt vettem ki belőle, hogy a 4 unit egy-egy SIMD egységként működik, igen hasonlóan ahhoz, ahogy a G80-ban 8 SIMD egységbe van szervezve a 128 stream processor. -
-
Persze, sokmindenhez kell szögfüggvény, csak az nem állt össze a fejemben, hogy mitől kell most hozzá hirtelen ilyen HW támogatás. De a T&L változása jó érvnek tűnik, meg az előbb említett geometry shaderek is.
A füstölésről. Egyik oka biztosan az, hogy amíg az nVidia-nál már egy ideje szempont a fogyasztás (nyilván nem utolsósorban a hűtés miatt, de ez most mindegy), addig az ATI erre nagy ívben sz**ni tűnik. De hogy ez önmagában megmagyarázza a 1.5-szeres / tranzisztor fogyasztást, azt még én sem hiszem
SIMD-ek és MIMD-ek: a cikkbe belenéztem, alkalomadtán végig elolvasom, thx. Ami még érdekes, hogy az R600 is hasonlóan van szervezve, ott a 64 processing unit van 4 SIMD-be szétpakolva, bár azt nem tudom, hogy azokon belül van-e további olyan bontási lehetőség, ami a G80-nál (logikus lenne, hogy legyen). -
dezz
nagyúr
Egyébként asszem mégis ''kőbe lehet vésni'' azt a (2x)8-way SIMD működést G80-nál:
''There are 128 such processors (called SPs by NVIDIA) in a full G80, grouped in clusters of 16, giving the outward appearance of an 8-way MIMD setup of 16-way SIMD SP clusters. Inwardly, each 16 SP cluster is further organised in two pairs of 8 (let's call that 8x2) and the scheduler will effectively run the same instruction on each half cluster across a number of cycles, depending on thread type.'' [link] (Tudom, már nem mai.)
(A ''8-way MIMD'' a 8db clusterre vonatkozik, azok külön-külön legalább mást csinálhatnak.)
Szó van egyébként az elemzésben arról, hogy elvileg a shader procik tudnak ilyet, hogy dual-issue a MADD and MUL, viszont a szerzők, és mások ennek semmi jelét nem látták.
Még valami: itt is vannak ám trigonometriai utasítások, a special function egységek leple alatt. Ezek számát tekintve ellentmondás van eme elemzés, és a korábban linkelt tábla között. -
dezz
nagyúr
Nos eddig volt jó kis bedrótozott T&L, ezt most már szépen shader-programokkal kell csinálni. Talán nem kell hozzá szögfüggvény?
Nem vagyok túlzottanotthon a shaderprogramozásban, de mintha eddig is használatosak lettek volna szögfüggvények egyébre is. Nem tudom, be volt-e ilyen építve, de ha így nem, akkor textúrás táblázattal volt megoldva. Csak az ugye nem olyan pontos.
Jahh, az a 730M-s adat. Tudtommal az egy becslés, ami a die méretből és a 80nm (vs. 90nm) vonalszélességből indul ki.
Viszont valaminek el kell füstölnie a wattokat... Szerinted mi? -
A crossbar vezérlő nekem is eszembe jutott, biztosan költségesebb a ring bus-nál, de szerintem nem ez a nagyságrend.
Igen, sok mindenre lehet használni kedvenc szögfüggvényeinket, de eddig megvoltunk ilyen egységek nélkül - miért kellett pont most bedobni? (...) Egy tippem mondjuk támadt közben, a geometry shadingben lehet hasznuk.
Jót derültem a tranzisztorszámos eszmefuttatáson - végül is miért ne lehetne hamis a 730M-s adat?Tartok tőle viszont, hogy a fogyasztás tényleg annyi sok lesz...
-
dezz
nagyúr
A crossbaros memvezérlő is elég sok tranyóba kerülhet a G80-ban. Meg gondolom, az is, hogy G80-on külön vannak a MAD és interpolator/INT/spec. funct. egységek.
Nem 64 transcendens egység, hanem a 320-ból 64 tud ilyet is. Hogy érted, hogy mi szükség sin, cos, stb.-ra? Ha elég gyors, szükségtelenné teszi a textúrába tett táblázatokat, memóriahozzáféréseket spórolva.
Ez a ROP-os dolog szerintem inkább csak FUD.
[Szerkesztve] -
Ez kb olyan eset mint anno a 6800GT Vs 6800 Ultra.
50Mhz különbség volt a kettő között ami a 6800 Gt részéről 5 mp-volt és elérted az ultra szintet.
TELJESEN FELESLEGES VOLT EZ A KÁRTYA AZ NVIDIA RÉSZÉRŐL!!!
Szegény már szenved magától és nem birta ki,hogy ne adja ki ezt a kártyát!
Jobb lett volna novemberben egy 8900GTX. -
he7edik.
addikt
Azért az Ultra coolere nagyon bejövős
-
Igen, a nyers lóerő összehasonlítható, kérdés, hogyan veszi ennek hasznát a vezérlés. Agyaltam a dolgon, igazából azért piszkálja a csőrömet ennyire ez a 64 transzcendens egység, mert nem látom, mi szükség van rájuk
Jawohl, csak shaderről beszélünk, részemről azért, mert az R600 memóriavezérlője annyival fejlettebb, mint a G80-é, hogy eszembe sem jutott, hogy azon a fertályon lehet szűk keresztmetszet. Azt mondod, az ATI alulkalkulálta a ROP-okat? Azzal megnyernék a 2007-es év balekja díjatMondjuk egy ilyen bakit akár egy 2950-esben tudnak korrigálni.
Itt a teszt, ill. egy prezentáció, amiben tesztadatok is vannak: [link]
És akkor már csak egy kérdés: ha az R600 nemtranszcendens MAD-jai egyenértékűek G80 stream processzoraival, akkor hogy lehet a <10% különbség a két chip tranzisztorszáma között?
gbors -
Vistaboy
veterán
A GeForce 8800 Ultra várható ára 190K. [link]
Hát ez nem az Én pénztárcámhoz illő ár... -
he7edik.
addikt
Ha az XT 85K-ért 15-20%-al lasabb a 125K-s GTX-nél akkor bőven best-buy
[Szerkesztve] -
Vistaboy
veterán
Szerintem is az a helyzet hogy az előzetes tesztek alapján látták hogy a Radeon HD 2900XT nem teljesít olyan jól, mint az elvárható lenne. De nem szeretnék azt sem hogy lemaradjanak véletlenül 1-2 FPS-t a 8800GTX-el. Így kiadták az Ultra-t, ezzel már biztosan megverik az XT-t. Hacsak az XTX nem veri meg a szokásos 1-2 FPS-el...
-
dezz
nagyúr
Persze, a pontos teljesítmény mindig az adott alkalmazástól fog függeni. De azt akartam mondani, hogy a MAD (valahol MADD-nak írják) egységek száma, és az általuk pl. mp-enként végrehajtható utasítások száma azért összemérhető.
Nem tudom, mennyire gyakorlati v. elméleti az az összehasonlító tábla, szal azért még ne véssük kőbe ezt a 8-way SIMD dologot G80-nál.
Az R600-zal kapcsolatban 4+1 egységről beszélni félrevezető lehet, mert a korábbi genek voltak 4+1-esek (vec4+1 scalar), most meg 5 scalar egység van (+1 külön branch), amik fp MAD-ot, és int műveleteket tudnak, és egy tud transcendentalt is, de emiatt nem szokás külön venni.
Itt a shader teljesítményről van szó, hogy összességében hogy teljesítenek, az ugye függ egyéb dolgoktól is, mint pl. a ROP egységek száma. R600-ban állítólag ebből nincs túl sok, talán ezért volt ő is ''csak'' 2x gyorsabb, mint az X1950XTX. Meg tudnád egyébként osztani azt a tesztet? -
Hmmm, köszönöm a részletes magyarázatot, némileg szakszerűbb volt, mint az egyszerű meg a bonyolult unit
Viszont a magyarázatod megerősített abban, hogy a két architektúra általánosan csak nehézkesen összehasonlítható:
Bár elsőre kissé elhűltem a nyolcutas SIMD-ek láttán, igazából ennek óriási jelentősége nincsen - a feldolgozandó adatok jellege miatt megfelelő munkaszervezés esetén a 8-way SIMD a gyakorlati esetek túlnyomó részében jól fogja közelíti a 8 önálló egységet (nyilván nem 100%-osan, ellentétben az előző üzenetemben írtakkal). Feltételezem, hogy ezzel a megoldással egy rakás tranzisztort spóroltak.
Az R600 miatt azért vakarom a fejem, mert a 4+1 egység alapú szervezés mögött (ami ráadásul a fentiek alapján MIMD) makacsul valamilyen funkcionális célt sejtek, tipikusan bizonyos műveletsorok ''olcsóbb'' végrehajtását - ezért is beszéltem összetartozó műveletről. Viszont ez a megközelítés egy lényegesen nagyobb tudású feladatvégrehajtót feltételez, aminek a hatékonysága (különösen az életciklusa elején) a bemenő adatok függvényében erősen szórhat.
És igen, a számok alapján valóban 50%-kal gyorsabb kellene legyen az R600 - de nekem sincs jó érzésem. Láttam egy állítólag ATI-tól kiszivárgott tesztet, itt szélsőséges körülmények között 2x gyorsabb volt, mint az X1950XTX - pont ott, ahol már a 8800 Ultra is kb. 2x gyorsabb a volt királynál.
gbors -
RI/OS
addikt
válasz
he7edik. #105 üzenetére
,,Az Ultrának nagyon ''még húzzunk le egy uccsó bőrt a 8800 sorozatról'' amíg ki nem jönnek az új ATI-k szaga van. ( max a tuningos NV legenda életbentartása végett ....,,
pont ezt mondom én is. De ezt csak azért teheti meg mert az R600 nem fog nagyot szólni
,,mert az látható hogy az ATI kártyák nagyon alá lesznek árazva az nvidiáknak ( most térülmeg igazán az R500 amit Bill bácsinak fejlesztettek ),,
szerinted ha jobb lenne nem lenne drágább?
az ati sem a pénze ellensége. Egy jobb kártyáért többet kérne, mint az nv kártyái. Szerintem elég egyértelmü a dolog. -
dezz
nagyúr
Hát nem egészen.
Amit te ''egyszerű''-nek írsz, az a legtöbbet használt, fullos floating point MAD egység, integer supporttal (bitwise ops is). A ''bonyolultabb'' csak abban különbözik, hogy transcendentális (sin, cos, stb.) függvényeket is tud. Mindez úgy csoportosul, mintha 64db 5(+1)-way MIMD egység lenne, amiben az 5 független utasítás superscalarban hajtódik végre, azzal a kitétellel, hogy transcend. op csak egy lehet ebből. (A +1 az ugrás lehet.)
A G80 meg nem 128-way superscalar, hanem 16db 8-way SIMD MAD egység, plusz 16db 2-way SIMD interpolátor és spec. funct. egység (4 clk/op) van van. Azaz egy MAD egység ugyanazt az 1 utasítást hajtja végre 8 adaton. Azonban ha nem tudsz összeszedni 8 adatot 1-1 utasításra, akkor csökken a kihasználtság.
Szóval simán összehasonlítható pl. MAD ops/s szempontból, de más szempontból is.
Nézd csak meg ezt: [link]
Órajeleket is figyelembe véve, kevert MAD, MUL, és ADD utasításokat véve az R600 másfélszer gyorsabb, 100%-os G80 MAD egyéség kihasználtságot feltételezve. Mi van, ha nem jön össze a 100%...?
[Szerkesztve] -
Pedig tényleg nem hasonlítható direktbe össze - többek között azért sem, mert a 320-ból 256 ilyen fajta (egyszerű), 64 meg olyan (bonyolult(abb)). Célszerűbb úgy nézni az R600-at, hogy 64 általános processzora van, amelyek 1 órajel alatt több összetartozó műveletet is el tudnak végezni. Ezzel áll szemben az nVidia iszonyúan megpörgetett 128 stream processzora, 1 művelet / ciklussal. Szerintem csak konkrét esetre nézve lehet összevetni, általánosan elég nehéz.
Btw. míg a 8800 Ultráról feltételezhető, hogy GPU limitált esetben 0 stream processzor lógatja a lábát, az R600-nál a 320 unitot nézve ebben egyáltalán nem vagyok biztos.
gbors -
he7edik.
addikt
Azt elöbb is megtehették volna, minek vártak volna fél évet?
Az Ultrának nagyon ''még húzzunk le egy uccsó bőrt a 8800 sorozatról'' amíg ki nem jönnek az új ATI-k szaga van. ( max a tuningos NV legenda életbentartása végett )
mert az látható hogy az ATI kártyák nagyon alá lesznek árazva az nvidiáknak ( most térülmeg igazán az R500 amit Bill bácsinak fejlesztettek ) -
dezz
nagyúr
''#98: ja tudom az X1950XTX is jobb a gtxnél csak dx6ban kell nézni''
Szókiforgatós hangulatban vagy, vagy ez default?
''a 320stream meg nem hasonlitható össze az nvidia 128ával ezt már sokan elmondták!''
De igen, nagyon is összehasonlítható! Csak az órajel is számít persze, de ezt oda is írtam. Meg azt is, hogy milyen a kihasználtsága, de ezt is odaírtam. Vagy neked így már túl bonyolult volt? -
#64791808
törölt tag
Szerintem meg ha látok PH tesztet, helyi módra a két csúcs kártyáról, akkor alkotok véleményt, hogy melyik jobb.
Addig megint megy a találgatás, senki nem tud semmi, külföldi, isten tudja, mennyire kamu tesztek homályos számadataival megy a dobálózás.
Srácok megint a ''kinek-a-pöcse-hosszabb'' szintű eszmecsere van? -
RI/OS
addikt
válasz
he7edik. #100 üzenetére
minek hozták ki az ultrát?
Azért hogy az fanatikusokról akik azzal villognak hogy nekik van a csucs vgajuk,
megint lehuzzanak egy rakat pénztkörülbelül azért
#98: ja tudom az X1950XTX is jobb a gtxnél csak dx6ban kell nézni
a 320stream meg nem hasonlitható össze az nvidia 128ával ezt már sokan elmondták!
[Szerkesztve]
[Szerkesztve]
Új hozzászólás Aktív témák
Hirdetés
- Yettel topik
- Battlefield 6
- Gitáros topic
- Genshin Impact (PC, PS4, Android, iOS)
- Geri Bátyó: Megint tahó voltam – SZEMÉLYISÉGFEJLŐDÉS
- Android alkalmazások - szoftver kibeszélő topik
- Kiemelkedően csendes ASUS VGA jött a Noctua közreműködésével
- Új, belépő szintű Radeont kapnak az OEM-ek
- Lakáshitel, lakásvásárlás
- Kávé kezdőknek - amatőr koffeinisták anonim klubja
- További aktív témák...
- Asus TUF Gaming A14 FA401WU - 14" 2.5K 165Hz - Ryzen AI 9 HX 370 - 16GB - 1TB - RTX 4050 - 3 év gari
- REFURBISHED - HP USB-C Dock G4 docking station (L13899-001)
- Tablet felvásárlás!! Apple iPad, iPad Mini, iPad Air, iPad Pro
- Azonnali készpénzes Microsoft XBOX Series S és Series X felvásárlás személyesen/csomagküldéssel
- Honor Pad X8 64GB, Wi-Fi, 1 Év Garanciával
Állásajánlatok
Cég: FOTC
Város: Budapest