-
PROHARDVER!
A legtöbb kérdésre (igen, talán arra is amit éppen feltenni készülsz) már jó eséllyel megtalálható a válasz valahol a topikban. Mielőtt írnál, lapozz vagy tekerj kicsit visszább, és/vagy használd bátran a keresőt a kérdésed kulcsszavaival!
Új hozzászólás Aktív témák
-
Kvg
senior tag
Ezzel a hűtéssel olyan vísítós hangja leyz hogy csak na. Kivancsian várom a guru3d, vagy a kitguru tesztet.
Powercolor csak jobb lehet ennél.
Vega 56 30k val olcsóbb és sokkal gyorsabb. Ez így elég rossz vétel, de a naív emberek úgyis megveszik, mert ez 590 a legújabb széria. -
HSM
félisten
válasz
Petykemano #37393 üzenetére
1560Mhz alapórajel, nem rossz az. Az 580-asom meg se mozdulna ilyen órajelen...
-
Jack@l
veterán
Abu, mennyi vramot vizionáltál a topiklakóknak, amit a BFV majd enni fog? 12 vagy 16 gb volt amivel a hbcc majd simán elboldogul?
-
syberia
veterán
-
HSM
félisten
válasz
Petykemano #37380 üzenetére
Nem lenne elég. Mint írtam, ehhez a ROP-ok sávszélesség hatékonyságán is javítaniuk kéne, amit a zöldek már nagyon régóta jól csinálnak.
48ROP csak felesleges költség lett volna, ahhoz már kevés lenne a 256bites GDDR5 busz. Viszont a pletykák alapján lényegesen növelt órajelek kellemesen fognak hatni a meglévő 32ROP tempójára is.
Modern motorokban amúgy szvsz teljesen jó ez a megközelítés, arra a felbontásra (főleg 1080p-sek) ahova ezek a kártyák pozicionálva vannak bőven elég ennyi ROP. Most néztem pl. BF5 tesztet TPU-n, meg is előzte 5%-al a 1060-at. Az 590 pedig ha tényleg alapból felemeli a mostani 1340Mhz 580 órajelet 1500-1600-ra az igazán ütős kis holmi lenne.
Az Tflopsban 1500mhz-es GPU-val már 7Tflopsot tud egy Polaris20, ami már több, mint amit alapból egy GTX1070 tud, ami azért elég derék.
Tehát bár ROP terén limitáltak némileg, számítási kapacitás van dögivel. Viszonyításként egy GTX1060 teljes kiépítésben mindössze durván 4,5Tflops. -
Abu85
HÁZIGAZDA
válasz
lezso6 #37379 üzenetére
Az nem. Az SRAM ECC, az lényegében egy end-to-end ECC. De ez önmagában nem elég a RAS-hoz. Ott külön szervizelhetőségi paraméterezhetőség van a rendszerben, hogy a megfeleljen a RAS-funkcionalitásnak, ami végeredményben lehetővé teszi, hogy a szerver 24/7 működjön. Ez azért nem volt eddig benne a GPU-kban, mert marha bonyolult, viszont így megnyíltak a GPU-k is a feladatkritikus rendszereknél.
-
dergander
addikt
válasz
Petykemano #37380 üzenetére
Igen, de akkor módosítani kellett volna sokat, így meg egy rebrand 580, kicsit finomítottan kisebb csíkszélességgel. Ez így költséghatékonyabb, mint még áttervezni +16 ROP valamint a memóriavezérlőt GDDR5x-re.
-
Petykemano
veterán
-
válasz
Petykemano #37370 üzenetére
Nem a GCN a probléma, hanem az, hogy fejlesztik, ezt már írtam.
A Vega 20 a tudása miatt nagy. 1/2 FP64 támogatás, 4096 HBM (I/O doesn't scale), SRAM ECC, dot product.
A Vega 10 szintén, egy Fiji die shrink felezett HBM-mel kb 300 mm2 lett volna. Ehhez képest a Vega 10 hatalmas lett, 480 mm2. Van itt DSBR, NGG, 2x FP16 támogatás, ezek nincsenek ingyen tranzisztorok szintjén.
A többi rendben van, még a Fiji mérete is, csak játékban valamiért nem skálázódik jól a kisebbekhez képest. Ugyanez igaz a Vegára is.
De ha a compute-ot nézed, akkor nagyon sokat lép előre a GCN. Csak hát játékban ebből nem látni semmit.
-
HSM
félisten
válasz
solfilo #37365 üzenetére
Nekem nem tűnik kevésnek hozzá a szintén 8Ghz-es VRAM, az Rx580-om is úgy vettem észre jobban meghálálja, ha felrántom 1400Mhz GPU órajel fölé, mintha a ramot piszkálnám. Szerintem jó lesz ez, bőven el fogja bírni a magasabb órajelű GPU-t.
(#37370) Petykemano: Szvsz itt már elfogy a 64ROP, plusz a sávszél hozzá. Hatékonyabb és több ROP kéne, ami takarékosabb a sávszéllel, jelenleg szvsz ez az Nv legnagyobb fegyvere.
A többi területen szvsz bőven elég erős a két nagy Vega, akár egy 1080Ti ellen is.
Az RX580-on is a 32ROP kevés kicsit, főleg a 1060-hoz képest érezhetően itt-ott és ha belegondolsz, a Vega64 kb annak (RX570) a duplázása felépítésre.
Mondjuk ahol meg inkább számítási kapacitás kell, ott meg az 580 veri a 1060-et, nekem inkább ez a verzió jön be, de mindenképpen érdekes összehasonlítás szempontjából. -
Televan74
nagyúr
válasz
Petykemano #37370 üzenetére
Vagy talán el kellene szakadni a GCN -től,és az alapokat újragondolni.Ha már ennyire nem megy.Nekem úgy tűnik egy kicsit,hogy zsákutcában araszolnak előre,csak még nem tudják hol a vége.
-
Petykemano
veterán
válasz
#45185024 #37369 üzenetére
Valamelyik nap a VS-ben én is azon lamentáltam, hogy mennyire kevés előrelépés történt az AMD oldalán az elmúlt években:
28planar->(20planar->)14+finfet!->10finfet->7finfet
0.127-um2 ==> 0.027um2
5 generációnyi process fejlődés, 5x kisebb SRAM cellá
4-5 generációnyi architekturális fejlődés.Ehhez képest a 450mm2-es 28nm Hawaiihoz képest a 330mm2 7nm Vega20 épp csak a kétszeres sebességet érheti el ugyanezzel a fogyasztással. És ezt is nagyrészt annak köszönhetően, hogy 1050-ről felment az órajel 1800-ra.
Mintha kissé megállt volna az idő.Az AMD valahol a hawaii és a fiji környékén tényleg elérhette a GCN skálázódási határát: 64CU, 64 ROP.
A vega64 a hawaiihoz képest a TPU adatbázisa szerint 75%-kal gyorsabb.
A boost órajele 50%-kal magasabb.
43%-kal több SP-t tartalmazSzámokban ez annyit jelent, hogy
FP32: 5,632 GFLOPS vs 12,583 GFLOPS (+123%)
Sávszél: 320.0 GB/s vs 483.8 GB/s (+51% + DCC)
Pixel Rate: 64.00 GPixel/s vs 98.30 GPixel/s (+53%)
Texture Rate: 176.0 GTexel/s vs 393.2 GTexel/s (+123%)a 75%-os előnyből (vega6 vs 290X) 50%-ot biztosan az órajel magyaráz és ezzel tudta tartani a lépést a sávszélesség, amit segít a DCC. ha a pixel fill rate-et tekintjük szűk keresztmetszetnek, akkor az abban a fennmaradó részből valamicskét magyarázhat még a dsbr.
De a villantáshoz úgy tűnik, hogy valamilyen nagy csomót kéne átvágni az architektúrában. És úgy tűnik, hogy az utóbbi években ez nem sikerült, vagy nem ezzel próbálkoztak, hanem valahogy az órajelet növelni, mert az mindenen segít.
-
#45185024
törölt tag
válasz
#59036672 #37367 üzenetére
Nézd én ezt elmondtam már a VSben is, de haragaszkodsz akkor itt is megteszem.
Próbáld meg elfelejteni a márkahűségedet.Az hogy minden csíkszélességen 60%ot emel egy kártya teljesítményén egyszerűen nem igaz ! Ez PR tevékenység.
A 12 nm 5% teljesítménynövekedést hoz plusz 200-300 Mhz-et.
A 7nm mint fent is látod 25%-ot hoz de ott az energiahatékonyság kellett a +50% a képen direkt ezért mutattam hogy az emberekben ez rögzüljön.
Ezenkívüll hoz a tsmcnél gyártási technológiája és ennyi.
Amikor cuda magot emelünk , amikor sokkal sokkal több szilíciumot öntünk egy GPUba akkor érzékeltethetünk hatalmas növekedéseket ,több mint 80 százalékkal nőtt a tranzisztor szám 471 (1080ti) 754 nm2 2080TI és 545 a 2080 de a valóság meg az hogy az AMD is csak úgy tudna erősödni ha kihozna egy 5000 6000 shaderes kártyát 12nmen és az is pont 300 felett lenne. Ezt az utat AMD elvetette. Ezen lehet hőbörögni de a 7nmes szervercuccok sokkal zsírosabbak, az epyc /zen2 sokkal zsírosabb piac főleg hogy ragasztgatunk. Viszont ezekkel nincs érdeke hogy lejöjjön árban.
-
#45185024
törölt tag
Itt egy firestrike extreme táblázat
meg kell nézni mire elég a 7350 pont
Harcol a Fury X-el -
sakal83
addikt
Sziasztok
Mikor es mennyiert jon az rx590? Illetve a 1070hez kepest mire kepes?
-
#45185024
törölt tag
válasz
lezso6 #37362 üzenetére
Jó hát nem játékra erősítették ez látszik az előrelépéseken is.
Nem 1.25 performancet vártunk a 7nm-től. De szervereknél más a fontosabb
Viszont az 1800-as órajelet akkor is említsük meg mert ez később fontos lehet.
Lisa interjú az előadás után. -
válasz
#45185024 #37361 üzenetére
Ja, hát a lényeg az, hogy az új Vega 20 alapú Instinct kártyákkal teljes compute piacot célozzák, mert ki***** sokoldalú és univerzális az új ISA. A fő újítás ugye az 4 elemű INT8 illetve a 8 elemű INT4 vektorpátok dot productja (skaláris szorzata), azaz két vektorból csinál egy skalárt.
De ezek már a P100 utáni Pascaloknál már megvolt az INT4 kivételével, szóval az AMD nem talált fel semmit.
Ugye P100-nál csak FP16 "dot product" van, de fix funkciós hardverrel, amit Tensornak hívnak. A Turing pedig behozta a Tensor magokba az INT8 és INT4 "dot product" támogatást is.
A Tensornál azért az idézőjeles "dot product", mivel csak be van égetve, önmagában csak dot productot nem tud, legalábbis nagyon nem hatékony a feladatra. A Tensor annyit csinál, hogy összeszoroz 2 db 4x4-es mátrixot és az eredményül kapott 4x4 mátrixhoz hozzáad egy harmadik 4x4-est, effektíve "mátrixos FMAC".
Ez mátrixok esetén baromi hatékony. Azonban a fentiből az is következik, hogy ha te 16 pár teljesen független vektorból akarsz csinálni 16 db dot productot, akkor cseszheted, mert 64-et kapsz, azaz az eredmények 3/4 része kuka, felesleges.
Bár ilyen szituáció nem tudom hol van, azaz amikor a dot productot nem mátrixszorzásra használod, hanem önmagában. Szóval az AMD-s előny valószínűleg nem ér semmit. S fontos adalék, hogy a Vega 20 INT4 dot productja csak 8x8 mátrixon alkalmazható, 4x4-es mátrixon nem, ellentétben a Turinggal.
Szóval összefoglalva az van, hogy az AMD a vektorfeldolgozásra gyúrt rá, míg az NV a mátrixra. Már megint két külön irányban megy a fejlesztés.
-
#45185024
törölt tag
Azt tudjátok hogy volt egy kis előadás is horizon utána?
Amúgy Kürt csinál MI oktatást akit érdekel közületek már azoknak aki tud kígyóul... -
leviske
veterán
válasz
dergander #37342 üzenetére
Ez azért múlik az IMC-n is. Hiába raknak mellé drágább memóriákat, ha magasabb órajelen nem képes lekezelni.
(#37352) lezso6: Engem nem lepne meg, ha mostanra jutottak volna el oda, hogy inkább engedik egy kicsit felfelé a lapkaméretet. A GloFo helyzete miatt valószínű, hogy egy darabig muszáj lesz 14nm-es GPU-t is gyártaniuk, ahhoz pedig szükségük lehet a magasabb órajelekre.
Emlékszem, a RV790 idején is nagyobb lapkával sikerült elérni, hogy magasabb órajeleken és alacsonyabb fogyasztással üzemeljen a HD4890, mint a HD4870. Ha a kapacitorgyűrűs megoldás nem lett standard, akkor van rá esély, hogy olyasmivel próbálkoztak be most is.
Így talán volna rá esély, hogy teljesítményben ne legyen olyan vállalhatatlanul nagy szakadék az új GPU és a Polaris alapú termékek közt.
-
-
válasz
Petykemano #37339 üzenetére
Persze, de attól még a TSMC elvileg jobb órajelben. És volt rá idejük, hogy portolják. Persze attól még lehet, hogy egyszerűen csak 250 wattos lesz az 590 vagy optimalizáltak valahogy a GloFo 14nm-en.
Egy hét múlva kiderül, vagy legalábbis elvileg november 15-én jön az RX 590.
-
Petykemano
veterán
válasz
lezso6 #37337 üzenetére
A 12nm nem is 12nm, hanem 14+ eredetileg. Ez biztos könnyű átmenet.
De tsmc-re átvinni? Azért meglepődnék, ha ennyire könnyű lenne, hogy egy ennyire sokéves terméket megérné. Ha már dolgozni kell vele, áttervezni, akkor már miért nem egy vegát? Vega11? A subor+-ban ott az IP a gddr5-höz.Én inkább két dologra tudnék gondolni:
A 12nm megjelenésekor volt szó arról, hogy az tudna magasabb track height -et. Talán úgy volt, h a 14nm 7.5, v 9 az meg tudna 9 v 10.5-t. A PR esetén még azt is megemlítették, h ez nem váltizott és a lapkaméret se, cserébe több a tranzisztorok közötti holtér, stbOlyat is olvastam már két helyen, h a Vega mobile és a subir is azért keszült 14nm-en, mert az energiatakarékosabb, mint a 12 lowpower esetén
Vagy az lehet, hogy a p30-at teljesítményorientált processzre optimalizáltan készítették, vagy csak simán tovább tolták a TDP-t 210-re.
Vagy még tudodmi? Hogy nem kell spórolni a waeferrel és most már válogathatják a lapkákat és nem szükséges túlfeszelni, hogy minél több működjön a célfrekvencián. A Vega esetén is lehetett magasabb órajeleet elérni alulfeszeléssel.
-
#45185024
törölt tag
Mik ezek az órajelek heló a Vega 56 se megy ennyit.
RX 590
PowerColor 1,576 MHz, 1,645 MHz
XFX 1,580 MHz, 1,680 MHz
Mondjuk az XFXnek örülök mindig jó volt a VRM hűtése!
Gpu Score
Fire Strike Extreme 7350 -
#45185024
törölt tag
válasz
Petykemano #37307 üzenetére
Ezek az AMDs fiúk mindig kitalálnak valamit...
Itt az AMD új konzoljaja nem.
Ps4 PRO revision 7200 -
HSM
félisten
válasz
Petykemano #37330 üzenetére
Hogy praktikusan az elméleti maximumot hozza minden típusból, ami 32bites feldolgozókkal lehetséges.
-
TESCO-Zsömle
titán
válasz
Petykemano #37330 üzenetére
A vízszintes vonalkák hiányából.
-
válasz
füles_ #37328 üzenetére
Nagyon durva, hogy így kimaxolták a SIMD motorokat, mindent is tudnak.
Történelem FP32-höz viszonyítva:
FP64 FP16 INT8 INT4 Tensor
Fermi 1/2 - - - -
Tahiti 1/4 - - - -
Kepler 1/3 - - - -
Hawaii 1/2 - - - -
Maxwell 1/32 - - - -
Fiji 1/16 1x - - -
GP100 1/2 2x - - -
GP102 1/32 1/128 4x - -
Vega 10 1/16 2x - - -
GV100 1/2 2x 4x - 8x FP16
TU102 1/32 2x - - 8x FP16, 16x INT8, 32x INT4
Vega 20 1/2 2x 4x 8x - -
válasz
stratova #37322 üzenetére
Ebben van valami, a Fiji és Vega HBM PHY-je között gyakorlatilag semmi méretbeli különbség nincs, pedig ugye 28 vs 14 nanométer wazze. Ja, hát a PHY már csak ilyen.
De azért lásd azt is, hogy a Polaris 256 bites GDDR5 PHY-je se foglal kevés helyet.
Remélem hamarosan megskalpol egy Vega 20-at is a kedvenc fotósom.
-
válasz
Petykemano #37317 üzenetére
Jajistenem, miért kell két topik?
Na mindegy, köszi, elmentettem, oda írok legközelebb.
-
Petykemano
veterán
válasz
lezso6 #37316 üzenetére
Ott szigorúan csak olyan megbízható forrásból származó konkrét információkat szabad megosztani, amiket egy gyakorlott IT újságíró akár cikkben is publikálhat egy másik portálon.
Illetve van 2-3 hozzáértő, aki bátran megszólalhat, mert olyan szakmai és/vagy háttérinformációkkal rendelkeznek, amelyek megbízhatónak tekinthetők. (Fiery, Balala2007)
(A már rég ismert, vagy ismerhető, hozzáférhető információk helye szintén nem ott van.)Spekulációk, gondolkodások, beszélgetések, kétes eredetű információk itt
-
Ja, az a másik topik.
-
válasz
Petykemano #37311 üzenetére
Én reménykedem, hogy elérik a 2x-et.
Ez is lehetséges, nem lehet csak úgy átvinni bármit egy teljesen másik gyártó gyártósorára gyártani.
Fent írtam, hogy a GloFo 14 nm-hez képest a TSMC 7 nm az 2.92x. Nem mellékesen a GloFo 14 nm-hez képest a TSMC 16 nm az 1.09x kisebb. Hangsúlyozom, ezek HD SRAM-ra vonatkozó skálázódások, szóval nem szabad készpénznek venni.
-
Petykemano
veterán
válasz
lezso6 #37310 üzenetére
Tegyük hozzá:
- ott van apró betűkkel, hogy UPTO 2x. Ezzel együtt az 1.55 harmatos
- Eddig a GF node-ján voltak. most meg eza 7nm TSMC. Itt esetleg lehetséges, hogy erre a node-ra nem tudták alkalmazni a saját lib-jüket?
- Egyébként AT a 16nm-hez képest 70%-os area reductiont ígért. Ehhez képest még a 2x (50%) is kevesebb.Arról egyébként meg is feledkeztünk, hogy ez már TSMC node. Eddig azt hittük, vagy legalábbis nyitott kérdés volt, hogy talán a 14nm gyengébb, mint a TSMC 16nm és ezért alacsonyabb a frekvencia. Ezt igazolni látszott az is, hogy az NV samunál gyártott lapkái GP107 is alacsonyabb frekvenciát ütöttek meg.
De úgy tűnik, hogy hiába a 7nm, és hiába a TSMC, a vega/GCN nem táltosodott meg. -
válasz
stratova #37304 üzenetére
Az a 2x ordas kamu, hisz effektíve csak 1.55x. Remélem a Vega 20 csak extrém redundanciát alkalmaz, s később meglesz a 2x.
Tonga után Polaris esetén 1.76x a tranzisztorsűrűség növekedése, ami azért jobb. Persze ekkor a 14 nm már ténylegesen tömeggyártásba való volt. Fury vs Vega esetén 1.72x.
Másik oldal: GP102 vs GM200: 1.91x. Hoppá. A Pascal-Volta esetén elhanyagolható a különbség (1.01x), a Pascal-Turing összehasonlításakor pedig még picit csökken is a tranzisztorsűrűség (0.96x). Egyébként a Vega és a Pascal tranzisztorsűrűsége megegyezik, századra.
Persze ezeket a számokat fenntartásokkal érdemes kezelni, mert más felépítésű lapkák, nem minden részegységet lehet azonos mértékben leskálázni.
-
Petykemano
veterán
válasz
stratova #37304 üzenetére
50% power a power save módban elég jó (~100W)
Tegyük hozzá még a HBM helyett a GDDR6-ot és megkapjuk 120-150W-ból az 1080 teljesítményű navit. Talán annak mérete se lenne 330mm2.De a 15-25% frekvencia előrelépés elég harmat.
-
#45185024
törölt tag
Itt az Intel új kártyája ja nem
SAPPHIRE Radeon RX 590 NITRO+ Special Edition -
stratova
veterán
válasz
lezso6 #37302 üzenetére
Kissé elnagyoltan elvileg ez a helyzet.
-
A Vega 10 486 mm2, a Vega 20 331 mm2. Ez kicsit csalódás, kb 1.46x kisebb az új Vega.
Ennyi helyet foglalna az, hogy meglegyen az 1/2 FP64? Vagy a 4096 bit HBM interfész ekkora nagy lenne? Vagy?
Utoljára ilyen relatív duplapontosságú teljesítmény a Hawaii-ban volt. Az 438 mm2-be zsúfolt 44 CU-t, míg a Tahiti 352 mm2-be 36 CU-t, itt alig van különbség, főleg hogy a Hawaii frontend és backend terén is duplázott. Persze lehet a turpisság ott is megvan, hogy a Hawaii tranzisztorsűrűsége ugyanazon a 28 nm-es gyártástechnológiával kb 15%-kkal jobb.
Ha ugyanezt nézzük a Vegáknál, akkor 1.55x nagyobb tranzisztorsűrűséget tud a Vega 20, de ezt úgy, hogy 14 nm-ről 7 nm-re ugrott! Ez eléggé kevés, annak tudatában, hogy a wikichipen fellelhető információk alapján a GloFo 14 nm-hez képest a TSMC 7 nm-e HD SRAM cellákkal 2.92x sűrűbb. Ha ennyi nem is, legalább 2x transisztorsűrűség azért elvárható lett volna szerintem.
Remélhetőleg ez jövőre nagyban javulni fog, lehet a kihozatal miatt ilyen "tranzisztorhíg" a Vega 20?
Új hozzászólás Aktív témák
Hirdetés
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az AMD éppen érkező, vagy jövőbeni új grafikus processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva. Architektúra, esélylatolgatás, érdekességek, spekulációk, stb.
- Hálózati / IP kamera
- Elite: Dangerous
- AMD K6-III, és minden ami RETRO - Oldschool tuning
- HiFi műszaki szemmel - sztereó hangrendszerek
- Kerékpárosok, bringások ide!
- Macron betiltatná az EU-ban a közösségi médiát a 15 év alattiaknak
- Megmondták, hogy miért nem kapkodunk új okostelefon után
- ThinkPad (NEM IdeaPad)
- Házimozi haladó szinten
- Térerő gondok, tapasztalatok
- További aktív témák...
- AKCIÓ! ASUS B650M R5 7600X 64GB DDR5 1TB SSD RTX 3080Ti 12GB Be Quiet! Pure Base 500FX ASUS 1000W
- LG 40WP95XP-W - 40" NANO IPS - 5120x2160 5K - 72Hz 5ms - TB 4.0 - HDR - AMD FreeSync
- AKCIÓ! ASRock Z390 i7 8700K 32GB DDR4 500GB SSD RTX 3050 8GB Zalman i3 Edge Seasonic 650W
- Bomba ár! Lenovo X1 Yoga 2nd - i7-7G I 8GB I 256SSD I 14" WQHD Sérült I W11 I CAM I Garancia!
- CarPlay / Android Auto adapter meglévő Android alapú fejegységhez
Állásajánlatok
Cég: PC Trade Systems Kft.
Város: Szeged
Cég: CAMERA-PRO Hungary Kft
Város: Budapest