- Radeon RX 9060 XT: Ezt aztán jól meghúzták
- Atomenergiával dübörögnek tovább az Amazon adatközpontok, SMR-ek is jöhetnek
- Macron betiltatná az EU-ban a közösségi médiát a 15 év alattiaknak
- Az NVIDIA ipari AI-felhőt épít a németeknek, együtt az OpenAI és a Google
- Két új Ryzen közül választhatnak a kézikonzolok
-
PROHARDVER!
A legtöbb kérdésre (igen, talán arra is amit éppen feltenni készülsz) már jó eséllyel megtalálható a válasz valahol a topikban. Mielőtt írnál, lapozz vagy tekerj kicsit visszább, és/vagy használd bátran a keresőt a kérdésed kulcsszavaival!
Új hozzászólás Aktív témák
-
Petykemano
veterán
válasz
S_x96x_S #62298 üzenetére
Egész versenyképes lehetne 400mm2-es GCD-vel és 450W-os TDP-vel.
Az jutott eszembe a Mi300-ról, hogy vajon az most mennyire a határon pörög? És hogy mennyire hamar lehet iterálni.
Mire is gondolok?Vajon a 300-350mm2-es N6-on gyártott lapkák kimaxoltnak számítanak? Összességében a 1700mm2-es alapterületnél nem is lehet tovább terjeszkedni
2020-ban még azt mondták, hogy a Cowos a reticle size (858mm2) 2x-esében tud lapkák összerakásában rendelkezésre állni. [link] a Mi300 ezt ki is használja.
Itt már 6x reticle size-ról írnak, ami valami 5100mm2. [link]
Tartok tőle, hogy a szorzó ugyan helyes, de a reticle size értéknek itt már nem a 858mm2-t, hanem az Abu által emlegetett N3 alatt feles értéket kell érteni. Vagyis összességében kb 2500mm2 lehet majd a csomag.Számomra különös, hogy a 370mm2-esnek mondott alapra csupán 2db 115mm2-es CDNA3 lapkákat vagy 3x71mm2-es CPU lapkákat helyeznek el. Vajon miért csak 210mm2 méretben fedi le? [link] Miért ilyen nagy a differencia? Nem lehet-e a base die méretét jobban kihasználva lefedni?
Az iteráció is egy érdekes kérdés. A CDNA3 esetén az XCD-ről tulajdonképpen minden sallangot leválasztottak, a last level cache és az IO - vagyis azok a részek, amelyeknél gyártástechnológiai skálázódás jelentősen lelassult vagy megállt - is a base die-on kapott helyett. A Logic rész mérete viszont az N3 esetén is még remekül csökkenthető. Logikus volna, hogy mihamarabb N3-on készüljön az XCD, mert úgy még több számolóegységet tudnak rárakni.
-
-
S_x96x_S
addikt
"Making AMD GPUs competitive for LLM inference" ( Aug 9, 2023 )
https://blog.mlc.ai/2023/08/09/Making-AMD-GPUs-competitive-for-LLM-inference
( HN: https://news.ycombinator.com/item?id=37066522 )TL;DR
MLC-LLM makes it possible to compile LLMs and deploy them on AMD GPUs using ROCm with competitive performance. More specifically, AMD Radeon™ RX 7900 XTX gives 80% of the speed of NVIDIA® GeForce RTX™ 4090 and 94% of the speed of NVIDIA® GeForce RTX™ 3090Ti for Llama2-7B/13B. Besides ROCm, our Vulkan support allows us to generalize LLM deployment to other AMD devices, for example, a SteamDeck with an AMD APU.
-
[Special driver for Ratchet and Clank from AMD]
Ratchet & Clank Rift Apart update enables ray tracing on Radeon RX GPUs
-
Abu85
HÁZIGAZDA
válasz
Petykemano #62288 üzenetére
A kiemelt partnereknek, nem az átlag vásárlóknak.
-
válasz
Raymond #62291 üzenetére
Elmentettem a múltkor ezt a videót, hogy majd egyszer bedobom ide [link] Hihetetlen :
azóta is jót röhögök rajta :ahogy elmondja és felvezeti majd tálalja mi jön itt , vérengzés, paks, stb...
Az első 4-5 percben szekunder szégyenérzetem van ez miatt az ember miatt, de nem tudom miért nekem.
Sajnos ezután születnek ezek a kommentek: [link]
[link]
57800 tól érdemes s elolvasni egy olyan 50-60 kommentet
Mlid és társai itt meg alá teszik a lovat sajnos.
Ez miatt van mindig hypevonat mert Nvidia gyalázást és Nvidia gyilkolást várnak, AI szinten is, gamingban is,mindenben is. nem pedig egy jó GPU-t.
Ugye poor Volta, meg Nvidia killer stb.... Erre épül MLiD és RGT pályafutása. Már kezdődik a Chiplet hype... -
S_x96x_S
addikt
válasz
Raymond #62289 üzenetére
> Ez ujdonsag lenne a vasarloknak mert egyelore
> ugy nez ki az iden max az El Capitan-ba n lesz csak MI300 az ev vegeig.valószínüleg a vásárlók típusától is függ ..
mert a magyar nagykerekbe még tényleg nem várnám ..
de az AWS/Azure/Google Cloud -ban már mintaképpen "feltünhet" ..Azért Lisa Su óvatosan optimista volt a befektetők felé,
és bár a tervezett MI300 -as idei bevételek nagy része tényleg El Capitan ( ~ supercomputing ) ; de nem az egész ...
( Persze ha ezek minde előre fizetős ügyfelek az már más tészta )Mindenesetre Q4 Mi300 ramp -ot nagyon nyomja a menedzsment,
de jelentős felfutás csak 2024-ben várható.
Aztán majd meglátjuk mit hoz a valóság,
nem lehetetlen, hogy neked lesz igazad és a szkepticizmus indokolt ..
de akkor az AMD befektetők morcosak lesznek ..--------------
Lisa Su - 1 hetes véleménye - A "Q2 2023 Earnings Call Transcript" -ből szemezgetve:
"
Yes, sure. So, it is a large ramp, Stacy, into the fourth quarter. I think the largest piece of that is the MI300 ramp. But there is also a significant component that's just the EPYC processor ramp with, as I said, the Zen 4 portfolio. In terms of the lumpiness of the revenue and where it goes into 2024. Let me give you kind of a few pieces.
So, I think there was a question earlier about how much of the MI300 revenue was AI centric versus let's call it supercomputing centric. The larger piece is supercomputing, but it's meaningful revenue contribution from AI. As we go into 2024, our expectation is again, let me go back to the customer interest on MI300X is very high. There are a number of customers that are looking to deploy as quickly as possible.
So, we would expect early deployments as we go into the first-half of 2024, and then we would expect more volume in the second-half of '24 as those things fully qualify. So, it is going to be a little bit lumpy as we get through the next few quarters. But our visibility is such that there are multiple customers that are looking to deploy as soon as possible. And we're working very closely with them to do the co-engineering necessary to get them ramped.
--------------And then we will have contribution from both MI300X going to large AI customers as they start their initial ramps, as well as MI250s with a number of customers who have now -- view that as a very good option for some of the workloads that are not necessarily the largest language models or the largest parameters, but let's call it more sort of the other AI workload. So, those are the components of the fourth quarter implied growth. Lots of pieces to it, but clearly a big piece of it is the MI300 ramp.
--------------
And in particular, where we've seen a lot of interest is in the sort of large language model inference. So, MI300X has the highest memory bandwidth, has the highest memory capacity. And if you look at that inference workload, it's actually a very, it's very dependent on those things. That being said, we also believe that we have a very strong value proposition and training as well. When you look across those workloads and the investments that we're making, not just today, but going forward with our next generation MI400 series and so on and so forth, we definitely believe that we have a very competitive and capable hardware roadmap. I think the discussion about AMD, frankly, has always been about the software roadmap, and we do see a bit of a change here on the software side. Number one, we've put a tremendous amount of resource on it. So, bringing together our former Xilinx software team, together with the AMD sort of based software team, we've dramatically increased the resources. And also the focus has now been on sort of optimizing at these higher level models.
So, if you think about the frameworks around PyTorch and Triton and Onyx, I think many of the new AI centric companies are actually optimizing at a different level, and they're working very closely with us. So, in this place where AI is tremendously exciting, I think there will be multiple winners. And we will be first to say that there are multiple winners. But we think our portfolio is actually fairly unique in the sense that we do have CPUs, GPUs, we have the accelerator technology with Ryzen AI on the PC side as well as in the embedded side with our Xilinx portfolio. So, I think it's a pretty broad and capable portfolio.----------------- ( supply chain )
Yes, absolutely. So, I'm not going to comment on the exact units, but what I will say is that we've been focused on the supply chain for MI300 for quite some time. It is tight. There's no question that it's tight in the industry. However, we have sort of commitments for significant capacity across the entire supply chain. So, co-host is one piece of it, high bandwidth memory is another piece of it and then just the general capacity requirements and look, our goal is to make this a significant growth driver for AMD, I think it's a great market opportunity. We love the engagements with customers, it's our responsibility to provide the supply for the demand and so that's what we've been working on.
-----------------
Sure. So, there were a lot of aspects to that question, Chris. So, let me try to give you some framework here. I don't think we're ready to talk about timing yet of revenue numbers. What we will say is we do believe it's a multibillion dollar opportunity. I think 2024 is a very important year for us.
Ramping MI300 in multiple customers over the next several quarters is very important. I think I mentioned earlier in the Q&A that the customer interest is actually diverse, which is great. It includes sort of what you would expect in terms of the large Tier-1 hyperscalers. But I think these new class of sort of AI focused companies have been working very closely with us, and then some of the large enterprises are also looking at ramping up their efforts. The performance that we see is strong. I think the large language model work that we've done, we've done a lot of it on MI250, and we've seen very good results that's on both training as well as inference. I think as we go through MI300 again, the early results are strong.
For AI applications, what we're seeing now is MI300X. So, let's call it the GPU only version is the one that is sort of most prevalent in the AI customer engagement. But the MI300A, actually, which is sort of where we have the CPU and the GPU more closely coupled together is also of interest. So, I think the key is I think we've built a platform that does allow people to kind of choose what is best for the models and for the workloads that they're trying to enable. And that's what we're working on.---------------
Yes, thanks Chris. Let me just make sure I get the statement clear. So, both MI300A and MI300X will be part of the ramp, particularly in the fourth quarter. And as we go into next year for the AI specific applications, we are more heavily weighted towards MI300X, just given sort of where the software is written. And to your question about gross margins at the corporate level, so we would expect that our AI business will be accretive to gross margins at the corporate level. And obviously, as you start the ramp, there's a little bit of learning, but overall we expect it to be accretive to our corporate gross margins.
"
( via "Advanced Micro Devices (AMD) Q2 2023 Earnings Call Transcript" )------------------------
-
Raymond
titán
válasz
Petykemano #62290 üzenetére
"RDNA5 2025Q4!!!! Ez döbbenet."
RGT, a MLiD unokatestvere/bajtarsa
Eloszor az RDNA3 maradekat kene kiadni utanna megnezni mikorra sikerul az RDNA4 es aztan lehet arrol spekulalni hogy az akkori allas szerint mi a realisztikus egy RDNA5-nel.
-
Petykemano
veterán
Azt mondja, hogy a N43 és N44 monolitikusak. Ez még az RDNA3 chipletezéshez képest is visszalépést jelent. (Ez persze nem biztos, hogy rossz ezekre a lapkákra nézve)
Azt gondolnám, hogy ha az RDNA3 folytatásához hasonló a GCD feldarabolásán alapuló multi-GCD chipletezéssel próbálkoztak volna, akkor legrosszabb esetben is az RDNA3 esetén is látott megoldáshoz fallbackelnének.
Ha a megmaradt lapkák valóban monolitikusak lesznek, akkor gyanítható, hogy valami egész más nem sikerült.RDNA5 2025Q4!!!! Ez döbbenet.
Ami miatt írom az mégsem ez, hanem egy állítólagos 400mm2-es RDNA3 (Navi36) lapka megemlítése - persze sajnos azzal a megjegyzéssel, hogy ennek kiadása valószínűtlen. Lehet, hogy az AMD-s urak erről beszéltek, mint 600W-os GPU. De lehet, hogy ez is csupán egy olyan dolog, hogy megemlítek valamit, azzal, hogy az nem fog megjelenni és aztán amikor tényleg nem jelenik meg, akkor jutott is - maradt is alapon nem lehet engem felelősségre vonni.
-
Raymond
titán
válasz
Petykemano #62288 üzenetére
"Ez azt mondja, hogy Mi300-at szállítják a vásáróknak."
Ez ujdonsag lenne a vasarloknak mert egyelore ugy nez ki az iden max az El Capitan-ba n lesz csak MI300 az ev vegeig. -
Petykemano
veterán
Itt egy értekezés pont az iménti "chiplet / nem chiplet / meddig nem chiplet" témában: [link]
(Ez azt mondja, hogy Mi300-at szállítják a vásáróknak.)
-
Petykemano
veterán
válasz
Busterftw #62285 üzenetére
Yanis Varoufakis egy időben úgy kritizálta az Európai Uniót érő "demokrácia-deficit" kritikát, hogy az olyan, mintha azt mondanánk, hogy a Holdon oxigén-deficites a légkör. A Holdon valójában nincs oxigén.
Valahogy így van a kapcsolat monopólium és a verseny (versenyellenesség) tekintetében is. A monopóliumra azért nem lehet azt mondani, hogy az versenyellenes, mert a monopólium valójában a verseny hiányát jelenti.
-
Busterftw
nagyúr
válasz
S_x96x_S #62283 üzenetére
"Nem pontosan értelek .. miért ne jelentene ?"
Ugy ertem, hogy az AI gyorsitok sikere nem jelenti automatikusan azt, hogy consumer gpu piacon is sikert ernek el. Ugyan GPU, de ez egy teljesen mas szegmens. (lasd Epyc/Ryzen siker/pelda)Jo lora tettek az Epyc-kel, mostanra sikeres a szerver uzletag, viszont ettol az AMD nem lett jobb pozicioban GPU vonalon (consumer).
"de a monopólium verseny ellenes .."
Ha jol tudom ez jogilag nem igy van, a monopolium onmagaban nem versenyellenes, csak ha visszaelnek vele. -
S_x96x_S
addikt
(piac)
azért mások is gondolkodnak chiplet cloud-ban
és az AMD-nek igencsak szüksége lesz a Xilinx -es gyorsítók beintegrálására
hogyha versenyben akar maradni ...
mert csak a GPU nem mindenre optimális ( főleg ha a TCO-t is nézzük. )---------------
CHIPLET CLOUD CAN BRING THE COST OF LLMS WAY DOWN
(July 12, 2023)
https://www.nextplatform.com/2023/07/12/microsofts-chiplet-cloud-to-bring-the-cost-of-llms-way-down/
"If Nvidia and AMD are licking their lips thinking about all of the GPUs they can sell to the hyperscalers and cloud builders to support their huge aspirations in generative AI – particularly when it comes to the OpenAI GPT large language model that is the centerpiece of all of the company’s future software and services – they had better think again.
..... "
-
S_x96x_S
addikt
válasz
Busterftw #62280 üzenetére
> Csak ugye b. gpu-król beszél, gpu találgatósban.
> Ha az AI bejön az AMD-nek még nem jelent semmit.Nem pontosan értelek .. miért ne jelentene ?
A GPU már nem csak a gaming -ről szól ..
még az "NVIDIA H100 Tensor Core GPU" is GPU,
ugyanazok az építőelemek .. az AI-nál és a GPU-nál
az MI300 lényegében egy big APU .. És a Grace is az.persze kezd ketté válni .. ahogy az AMD- is szétszedte CDNA - RDNA -ra.
de még mindig GPU : "AMD Instinct is AMD's brand of professional GPUs"> Szóval értem en a lelkesedést , de fordítottan is igaz a corporate strategic blindness.
persze ez fordítva is igaz.
Az AMD a szoftvert és az ökoszisztémát nézte be .
Az nVidiának a CUDA bejött .. 100% - ban odatették a fókuszt és az erőforrást ..
és bár az AMD-nek volt pár kisérletezése és prototípusa, de nem annyira tette oda magát ..
és most meg kell küzdenie ezzel - be kell hozni a hátrányt - ami nem olyan könnyű ..És nem csak az AMD-nek,
hanem a piacnak is, mert a verseny jó - de a monopólium verseny ellenes ..--> NVIDIA's CUDA Monopoly
és a mai Hacker news - ahol ezt a témát járják körbe - érdemes beleolvasni !
--> https://news.ycombinator.com/item?id=37031451 -
Busterftw
nagyúr
válasz
S_x96x_S #62279 üzenetére
Csak ugye b. gpu-król beszél, gpu találgatósban.
Ha az AI bejön az AMD-nek még nem jelent semmit.Az Epyc és a Ryzen is bejött nekik, mégsincs az Nvidia gpu piacon a visszapillantó tükörben, ahogy az Intel sem a CPU piacon.
Az AMD ezzel szemben az Epyc és Ryzen sikerei után egyre jobban lecsúszott a GPU piacon.Szóval értem en a lelkesedést , de fordítottan is igaz a corporate strategic blindness.
-
S_x96x_S
addikt
> a világ legsikeresebb GPu gyártójaként nem láthatta gondolod?[link]
> Szerencséjük volt?ez nem érv ..
a múltbéli siker "sose" garancia a jövőbeli sikerre ..
és létezik szervezeti vakság is .. ( ~ corporate strategic blindness )a KODAK
és a NOKIA is látta a trendet , csak nem hitte azt, hogy veszélyes és utána kapkodtak és rossz döntéseket hoztak.> nekem kissér fura, alulról nézve felfele állítjátok be vesztesnek Nvidiát, elmaradottnak,
> és lúzernek a fejlesztések szintjén.Nyugi, még nem vesztes és nem lúzer.
de ha az AMD-nek a chiplet bejön AI és GPU - fronton is ... akkor már az AMD nem a visszapillantó tükörben lesz.
Az AMD 100%-ban odatette magát a chipletre .. már-már vallásosan ..Vagyis az nVidiáért (is) aggódunk páran, mert a verseny jó
-
HSM
félisten
Nagyjából ezt számolgattam ki én is [link] .
(Nem láttam még a videót, amikor ezeket számolgattam.)
Egyébként, a mostani wafer-árakon az AD103 szerintem eléggé eltalált lett.
A 4090 óriás csip méretét kicsit meredeknek látom még a sok tiltás mellett is, de ettől függetlenül az is nyilván igen jó lett, bár megnéztem volna a bolti árát az eredetileg belengetett közel 20 000$-os 5nm wafer árakon. -
A architektúra tervezését igen, biztos évekkel előre elvégzik, de a gyártásra tervezésnél az árazassál már tisztában kell lenniük.
Azért olyan nagy eltérés nincs a megjósolható árazásban hisz például a 3 nm már most is elérhető árajánlattal, az Apple használja ezerrel, már 2020 ban lefoglalta , 2 év múlva is elérhető lesz mire az Ada next piacra kerül ez így volt az 5 nm gyártással is.Ez egy nem rossz kis videó matekról., igaz nagyon leegyszerűsítve. [link]
Minkét architektúra 5 nm gyártáson készült és AMD nek kiegészítve 6 nm gyártással azaz egy olcsóbb gyártással és még így is állítólag közel annyi a Navi 31( 140-160$ + interposer és csomagolási költség hozzáadódik ehhez, kb 200$) az egészhez a monolitikus dizájnnal szemben.
És ne elejtsük el hogy a csúcs navi 31 a 4080 nal versenyez ami AD103@ 309 mm2 teljes értékű AD102( 4090TI) közel 45 % kal gyorsabb lehetne , mint a Navi 31...
Kepler és nerdtech szerint a 7900XTX teljes előállítási költsége 4-500$ [link] az RTX 4080 költsége 300-350$[link]
ha egy csúcs AD102 ( nem a 4090) 5-600 dollár és közben ennyivel gyorsabb akkor a matek jó volt még akkor is ha a Navi 31 4090 sebességű lett volna ,mert cserébe nem tartalmaz kockázatot, kísérleti státuszt.
Ha jól néztem a Navi 31 533 mm2 az AD102( 4090) 609mm2 és le van tiltva egy csomó részegység és az L2 egy része a 4090-ben -
hahakocka
őstag
Gondolom emlèkeztek a Rx 480 vs Rx 580 esetre is. De lehetne mèg sok más âtnevezèses esetet mondani. A marketingben lehet az lesz oda is van írva se valójàban kb egy àtnevezès a az addig kiadott Rdna3 újdonsàgok jó rèsze se jellemzi ki van spóroltatva. Le van butítva ahogy HSM is írta.
-
HSM
félisten
Az architektúra alapjainak sokszor előbb kell készen lennie, mint ahogy elérhető lenne a gyártástechnológia, hát még annak árazása... Szóval kötve hiszem, hogy amikor elkezdték tervezni az Ada-t, akkor már tudták volna, mennyibe fog kerülni az 5nm-es gyártás.
Érdekesség egyébként, hogy párszor előfordult a történelemben, hogy az Nv-nél megbosszulta magát, hogy ki akarták maxolni a gyártástechnológiát. Gondolok itt a GTX280-ra és a GTX480-ra, mindkettőnél túllőtek a célon, amivel igen kellemes piaci helyzetbe hozták a konkurens HD4870 és HD5870 kártyákat."az RDNA1 architektúrájában"
Abban nem. De az RDNA2-ben igen. (L3 beépítése az L2 növelése helyett.)"hogy TSMC kb mekkora árazást ad a wafferre hisz ez nem napi árfolyam"
Nem hinném, hogy bármelyikünk ebbe belelátna, de a pletykált, rendkívül alacsony Wafer-árak szinte biztosan nem jöhettek volna létre az előre nehezen jósolható meredek kereslet (és ebből fakadóan gyártósor kihasználtság) csökkenés nélkül. -
Komplikato
veterán
Azért Linus videója a témában eléggé odavert pár hete, pedig hát ő ugye nem annyira hardcore HW szakértő, főleg NEM PC ügyileg, mint szeretné elhitetni magáról. Az AI vitában nem látom visszaköszönni, hogy NVidia AI kutatásokra mennyit költ és ennek mennyi rengeteg eredménye van. Ilyen hülyeségeket kell olvasni szakmai fórumokban is, hogy az Nvidia "felült" az AI hype-ra, mert most az a menő. Mint ha közük se lenne hozzá. A 2 minutes papper csatornán bemutatott AI technológiák nagyobbik fele mind NV kutatási téma és vagy szoftver fejlesztés. Na és én ezt a felét hiányolom AMD oldaláról, nyilván ott is folynak kutatások, de úgy látszik kivűlről nincsenek ennyire mélyen benne.
-
Igen azért írtam ,hogy az Ada next ami majd jönni fog 2025 ben lesz a Chiplet elötti utolsó gen, mint az RDNA 2 volt AMD nél.
Az ár a 4090 vs 7900XTX miatt jött szóba , legalább is HSM szerintem erre gondolt.
A chipletnél Nvidánál a hűthetőség és az összeköttetés/ tokozás miatt írták anno, hogy halasztanak, meg ha jól tudom azon variálnak hogy bontsák/ kössék össze a szegmenseket, melyik okoz kevesebb késleltetést és kerül kevesebb energiába.Komplikato: Igen ,ők formálják a piacot a szoftverezettséggel a hardveriekhez így is lehet fogalmazni és ez fordítva is igaz.
-
Abu85
HÁZIGAZDA
Az RDNA 2-ben volt nyoma annak, hogy chiplet lesz, mert ugye a problémát az jelenti a chipletnél, hogy nem tudod hol jól megvágni a GPU-t. Ehhez kellett egy victim cache, hogy szeletelhető legyen a dizájn.
Nem az árral van baj, hanem azzal, hogy a 3 nm-es node esetében a reticle limit nagyon picike. Mindössze 429 mm^2. Tehát ennél nagyobb lapkát nem lehet tervezni. Mondjuk ettől még lehet monolitikus az NV-féle next-gen, csak nem tudják, hogy az AMD mit fog csinálni. Valószínű, hogy az NV is chipletben gondolkodik, mert egyszerűen túl szűkös a friss limit. Az MCM chipletet egyébként meg lehet oldani egyben is. Nem muszáj ám három részletben bevezetni, mint ahogy az AMD teszi. Utóbbi csak biztonságos, mert annyi helyen félremehet, hogy aztán a jó ég tudja, hogy hol a bug, de amúgy technikailag kivitelezhető egyben megcsinálni mindent.
-
Petykemano
veterán
Én hajlamos lennék elhinni azt, hogy az ilyen - sikeres - cégek vezetőinek valóban magasfokú az előrelátása. Persze azért ugye tudjuk, hogy az évtizeteken keresztül sikeres politikusok nem csak annak köszönhetik sikereiket, hogy csupán remekül tapogatják le a néplelket, hanem megfogják és agyagként formálják is azt.
Azt nem bírom (akkor lóg ki a lóláb), amikor meg valamilyen PR szempontból "kellemetlen" dolog történik, akkor elkezdenek takarózni váratlan és/vagy kiszámíthatatlan piaci folyamatokkal.
Máskülönban azzal - sajnos - egyet kell értsek, hogy valószínű, hogy az Nvidia nem azért nem hozott még piacra chipletes terméket, mert nagyon le vannak maradva ennek a területnek a kutatás-fejlesztésével. Több alkalommal előfordult már (pl tesszeláció, HBM, gyártástechnológia), hogy az Nvidia valamivel látszólag később rukkolt elő, de amikor az megtörtént, az nagyon profin történt és megsemmisítőleg hatott az azt megelőző évek arra irányuló érvelésére nézve, hogy az AMD azért volna valamilyen vonatkozásban előnyben, mert már X generáció óta termék formájában ki is adják.
Ha esetleg tudsz olyat mondani, ahol az látszott, hogy az Nvidia kapkodott, vagy tapasztalatlanság miatt bukdácsolt és az AMD képes volt néhány éves előnyét megtartani, akkor kiváncsi vagyok rá.
Én nem gondolom, hogy az Nvidia ne folytatna kutatás-fejlesztést ebben a témában. Csak nem jelentetnek meg belőle terméket. Nem feltétlenül azért, mert még sehogy se állnak, hanem talán azért, mert nem szorulnak rá arra, hogy egy megoldást a nagyközönséggel béta-teszteljenek, vagy épp azért, mert van erőforrásuk párhuzamosan futtatni többféle fejlesztést. Másként fogalmazva, lehet, hogy az Nvidiának volt - chipletes - B terve arra nézve, ha nem így alakulnak a wafer árak. Másként fogalmazva: Jensen nem látnok, csak rendelkezésére állnak az ahhoz szükséges erőforrások, hogy többféle szcenárióra is felkészüljön.
Tartok tőle, hogy benne van az a lehetőség, hogy ugyanez fog történni a chiplettel is: hogy amikor az nvidia megjelenteti a saját megoldását, akkor az addig többéves előnynek tűnő AMD erőfeszítés hirtelen más megvilágításba kerülve többéves értelmetlen és kézzelfogható hasznot nem hajtó szerencsétlenkedésnek (pionírkodásnak) fog tűnni.
-
Én nem írtam olyat hogy tudták az 5nm árazását sehol előre,de abban biztos lehetsz hogy mielött egy architektúrát el kezdenek fejleszteni egy gyártásra akkor már lekötik bizonyos feltételekkel az árazást. ( előrendelt mennyiség, kötbér, előleg befizetés stb) Én teljesen más területen ,de ebben dolgozom és ez nálunk is így megy.
Amúgy szó volt arról hoyg Nvidiának van egy B terve arra hogy a MCM dizájnt hoz az RDNA ellen a csúcsra, de aztán Jensen eltörölte. Itt volt róla szó:[link]Miért kellene hogy nyoma legyen? az RDNA1 architektúrájában volt nyom arra hogy az RDNA3 chiplet lesz ?
Az Ada2 is monolitikus lesz még.2027 kb amikor jön geforce szintre.
Az Nvidia ütemterve szerint előszőr a professzionális szintre hozzák be az MCM vonalat, meg kisebb autó gyártás, 5 G Mediatek, stb.
Szerintem tökéletesen tisztában voltak azzal mindkét cégnél, hogy TSMC kb mekkora árazást ad a wafferre hisz ez nem napi árfolyam előre megegyeznek, nem ma kezdték. Egy termék ára tól-ig van meghatározva valószínűleg. -
HSM
félisten
Nem állítottam be őket vesztesként. Csupán azt próbáltam kiemelni, hogy az érvelésed gyenge lábakon áll, hiszen nem tudhatta senki előre, hogyan fog alakulni az 5nm árazása. Így "vakon" bevállalni egy 600mm²-es csipet a megjelenésekor brutálisan drága 5nm-en minimum bátor húzás volt.
Illetve, amire utaltam még, hogy játékos felhasználású GPU-ból az AMD már lerakott az asztalra egy alapvetően igen jól működő, konkrét megvalósítást, míg az Nv Ada architektúrájában semmi nyoma, hogy akár csak elmozdultak volna MCM irányba.
-
a világ legsikeresebb GPu gyártójaként nem láthatta gondolod?[link]
Szerencséjük volt?Az a óriás GPU energiahatékonyabb és olcsóbban gyártható minta 7900XTX :
Amúgy már a Volta a GV 100 ban is évekkel ezelött már speciális fabric interfészt használtak.
Abu cikke 2017 ből : [link]
Nvidia MCM : [link]nekem kissér fura, alulról nézve felfele állítjátok be vesztesnek Nvidiát, elmaradottnak, és lúzernek a fejlesztések szintjén. Ilyenkor kicsit értetlenül állok, hogy ugyan abban a moziban ülünk e, mert szerintem nem.
-
-
HSM
félisten
válasz
Petykemano #62231 üzenetére
3-3.5Ghz-el, és kicsit ügyesebb driverrel bőven ~40%-al erősebb lenne, ami a mostani CU-számmal is igencsak versenyképes lehetne.
Nem is elrugaszkodott szám ez, hiszen a jobb Navi21-ek már 7nm-en súrolták a 3Ghz-et.
Az is érdekes adalék, hogy a CU órajel tartománya el lett választva a GPU többi részéről. Ez utalhat arra is, hogy arra számítottak, hogy a CU-kat sikerült ezáltal magasabb órajelen járatni, de a gyakorlatban ez fordítva sült el, a 7900XTX gyári front-end órajele 2.5Ghz lett, míg a shader órajel csak 2.3Ghz.
Nagyon érdekes még amit itt írnak: [link] ("Frontend Clock Behavior" rész) . Jól látszik a grafikonon, hogy alacsony órajelen egyforma órajelen járatja a 7900 is a frontend/shader tömböt (itt hirtelen nem a frontend a limit?!
), de nagyobb órajelen "lemaradnak" a shaderek... A "hivatalos" magyarázat számomra kevéssé meggyőző, főleg shaderből implementált RT-vel.
#62233 b.: "Jensen több éve már azt mondta hogy 3 nm gyártás felett és megfelelő tokozás hiányában nem érdemes Chipletes GPU -ban gondolkodni. Igaza volt."
Persze, ő mindenki előtt látta, hogyan fog alakulni a kereslet/kínálat (=árazás) a modern gyártástechnológiákon. Ez is kevéssé hihető.Sokkal inkább szerecséje volt, hogy igen hamar olcsó lett az 5nm, így az AMD nem tudta kihasználni a chipletezésből származó előnyöket a Navi31-32-nél, és így az Nv büntetlenül gyárthat ormótlan nagy 5nm GPU-kat, mint pl. a 4090-esé, 609 mm²-el. Volt, amikor nem jött be ez a taktika, abból lettek pl. a Fermi-s mémek, mint pl. ez a gyöngyszem: [link] .
"Azt gondlom az Nvidia első chipletes GPu -i már rég tervező asztalon megszülettek"
Azért ide némi adalék, hogy míg a Navi31 esetén már a memória-alrendszer jelentős részét sikeresen leválasztották az L3-al együtt, addig Nv-nél az L2 növelésével éppen a GPU "növekedett" méginkább. Ez nem tűnik a chiplet felé való lépkedésnek...#62262 Busterftw : Jelentős butítást kapott, hiába RDNA3, nem kapta meg a nagyobb modellek másfélszer akkora regiszterét a CU, hanem maradt az RDNA2-es méretnél....
-
PuMbA
titán
válasz
hahakocka #62261 üzenetére
RDNA3 kártya
Az, hogy a cache mérete kisebb, nem változtatja meg az architektúrát, sem a chiplet, hiszen ugyanazok az egységek vannak benne, csak fizikailag más helyen. A chiplet minimálisan még csökkenti is a teljesítményt, ezt kimérte a Chips and cheese, mert van egy felesleges interfészed, ami növeli a késleltetést.
-
hahakocka
őstag
7600 as nem igazi RDNA 3 kártya nem chipletes egy csomó dolog kiherélt benne kb egy 6670xt.
7900xt-7900xtx meg most majd az új karik (7700-7800) azok amik igazán számítanak szerintem RDNA3 kapcsán. Ott pedig 30W difi van meg, sokkal több ram (+8gb), olcsóbb ár, jó sokféle jó hűtés, jobb raszter, és 20% al rosszabb RT. 4090 től vannak igazán lemaradva de az akkora fizikailag túlzással mint Paks és fogyasztás sokszor 500W, dupla ár s így hoz 30-40% ot + nem egy kateg.
Ha bukó lesz a 7700-7800 azt viszont megfogják érezni Lisáék. -
S_x96x_S
addikt
> Ha jól tudom a hardveres költség mellett a szoftveres háttér jobban számít a
> megrendelőknek.azért pár dolog már most is működik. pl. PyTorch
és remélhetőleg az AMD még nagyobb fókuszt tesz a szoftverre ..."""
With PyTorch 2.0 and ROCm 5.4+, LLM training works out of the box on AMD MI250 accelerators with zero code changes when running our LLM Foundry training stack.Some highlights:
- LLM training was stable. With our highly deterministic LLM Foundry training stack, training an MPT-1B LLM model on AMD MI250 vs. NVIDIA A100 produced nearly identical loss curves when starting from the same checkpoint. We were even able to switch back and forth between AMD and NVIDIA in a single training run!
- Performance was competitive with our existing A100 systems. We profiled training throughput of MPT models from 1B to 13B parameters and found that the per-GPU throughput of MI250 was within 80% of the A100-40GB and within 73% of the A100-80GB. We expect this gap will close as AMD software improves.
- It all just works. No code changes were needed.
"""
https://www.mosaicml.com/blog/amd-mi250 -
Abu85
HÁZIGAZDA
válasz
Busterftw #62255 üzenetére
Árban drágább csak Instinct MI300A-t venni, mint EPYC+gyorsítót, viszont nem a hardver ára a lényeges a cégeknek, mert az valójában a teljes beruházási költség nem túl nagy része. Amiben erős az MI300A, az a jobb fogyasztás és AI-hoz sokkal jobban illő felépítés. Tehát a TCO-ban már gyorsan visszahozza a hardver az árát, és egy éves távon már az MI300A az olcsóbb. Tehát ha legalább egy évig megtartja a vásárló a hardvert, akkor jobban megéri MI300A-t venni, mint EPYC+gyorsítót.
Alapvetően ez az a két dolog, ami miatt most rácuppant a piac az MI300-ra. Az MI300X-nél a memóriakapacitás a kulcs, míg az MI300A-nál a TCO, meg az a tény, hogy APU-ról van szó.
#62256 b. : Nyilván az MI300A nagy előnye, hogy nem kell átírni a szoftvereket ARM-ra. De ez csak ideiglenes előny, idővel, teszem azt úgy 3-4 éves távon elvész. Az NV-nél a Grace+Hopper ennek az iránynak a nulladik generációja. Ez a bevezető, hogy elkezdődjenek a szoftveres munkálatok.
-
válasz
S_x96x_S #62252 üzenetére
Csak ez ugye kapható, nvidia meg bejelenti most a H2000 at holnap a SIGGRAPH -on és egyéb dolgokat.[link]
Ha jól tudom a hardveres költség mellett a szoftveres háttér jobban számít a megrendelőknek.
Annyira nagyok a megrendelések, hogy egy növekvő piacon kell is a több versenyképes gyártó és termék szerintem. -
Busterftw
nagyúr
Rick bacsi mondta, AMD EVP egy adott interju soran:
Es ugyan van 500-600W 4090 BIOS, de a legtobb 450W, jatek alatt pedig ennel is kevesebbet fogyaszt (TPU atlaga 420W), az UV potencial pedig remek. (itteni topikbol egy pelda)
"87% powerlimit, +120mhz, igy 3030, 3045 mhz ingame, 360w korul megall god of war kozben 4k 117 fps mellett."
Szoval cseppet sem ertem Rick bacsi hebegeset a 600W-rol. -
Abu85
HÁZIGAZDA
válasz
S_x96x_S #62252 üzenetére
Igen, de az AMD azért vár ettől többet, mert az MI300 az nem csak gyorsító, hanem APU. És egy csomó cég számára sokkal egyszerűbb lesz EPYC+gyorsító helyett MI300-at rendelni, tehát nem is kell majd gyorsítóban gondolkodniuk. Így könnyű több pénzt várni az EPYC-hez viszonyítva, mert a MI300 nem csak gyorsító.
A MI300X pedig azért kapós, mert van rajta 192 GB memória. Egyszerűen baromira megéri ugrani rá bármiről, mert ennyi memóriával sokkal olcsóbb lehet az üzemeltetés. De ez ugyanúgy áll majd mindenre, ha az NV hoz valamit mondjuk 384 GB memóriával, akkor arra is ugrik majd mindenki, és ha az AMD hoz valamit 512 GB-tal, akkor arra is. Minden ilyen lépés csökkenti az üzemeltetési költségeket. Tehát egy hardverváltást záros határidőn belül ki lehet termelni.
-
S_x96x_S
addikt
-
Abu85
HÁZIGAZDA
Igazából a chiplet mindenképpen kell mindenkinek. Aki top GPU-ban gondolkodik, muszáj chiplettel összeraknia. Már nincs választási lehetőség 3 nm-en és alatta. Az 4/5 nm volt az utolsó node, ahol tervezhető volt relatíve nagy kiterjedésű lapka. Ma még ez választás kérdése volt, holnap már kötelező a chiplet.
-
Petykemano
veterán
válasz
Yutani #62241 üzenetére
"a chipletezés nem tart itt, hogy két közepes die-ból kiállítson egy felső kategóriás terméket"
Nem vagyok chiptervező. De számomra - elképzelve - nehezebb feladatnak tűnik (szoftveres támogatás nélkül) megoldani, hogy két külön-külön is teljesértékű chip úgy működjön együtt, mintha ők mindig egy összetartozó egység lennének.Nem annyira a Shader Engine, hanem sokkal inkább a központi egységek összehangolása, a közöttük való kommunikáció és adat-és különösen a feladat megosztás megoldása kérdéses számomra.
Abban egészen biztos vagyok, hogy ez nem tudna úgy működni, mint a Zen chipletek esetén, hogy szubsztráton keresztül valamilyen relatív vékony csatornán kötik össze a chipleteket. Ezt a Mi250 és az Apple M1 Ultra (Fusion) esetén is brutálisan széles interconnect oldja meg. (Mindazonáltal tudomásom szerint a Mi250 nem is látszódik 1 GPU-nak.)
Ezért nekem könnyebben kivitelezhetőnek tűnik egy olyan bontás, hogy központi egységet tartják egyben és a Shader Engine-eket választják le.
Így csak 1 db Shader Engine chipletet kéne gyártani és ezek számával, valamint a központi egység méretével lenne skálázható. Persze gyanítom, hogy a központi egység és a SE között is borzalmas sávszélességre lenne szükség.Ezt nem biztos, hogy meg lehet vagy érdemes valósítani olyan 2.5D csatlakozókkal, mint amit a Navi31 és Navi32 esetén láttunk. Életképesnek egy a Mi300 esetén is látott 3D megoldást látnék, ahol a base Die egy pl N6-on gyártott lapka, ami tartalmazza a központi egységet, parancsprocesszort, L2$-t , valamint az IO-t és a fixfunkciós egységeket, továbbá 2.5D csatlakozókat a széleken található szintén külön gyártott, infinity cache-t tartalmazó MCD-khez.
És ennek a base die-nak a tetejére vannak integrálva a V-cache-nél látott 3D tokozásos (vagy ahogy a Mi300-nál is láttuk) módszerrel a compute lapkák.
A Base Die-ban az L2$ mérete és a parancsprocesszor képességei nyilván skálázhatók bizonyos mértékben.Látjuk, hogy ez működik a Mi300-nál is.
Az persze elképzelhető, hogy egy ilyen tokozással készülő lapka most még vagy drágább, vagy ha minden figyelembeveszünk , nem is feltétlenül drágább, de kisebb volumenben állítható elő, mint egy "monolitikus" GCD. Viszont ez az elképzelés tulajdonképpen visszafelé kompatibilis maradhat azzal, ahogy most összerakják az RDNA3-at. Tehát a kurrens MCD-k akár fel is használhatók.Mi van, ha nem azért kaszálták el a nagyobb RDNA sku-kat (lapkákat), mert nem sikerült összerakni a multi-GCD GPU-t, hanem mert sikerült összerakni a Mi300-hoz hasonló módszerrel és annak fényében már nem is lenne érdemes kiadni azokat, viszont a kisebb RDNA4 lapkák esetén meg nem érné még (költség vagy volumen miatt) meg ezt a módszert bevetni?
Ha ez így is van, akkor is valószínű, hogy ez már nem RDNA4 lesz. Ha emlékszel, a Polaris esetén is volt pletyka egy nagyobb Polaris lapkáról, amit végül elengedtek, mert "mindjárt" itt a Vega.
-
PuMbA
titán
-
-
PuMbA
titán
válasz
Busterftw #62246 üzenetére
Az a baj, hogy az AMD az alsó és közép kategóriában akar versenyezni, de a most kijött 40 játékot tartalmazó RX7600 vs RTX4060 Hardware Unboxed tesztben az látszik, hogy az AMD raszterben egál, RT-ben jóval lassabb és többet fogyaszt, miközben közel azonos áron vannak a boltokban. Eltűnt az AMD előnye, ami az előző generációban még ott volt az RX6600 vs RTX3050 személyében.
-
Busterftw
nagyúr
válasz
Yutani #62241 üzenetére
AMD ugye azt nyilatkozta, hogy hozhattak volna 4090 ellen valamit, de inkabb az "energiatakarekos" termekeken volt a fokusz RDNA3 eseteben.
Ami erdekes, mert amikor Nvidia a rosszabb node miatt (Samsung) Amperenel kenytelen volt jobban huzni a kartyait, siman megtettek annak erdekeben hogy a piaci elsoseg megmaradjon.
Most az AMD ezt sem tudja kihasznalni, mert az Nvidia vegre nem csoroskodott a gyartas technologian. Kerdes az AMD miert nem tette most meg ugyanezt, a valasztott node azert nem gyenge.Ennyire nem akartak az uj csatlakozot, vagy ennyire rosszul skalazodik az RDNA3?
-
Busterftw
nagyúr
Illetve en azt realisabbnak tartom, hogy amiatt nem lesz xx90 SKU, mert nem fog az AMD ellen kelleni, eleg lesz a xx80, mintsem azert, mert a technologia korlatozza oket.
Mar csak azert sem, mert ez a gen megmutatta, ugy csusztatjak a szamokat ahogy akarjak.
Sajat velemeny, de nekem a regi xx80 es xx80ti felso hatar jobban tetsztett.
-
válasz
S_x96x_S #62236 üzenetére
Ezért lépnek majd 3 nm nél Chipletre, mindenki arra lép....MCM a professzionális vonalra először, majd később Geforce vonalon.
Ha az Ada next tényleg annyira jó lesz, mint ahogy rebesgetik, akkor igazából 2027 amikor ki kell jönniük az első Chipletes Geforce kártyáknak addigra már lemegy 2 generáció professzionális vonalra lehozott chipletes kártya gen.
Intel ott lesz kiszolgálni őket addigra szerintem ismét jók lesznek gyártástechnológiában.
Ha megnézed amit írnak, pont ezt írtam én is feljebb Amd stratégiájára. Egyszerűen a középkategória lesz a kifizetődő.
Feltételezve, hogy igazak a pletykák mindkét cégre:Az Ada next állítólag az egyik legnagyobb előrelépés lesz, de vegyünk 40 % előrelépést a mostani genhez.( de 50 % fölötti a pletyka)
Nvidia nem ad ki Titant mert minek.
Ha kiadna akkor kb 40 % kal erősebb lenne a csúcs NV mint a csúcs RDNA3. ( tegyük fel AMD nek is lenne lehetősége lépni még maxra húzott fogyasztással, legyen 30 %)
A Következő genre akkor ez kb 70- 80% lenne a 7900XTX hez nézve, annyit kellene hoznia a 8900XTX nek. a csúcson. -
válasz
S_x96x_S #62236 üzenetére
Már most kétségeim vannak, hogy a Blackwell mellett az AMD hogy fog szerepelni. Teljesen hihetőnek tűnik, hogy csak középkategóriáig állít ki versenytársat az NV kártyáknak, a chipletezés nem tart itt, hogy két közepes die-ból kiállítson egy felső kategóriás terméket. Nem lesz itt 3870 X2 pillanat chipleten.
-
S_x96x_S
addikt
> Ezek a találgatások olyan légbőlkapott hülyeségek,
légbőlkapott == felhő == cloud
de amúgy az LK-99 mindent megváltoztat.
Room Temperature Superconductor LK-99 May Change Chip Industry -
Ribi
nagyúr
Igen és hányszor mondták már, hogy x nm alá nem lehet menni és mégis. Én a teljes gpu méretre gondoltam a 400mm alatt. Mert a csiplet dizájn az nincs. Nv meg nyilván csakúgy elengedi a top szegmenst. Mert az NV ezt mondta MiLD-nek. Hihhetőő...
És ez alatt AMD mit fog csinálni? Nekik nem gond ez a határ? Vagy rájuk nem vonatkozik? Eddig rendszerint AMD volt akik lemaradtak a top szegmensről. -
S_x96x_S
addikt
> Jensen több éve már azt mondta hogy 3 nm gyártás felett és megfelelő tokozás
> hiányában nem érdemes Chipletes GPU -ban gondolkodni.3nm alatt meg lehet, hogy megszűnik az x90 GPU sorozat.
és ha ez a trend, akkor érthető az AMD "pletykált" döntése is az RDNA4 kapcsán."One of the more spurious claims made by Moore's Law is Dead is that when Nvidia gets below 3nm, the reticle limit for the masking process will only allow for a die roughly ~400mm squared, which is half the size of its flagship data center products. His Nvidia source reportedly told him that by then, the company would be known more as an AI than a gaming business and would likely cease producing x90 GPUs, opting for x80 and lower cards to compete with AMD. It's many years from now, like around 2026, so who knows what the future will hold. But it's an interesting notion to ponder."
( via ) -
S_x96x_S
addikt
a verseny jó
> Jensen több éve már azt mondta hogy 3 nm gyártás felett és megfelelő tokozás
> hiányában nem érdemes Chipletes GPU -ban gondolkodni. Igaza volt.ha jól tudom,
- akkor a blackwell - 3nm de a GeForce még mindig monolitikus lesz.
- a felső kategória meg MCM ..> mert az öreg nem fogja elengedni az AI szegmenst
> és nem tudod mi van ott a szütyőben. hogy sikerül nekik bemutatkozni
> a saját MCM dizájnjukkal, mert AMD nek nem sikerült túl jól a debüt.meg kell várni az MI300 teszteket ...
Bár az AMD MI300 bár még nem tökéletes, de remélhetőleg fog csinálni egy kis versenyt.
és ha a chiplet-es architektúrát gyorsan tudják iterálni,
akkor az MI400 +1 év múlva már elég sok problémát okozhat Jensennek ..Nvidia H100 SXM : 80GB at 3.3 TB
MI300 : 128GB or 192GB at 5.6 GT/sa verseny jó
persze az AMD-sek -bár "magabiztosak" azért nincsenek könnyű helyzetben, de 100%-ig hisznek a stratégiában .. és ha kitartóak, lehet, hogy övék lesz a sajt és a dícsőség.
Sam Naffziger , AMD (2022)
Naffziger replied, explaining: "It's hard to speculate. NVIDIA certainly hasn't jumped on the chiplet bandwagon yet. We have a big lead there and we see big opportunities with that. They'll be forced to do so. We'll see when they deploy it. Intel certainly has jumped on that. Ponte Vecchio is the poster child for chiplet extremes. I would say that there's more convergence than divergence.
But the companies that innovate in the right space the soonest gain an advantage. It's when you deliver the new technology as much as what the technology is. Whoever is first with innovation has the advantage".
( via ) -
Busterftw
nagyúr
Ezt én sem értem, az Nvidia nem arról híres, hogy hátradőlne.
Nem emlékszem pontosan miről volt pontosan szó, de hasonlóról volt hír itt ph-n, hogy 2 év múlva az AMD beérheti az Nvidiat.Mintha a világ legtermészetesebb dolga lenne, hogy az Nvidia abban a két évben csak szotyizik, nincs R&D és nem jönnek új generációs termékkel.
-
válasz
S_x96x_S #62232 üzenetére
"De én az nVidia helyében sem dölnék megelégedetten hátra
.. mert az már látszik, hogy az
AMD hova akar eljutni és mi a stratégiája
és ha az AI chipletes gyorsítás teljesen működik majd,
akkor az a gaming szintre is lecsorog. (RDNA4, RDNA5 )"Az Ai szegmens teljesen eltérő GPU-t követel meg.
Ne vedd VS -nek, nem annak szánom :
Gondold hogy ők hatra dőlve ülnek a trónról és elégedetten mosolyognak vagy fogalmam sincs miből ez az örök hurrá optimizmus.
Jelenleg az Nvidia egy olyan gent hozott ami konkrétan felmosta volna a padlót az eddigi generációkkal, enegiahatékonyság és teljesítmény terén is. csak úgy minden extra nélkül, ismét egy új és másik gyártástechnológián, első körben.
Jensen több éve már azt mondta hogy 3 nm gyártás felett és megfelelő tokozás hiányában nem érdemes Chipletes GPU -ban gondolkodni. Igaza volt.
Azt gondlom az Nvidia első chipletes GPu -i már rég tervező asztalon megszülettek és biztos vagyok benne , ha megfelelő gyártástechnológiát kapnak ütős cuccok lesznek, és egyből konkurenciái lesznek az AMD hasonló megoldásainak mert tervezni azt nagyon tudnak.
Szóval szerintem jó hogy AMD fejleszt és halad , ezt is kell csinálni, csak nem érdemes lebecsülni az Nvidiát és egy oldalról szemlélni az AMD-t , mert az öreg nem fogja elengedni az AI szegmenst és nem tudod mi van ott a szütyőben. hogy sikerül nekik bemutatkozni a saját MCM dizájnjukkal, mert AMD nek nem sikerült túl jól a debüt. -
S_x96x_S
addikt
válasz
Busterftw #62225 üzenetére
> Persze a shownak mennie kell, "we love gamers" és "hozhattunk
> volna mi is egy 4090 szintű kártyát de mégsem" duma megy,
> de ők is látják a számokból és a közhangulatból, hogy
> ez így nem megy.azért újabban elég magabiztos az AMD ...
és most is lóugrásban halad,
amit egy egyszerű halandó - aki csak egy megfizethető GPU-t
szeretne ( ráadásul PONT MOST vagy karácsonyra )
teljesen jogosan nem ért meg.az AMD mint cég - globális optimuma más.
és most az AI az a terület .. amire 100%-ban fókuszál.De én az nVidia helyében sem dölnék megelégedetten hátra
.. mert az már látszik, hogy az
AMD hova akar eljutni és mi a stratégiája
és ha az AI chipletes gyorsítás teljesen működik majd,
akkor az a gaming szintre is lecsorog. (RDNA4, RDNA5 ) -
Petykemano
veterán
Egyet tudok érteni veled. Az alacsony CU szám egészen arra utal, hogy Maxwellt akartak volna húzni - vagyis azon a 3.5GHz-en járatni, amin egyes compute workloadok futottak.
De vajon hogy illik a képbe az, hogy a megjelenés előtti pletykákban volt egy 30%-os csökkenés a CU-k számát illetően? Benézték volna a 3.5GHz-et, a kisebb lapkát küldték volna gyártásba és az utolsó pillanatban jöttek volna rá, hogy gaming workload esetén mégse hozza azt a frékvénciát? Azért ez elég amatőr lenne.
-
S_x96x_S
addikt
válasz
paprobert #62227 üzenetére
> Én két dologban látom, amiben megtört az RDNA felfelé ívelő pályája.
> 1. Az AMD nem tudott olyan ütemben CU számot növelni.~ Ez csak az RDNA3-ra igaz,
de jön az RDNA4 - ami már teljesen más lehet.
vagyis én nem általánosítanék még ebből.másrészt ..
Az MI300 + CDNA3 -al a CU skálázódás megoldódott. ( MI300X = 304 GPU CUs )
és ha az RDNA4 is "rendes" Unified Memory -t kap mint a CDNA3,
akkor szabadon kombinálhatja az Amd a CDNA3-at és az RDNA4- ket.
Szerintem elég erős "általános" GPU-t lehetne összerakni:
- 1x RDNA4 chiplet + 3x CDNA3 GPU chiplet -ből.
Amikor is a driver .. amit lehet áttol a backend CDNA3 -rade még
- [ 1x RDNA4 chiplet + 1x CDNA3 GPU chiplet ]
- [ 1x RDNA4 chiplet + 2x CDNA3 GPU chiplet ]
is elég erős lehet - és a moduláris felépítés miatt, a gyárthatóság és a költségek is egybevágnak az AMD filozófiájával.Lehet, hogy játékban az még nem lesz Number01, ( ~ majd csak az RDNA5 )
de Blender/ Rendering / CAD / Műszaki szimulációk / AI / ML - terén
el tudja szívni a levegőt és a felhasználókat az RTX 5090 Ti körül -
Yany
addikt
válasz
Raymond #62220 üzenetére
Asszem kicsit túlreagáltam, csak néha kiábrándít, amikor fetisizálódnak a várakozások és teljesen elrugaszkodott megfejtések születnek érzésekre és emberi gyarlóságokra analogizálva. Persze, valahol részleteiben szerepet játszó tényezők, de nem egy monstre vállalat viselkedését definiálják közvetlenül. Nem akartam bántó lenni, ha úgy sikerült, elnézést kérek.
-
HSM
félisten
válasz
Petykemano #62215 üzenetére
"...akkor miért nem skálázzák és miért nem készítenek belőle még kettőt - nagyobbat?"
Igen, pontosan erre."De ha nem sikerült összehozni a multi-chipletes skálázódást, akkor a két nagyobb verzió törlése érthető volna."
Így valóban logikus... És könnyen lehet, hogy most inkább mást priorizáltak, minthogy ezzel szenvedjenek. De ettől függetlenül hagyhatták volna az egészet, és megcsinálhatták volna felskálázva egybe, ahogy az eddigi szériáknál is ment.Érdekes egyébként, hogy egy japán blogon épp a felvetésembe botlottam (GPU=/=SKU) ...
[link]
#62226 Z_A_P : És mindezt egy elég nagy fiaskónak kikiáltott R600 (HD 2900 XT) után.
#62227 paprobert : "Ez skálázódási problémát jelez, és valószínűleg ez az oka, hogy miért nincs egy még nagyobb GCD."
Én azt gyanítom, más állhat a jelenség mögött. Mégpedig az, hogy nem sikerülhetett vagy a tervezett órajelet, vagy a tervezett IPC-t elérni. Az órajelet szinte biztosan, a Navi21-hez képest alig sikerült órajelben előrelépni, és a driver sem biztos, hogy a helyzet magaslatán van, a megjelenéskor a szokásosnál is félkészebb benyomást keltett. Az esetleges egyéb hardveres hibákról nem is beszélve. Szerintem erre utal az is, hogy a teljes portfólión számomra látványosan alulméretezett CU-számok vannak, ami főleg a megjelenés előtt álló N32-nél feltűnő. Számomra ez arra utal, hogy lényegesen magasabb CU-teljesítménnyel kalkulálhattak a fejlesztés korai fázisában.Szerintem egy 120CU-s 8900XTX-nek és egy 80CU-s 8800XT-nek bőven lett volna hely/lehetőség, akár RDNA3 alapokon is... Szerintem bőven lenne érdeklődés ilyen termékekre +1 év múlva is.
-
paprobert
őstag
Én két dologban látom, amiben megtört az RDNA felfelé ívelő pályája.
1. Az AMD nem tudott olyan ütemben CU számot növelni. Egy kisebb növekmény volt, míg az NV könnyedén duplázott. Ez skálázódási problémát jelez, és valószínűleg ez az oka, hogy miért nincs egy még nagyobb GCD.
Amíg ez nincs megoldva, addig a chipletezés is elveszti az pozitívumai nagy részét.2. Órajel. Nem kell részleteznem, az RDNA3 alapú kártyák újra GCN szintű órajelbeli lemaradásban vannak, pedig 2 generáción keresztül előny volt.
3. Amikor pedig energiahatékonyságbeli hátrány is van (most az van), az egyébként is behatárolja a maximális méretű GPU ütőképességét.
Szerk: Ezt egy 7900XTX-nél nagyobb GPU-ra értem.
-
Busterftw
nagyúr
válasz
S_x96x_S #62221 üzenetére
Kifejtve, így értettem.
A vga piac eddig is úgy tűnt, hogy magasról tesznek rá, Epyc/Ryzenen volt a fókusz, most pedig az AI/gyorsítókon a közeljövőben.Persze a shownak mennie kell, "we love gamers" és "hozhattunk volna mi is egy 4090 szintű kártyát de mégsem" duma megy, de ők is látják a számokból és a közhangulatból, hogy
ez így nem megy. -
Petykemano
veterán
válasz
Busterftw #62217 üzenetére
Szerintem ehhez az szükséges, hogy alapjaiban változzon meg az elképzelés arról, hogy mi eredményez eladást, mindshare-t.
Eddig legalábbis egy erős érvnek számított az, hogy ha egy márka tartósan őrzi a királytermék birtokosa címet, akkor annak kivételességének fénye az alsóbb szegmensbe tartozó termékekre is rávetül - részben azáltal, hogy a terméket eleve jónak gondoljuk, részben a győztes csapathoz húzás miatt. Ebből a szempontból fontos, hogy kinek a kártyája van influencerek, teszterek gépében, akik a legjobbat akarják, nem pedig a "legjobbat, valami magyarázattal"
Az egész chipletezésnek a legfőbb célja - túl azon, hogy különböző gyártástechnológiák használatával lehet spórolni - hogy végső soron nagyobb összlapkaméretet tudsz összerakni, mint monolitikus módon az lehetséges (ide értve a defektarányt is) volna. Az AMD halad ebbe az irányba. Nehezen tudom elképzelni, hogy amúgy technikailag minden kész és alkalmas lenne chipletekből összerakni nagyobb teljesítményű terméket (ami működik is, skálázódik is), de úgy döntenek, hogy "áh, inkább mégse".
Szerintem tehát inkább lehet szó arról, hogy valami nem sikerült. (Esetleg az, hogy egy másik koncepció jobban bevált.)
-
S_x96x_S
addikt
az AMD most ugyanarra a piacra fókuszál mint az NVIDIA H100 - ott a sajt ..
és az MI300 már eleve begyüjthetett hatalmas Cloud és a HPC megrendeléseket;
és jön az MI400 -is ..
Vagyis aki él és mozog az AMD-nél az erre lehetett ráállítva.WorkStation/High-End.
Az MI400A ( RDNA4-el ? ) valószínüleg jö(het) Threadripper kivitelben is,
és ezzel ki lehet váltani
az Intel WorkStation CPU -t + 1-2x nVidia RTX 5090 -es GPU-t ( 2x 24 GB VRAM-al )vagyis az AMD-nek azzal kell támadnia - ami az erőssége;
az erős X86 APU -val és az integráltsággal. -
válasz
S_x96x_S #62221 üzenetére
Szerintem egyszerűen a highend szegmens nem éri meg, mert rohadt drágán lehet eladni csak és gyártani is drága.
Viszi a lefoglal gyártási kapacitást, komoly hűtési igénye van, presztízs szinten csak veszíteni lehet az Nvidiával szemben szerintem, mert sok éve talán nem volt olyan gen hogy ne az övék legyen a leggyorsabb csúcs GPU, kerül amibe kerül és közben az eladások tippre 5-10 % részét teszi ki.
A középkategória a lényeg bevétel szempontjából. Az meg azon az áron megy már most is ,később meg még drágábban, ami eddig volt a top csúcs kb.
Tehát a 8800XT-5070 ti 8-900 dollárért kb annyi hasznot hoz mint 2 generációval ezelőtt egy 2080Ti .Erre készít elő mindkét gyártó, hogy a középkategória 600 dollártól kezdődik, minden az alatti GPU belépő szint lesz. AMD szerintem üzleti/ taktikai lépést tesz bevétel / fejlesztési költség racionalizálás szempontjából és ott sokkal könnyebb versenyképesnek lenni kifizetődően.
Az AI/ HPC szegmens egyre jobban minden mástól eltérő specifikus felépítésű GPu kat kíván meg amik nem kamatoztathatók Dekstop gaming szinten igazán már max egy egy apró szelet és fejlesztés belőlük.
Hozzáteszem ha ez igaz, mert még annyira távoli dologról beszélünk, hogy ilyenkor még nem szokott semmi igazán komolyan vehetőnek számítani. -
S_x96x_S
addikt
válasz
Busterftw #62217 üzenetére
> Az mennyire lehet reális indok, amit pár komment is említ,
> hogy az AMD egyszerűen bedobta a törölközőt
> és feladja a high end szegmens versenyt Nvidiaval.semmenyire ..
de ha úgy fogalmazod meg,
hogy az AMD minden (GPU) fejlesztést az AI-nak és az Mi300 /Mi400-nak rendelt alá ,,
mert az AI high- end szegmensben van a pénz
és az Nvidiát ott lehet érzékenyen betámadni és kiénekelni a sajtot ..
és emiatt a consumer piacra minimálisan fókuszál, akkor az mindenkinek jobban hangzik.hasonló stratégia - mint az Intel ellen is
a zsíros Xeon / szerver piacra ment rá és a budget atom/i3 szegmensre minimálisan fókuszál. Ott se mondod, hogy feladta a versenyt az Intellel .. -
Yany
addikt
válasz
Busterftw #62217 üzenetére
Mit jelent, hogy "bedobja a törölközőt"? Ilyen gazdasági fogalom nincs. Átadta a piacot? Puszira? Vagy "rádöbbent", hogy nem elég jó? Vagy nem is tudom, hogy kéne ezt érteni. Egyik ostobább felvetés, mint a másik. Egy vállalkozás egy piacon, amin jelen van, max. elveszti a versenyt, vagy ha jobban tetszik, a csatát, de nem adja oda, mert felébred egy hirtelen álomból, hogy "jaj!". "Odaadja az A piacot mert ott van nekik a B és C" ??? Ez mi? Néha túltoljátok itt ezt a lamentálást, hogy mi történhetett és kvázi személyként tekintetek egy vállalatra.
-
Busterftw
nagyúr
válasz
Petykemano #62215 üzenetére
Az mennyire lehet reális indok, amit pár komment is említ, hogy az AMD egyszerűen bedobta a törölközőt és feladja a high end szegmens versenyt Nvidiaval.
Nekik ott a konzol, a desktop vga szereplésük mélyponton, a PC piac pedig gyengélkedik. -
válasz
Petykemano #62215 üzenetére
Pedig én tudnék örülni egy 3870 X2 pillanatnak, csak chipletes verzióban.
-
Petykemano
veterán
"Nekem az szokatlan, hogy ha már a kis GPU-k elkészülnek, akkor miért ne csinálnák meg a nagyobb verziókat, főleg, ha igény is lenne rájuk?"
Úgy érted, hogy ha már beleteszik a tervezési költséget az RDNA4 architektúrába - elvileg ez a drága és hosszadalmas -, és készítenek belőle 2db fizikai implementációt, akkor miért nem skálázzák és miért nem készítenek belőle még kettőt - nagyobbat?
Elképzelhető, hogy ugyanúgy skálázódási problémákba ütköztek, mint hajdanán. Végső soron az RDNA3-nál is volt egy letekerődése a várható SKU számítási egységeinek számára vonatkozólag.
Ugyanakkor azt gondolnám, hogy ennek már most is látnunk kéne majd a jeleit, hogy mondjuk 4K/4K+RT esetén a 60CU-tól a 96CU-ig nem megfelelően skálázódik a teljesítmény. Ennek akkor abban kéne megnyilvánulnia, hogy a Navi32 méretéhez és számaihoz képest igen jó teljesítményt hoz. A Navi33 ismert számai viszont pont nem utalnak ilyesmire.A másik lehetőség az, hogy a nagyobb verziók eleve multi-chiplet alapon készültek volna.
Például:
Navi41: 400mm2 (2x Navi43)
Navi42: 300mm2 (2x Navi44)
Navi43: 200mm2
Navi44: 150mm2
De ha nem sikerült összehozni a multi-chipletes skálázódást, akkor a két nagyobb verzió törlése érthető volna. -
HSM
félisten
válasz
Petykemano #62211 üzenetére
Nekem az szokatlan, hogy ha már a kis GPU-k elkészülnek, akkor miért ne csinálnák meg a nagyobb verziókat, főleg, ha igény is lenne rájuk?
Polaris/Vega időben ennek érthető okai voltak (skálázódási gondok), de ezek már megoldódtak. -
Petykemano
veterán
"Nem lehet a leírtaknak olyan értelmezése,"
Mivel nem tudjuk, hogy a megmondóemberek pontosan milyen anyagot láttak, ezért lehetne feltételezni, hogy akár félreértés is lehet. Korábban az AMD kitesztelte a 256b + infinity-cache és a 384b kombinációkat. Ez alapján nem elképzelhetetlen az sem, hogy a biztonság kedvéért terveztek nagyobb lapkát is, amit sikeres multi-chiplet GPU esetén el lehet engedni.
De sajnos legalább ennyire jól hihető az is, hogy multi-chiplet GPU-t nem sikerült összehozni.Az RDNA3 esetén a Navi 31-32 egyszerre jelent egy egyedi N5-ön készülő GCD-t és magát az abból összerakható GPU-t is. Sikeres multi-chiplet GPU esetén a kettő elválhat egymástól. De hogy a Navi41 és Navi42 elkaszálása csupán 1-1 monolitikus chipletet jelentett-e, ami szükségtelenné vált, vagy épphogy a - monolitikus, vagy chipletekből összerakott - GPU-t, azt épp az tudná megválazolni, ha tudnánk, hogy az AMD-nek működik-e a multi-chipletes megoldás.
Nekem túlságosan valószerűnek tűnik a kesergés ahhoz, hogy csupán egy félreértésről legyen szó.
-
S_x96x_S
addikt
(aug3.hír)
az AMD által berendelt CoWoS kapacitás a TSMC-nél ~ a fele az nVidia által lefoglalt kapacitásnak. ---> az AMD elég optimista és hamarosan várható az MI400 is."TSMC recently placed orders for additional tools used for chip-on-wafer-on-substrate (CoWoS) packaging, as indicated in the most recent earnings call. The company seems to be particularly optimistic about demand for AMD’s upcoming Instinct MI300-series datacenter APUs and GPUs, DigiTimes reports, saying it will be half of Nvidia's total output of CoWoS-packaged chips."
"This essentially suggests that demand for AMD’s next-generation compute GPU will be half of Nvidia's shipments of CoWoS-equipped GPUs, which is a very optimistic expectation as today Nvidia commands over 90% of the compute GPU market due to the dominance of its CUDA software stack among AI and HPC developers."
( via https://www.tomshardware.com/news/tsmc-preps-for-amd-and-nvidia-advanced-packaging-boom )
-
S_x96x_S
addikt
Videocardz is lehozta a hírt .. hozzátéve a saját értelmezését ..
"AMD rumored to be skipping high-end Radeon RX 8000 RDNA4 GPU series"
https://videocardz.com/newz/amd-rumored-to-be-skipping-high-end-radeon-rx-8000-rdna4-gpu-series -
S_x96x_S
addikt
válasz
Petykemano #62203 üzenetére
> Nézzük a jó oldalát. ... RDNA4
Most:
- hogy van info az MI400, CDNA3 -ról ( leak by Lisa Su )
- és az MI300P -t PCIe kártyára tervezték 4x CDMA2 -vel ( via semianalysis )
Nem kizárható:- hogy a következő generációs PCIe MI400P -már RDNA4 -el is tud működni. ( 4x RDNA4 )
és akár kombinálni is lehet : [ 2x RDNA4 + 2x CDNA3 ] ; [ 1x RDNA4 + 3x CDNA3 ]- tartalmazza az XSwitch interconnect technologiát: ami az NVLink megfelelője.
- valamint a Gen5 + CXL 2.0 képes - és lehetőség lesz a multi-GPU -ra.
És a jövő kiszámíthatatlan:
mert sötét lóként még ott van a szupravezetés is: LK-99
https://en.wikipedia.org/wiki/LK-99
és egyesek már 500x -os hatékonyságú chipeket vizionálnak -
válasz
Petykemano #62203 üzenetére
Vagy lehet az egész csak egy jó nagy félrevezetés Nvidia részére, marketing vagy pedig fals infó.
Mondjuk az sem kizárt amit írtak, már hogy az Ada next az egyik legnagyobb előrelépés lesz generációs szinten.
Ha nem történt volna SKu eltolás nvidiánál, most sem lenne nagyon csúcs SKU AMD nél, még is jó generáció lett ,csak túlárazott. -
S_x96x_S
addikt
AMD CEO already teases next-generation Instinct MI400 accelerator series
https://videocardz.com/newz/amd-ceo-already-teases-next-generation-instinct-mi400-accelerator-series
( CDNA4/Zen5 (?) )
When you look across those workloads and the investments that we’re making, not just today, but going forward with our next generation MI400 series and so on and so forth, we definitely believe that we have a very competitive and capable hardware roadmap. I think the discussion about AMD, frankly, has always been about the software roadmap, and we do see a bit of a change here on the software side.
— AMD CEO Dr Lisa Su
-
HSM
félisten
válasz
Petykemano #62202 üzenetére
Nem lehet a leírtaknak olyan értelmezése, hogy nem lesz nagy GPU? Tehát nem SKU, hanem GPU? Korábban szóltak erről pletykák, hogy a GPU is chipletes lesz, logikus is lenne arra továbblépni. Pl. belépőszint 1GCD+2MCD, középkategória 2GCD+3/4MCD, felső kategória pedig 3-4GCD+5/6MCD.
De lehet csak a közép/felső kategóriánál érné meg, és nyilván itt számít, hányfelé tudják/akarják bontani, akkor mondjuk a Navi32 helyére 1GCD+3/4MCD, és ebből készülhetne high-end, 2GCD+5/6MCD. -
Petykemano
veterán
válasz
Petykemano #62202 üzenetére
Nézzük a jó oldalát.
Régóta az ez első olyan alkalom, amikor nem mondhatjuk azt, hogy hát az RDNA3 gyengére sikeredett, de majd az RDNA4 jó lesz. -
Petykemano
veterán
válasz
Devid_81 #62201 üzenetére
A közösség, akik nagyobb tudással szoktak rendelkezni , reakciója elég autentikusnak tűnik. Nem látok somolygást, tényleg siratják a helyzetet.
Én csak egyetlen olyan véleménnyel találkoztam, ami némi ravaszságot feltételez méghozzá abban, hogy az RDNA4 ha nagyobb sku-t nem is hoz végül, de komoly lemaradást nem fog eredményezni, mert lényegesen hamarább piacra kerül, mint feltételezett konkurense, amihez képest mérete eltörpül.
-
Devid_81
félisten
Új hozzászólás Aktív témák
Hirdetés
A topikban az OFF és minden egyéb, nem a témához kapcsolódó hozzászólás gyártása TILOS!
MIELŐTT LINKELNÉL VAGY KÉRDEZNÉL, MINDIG OLVASS KICSIT VISSZA!!
A topik témája:
Az AMD éppen érkező, vagy jövőbeni új grafikus processzorainak kivesézése, lehetőleg minél inkább szakmai keretek között maradva. Architektúra, esélylatolgatás, érdekességek, spekulációk, stb.
- Automata kávégépek
- Autós topik
- Motorolaj, hajtóműolaj, hűtőfolyadék, adalékok és szűrők topikja
- D1Rect: Nagy "hülyétkapokazapróktól" topik
- Kerékpárosok, bringások ide!
- 3D nyomtatás
- Amazfit Active 2 NFC - jó kör
- Counter-Strike: Global Offensive (CS:GO) / Counter-Strike 2 (CS2)
- EA Sports WRC '23
- EAFC 25
- További aktív témák...
- RX 6650 XT 8GB Core Gaming 3 év Alza garancia.
- ASUS PRIME GeForce RTX 5080 O16G
- GIGABYTE RTX 5080 16GB GDDR7 AERO OC SFF - Új, 3 év garancia - Eladó!
- ZOTAC GeForce GTX 1080 8Gb ArcticStorm+Raijintek Triton 240mm radiator (+ventilátorok és fittingek)
- Inno3D GeForce X3 RTX 3070 Ti 8GB GDDR6X Videokártya!
- MacBook felvásárlás!! MacBook, MacBook Air, MacBook Pro
- BESZÁMÍTÁS! Asus Rog Zephyrus G14 notebook - R9 4900HS 16GB RAM 512GB SSD RTX 2060 6GB Max-Q WIN10
- Bomba ár! Lenovo X1 Yoga 3rd - i5-8GEN I 8GB I 256GB SSD I 14" FHD Touch I W11 I CAM I Garancia!
- Bomba ár! Dell Latitude E6500 - Intel P8600 I 3GB I 160GB I DVDROM I 15,4" WXGA+ I Garancia!
- 118 - Lenovo Legion Pro 5 (16ARX8) - AMD Ryzen 9 7945HX, RTX 4070 - UK billentyűzet
Állásajánlatok
Cég: Liszt Ferenc Zeneművészeti Egyetem
Város: Budapest
Cég: CAMERA-PRO Hungary Kft
Város: Budapest