Hirdetés

Miért érhető el relatíve kevés új generációs GeForce?

Kevés a memória? Rossz a kihozatal? Hibázott a Samsung vagy az NVIDIA? Kicsit mindegyik igaz, de összességében egyik sem.

Az NVIDIA vezetője nemrég beszélt arról, hogy idén már nem javul az új generációs GeForce-ok elérhetőségével kapcsolatos helyzet, amely nem túl jó, mivel jóval nagyobb az igény a termékekre a boltokba leszállított mennyiségnél. Arra a kérdésre azonban mindenki keresi a választ, hogy ez miért alakult így. A média által leginkább felhozott tényező az, hogy a Samsung 8 nm-es gyártástechnológiájának rossz a kihozatala. Igen ám, de ez egy igen régóta elérhető eljárás half node-ja, amire eddig soha semmilyen panaszt nem lehetett hallani, pedig nem kis cégek gyártatnak rajta, megemlítve például itt a Qualcommot, de a Samsung is használja.

Az elmúlt hetek során számos helyen érdeklődtünk, és sokszor igen ellentmondásos információkhoz jutottunk hozzá. Az egyik legsűrűbben kapott válasz az volt, hogy kevés a GDDR6X szabványú memória. Ugyanakkor a legfrissebb információink szerint ez csak az első hetekben volt igazán gond, manapság az ellátás jelentősen javult. Mondhatni ez megszokott tényező, az új memóriaszabványok bevezetése sosem egyszerű, és bizony a start pillanatában lehetnek ebből fennakadások, de úgy néz ki, hogy lassan rendeződik a helyzet.

Hirdetés

A memória szempontjából tehát elkezdtek jó hírek érkezni, de mégsem látni, hogy jelentősen nőne a kiskereskedők felé szállított GeForce RTX 3080 és 3090 termékek száma. Emiatt az utóbbi időben már a Samsung 8 nm-es node-jára koncentráltunk, de a már ezen készülő lapkák kapcsán senki sem jelentett problémát. Az elmúlt napokban azonban megtudtuk, hogy az NVIDIA által használt 8 nm-es node, viszonylag sokban eltér attól a verziótól, amit a dél-koreai bérgyártó a többi megrendelőnek biztosít. Egészen konkrétan egy specializált, igen nagy tranzisztorsűrűségre optimalizált változatról van szó, amihez a zöldek is egy nagy sűrűséget biztosító dizájnkönyvtárat alkalmaznak. Mindennek az előnye, hogy az eddig megjelent, Ampere architektúrára épülő, GA102-es GPU-ba négyzetmilliméterenként átlagosan 45 millió tranzisztort préselnek, ami például jobb érték, mint amit az AMD felmutat a TSMC 7 nm-es eljárásán. Persze utóbbi vállalat inkább teljesítményre optimalizált dizájnkönyvtárat alkalmaz, viszont látható, hogy alapvetően majdnem egy node hátrányból hasonló a tranzisztorsűrűség.

A legfrissebb információink szerint ehhez kapcsolódnak a gondok is. A nagy sűrűséget biztosító dizájnkönyvtáraknak van egy olyan átka, hogy a működési órajel szempontjából nem bírnak olyan jó képességekkel, mint a teljesítményre optimalizált dizájnkönyvtárak. Ezen konkrétan azt kell érteni, hogy kisebb órajelet lehet beállítani, és ennek a növelése is aránytalanul nagy fogyasztástöbblettel jár.

Minden egyes dizájn esetében van egy olyan órajelszint, aminél már a működés nem megbízható. Ez az a pont, amikor úgynevezett kezelhetetlen órajelcsúszás következik be, ami azt eredményezi, hogy két logikai blokk úgy dolgozik eltérő ütemben, hogy az hibákat generál, ami legtöbbször a rendszer lefagyásához vezethet. Ezek bekövetkezése ellen nagyon sokat tesznek a cégek, de a fizika törvényeit nem tudják megkerülni, és az a legfőbb cél, hogy az összetartozó áramkörök esetében a csúszás minimalizálva legyen, amivel megtartható a stabil és pontos működés. Konkrét értékek itt nincsenek, mindig az adott dizájn és a célzott órajel határozza meg a csúszás maximálisan megengedett mértékét.

Úgy tudjuk, hogy a legyártott GA102 lapkák esetében túl nagy lehet az órajelcsúszás, ami végeredményben nem stabil rendszereket eredményez. Ez kezelhető lenne az órajel lényeges visszavételével, de akkor a hardver jelentős teljesítményt is veszítene, vagyis jelenleg az történik, hogy kiválogatásra kerülnek a relatíve magas órajelen is jól működő GPU-k. Azt nehéz megállapítani, hogy a probléma forrása hol keletkezik, valószínűleg az órajelelosztását biztosító hálózat szintjén, de hozzá kell tenni, hogy az NVIDIA és alapvetően a Samsung is rendívül extrém paraméterezéssel működteti a 8 nm-es eljárást, ilyennel nem nagyon lehetett találkozni korábban. Itt érdemes kitérni rá, hogy az a nyolcas a nanométer előtt csak egy szám, olyan nagyon lényegesen nem befolyásolja a tranzisztorsűrűséget, vagyis alapvetően van rá mód, hogy elérhető legyen vele például a 7 nm-es full node-ok szintje, csak az a kérdés, hogy milyen hátrányokat kell ehhez felvállalni. Például a beállítható órajelszint egy tipikus problémaforrás szokott lenni, a mértéke a kérdéses.

Valószínű, hogy a végleges paraméterezés elsődlegesen a sorozat gyorsaságáért felelt, elvégre 1,5 GHz környékén messze nem lenne képes olyan komoly tempóra a GeForce RTX 3080 és 3090. Talán az NVIDIA-nak arról is volt már megközelítőleges információja, hogy milyen sebesség kell az új generációs Radeonok elintézéséhez. Ezek a cégek alapvetően GPU-k tervezéséből élnek, tehát ha nincs is meg minden adat a konkurenciáról, azért viszonylag pontosan be tudják lőni az ellenfél kínálatának várható sebességét.

Az órajelcsúszással kapcsolatos gondok egyébként javíthatók, elvégre ilyenekkel – kisebb-nagyobb mértékben – mindig küzdenek a vállalatok. Ráadásul a fizikailag kisebb kiterjedésű lapkákat jellemzően kevésbé érinti, ami a tömegpiac szempontjából jó hír az NVIDIA számára.

Felelőst egyébként nehéz keresni, mivel valójában az érintettek túlvállalták magukat, és erre azért nem egy példát láttunk az IT-piacon. Valamilyen mértékben egyébként hibáztatható a Samsung, ha nem figyelmeztették a partnerüket arra, hogy az elgondolásuk impozáns ugyan, de a gyakorlatiban ez – relatíve magas órajellel – aligha fog jól működni. Felajánlhatták volna számukra a 7 nm-es eljárásukat, amivel az ilyen extrém tranzisztorsűrűség sokkal jobban kezelhető. Persze az is lehet, hogy ezt megtették, csak az NVIDIA ragaszkodott ahhoz, hogy 8 nm-be zsúfoljanak ennyi tranzisztort. Az sem kizárt, hogy két éve azt hitték, hogy elég lesz majd az 1,5 GHz környéki órajelcsúcs. És itt a fő probléma az idő, mert ezeket a döntéseket sok-sok, akár 20-22 hónappal korábban hozták meg, ami mutatja a chiptervezés nehézségét: mozgó célpontra kell lőni egy nagyon korán elsütött puskából.

Hirdetés

Előzmények

Hirdetés