Helyenként furcsa eredményeket produkál a GeForce GTX 970

Ahogy nő a GeForce GTX 970-et vásárló felhasználók száma, úgy jön elő egyre több panasz arra vonatkozóan, hogy a termék helyenként érthetetlenül furcsa eredményeket produkál. A felmerült jelenségekkel, miszerint a 4 GB-os GeForce GTX 970 nem igazán használ 3,5 GB-nál többet, a Reddit, az Overclock és a Guru3D fórumán belül is foglalkoznak a felhasználók. Ezt persze igen nehéz normális körülmények között mérni, de végre az NVIDIA is reagált a panaszokra, így a vállalat kifejtette, hogy a tapasztalt működés nem hiba, ugyanis a terméket így tervezték.

Az NVIDIA hivatalos közleménye szerint a GeForce GTX 970-hez írt grafikus eszközillesztő rutinjai elsődlegesen 3,5 GB-ot tesznek lehetővé a játékok számára, és a maradék 0,5 GB-hoz csak akkor nyúl a rendszer, ha ez elengedhetetlenül szükséges. A zöldek ezzel magyarázzák, hogy a harmadik féltől származó programok a GeForce GTX 970 esetében csak ezért jeleznek vissza 3,5 GB-os memóriahasználatot.

Mára egyébként az is kiderült, hogy a kártyán található 4 GB-nyi memória ténylegesen hozzáférhető, de a memória utolsó 0,5 GB-os része az elméleti sávszélesség töredékével érhető el, illetve az L2 gyorsítótár utolsó 0,25 kB-os területe semmilyen formában nem férhető hozzá, és pont azért van úgy beállítva a grafikus eszközillesztő ahogy, hogy ez ne jelentsen gondot.

A fenti válasz önmagában viszont nem tűnik logikusnak, hiszen a maga a memóriavezérlő a GeForce GTX 970 és a 980 esetében nem különbözik, illetve mindkét hardvernek pont ugyanannyi ROP blokkja van. Egyedül annyi a különbség, hogy a GeForce GTX 970 három SMM-mel kevesebbel rendelkezik, mint a GeForce GTX 980, tehát 384 CUDA maggal kevesebb áll rendelkezésre a GPU-ban található amúgy 2048 darab CUDA magból. Hasonló módon letiltott erőforrásokat más hardvereknél is láttunk már, de akkor a fenti működést ez nem hozta magával, így azt gondolhatnánk, hogy van valami csavar a történetben.

A rövid válasz az, hogy nincs. Sajnos az NVIDIA az architektúráit nem dokumentálja, így konkrétan nem lehet megismerni a GM204 működését, de megtudtuk, hogy hardver dizájnja jelentősen egyszerűsödött a korábbi megoldásokhoz viszonyítva.

A fejlesztőktől származó információink szerint a GeForce GTX 970 azért működik ilyen furcsán, de fontos hangsúlyozni, hogy nem hibásan, mert az NVIDIA a fogyasztás csökkentése érdekében a teljes feldolgozási folyamatot komponenscsoportokra korlátozza. Ez azt jelenti, hogy a konkurens architektúrákhoz viszonyítva a rendszerben nem különülnek el teljesen a raszter motorok, a feldolgozók és a ROP-blokkok, vagyis ezek működése teljesen egymáshoz idomul. Mindez azt is jelenti, hogy ha az említett három elem egyikéből az NVIDIA valamennyit letilt, akkor az olyan adatbuszok letiltásával is jár, amely korlátozza a letiltott elemhez tartozó egyéb részegységeket.

A GeForce GTX 970-re levetítve a lapka 16 SMM-jéből 3 le van tiltva, ugyanakkor letiltott SMM-eket tartalmazó GPC-n belüli rasztermotor, illetve a GPC-hez rendelt ROP blokk és a hozzá tartozó memóriavezérlő esetében nem kell korlátozásokkal számolni, eltekintve a L2 gyorsítótár letiltott részétől. Viszont az SMM-ek kiütésével a bennük található adatbuszok is elérhetetlenek, ami azt jelenti, hogy az adott GPC-n belül a megmaradt aktív adatbuszok túl lennének terhelve. Annak érdekében, hogy ez ne következzen be, az NVIDIA bizonyos szoftveresen beépített funkciókkal korlátozza a letiltott SMM-ekhez tartozó rasztermotor, a ROP blokk és a memóriavezérlő képességeit, és lényegében ez okozza a fenti jelenséget.

Az NVIDIA tehát igazat mond, azaz a Maxwell architektúra így lett tervezve. Ennek a dizájnfilozófiának az előnye, hogy nem igényel rengeteg tranzisztort felemésztő univerzális belső adatbuszt az egyes részegységek között, amit igen nehéz jól megtervezni, ráadásul sokat hozzátenne a fogyasztáshoz is, ugyanakkor hátránya, hogy az egyes részegységek letiltása más részegységek működésére is negatív hatással lesz. Ez például megfigyelhető a GeForce GTX 970 pixelkitöltési teljesítményén. Elméletben ez a hardver csak 3%-kal gyengébb ezen a területen a GeForce GTX 980-nál, de a gyakorlatban már 28% a különbség. Világosan látszik, hogy a letiltott SMM-ek hiányzó adatbuszai miatt a GeForce GTX 970 képtelen használni az összes ROP blokkot.

A probléma egyébként nem jelentős, sőt igazából a tervezett működés miatt nem beszélhetünk problémáról sem. Inkább az tűnik gondnak, hogy az NVIDIA nem árulta el, hogy a GeForce GTX 970 a fent említett módon dolgozik, ami miatt a felhasználók kicsit másra számítottak.

Azóta történt

Előzmények

Hirdetés