Így muzsikál Ada: teszten a GeForce RTX 4080

Az NVIDIA új generációs GPU-ját az ASUS tuningolt ROG Strix kártyájával próbáltuk ki.

3. A multiprocesszorokon kívül
1. Bevezető, versenytársak 2. Ada Lovelace AI-ra kigyúrva 3. A multiprocesszorokon kívül 4. Sugárkövetés és multimédia 5. ROG Strix RTX 4080 16 GB OC Edition 6. Tesztkörnyezet 7. Eredmények: Assassin’s Creed Valhalla 8. Eredmények: Dirt 5 9. Eredmények: Far Cry 6 10. Eredmények: Godfall 11. Eredmények: Hitman 3 12. Eredmények: Horizon Zero Dawn 13. Eredmények: Metro Exodus Enhanced Edition 14. Eredmények: Shadow of the Tomb Raider 15. Eredmények: Strange Brigade 16. Eredmények: Tom Clancy’s Ghost Recon Breakpoint 17. Eredmények: World War Z 18. Fogyasztás, hőmérséklet, tuning 19. Értékelés
Írta: Wombath
2022-11-24 11:38

A multiprocesszorokon kívül

Az Ada Lovelace architektúra strukturális felépítése a setup területén is ismerős lehet, mivel az NVIDIA továbbra is egy raszteres és egy úgynevezett PolyMorph részre vágja a hagyományos értelemben vett setup motort. Az előbbi egységből hét található az AD103-ban, és egy raszter motor maximum hat darab Texture Processor Cluster (TPC) ellátásáról gondoskodik. Ezt a felállást a vállalat – szokás szerint – Graphics Processing Clusternek (GPC) nevezi. A raszter motor órajelenként 16 pixelt képes feldolgozni, ami az AD103 esetében a teljes lapkára nézve 112 pixelt jelent, amely adat egyensúlyban van a 112 blending egységgel is, azaz a friss fejlesztés ezen a ponton kiegyensúlyozott.

NVIDIA AD103 [+]

A TPC-kben található PolyMorph motor a geometriával kapcsolatos munkálatokat végzi, és ennek a korábbi rendszerekhez képest szintén nem változott a működése. Mivel az AD103-ban 40 TPC található, ez értelemszerűen ugyanennyi PolyMorph motort eredményez. Éles szemű olvasóink észrevehetik, hogy az előző bekezdés alapján valami nem stimmel. Elvégre ha hét darab GPC van a lapkában, és GPC-nként hat TPC-vel lehet számolni, akkor 42 TPC-nek kellene lennie. Azért nincs ennyi, mert a hétből két GPC-ben fizikailag is csak öt TPC van, ami egy hardveres korlát, így lett a rendszer tervezve.

A ROP-blokkok szempontjából marad az Ampere-ből ismert felépítés, vagyis egy GPC-ben maximum két ROP-blokk lehet, és egy ilyenben továbbra is 8 blending és 32 Z mintavételező egység található.

A multiprocesszorokon kívüli rész eddig nem tűnik túl izgalmasnak, hiszen gyakorlatilag nem látni újítást, de van egy pont, ahol az NVIDIA nagyot lépett előre, az pedig az L2 gyorsítótár kapacitása. Az AD103-as GPU 65 536 kB-os, azaz 64 MB-os megosztott L2 gyorsítótárat kapott, és ehhez kapcsolódik a GDDR6X-os szabványú memóriákat támogató memóriavezérlő, ami 32 bites csatornákra szétosztott, 256 bites buszt eredményez.

Rögtön felmerülhet a kérdés, hogy miért ugrott az NVIDIA ilyen jelentőset az L2 gyorsítótár terén, amire valószínűleg sokan rávágják, hogy az AMD-féle Infinity Cache-re akarhattak reagálni, de ez ennél azért bonyolultabb. Az RDNA 2-ben az Infinity Cache egy victim cache, aminek a feladata kizárólag az volt, hogy a grafikus vezérlő mozaikalapú leképezési modelljét segítse abban, hogy ne kelljen egy csomó esetben elmenni az adatért a videomemóriáig. Emiatt a specifikus működése miatt az Infinity Cache alapértelmezetten nem is része az alapvető cache-rendszernek. Tehát amikor egy RDNA 2-es GPU beolvas egy adatot a videomemóriából, akkor az először az L2 gyorsítótárba kerül, majd onnan az L1-be. Az Infinity Cache pusztán egyfajta mentőcsónakként funkcionál, ami konkrétan kimenti azokat az L2 cache-ből kidobandó gyorsítótársorokat, amelyek a mozaikalapú leképezéssel kapcsolatos feladatok számára hasznosak lehetnek. Nyilván itt fel lehet hozni, hogy ezt sem feltétlenül teszi nagy hatékonysággal, és természetesen aránylag sokszor megmenthet olyan adatokat, amelyek hasztalanok a cél szempontjából, de az elvi alapokat tekintve a működési háttér egy problémakör megoldására fókuszál.

Az NVIDIA a hatalmas L2 gyorsítótárral sokkal általánosabban gondolkodik, tehát nem egy célirányos fejlesztésről van szó, mint amilyen az Infinity Cache, hanem igazából az a lényeg, hogy minden munkafolyamatra legyen pozitív hatása. Minden bizonnyal klasszikus vagy némileg modernebb grafikai számításokban kevés haszna lesz, de bizonyos esetekben azért számottevő előnyt biztosíthat. Ilyen lehet például a Tensor feldolgozók kiszolgálása, illetve a sugárkövetéshez használt komplexebb gyorsítóstruktúrák kezelése.

Megemlítendő, hogy az Ada Lovelace új OFA, azaz Optical Flow Accelerator egységet vezet be, amelyhez hasonló ugyan található az Ampere architektúrájú GPU-kban is, de a friss fejlesztés jóval potensebb, mivel 126 helyett 305 TOPS-os teljesítményre képes. Erre a rendszerre alapoz a DLSS 3 képkocka-generálása is. Nem elhanyagolható az sem, hogy lapka rendelkezik még két DMA motorral, illetve x16-os PCI Express 4.0-s vezérlővel.

A cikk még nem ért véget, kérlek, lapozz!

Kapcsolódó cégek:
NVIDIA
ASUS

Azóta történt

Rossz arányban készül a GeForce RTX 4080 és 4090?

A csúcsmodellre lenne kereslet, de nincs elég belőle, eközben a kisebbik testvéréből sok van, csak nincs rá akkora igény.

Hír 2022-11-29 238
Új firmware kell GeForce RTX 4090-ekre a Need For Speed Unbound futtatásához

Az Electronic Arts villogó kijelzőről ír, és a problémát nem lehet szimplán a programból, vagy meghajtófrissítés útján megoldani.

Hír 2022-12-02 105
Árcsökkentésre készülnek az NVIDIA partnerei

Ezzel kezelnék a növekvő GeForce RTX 4080-es raktárkészlet problémáját.

Hír 2022-12-06 79
4070 Ti=4080 12 GB a PNY szerint is

Az amerikai gyártótól kiszivárgott két, hamarosan piacra kerülő VGA néhány specifikációja.

Hír 2022-12-15 9

Előzmények

Közleményben tájékoztatja az ügyfeleket a leégő tápkábelekről az NVIDIA

A vállalat megvizsgálta a problémát, és arra a következtetésre jutottak, hogy a rossz csatlakozás vezethet a túlhevüléshez.

Hír 2022-11-21 69
Új GeForce RTX VGA-k az ASUS elképzelése szerint

Első körben nyolc eltérő SKU-t jegyez a vállalat, de külső megjelenés szempontjából csupán kétféle kivitelről van szó.

Hír 2022-09-28 49
Szállingóznak az új GeForce-ok specifikációi

Sajnos nagyon részletes adatokat még most sem közöl az NVIDIA, de a bemutatón elhangzottaknál több információ van már.

Hír 2022-09-21 83
Leleplezte az Ada Lovelace architektúrára épülő GeForce-okat az NVIDIA

A technikai specifikációkkal szűkmarkúan bánt a vállalat, de idén három modell biztosan érkezik.

Hír 2022-09-20 230

Hirdetés

Felesleges óvatosság a vírusvédelem?

PR Gyakran hallani ismerősöktől, fórumokban, hogy nem kell vírusvédelem, maximum a beépített, ingyenes. Sőt, szakcikkekben is sokszor lehet találkozni olyan állításokkal, hogy manapság már felesleges dolog az antivírus, kár erre költeni.

Percről percre

Poco X6 5G - egy Redmi álruhában

ma Ez az egyik legolcsóbb készülék Dolby Vision kijelzővel, és más jó tulajdonságai is vannak, de nem tökéletes.

Van, ahol lesz összecsomagolt Disney+ és Max

it A Disney és a Warner Bros Discovery elsőként az USA-ban csomagolja össze a Disney+, a Hulu és a Max szolgáltatásokat.

A gyógyszeripar AI-forradalmasítására készül a Google

it A Google DeepMind bemutatta a következő-generációs gyógyszerfelfedező AI-modellt.

Állásajánlatok

Full stack Laravel fejlesztő

Cég: Promenade Publishing House Kft.

Város: Budapest

Részletek

Diákmunka junior fejlesztő

Cég: Ozeki Kft.

Város: Debrecen

Részletek

Így muzsikál Ada: teszten a GeForce RTX 4080