Bevezető, versenytársak
Szeptember elején leplezte le legújabb GPU-generációját az NVIDIA, mely ezúttal a 19. században élt matematikus hölgyről, Ada Lovelace-ről kapta kódnevét. Szinte napra pontosan két év telt el azóta, hogy 2020 őszén a 30xx-es széria alapját adó Ampere bemutatkozott, így mindenképpen ideje volt már a frissítésnek. Ahogy azt megszokhattuk, az új architektúra először a csúcskategóriában jelent meg, a GeForce RTX 4090 és a GeForce RTX 4080 képében. Az első a 3090-hez hasonlóan egy „halo” termék – vagyis elsősorban azt demonstrálja, hogy mire képes az új GPU, ha mindent kifacsarnak belőle. Ennek megfelelő az árazása is, melyet a bejelentésekor 1600 dollárra állított be az NVIDIA – elméletben, mert a boltokban inkább 2000 dollár felett, itthon pedig a milliós határ környékén találkozhatunk vele.
Így a „megfizethetőbb” címkét jelenleg a csúcskategóriás GeForce RTX 4080 birtokolja, melynek piaci megjelenése ugyanakkor nem sikerült igazán jól, az NVIDIA ugyanis először két különböző GPU változatot is szeretett volna ezzel a megnevezéssel a boltokba küldeni. Ez a terv azonban nem aratott nagy sikert a potenciális vásárlók körében, így végül az olcsóbb, 900 dolláros, 12 GB-os RTX 4080-at törölték a portfólióból, és csak a drágább (1200 dolláros ajánlott árral bejelentett) GeForce RTX 4080 16GB maradt meg. Mint a nevéből is látszik, ez 16 GB VRAM-mal rendelkezik és az AD103 GPU-ra épül, mely 280,9 Gpixel/s és 762,4 Gtexel/s teljesítményt kínál.
Versenytársak
Tesztalanyunk az egyedi felépítésű, ROG Strix GeForce RTX 4080 16GB GDDR6X OC Edition névre hallgató modell, mely némi gyári tuningban is részesült, így Boost órajele 2508 MHz helyett 2655 MHz lehet, hűtése pedig kettő helyett három ventilátorral dolgozik. Versenytársai elsősorban az előző generációk csúcsmodelljei közül kerülnek ki:
VGA megnevezése | ROG STRIX GeForce RTX 4080 16 GB OC Edition |
EVGA GeForce RTX 3090 FTW3 Ultra |
Gainward GeForce RTX 3080 Ti Phoenix |
MSI GeForce RTX 3080 12 GB Suprim X |
ASUS TUF Gaming GeForce RTX 3080 OC |
AMD Radeon RX 6950 XT |
---|---|---|---|---|---|---|
Kódnév | AD103-300 | GA102-300 | GA102-225 | GA102-220 | GA102-200 | Navi 21 KXTX |
Gyártástechnológia | 5 nm (TSMC N4) | 8 nm (Samsung) | 7 nm (TSMC) | |||
Mikroarchitektúra | Ada Lovelace | Ampere | RDNA2 | |||
Tranzisztorok száma | 45,9 milliárd | 28,3 milliárd | 26,8 milliárd | |||
GPU-lapka mérete | 379 mm2 | 628,4 mm2 | 519,8 mm2 | |||
GPU alap/turbó órajel | 2205/2508 MHz | 1395/1800 MHz | 1365/1665 MHz | 1260/1890 MHz | 1440/1815 MHz | 1925/2310 MHz |
GPU/shader órajele üresjáratban |
210 MHz | dinamikusan változó | ||||
Shader processzorok típusa |
stream (16+16 co-issue) | multiprecíziós vektor | ||||
Számolóegységek száma | 9728 | 10496 | 10240 | 8960 | 8704 | 5120 |
Textúrázók száma | 304 textúracímző és -szűrő |
328 textúracímző és -szűrő |
320 textúracímző és -szűrő |
280 textúracímző és -szűrő |
272 textúracímző és -szűrő |
320 textúracímző és -szűrő |
ROP egységek száma | 14 blokk (112) | 12 blokk (96) | 4 blokk (128) | |||
Memória mérete | 16 384 MB | 24 576 MB | 12 288 MB | 10 240 MB | 16 384 MB | |
Memóriavezérlő | 256 bites crossbar | 384 bites crossbar | 320 bites crossbar | 256 bites hubvezérelt | ||
Memória órajele terhelve | 22 400 MHz (GDDR6X) | 19 496 MHz (GDDR6X) | 19 000 MHz (GDDR6X) | 18 000 MHz (GDDR6) | ||
Üresjáratban | 51 MHz (GDDR6X) | dinamikusan változó (GDDR6) |
||||
Max. memória- sávszélesség |
716 800 MB/s | 935 800 MB/s | 912 000 MB/s | 760 300 MB/s | 576 000 MB/s | |
Dedikált HD transzkódoló |
2x NVENC8 | NVENC7 | RME | |||
Hardveres videó- lejátszás támogatása |
NVDEC5 | |||||
Hivatalos fogyasztás | ~320 watt | ~350 watt | ~370 watt | ~320 watt | ~335 watt |
Kattintásra a táblázat kinyílik
Ada Lovelace AI-ra kigyúrva
Az elmúlt időszak nem alakult túl jól a VGA-piacon a játékosok nézőpontjából, aminek elsődlegesen a bányászláz fellángolása volt az oka, de ennek már láthatóan vége, és az NVIDIA pont jókor jelentette be az új GeForce-ok érkezését, amelyek közül a GeForce RTX 4090 és 4080 jelölésű modell elérhetővé is vált. Jelen tesztünkben az utóbbira koncentrálunk, amely nem a sorozat leggyorsabbika, de kellemes sebességet kínál, és nem mellesleg ennek is elég durva az ára.
Hirdetés
Az alapokat tekintve az NVIDIA az Ampere helyére az Ada Lovelace architektúrát dobta be, amely az említett VGA esetében az AD103-as kódnevet viselő lapkában dolgozik. A fejlesztés a TSMC 4N jelzésű 5 nm-es node-ján készül, és 45,9 milliárd tranzisztorból épül fel, miközben a kiterjedése 378,6 mm².
Az Ada Lovelace architektúra elsődlegesen az Ampere továbbfejlesztésének tekinthető. A streaming multiprocesszorok általános felépítése szinte nem is változott, inkább a bennük rejlő részegységek tekintetében vannak újítások – de ne rohanjunk ennyire előre!
Az Ada Lovelace architektúra multiprocesszora [+]
Az Ada Lovelace multiprocesszorokon belül maradt a jól megszokott, négy compute blokk. Ezekben található egy L0 utasítás gyorsítótár, egy feladatirányító (dispatch), illetve egy warp ütemező, amelyek többféle futószalagot etetnek. Az NVIDIA szokás szerint a CUDA mag kifejezést használja, de ahogy korábban, úgy ennek a friss dizájn esetében sincs értelme, mivel már nem komplex feldolgozók találhatók a blokkokon belül. Ennek megfelelően az Ada Lovelace architektúrában az utasításszavak végrehajtása a nekik megfelelő futószalagon történik.
A dizájn alapjai az Ampere-hez képest nem változtak, ha 32 bites lebegőpontos operációról, azaz FP32-ről van szó, akkor két darab 16 utas tömb áll rendelkezésre, de ezek közül az egyik 32 bites integer, azaz INT32 feladatokat is képes elvégezni. Az előbbi felépítéssel megmaradt co-issue feldolgozási modell, méghozzá 16+16-os formában, vagyis egy compute blokkon belül egyszerre két darab olyan warp (megszokott szóhasználattal élve wave) is futtatható, amelyekben 32 bites lebegőpontos operációk kerülnek végrehajtásra. Az ütemezés szempontjából sincs változás, vagyis a két futtatott warp egy ütemezőn kerül kiosztásra, tehát a feldolgozandó feladatok között nem állhat fenn függőség.
A fentieken túl mindegyik compute blokknak része a Tensor műveletekért felelős, egy darab 512 utas, structural sparsity támogatással dolgozó tömb, amely immáron egy negyedik generációs fejlesztés, és a képességei megegyeznek a Hopper architektúrában bemutatott megoldással.
Az NVIDIA egyébként továbbra is az FP32-es ALU-kat tartja CUDA magoknak, és ezek a részegységek megfelelnek az IEEE754-2008-as szabványnak, vagyis támogatják a MAD (Multiply-Add), illetve az FMA (Fused Multiply-Add) instrukciókat. Az FP16-os műveleteket az alapértelmezett feldolgozótömb kezeli, méghozzá úgy, hogy egy FP32-es feldolgozó két darab, egymástól nem függő 16 bites lebegőpontos operációt hajthat végre. A másodlagos, INT32-es feldolgozótömb ugyan az FP32-t támogatja, de az FP16-ot már nem, tehát az Ada Lovelace esetében a szimpla és a felezett pontosság melletti elméleti számítási teljesítmény megegyezik.
A load/store egységek bekötése másolja az Ampere és a Turing dizájnját, ahogy a trigonometrikus és transzcendens utasítások végrehajtásáért felelős speciális funkciókat biztosító egység (SFU) kialakítása is. A textúrázási képességek területén sincs újítás. Az egyes streaming multiprocesszorok egy darab, négy csatornát biztosító textúrázó blokkot tartalmaznak, amelyet négy compute blokk használ egyszerre.
A compute blokkokon belüli regiszterterület marad 64 kB, vagyis annyi, amennyi az előző generációkban volt, továbbá a 128 kB-os L1 gyorsítótár tekintetében sincs előrelépés. Ez az egység ezúttal is számos konfigurációban fogható be. Amennyiben az adott compute blokk grafikai feladatot futtat, akkor kötelező 64 kB-ot biztosítani a textúrázóegységeknek, miközben 48 kB lesz a helyi adatmegosztás, illetve 16 kB fenntartása szükséges a grafikai futószalagokhoz. Compute feladatok mellett már sokkal szabadabb a felhasználás, az általános gyorsítótár 28, 64, 96, 112, 120 vagy 128 kB lehet, és ha marad nem lefoglalt terület, akkor az befogható helyi adatmegosztásra.
Fontos kiemelni, hogy az NVIDIA ugyan hivatalosan nem jegyzi, de minden egyes multiprocesszor tartalmaz két darab 64 bites lebegőpontos, azaz FP64-es ALU-t. Ezek fizikailag úgy vannak beépítve, hogy két compute blokkhoz kapcsolódik egy feldolgozó, amely a működése során a társított blokkok regiszterterületét és gyorsítótárait használhatja. A zöldek erről azért nem számolnak be, mert igencsak kis teljesítményről van szó, és alapvetően az Ada Lovelace dizájnja nem is arra lett kitalálva, hogy dupla pontosságot igénylő programokat futtasson hatékonyan, de funkcionálisan adott a lehetőség.
A multiprocesszorokon kívül
Az Ada Lovelace architektúra strukturális felépítése a setup területén is ismerős lehet, mivel az NVIDIA továbbra is egy raszteres és egy úgynevezett PolyMorph részre vágja a hagyományos értelemben vett setup motort. Az előbbi egységből hét található az AD103-ban, és egy raszter motor maximum hat darab Texture Processor Cluster (TPC) ellátásáról gondoskodik. Ezt a felállást a vállalat – szokás szerint – Graphics Processing Clusternek (GPC) nevezi. A raszter motor órajelenként 16 pixelt képes feldolgozni, ami az AD103 esetében a teljes lapkára nézve 112 pixelt jelent, amely adat egyensúlyban van a 112 blending egységgel is, azaz a friss fejlesztés ezen a ponton kiegyensúlyozott.
A TPC-kben található PolyMorph motor a geometriával kapcsolatos munkálatokat végzi, és ennek a korábbi rendszerekhez képest szintén nem változott a működése. Mivel az AD103-ban 40 TPC található, ez értelemszerűen ugyanennyi PolyMorph motort eredményez. Éles szemű olvasóink észrevehetik, hogy az előző bekezdés alapján valami nem stimmel. Elvégre ha hét darab GPC van a lapkában, és GPC-nként hat TPC-vel lehet számolni, akkor 42 TPC-nek kellene lennie. Azért nincs ennyi, mert a hétből két GPC-ben fizikailag is csak öt TPC van, ami egy hardveres korlát, így lett a rendszer tervezve.
A ROP-blokkok szempontjából marad az Ampere-ből ismert felépítés, vagyis egy GPC-ben maximum két ROP-blokk lehet, és egy ilyenben továbbra is 8 blending és 32 Z mintavételező egység található.
A multiprocesszorokon kívüli rész eddig nem tűnik túl izgalmasnak, hiszen gyakorlatilag nem látni újítást, de van egy pont, ahol az NVIDIA nagyot lépett előre, az pedig az L2 gyorsítótár kapacitása. Az AD103-as GPU 65 536 kB-os, azaz 64 MB-os megosztott L2 gyorsítótárat kapott, és ehhez kapcsolódik a GDDR6X-os szabványú memóriákat támogató memóriavezérlő, ami 32 bites csatornákra szétosztott, 256 bites buszt eredményez.
Rögtön felmerülhet a kérdés, hogy miért ugrott az NVIDIA ilyen jelentőset az L2 gyorsítótár terén, amire valószínűleg sokan rávágják, hogy az AMD-féle Infinity Cache-re akarhattak reagálni, de ez ennél azért bonyolultabb. Az RDNA 2-ben az Infinity Cache egy victim cache, aminek a feladata kizárólag az volt, hogy a grafikus vezérlő mozaikalapú leképezési modelljét segítse abban, hogy ne kelljen egy csomó esetben elmenni az adatért a videomemóriáig. Emiatt a specifikus működése miatt az Infinity Cache alapértelmezetten nem is része az alapvető cache-rendszernek. Tehát amikor egy RDNA 2-es GPU beolvas egy adatot a videomemóriából, akkor az először az L2 gyorsítótárba kerül, majd onnan az L1-be. Az Infinity Cache pusztán egyfajta mentőcsónakként funkcionál, ami konkrétan kimenti azokat az L2 cache-ből kidobandó gyorsítótársorokat, amelyek a mozaikalapú leképezéssel kapcsolatos feladatok számára hasznosak lehetnek. Nyilván itt fel lehet hozni, hogy ezt sem feltétlenül teszi nagy hatékonysággal, és természetesen aránylag sokszor megmenthet olyan adatokat, amelyek hasztalanok a cél szempontjából, de az elvi alapokat tekintve a működési háttér egy problémakör megoldására fókuszál.
Az NVIDIA a hatalmas L2 gyorsítótárral sokkal általánosabban gondolkodik, tehát nem egy célirányos fejlesztésről van szó, mint amilyen az Infinity Cache, hanem igazából az a lényeg, hogy minden munkafolyamatra legyen pozitív hatása. Minden bizonnyal klasszikus vagy némileg modernebb grafikai számításokban kevés haszna lesz, de bizonyos esetekben azért számottevő előnyt biztosíthat. Ilyen lehet például a Tensor feldolgozók kiszolgálása, illetve a sugárkövetéshez használt komplexebb gyorsítóstruktúrák kezelése.
Megemlítendő, hogy az Ada Lovelace új OFA, azaz Optical Flow Accelerator egységet vezet be, amelyhez hasonló ugyan található az Ampere architektúrájú GPU-kban is, de a friss fejlesztés jóval potensebb, mivel 126 helyett 305 TOPS-os teljesítményre képes. Erre a rendszerre alapoz a DLSS 3 képkocka-generálása is. Nem elhanyagolható az sem, hogy lapka rendelkezik még két DMA motorral, illetve x16-os PCI Express 4.0-s vezérlővel.
Sugárkövetés és multimédia
A sugárkövetést a korábbi oldalakon kihagytuk, mivel ezt mindenképpen érdemes külön elemezni. Az NVIDIA most is úgynevezett RT magként jelzi az eljárásért felelő egységeket, és ezekből egy-egy feldolgozó található multiprocesszoronként, azaz az AD103-as lapkára nézve összesen 80.
Az új RT magokon belül továbbfejlesztett, metszésvizsgálatra, illetve bejárásra vonatkozó részegységek tanyáznak, de az NVIDIA ezeket kiegészítette még két további fixfunkciós motorral, amelyek az Opacity Micromap Engine és az Displaced Micro-Mesh Engine nevet viseli. Előbbi segítségével gyorsítható az átlátszóságra vonatkozó információt hordozó felületeken a sugárkövetés, míg az utóbbi fejlesztés arra a problémára reagál, hogy a geometriai részletesség növelésével nagymértékben nő a gyorsítóstruktúra előállításához szükséges idő, illetve a memóriaigény.
Opacity Micromap Engine
A Displaced Micro-Mesh Engine kapcsán érdemes időzni egy picit, ugyanis ismert probléma, hogy a sugárkövetés alapvetően limitálja az adott programban alkalmazható geometriai részletességet, ugyanis vagy a felületek nagyon kidolgozottak, vagy sugárkövetéses effektet alkalmazzák erőteljesen, de a kettő együtt egyelőre eléggé rosszul működik, és ez nagyrészt a DirectX Raytracing API limitációiból ered. Az NVIDIA ezt a gondot egy specifikus hardverrel próbálja kevésbé érezhetővé tenni, ami lényegében azt csinálja, hogy veszi az eredeti felületet, majd annak a részletességét radikálisan csökkenti, így végeredményben sokkal kevesebb háromszögből áll majd, miközben a felület információit elmenti displacement map formájában. Ezáltal maga a gyorsítóstruktúra egyszerű maradhat, hiszen a valós számítások szintjén a felület tényleges részletességének csak a töredékét kell figyelembe venni. Ez egyébként ad majd némi minőségbeli különbséget, hiszen nyilván nem ugyanaz a teljes geometriai részletességgel kalkulálni, vagy annak csak egy lebutított részével, külön generált magasságtérképből, de olyan limitáltak a szabványos lehetőségek, hogy rá van kényszerülve a piac a hasonló trükkökre, ha a sugárkövetést nem csak szimpla effektekhez akarjuk továbbra is használni.
Displaced Micro-Mesh Engine [+]
További sugárkövetéshez kapcsolódó újítás az SER, azaz a shader execution reordering, ami lényegében képes a futó shadereket úgy rendezni, hogy az javítsa a koherenciát, vagyis az éppen futtatott folyamatok többször találják meg a szükséges adatokat a gyorsítótárban.
SER, azaz a shader execution reordering
Fontos kiemelni, hogy az Opacity Micromap Engine, az Displaced Micro-Mesh Engine és maga a SER is direkt támogatást igényel az alkalmazás részéről, tehát nem működnek csak úgy maguktól. Ezekhez az NVIDIA az NVAPI nevű szervizkönyvtáron keresztül kínál majd elérést, amivel kiegészíthetők a szabványos DirectX Raytracing adta lehetőségek.
Multimédia és kijelzőkezelés
Az Ada Lovelace multimédiás szinten is fejlődött, ugyanis megújul az NVENC nevű hardveres kódoló, amely immáron a nyolcadik generációt tapossa, és már támogatja az AV1-es formátumú videók kódolását. Sőt, a nagyobb GPU-kba két NVENC kódoló kerül, amelyekkel másodpercenként 60 képkocka mellett lehetőség van egy 8K vagy egyszerre négy 4K felbontású tartalom előállítására. Az NVDEC nevű hardveres dekódoló blokk nem változott, abból továbbra is az Ampere dizájnokban alkalmazott ötödik generációs verziót használja a cég.
A kijelzőmotoron az NVIDIA nem újított, vagyis a friss fejlesztések megörökölték az előző generációból a DisplayPort 1.4a támogatását a DSC 1.2-vel, illetve a HDMI 2.1-et.
ROG Strix RTX 4080 16 GB OC Edition
A tesztek megkezdése előtt lássuk részletesebben is a tesztalanyt, melynek külsejét egyetlen szóval érdemes jellemezni, ez pedig a drabális – könnyen előfordulhat, hogy gépfejlesztésnél nemcsak a VGA-t, de a házat és a tápegységet is cserélnünk kell, hogy egyáltalán használni tudjuk a frissen megvásárolt grafikus kártyát.
Ahogy a fotókon is látszik, a 358 x 149 x 70 mm-es egység mellett szinte minden eltörpül, még a korábban olyan nagynak tűnő Gigabyte AORUS 2080 Ti Extreme is csak a „válláig ér”.
A ROG Strix RTX 4080 16GB OC Edition hivatalosan 3,5 foglalatnyi helyet igényel, úgyhogy túl sok bővítőkártyának nem marad mellette hely, a függőleges beépítésről ábrándozóknak pedig arra is érdemes felkészülni, hogy ugyan csak két takarólemeznyi helyet foglal a gépház hátában, de vastagsága miatt mégsem sok házban lesz lehetőség ezt meglépni. Keskenyebb PC-knél gondot okozhat a VGA magassága is, előfordulhat, hogy beleér az oldalfalba – vagy legalábbis olyan közel kerül hozzá, hogy az már lerontja a hűtés teljesítményét.
A kártya dobozában egy kis tartót is mellékelnek, melyben egy csavarhúzó is lapul [+]
A kártya nagy méretét természetesen elsősorban a hűtésnek köszönheti, mely a hátulsó merevítőlemezzel együtt igen nagy arányban fémből készül, ennek megfelelően tehát jó nehéz is (a VGA súlya megközelíti a 2,5 kg-ot), szinte biztos, hogy érdemes lesz használni a kártyához mellékelt tartóelemet, hogy tehermentesítsük a PCI Express foglalatot. A hűtés tulajdonképpen teljesen körbeveszi a NYÁK lemezt, melyen túl is lóg, így a harmadik ventilátor át tudja fújni a VGA alatt esetleg megrekedő meleg levegőt a gépház tetejébe, hogy aztán onnan a szellőztetőventilátorok elszállítsák.
A hűtés, ahogy illik, bőven rendelkezik díszekkel: a ventilátorok oldalán egy ezüst-kék-piros színátmenetes megoldásnak örülhetünk, felül és hátul pedig Aura Sync kompatibilis, RGB színekben pompázó elemek vonzzák magukra a tekintetet. A korábbi ROG Strix modellekhez hasonlóan a kártya hátsó élén plusz ventilátorcsatlakozókat is találunk, melyeket a VGA vezérel a GPU hőfokának megfelelően.
Maga a hűtés nemcsak hővezető csöveket, de vapor chamber alapú központi blokkot is használ, és a GPU mellett a VRM elemeit, illetve a memóriamodulokat is hűti. A kínálatból nem hiányzik a megszokott BIOS kapcsoló sem, amivel normál vagy csendesebb hűtést garantáló állás között választhatunk. Figyelembe véve, hogy a kártya már alapbeállításon is félpasszív üzemmódot kínál, ráadásul ventilátorai igen halkak, a kapcsolónak viszonylag kevés értelmét látjuk, de ha valaki extrém csendes gépet építene, akkor a lehetőség adott.
Kimenetekből három DisplayPort 1.4a és két HDMI 2.1a áll rendelkezésre, itt tehát nem történt változás a korábbi modellekhez képest. Felül viszont már találkozhatunk az utóbbi időben kétes hírnévre szert tett 12+4 tűs 12VHPWR konnektorral, melyhez a dobozban mellékelik a három darab 6+2 tűs, hagyományos PCIe csatlakozót fogadni képes adaptert.
Ezzel kapcsolatban megjegyeznénk, hogy a VGA meglehetősen érzékeny a tápellátásra: bár a hivatalos adatok 750 wattos ajánlott teljesítményről szólnak, arra nem térnek ki, hogy ezen felül érdemes olyan tápot keresni, mely három különálló 6+2 tűs csatlakozót kínál. Megpróbáltuk a tesztágyban használt 1200 wattos FSP Platinum táppal úgy meghajtani a kártyát, hogy csak két kábelt használunk (természetesen ezek dupla csatlakozós kábelek, így mindhárom konnektor megkapta a szükséges áramot), de ilyenkor amint a játékokra váltottunk, elkezdett a 12VHPWR konnektor mellett pislogni az elégtelen tápellátásra utaló vörös LED. Tény, hogy ettől még a rendszer tökéletesen és lassulás nélkül működött, de a jelenség mutatja, hogy jobb biztosítani a három különálló csatlakozót, mintsem kockáztatni a gyakori fagyásokat.
Tesztkörnyezet
A tesztre használt hardverösszeállítás nem változott korábbi tesztjeink óta: ASRock B550 PG Velocita alaplap, AMD Ryzen 7 5800X processzor és Patriot Viper DDR4-3600 RAM képezi a rendszer alapját.
Alaplap | ASRock B550 PG Velocita |
---|---|
Processzor | AMD Ryzen 7 5800X (PBO: Enabled) |
Processzorhűtő | Fractal Design Celsius S36 |
Memória | 4 x 16 GB Patriot Viper 4 Blackout DDR4-3600 |
Videokártya | ROG Strix GeForce RTX 4080 16 GB OC Edition (driver: 526.98) |
SSD | - Kingston UV500 480 GB - Patriot Viper VP4100 1 TB |
Ház | Cooler Master Test Bench V1.0 |
Tápegység | FSP Aurum PT 1200 |
Operációs rendszer | Microsoft Windows 10 Professional x64 22H2 |
A szoftverek – játékok – frontján továbbra is a megszokott programokat használjuk. Méréseinket az OCAT segítségével végezzük, az eredményeket pedig átlagolva és az alsó/felső 5 százalékot eldobva vesszük figyelembe.
Játékprogram | API | Videojáték-motor | Beállítások |
---|---|---|---|
Assassin’s Creed Valhalla | DirectX 12 | AnvilNext | Minden maximumon, de Adaptive Quality=OFF |
Dirt 5 | DirectX 12 | Ego | Minden maximumon, DXR bekapcsolva (ahol elérhető) |
Far Cry 6 | DirectX 12 | Dunia | Ultra preset, Motion blur On, DXR Shadows bekapcsolva (ahol elérhető) |
Godfall | DirectX 12 | Unreal 4 | Epic preset, DXR bekapcsolva (ahol elérhető) |
Hitman 3 | DirectX 12 | Glacier 3 | Minden maximumon, DXR kikapcsolva |
Horizon Zero Dawn | DirectX 12 | Decima | Ultimate Quality, Clouds: High |
Metro: Exodus Enhanced Edition | DirectX 12 | 4A | Extreme Preset, RTQ Normal, Reflections Hybrid (csak DXR-rel fut) |
Shadow of the Tomb Raider | DirectX 12 | Foundation | Minden maximumon, SMAAT 2x, Ambient Occlusion: BTAO, FidelityFX sharpening, DXR kikapcsolva |
Strange Brigade | Vulkan | Asura | Ultra preset, Async Compute on |
Tom Clancy's Ghost Recon Breakpoint | Vulkan | AnvilNext | Ultra preset, resolution scale 100% |
World War Z: Aftermath | Vulkan | Swarm | Minden maximumon, AA: TAA, FidelityFX CAS On |
Eredmények: Assassin’s Creed Valhalla
Eredmények: Dirt 5
Eredmények: Far Cry 6
Eredmények: Godfall
Eredmények: Hitman 3
Eredmények: Horizon Zero Dawn
Eredmények: Metro Exodus Enhanced Edition
Eredmények: Shadow of the Tomb Raider
Eredmények: Strange Brigade
Eredmények: Tom Clancy’s Ghost Recon Breakpoint
Eredmények: World War Z
Az előző oldalakon látottakat összefoglalva kijelenthetjük, hogy az RTX 4080 – az ASUS tolmácsolásában – hozza azt, amit egy új generációs kártyától elvárhatunk, sőt, annál még többet is, mert nem egyszerűen csak az RTX 3080-at utasítja maga mögé, de az RTX 3090-et is, ráadásul nem is kevéssel. Ez tulajdonképpen már az a szint, ahol 4K felbontásban, mindent maximumra állítva és a DXR-t bekapcsolva is teljes mértékben folyamatos játékot élvezhetünk, ha pedig egész minimálisan lejjebb adunk az igényekből vagy bevetjük a DLSS szolgáltatásait, akkor a 144 Hz-es vagy annál gyorsabb frissítésre képes monitorok sebességét is kihasználhatjuk. Ami az UHD alatti felbontásokat illeti, ezekre legfeljebb kompetitív felhasználás során lehet szükség – vagy akkor, ha monitorunk nem 4K-s, mely esetben igazából pénzkidobás az RTX 4080 beszerzése.
Fogyasztás, hőmérséklet, tuning
Az Ada Lovelace a TSMC új 5 nm-es gyártástechnológiájával készül, ami jót tesz a fogyasztásnak, annyira, hogy a teljesítmény/fogyasztás arány egyenesen kiválónak minősíthető. Persze ettől még egy sokat fogyasztó kártyával van dolgunk, mely különösen akkor kér sokat, ha még tuningoljuk is.
Szerencsére a melegedés és vele párhuzamosan a hűtés zaja a magas fogyasztás ellenére is igen kellemes, a brutális méretű hűtőrendszer nagyon szépen dolgozik – ezért is nincs igazán szükség a kártyán található BIOS kapcsolóra.
Tesztünkből a tuning sem maradt ki, ezt az ASUS által kínált GPU Tweak III-mal tettük meg, melynek automatikus rendszerével egy viszonylag szerény, plusz 3-5%-os gyorsulást tudtunk kisajtolni a ROG Strix GeForce RTX 4080 16GB OC Edition VGA-ból, de mindezt úgy, hogy a hűtés szinte semmivel sem lett hangosabb.
Értékelés
Nagyon impozánsra sikeredett Ada: a kártya magabiztosan ugrik az első helyre, és nemcsak az RTX 3080 12G-t, de az RTX 3090-et is előzi, és nem is csak pár fps-sel. Az tehát egyértelmű, hogy teljesítményben az új generáció nagyon jó lett, de ami ezt még jobbá teszi, hogy a fogyasztási adatok ehhez képest kifejezetten visszafogottnak tűnnek, ami az architektúra mellett a TSMC 4N technológiáját is dicséri.
Nyilvánvaló, hogy a GPU az UHD felbontás kiszolgálásra készült, hiszen maximális minőségi beállítások és aktív sugárkövetés mellett is teljesen akadozásmentes a játék, és van annyi tartalék a rendszerben, hogy ez várhatóan a jövőre megjelenő játékok esetében is így lesz majd. Ez azért is jó hír, mert a piaci folyamatokat tekintve nagyon is fontos a jövőállóság – amit tovább erősít a 16 GB memória.
Az összkép tehát, legalábbis az alaphardvert nézve, kedvező, de mint megszokhattuk, az árazás kissé belezavar a felhőtlen örömbe. A boltokban az RTX 4080-ra épülő kártyák árai ebben a pillanatban 700 000 forintnál magasabbról indulnak (a legolcsóbb modellek pedig kicsivel ezen határ alatt tartózkodnak), ami azt jelenti, hogy sok, még piacon lévő RTX 3090/3090 Ti változatnál jobb vételnek minősül. Az RTX 3080 Ti és 3080 12GB már fogósabb kérdés, ezekből ugyanis már 500 000 forint alatt is találni példányokat, amelyek ár/érték arányban jobbnak tűnnek – a 600 000 forint feletti szegmensben viszont egyértelműen az új generációé az elsőbbség. Veszélyesebbnek tűnik a 4080-ra az RX 6950 XT, melyből a gyárilag tuningolt modellek is elérhetők 480 000 forint körüli áron. Ám mind a 3080-as csapatra, mind az RX 6950 XT-re igaz, hogy az UHD felbontásban körülbelül 20-25 százalékkal lassabbak az RTX 4080-nál, mely elég jelentős különbség ahhoz, hogy ne pusztán az ár/érték arány alapján válasszanak közülük.
Áttérve most a tesztalanyra, a ROG Strix GeForce RTX 4080 16GB OC Edition a ROG-os tradícióknak megfelelően az RTX 4080 szegmens csúcsára került árazás tekintetében, ami 800 000 forint feletti összeget jelent. Ezért persze elsőosztályú, tetszetős és igényes dizájnnal rendelkezik és rendkívül erős hűtéssel, mely minden körülmények között garantálja nemcsak a GPU alacsony hőmérsékletét, de a valóban nagyon csendes működést is. Extraként két vezérelt ventilátorcsatlakozót, 18+3 fázisos, nagy tartalékokkal rendelkező VRM megoldást kapunk, illetve egy támasztékot, amivel a 2,5 kg-os kártyát stabilizálhatjuk a gépházban. A VGA gyárilag tuningolt, és ezen valamennyit még javíthatunk is, ami összeségében 5-6% többletet eredményezhet. De hogy mindez megéri-e a többiekhez mérten érezhető, 70-80 000 forintos felárat, az már a vásárló döntése.
![]() |
![]() |
NVIDIA GeForce RTX 4080 16 GB GPU | ROG Strix GeForce RTX 4080 16GB GDDR6X OC Edition |
Abu85, Wombath
A ROG Strix GeForce RTX 4080 16GB GDDR6X OC Edition videokártyát az ASUS bocsátotta rendelkezésünkre.