RDNA 2 kisebb kivitelben
Hát eljött ez a nap is: az ígéretek szerint holnap érkeznek a boltokba az AMD Radeon RX 6700 XT GPU-jára épülő videokártyák, hogy konkurenciát állítsanak az NVIDIA GeForce RTX 3070 és RTX 3060 Ti-nek. Legalábbis normális körülmények között így lenne, jelenleg azonban nincsenek normális körülmények, így a 2021-es tapasztalatok alapján valószínűleg még a véletlenül valóban a webes polcokra kerülő néhány kártyát is pillanatok alatt felvásárolják majd, hogy aztán 150-200%-os áremelés után bukkanjanak fel a neten. És valószínűleg még így is találnak vásárlót maguknak!
Ha eltekintünk persze a szomorú piaci helyzettől, akkor abból indulhatunk ki, hogy az AMD ajánlott árként 479 dollárt jelölt meg – ez némileg elmarad az NVIDIA GeForce RTX 3070-étől (499 dollár), de érezhetően több az RTX 3060 Ti-nél (399 dollár). Ebből nagyjából sejthető, hogy az AMD e kettő ellen szeretne versenyezni, egyik fő fegyvere pedig az 50 százalékkal több memória, mely időtállóbbá teszi a 8 GB-tal szerelt ellenfelekkel szemben. De mi a helyzet most, ebben a pillanatban? Melyik kártya ér el magasabb sebességet a játékok alatt? Ezt nézzük most meg.
Az RDNA2 architektúra alapvető működéséről korábbi cikkünkben már bővebben írtunk, de most egy újabb GPU-ról van szó, így érdemes ezt is kielemezni. A Navi 22 kódnevet viselő lapka a nagyobb verzióhoz hasonlóan a TSMC 7 nm-es node-ján készül, viszont már "csak" 17,2 milliárd tranzisztorból épül fel, miközben kiterjedése 336 mm².
A multiprocesszorok felépítése nem változott, de számuk igen, így a Navi 22-es grafikus vezérlőben 20 darab úgynevezett WGP (Workgroup Processor) található, amelyek két darab CU-t, azaz Compute Unitot tartalmaznak, és ezekben belül van két darab, egymástól teljesen független, saját skalár egységekkel dolgozó, 32 utas, azaz 1024 bites, multiprecíziós SIMD motor. Egy WGP-ben 128 kB-os Local Data Share (LDS) található, amelyen a négy darab, egyenként 128 kB-os regiszterterülettel rendelkező SIMD motor osztozik. A helyi adatmegosztás mellett CU-nként egy darab 16 kB-os L0 adat gyorsítótár is fellelhető.
A WGP-n belül a saját regiszterterülettel és wave pufferrel rendelkező skalár egységekhez tartozik egy közös 16 kB-os skalár és egy 32 kB-os utasítás gyorsítótár. Előbbit csak a skalár feldolgozó éri el, míg utóbbit az összes feldolgozó hasznosíthatja, és természetesen mindkét gyorsítótár írható és olvasható is. Ezek mellett a textúrázást CU-nként egy blokk oldja meg, amely négy darab, csak szűrt mintákkal visszatérő, Gather4-kompatibilis textúrázó csatornát rejt. Az SFU-k, vagyis a speciális funkciókért felelős egységek összesített száma sem változott, azaz SIMD-enként nyolc feldolgozóról beszélünk.
Az Infinity Cache most is jelen van, így a gyorsítótárak szervezése a Navi 21 mintáját idézi, ugyanakkor a Navi 22-ben a memóriavezérlőhöz 96 MB kapacitású írható és olvasható gyorsítótár kapcsolódik, és a 3 MB-os, szintén írható és olvasható másodlagos gyorsítótár ehhez van hozzákötve a ROP blokkal egyetemben. Ezek a részegységek továbbra is a másodlagos gyorsítótár kliensei, vagyis a pixel- és textúraadatokra vonatkozó memóriaelérések koherensek, továbbá minden ROP blokk saját RB gyorsítótára egy olyan 128 kB-os L1 gyorsítótárhoz kapcsolódik, amelyet még tíz darab WGP is elér, és ezek az egységek a raszterizálóval együtt ezen osztoznak. Mindemellett az L1 gyorsítótárhoz kapcsolódik a CU-khoz tartozó L0 is.
Hirdetés
A ROP blokkok továbbra is úgynevezett pixelmotorokat tartalmaznak, egészen pontosan 2-t, és egy pixelmotor 4 blending, illetve 8 Z mintavételező egységből áll, ami a Navi 22 esetében összesen 64 blending és 128 Z mintavételezőt jelent. Természetesen a VRS (variable rate shading) támogatása adott, ahogy megmaradt a Delta Color Compression technika is. Érdemes szót ejteni a memóriavezérlőről, amely 192 bites, így hat darab 32 bites buszon köthető rá egy-egy darab GDDR6 szabványú memórialapka.
Megvágva, nem felezve
Logikai felépítés tekintetében a Navi 22-t érdekes módon alakította ki az AMD a Navi 21-hez képest. Amíg utóbbi lapkában fő alapegységként négy darab shader motor található, addig az új kialakításba már csak kettő jutott. Ezzel a shader motorhoz szorosan kapcsolódó részegységek száma a felére esett a nagyobb testvérhez viszonyítva, viszont a parancsmotorok tekintetében már nincs változás.
A Navi 22-ben is alapvetően négy ACE dolgozik, amelyek egy HWS (Hardware Scheduler) fennhatósága alá tartoznak. Ezzel a rendszer összességében 32 compute parancslistát kezel egy grafikai parancslista mellett. Természetesen megmaradt a finomszemcsés preempció és a QoS (Quality of Service) támogatása. Előbbi felel azért, hogy a kritikus fontosságú feladatok előnyt élvezzenek, míg utóbbi a többfelhasználós környezet hatékony kezelését teszi lehetővé, ráadásul továbbra is virtualizálható a teljes lapkára, mindezt teljesen automatikus hardveres ütemezés mellett. Természetesen továbbra is a rendszer része a 64 kB-os globális adatmegosztás, vagy más néven Global Data Share (GDS), és az előző generációban bevezetett priority tunneling szintén elérhető.
Az AMD a kisebb lapkában is beveti a Navi 21-ben bevezetett új a grafikai parancsmotort, ami ugye többmagos kialakítású, így az áteresztőképessége kétszeres a korábbi generációhoz viszonyítva. Itt a cég a friss lapkát azért nem korlátozta le, mert a rajzolási parancsok számának növelésére csak erőből lehet reagálni, és hiába van feleannyi feldolgozó a Navi 22-ben, ezek megfelelő etetése a kisebb dizájnokban is kulcsfontosságú.
Ami érdekes, hogy az AMD az Infinity Cache-t nem felezte meg, ahogy a memóriabuszt sem. Inkább 192 bitet választottak 96 MB-os gyorsítótárral, ami a cég szerint egyfajta arany középút. A memóriabusz tekintetében elsődlegesen az számított, hogy optimálisan lehessen a VGA-ra tenni 12 GB-nyi VRAM-ot, amit nyilván hat memórialapkából megoldható, míg az Infinity Cache kapacitása elsődlegesen a célpiacra fókuszál. Elvileg 64 MB-tal is kihozható lett volna a lapka, de a találati arány nagyon lényeges. Ezt a témát korábbi cikkünkben körbejártuk, és az AMD diagramján látható, hogy 1440p-ben azért számít az a plusz 32 MB gyorsítótár, ezért került a fejlesztésre ennyi. 4K-ban már nem lenne nagy haszna, de a Navi 22-et eleve nem ekkora felbontásra tervezték, sokkal inkább Full HD-re és WQHD-re szánják.
Multimédiás szempontból, illetve kijelzőkezelés tekintetében a Navi 22 a Navi 21-et másolja, vagyis ugyanarra képes a két hardver, illetve a PCI Express 4.0 is adott 16 sáv mellett.
Tesztkörnyezet, versenytársak
A korábbi grafikus kártyákat vizsgáló tesztben írtak továbbra is igazak: egyelőre még párhuzamosan használjuk a méréseknél a Ryzen 7 3700X-et és a Ryzen 7 5800X-et – ettől eltekintve tesztágyunk ismerős lehet a korábbi cikkekből.
Alaplap | MSI MEG X570 GODLIKE |
---|---|
Processzor | - AMD Ryzen 7 3700X (PBO: Enabled) - AMD Ryzen 7 5800X (PBO: Enabled) |
Processzorhűtő | Fractal Design Celsius S36 |
Memória | 4 x 16 GB Patriot Viper 4 Blackout DDR4-3600 |
Videokártya | - ASUS TUF Gaming GeForce RTX 3080 OC 10 GB (illesztőprogram: 456.16 – „RTX 3080 edition”) - Palit GeForce RTX 3070 8 GB (illesztőprogram: 456.96 – „RTX 3070 edition”) - ASUS TUF Gaming GeForce RTX 3070 8 GB (illesztőprogram: 456.96 – „RTX 3070 edition”) - Gigabyte AORUS GeForce RTX 2080 Ti Extreme 11 GB GDDR6 (illesztőprogram: 456.16 – „RTX 3080 edition”) - ASUS ROG Strix GeForce RTX 2080 OC (illesztőprogram: 456.96 – „RTX 3070 edition”) - AMD Radeon RX 6800 (illesztőprogram: Adrenalin 20.45.01.12) - Gainward GeForce RTX 3060 Ti Ghost OC (illesztőprogram: 457.40) - EVGA GeForce RTX 3090 FTW3 Ultra (illesztőprogram: 460.89) - Sapphire NITRO+ AMD Radeon RX 6800 XT (illesztőprogram: Adrenalin 20.11.03) - ASUS ROG Strix GeForce RTX 3060 Gaming OC (illesztőprogram: 461.64) - AMD Radeon RX 6700 XT (illesztőprogram: Adrenalin 27.20.15002.118) |
SSD | - Kingston UV500 480 GB - Patriot Viper VP4100 1 TB |
Ház | Cooler Master Test Bench V1.0 |
Tápegység | FSP Aurum PT 1200 |
Operációs rendszer | Microsoft Windows 10 Professional x64 2004 |
Nem változtak a mérésekhez használt szoftverek és játékok sem, az utóbbiak felsorolását és beállításait az alábbi táblázatban szokás szerint összegeztük is. A méréseket továbbra is az OCAT 1.6/FrameView 1.1 segítségével végeztük, és jó szokásunk szerint az alsó és felső 5 százalékot elhagytuk, így az esetleges véletlenszerű megtorpanások nem befolyásolják az eredményt, melyet a háromszori mérésből végzett átlagolás még tovább pontosít.
Játékprogram | API | Videojáték-motor | Beállítások |
---|---|---|---|
Deus Ex: Mankind Divided | DirectX 12 | Dawn | Minden maximumon, de MSAA=OFF |
Forza Horizon 4 | DirectX 12 | Forzatech | Unlocked frame rate, ultra preset, dynamic optimization off |
Gears 5 | DirectX 12 | Unreal Engine | Ultra preset, Tiled Resources On |
Horizon Zero Dawn | DirectX 12 | Decima | Ultimate Quality, Clouds: High |
Metro: Exodus | DirectX 12 | 4A | Ultra Preset |
Shadow of the Tomb Raider | DirectX 12 | Foundation | Minden maximumon, SMAAT 2x, Ambient Occlusion: BTAO, FidelityFX sharpening |
Strange Brigade | Vulkan | Asura | Ultra preset, Async Compute on |
Red Dead Redemption 2 | Vulkan | RAGE | Quality Preset 19. lépcső, texture quality Ultra, 8x AF |
Tom Clancy's The Division 2 | DirectX 12 | Snowdrop | Ultra preset, resolution scale 100% |
World War Z | Vulkan | Swarm | Minden maximumon, AA: TAA, FidelityFX CAS On |
Versenyzők
Tesztünk főszereplője az AMD saját kiadású Radeon RX 6700 XT kártyája, mely, ahogy említettük, a GeForce RTX 3070 és RTX 3060 Ti ellen kell elsősorban felvegye a harcot.
A kártya a tavaly megjelent Radeon RX 6800 dizájnját követi, azzal a fontos különbséggel, hogy hűtéséről csak két ventilátor gondoskodik. Ezek kinézete ugyanakkor teljesen megegyezik a nagyobb testvérre került hármaséval, és hogy a nagy R-ek száma ne csökkenjen, közéjük egy méretes, krómozott példány is befért.
A hűtő maga keskenyebb (alacsonyabb) bordázattal rendelkezik, hiszen az alacsonyabb TBP miatt nem kell akkora hőmennyiséget elszállítania. Ez a másik oldalon is jelentkezik, a két darab 6+2 tűs tápcsatlakozó helyett elég egy 6+2 és egy 6 tűs példányt használni.
A hátoldalon egy teljesen zárt merevítő/hőelosztó lemezt láthatunk, csatlakozókból pedig három DisplayPort és egy HDMI kivezetést áll rendelkezésre – igen, az RX 6800-on felbukkanó VirtualLink Type-C-je helyett kapunk egy plusz DisplayPortot.
A díszítések terén sem történt változás: a hűtés előlapjának döntött részén elhelyezett Radeon felirat kapott diszkrét vörös világítást.
VGA megnevezése | GigaByte AORUS GeForce RTX 2080 Ti XTREME |
ASUS ROG Strix GeForce RTX 2080 OC |
Palit GamingPro GeForce RTX 3070 |
Gainward GeForce RTX 3060 Ti Ghost OC |
AMD Radeon RX 6800 |
AMD Radeon RX 6700 XT |
---|---|---|---|---|---|---|
Kódnév | TU102 | TU104 | GA104-300 | GA104-200 | Navi 21 | Navi 22 |
Gyártástechnológia | 12 nm (TSMC) | 8 nm (Samsung) | 7 nm (TSMC) | |||
Mikroarchitektúra | Turing | Ampere | RDNA2 | |||
Tranzisztorok száma | 18,6 milliárd | 13,6 milliárd | 17,4 milliárd | 26,8 milliárd | 17,2 milliárd | |
GPU-lapka mérete | 754 mm2 | 545 mm2 | 393 mm2 | 519,8 mm2 | 336 mm2 | |
GPU alap/turbó órajel | 1350/1770 MHz | 1515/1860 MHz | 1500/1730 MHz | 1410/1695 MHz | 1815/2105 MHz | 2424/2619 MHz |
GPU/shader órajele üresjáratban |
300 MHz | 210 MHz | dinamikusan változó | |||
Shader processzorok típusa |
stream | stream (16+16 co-issue) | multiprecíziós vektor | |||
Számolóegységek száma | 4352 | 2944 | 5888 | 4864 | 3840 | 2560 |
Textúrázók száma | 272 textúracímző és -szűrő |
184 textúracímző és -szűrő |
184 textúracímző és -szűrő |
152 textúracímző és -szűrő |
240 textúracímző és -szűrő |
160 textúracímző és -szűrő |
ROP egységek száma | 11 blokk (88) | 8 blokk (64) | 12 blokk (96) | 10 blokk (80) | 4 blokk (128) | 2 blokk (64) |
Memória mérete | 11 264 MB | 8192 MB | 8192 MB | 16 384 MB | 12 288 MB | |
Memóriavezérlő | 352 bites crossbar | 256 bites crossbar | 256 bites crossbar | 256 bites hubvezérelt | 192 bites hubvezérelt | |
Memória órajele terhelve | 14 000 MHz (GDDR6) | 14 000 MHz (GDDR6) | 16 000 MHz (GDDR6) | |||
Üresjáratban | 203 MHz (GDDR6) | 51 MHz (GDDR6) | dinamikusan változó (GDDR6) | |||
Max. memória- sávszélesség |
616 000 MB/s | 448 000 MB/s | 448 000 MB/s | 512 000 MB/s | 384 000 MB/s | |
Dedikált HD transzkódoló |
NVENC7 | RME | ||||
Hardveres videó- lejátszás támogatása |
NVDEC4 | NVDEC5 | ||||
Hivatalos fogyasztás | ~250 watt | ~215 watt | ~220 watt | ~200 watt | ~250 watt | ~230 watt |
Eredmények: Deus Ex: Mankind Divided
Ryzen 7 3700X-szel
Ryzen 7 5800X-szel
Eredmények: Forza Horizon 4
Ryzen 7 3700X-szel
Ryzen 7 5800X-szel
Eredmények: Gears 5
Ryzen 7 3700X-szel
Ryzen 7 5800X-szel
Eredmények: Horizon Zero Dawn
Ryzen 7 3700X-szel
Ryzen 7 5800X-szel
Eredmények: Metro: Exodus
Ryzen 7 3700X-szel
Ryzen 7 5800X-szel
Eredmények: Red Dead Redemption 2
Ryzen 7 3700X-szel
Ryzen 7 5800X-szel
Eredmények: Shadow of the Tomb Raider
Ryzen 7 3700X-szel
Ryzen 7 5800X-szel
Eredmények: Strange Brigade
Ryzen 7 3700X-szel
Ryzen 7 5800X-szel
Eredmények: Tom Clancy’s The Division 2
Ryzen 7 3700X-szel
Ryzen 7 5800X-szel
Eredmények: World War Z
Ryzen 7 3700X-szel
Ryzen 7 5800X-szel
Összegezve az eredményeket elmondhatjuk, hogy a Radeon RX 6700 XT nem igazán mutatja a bevezetőben említett, GeForce RTX 3060 Ti és RTX 3070 GPU-kkal harcba szálló kártya képét, legalábbis a tesztre használt programokkal semmiképp. Sebessége általában kicsit haladja csak meg a 3060 Ti-re épülő modellekét, egy-két esetben viszont határozottan elmarad tőle (ilyen például a Forza Horizon 4). Az RTX 3070 viszont egyetlen alkalommal sincs annyira közel, amennyire az MSRP-k alapján számítottunk rá.
Önmagában nézve egyébként nem rosszak a számok, sok játékban maximális minőségi beállítások mellett is vállalható az UHD felbontás, de ha az nem, a QHD mindenképp – néha akár olyan sebességgel is, ami még a VRR monitorok képességeinek kihasználását is lehetővé teszi.
Sugárkövetés hatása, fogyasztás, hőmérséklet
Idén már nem csak a GeForce RTX széria kiváltsága a sugárkövetés, a Radeonok esetében is bekapcsolható ez a funkció. Persze ennek komoly ára van sebességben:
A korábban tesztelt Big Navi kártyáknál is láthattuk, hogy a sugárkövetés bekapcsolása komolyabban visszavesz a sebességből, mint az NVIDIA megoldásainál - ráadásul itt a DLSS sem áll rendelkezésre, hogy ezen javítsunk. A visszaesés mértéke miatt a Radeon RX 6700 XT legfeljebb Full HD felbontáson képes megfelelő gyorsasággal megjeleníteni a képkockákat, de még így is valószínű, hogy érdemesebb lesz kevésbé agresszív beállításokkal használni ezt a szolgáltatást.
Fogyasztás és hőmérséklet
A fogyasztásban nincsenek meglepetések, az RX 6700 XT azt hozza, amit a sebesség alapján vártunk tőle. A hűtőrendszer használat közben jól teljesít, még teljes terhelésen is viszonylag halk, nincs zavaró zúgás, süvítés. A coil whine közepesen erős, egy nagyon nyitott ház esetében lehet, hogy még kívül is észlelhető, amennyiben a hűtések némák maradnak.
A teljesítmény, frekvencia, hőmérséklet görbéit nézve különösen a frekvencia esetében impozánsak a számok, de érdekes látni, hogy ezt nem követi a hőmérséklet és a teljesítményigény hasonló méretű növekedése.
Értékelés
Nézzük akkor most összegezve, hogy hogyan teljesít az új, "közepes" Navi a mezőnyben egy erős és egy nagyon erős processzor mellett:
Ryzen 7 3700X-szel
Ryzen 7 5800X-szel
A mérések után már kicsit keseregtünk azon, hogy a Radeon RX 6700 XT lassabb annál, amire számítottunk, és ezt az összesített értékelés is alátámasztja: a kártya gyakorlatilag a GeForce RTX 3060 Ti szintjén teljesít, a GeForce RTX 3070 viszont 10-15%-kal gyorsabb nála, attól függően, hogy mennyire CPU-intenzív az adott beállítás. Ez nem jó hír abból a szempontból, hogy a javasolt ár alapján itt egy RTX 3070 szintű kártyát kellene látnunk. Természetesen vannak az adott VGA-nak olyan jellemzői, amelyek a puszta fps értékeken nem látszanak, mégpedig elsősorban a 12 GB VRAM, mely a jövőbeli programok esetében még jelentős szerephez juthat (a Godfallnál bekapcsolt RT-vel például 3-4 GB-tal nő a VRAM-igény!), ami mindenképp fontos lehet egy adott esetben két-három évre vásárolt eszköznél.
Játékok memóriaigénye 1440p-ben (forrás: AMD)
Az nem vitás, hogy az AMD termékpalettáján helye van a 6700 XT-nek: a 6800 alatt nincs kurrens ajánlatuk, az előző generációs 5700 XT pedig körülbelül az RTX 3060 szintjén mozog teljesítményben. De még így is úgy véljük, hogy ezzel az ajánlott árral lehetne sebességben kicsit feljebb pozicionálni, és még akkor is bőven maradna hely a később érkező, olcsóbb változatoknak a piacon.
Persze egyelőre mindez csak elmélet, hiszen a piaci viszonyok olyanok, hogy ha az RX 6700 XT akár csak az ajánlott ár közelében elérhetővé válna, már kiérdemelné a kiemelten ajánlott díjat. Viszont hacsak nem változnak meg hirtelen az elmúlt hónapok trendjei, akkor erre nagyon ne számítsunk; a versenytársakhoz hasonlóan szűkös elérhetőség és az ennek következtében (is) az egekbe repülő árak okán nyugodtan kijelenthetjük, hogy legalábbis a következő időszakban az RX 6700 XT sem hoz megváltást a grafikus kártyák piacán.
Abu85, Wombath