Az AMD sem malmozott...
Alig másfél hete mutattuk be az NVIDIA tizedik generációs grafikus processzorát, a GT200-at, az AMD részéről máris itt van a válasz, az RV770 kódnéven emlegetett GPU. A GT200 (szó szerint) nagy lett, és elméletben erős is, szóval nagy kérdés volt, most mit tesz le az asztalra a konkurens, hogyan alakulnak az erőviszonyok a gyakorlatban. Izgalmas fordulat, hogy az AMD módosította tervezési irányelveit. Az R600-zal lefektetett (de már korábban is tetten érhető) alaptézis az volt, hogy a játékok olyan irányba fejlődnek, melynél a shaderek szerepe nő meg a textúrázó egységek kárára. A már-már hitvallássá vált gondolatnak csak egy nagy hibája volt, mégpedig hogy ott volt egy ellenfél, amely nem siette el az ez irányú fejlesztéseket, és kellő piaci befolyással rendelkezett ahhoz, hogy a játékok erőforrásigénye se mozduljon el gyorsan az AMD számára kedvezőbb összeállítás felé. A mérnökök okultak a dologból, és nem csupán a shaderek számát gyarapították tovább, de ezúttal nagyobb hangsúlyt fektettek a textúrázásra és az élsimításra is.
Egy-egy szíliciumszelet RV770 és GT200-as chipekkel... [+]
Az ATI Radeon HD 4800-as sorozattal debütáló RV770 lényegében az RV670-re alapoz, de felépítése visszavezethető egészen az R600-ig, bár sok helyen módosították, finomították, sőt a memóriavezérlőt teljesen át is dolgozták. Az AMD új chiptervezési stratégiájának egyik kulcseleme, hogy előtérbe kell állítani a számítási teljesítmény/fogyasztás, illetve a számítási teljesítmény/ár arányt. Ez az igény legkorábban a központi processzorok tervezésénél merült fel, ám más szegmensekben is egyre nagyobb jelentőséget kap, gondoljunk csak a néhány hónapja megjelent platform alapjául szolgáló AMD 780G chipsetre.
Ezzel párhuzamosan fordítottak a GPU-k bevezetésének menetrendjén is, aminek kommunikálása újabb pengeváltásra adott okok az AMD és az NVIDIA között. Az előbbi ugyanis kifejezetten a tágan értelmezett középkategória számára fejlesztette új GPU-ját, azt vallva, hogy elsőként a legnagyobb piaci szegmensben kell hozzáférhetővé tenni az új technológiákat, majd fölfelé és lefelé történő skálázással következhet a csúcskategóriába, illetve a belépőszintre szánt videokártyák elkészítése. Az NVIDIA ezzel szemben még a hagyományos receptet követi, a GT200-zal a felső szinten vetné meg a lábát, aztán ha már beáll a gyártás, jöhetnek a teljesítményben és persze méretben is kisebb GPU-k. Az AMD az ellenfél megoldására utalva azt hangoztatja, hogy a nagyméretű „megachipek” kora lejárt, az NVIDIA pedig igyekszik azt a látszatot kelteni, hogy a vetélytárs azért a középszegmensre koncentrál, mert erre futja erőforrásaiból. Természetesen az AMD sem akar kivonulni a relatíve csekély forgalmat generáló, de komoly presztízst jelentő csúcskategória piacáról, csak éppen másképp képzeli el a megvalósítást. Nem véletlen, hogy annyira tolja a CrossFire(X) szekerét, a cégnél nagyon hisznek a multi-GPU-s megoldásokban. Mi következik mindebből? Az, hogy az AMD nem nagyméretű chipek köré építené legerősebb videokártyáit, hanem inkább két kisebb GPU-t helyezne egy nyomtatott áramköri lapra, vagy azt tanácsolja a fejleszteni kívánóknak, hogy második, harmadik vagy akár negyedik videokártya üzembe állításával fokozzák a teljesítményt. Mindehhez elegendő egy megfizethető, viszonylag egyszerűen megtervezhető és legyártható chip is, amivel több legyet üthetnek egy csapásra. Egyrészt kezükben lesz egy könnyen eladható, „best buy” videokártya, másrészt a CrossFire révén két effajta chip összekötésével szinte azonnal kiadhatnak egy csúcskategóriás terméket is (azaz mindjárt két árkategóriát fedhetnek le egy GPU segítségével). És még nem szóltunk a kisebb gyártási költségekről, az alacsonyabb selejtarányról, a kisebb fogyasztásról...
Most pedig lássuk címszavakban, hogy mit várhatunk az új architektúrától:
- tervezési hatékonyság (magméret optimalizálása, teljesítmény/ár és teljesítmény/fogyasztás arány javítása)
- 800 darab stream processzor
- optimalizált textúrázók
- új textúracache felépítés
- új memóriavezérlő
- optimalizált ROP-ok
- továbbfejlesztett geometriai shader és a tesszellációs teljesítmény
A tervezés hatékonyságának tekintetében az AMD a jelek szerint tényleg nagyot alkotott, ugyanis a tranzisztorszám és a magméret csak 40%-kal nőtt, miközben a teljesítményt befolyásoló részegységek száma 2–2,5-szerese az RV670-ben találhatónak. Hogy ezt miként érték el, arra csak következtetni tudunk, ennél fontosabb, hogy ez a gyakorlatban mekkora valós sebességnövekedést eredményez. Még egy érdekesség: a gyártó szerint az egy négyzetmilliméterre vetített teljesítmény 70 százalékkal több, mint az előző generációnál.
A mérnökök úgy gondolták, hogy nincs okuk hozzányúlni az ALU:TEX arányhoz, azaz a számolók és textúrázók egymáshoz viszonyított számát nem változtatták meg (bár itt van egy kis csavar). Ez persze egyáltalán nem jelenti azt, hogy nem történt változás, hiszen csak az arány nem változott, a stream processzorok száma 320-ról 800-ra nőtt (10 darab 80-as SIMD tömb), ezzel arányban a textúrázóké pedig 16-ról 40-re (a címzők és szűrők egyaránt). Nehéz lenne megmondani, hogy a textúrázók számát az NVIDIA által „támogatott” játékok hatására növelték-e meg, vagy az AMD egyébként is ezt tervezte. Mindenesetre akármennyire is feleslegesnek tűnik ez 2008-ban, nem rossz az ötlet, mert ezen a területen a Radeonok hátrányban voltak a GeForce-okhoz képest. Nem mellékes, hogy a számolók esetében is rájuk fért a gyorsulás. Az RV670-ben található 320 stream processzor számszerűleg jóval több, mint a leggyorsabb GeForce-okban található 128 számoló, de figyelembe kell venni, hogy a GeForce-ok shader órajele közel kétszerese a GPU alapórajelének. Másrészt, mint tudjuk, a Radeonok esetében 5 utas szuperskalár shader processzorokból épülnek fel a SIMD tömbök, négy skalár és egy komplex végrehajtót találunk bennük, melyek csak akkor működnek optimális kihasználtsággal, ha az egyes végrehajtandó utasítások között nincs függőség. A 10 darab 80 stream processzoros tömbhöz egyenként 16 kB lokális gyorsítótár tartozik, a többi SIMD tömbbel pedig egy globális gyorsítótáron keresztül kommunikálnak, melynek mérete szintén 16 kB. Az 5 utas shaderprocesszorokkal kapcsolatban a dokumentumok kitérnek arra is, hogy az egész számokon végzett biteltolást 12,5-szer gyorsabban hajtják végre, mint elődeik.
A textúrázók esetében az első lényegi újítást már említettük, az RV770-ben immár 40 textúrázó, pontosabban 10 textúrázóblokk található (ugyanis ezek egy-egy SIMD tömbhöz kapcsolódnak, márpedig ezekből négy helyett immár tíz van). De ez csak a szűrők esetében jelent két és félszeres szorzót, ugyanis címzőkből az RV670-ben 32 darab található (még ez is 25%-os többlet). Talán még ennél is fontosabb változás, hogy megújult a cache-hierarchia: az L1 textúracache nem közvetlenül kapcsolódik a textúrázókhoz, hanem egy adatlekérdező buszon (Data Request Bus) keresztül, ráadásul nem egy közös L1 textúra-gyorstárat találunk a chipben, hanem – ha írásról (store) van szó, akkor – minden egyes SIMD tömbhöz kapcsolódik külön-külön egy. Valószínűsíthető, hogy olvasásnál a SIMD tömbök a Data Request Buson keresztül használhatják egymás adatait is. Az L2 cache elérhetősége is megváltozott, ugyanis ez nem közvetlenül az elsőszintű gyorstárakhoz kapcsolódik, hanem furcsa mód az egyes memóriacsatornákhoz, de erről még később szólunk.
A ROP-ok fejlesztésével az AMD az élsimítás teljesítményén kíván javítani. A ROP blokkok száma maradt négy, de a depth/stencil írás/olvasás kétszer gyorsabb lett elődjénél, tehát 64 pixel/órajelre képes.
A leírás említést tesz még a geometriai shader feldolgozási sebességének gyorsulásáról, amit többek között úgy értek el, hogy a chip több geometriai shader által generált adatot képes egyidejűleg kezelni és tárolni (több a gyorsítótár), illetve négyszeresére nőtt a kezelt GS-szálak száma is. A tesszelációt is továbbfejlesztették, mely alkalmazható replikáció (instancing) esetén is, és támogatja a DirectX 10.1-et.
Hub-központosított felépítés [+]
Az RV770 eddig ismertetett újításai nem voltak különösebben meglepőek, de az, hogy hozzányúltak a ring-bus memóriavezérlőhöz, váratlanul ért minket. Bármennyire is meglepő, az AMD eldobta a ring-bus memóriavezérlőt, és helyette kifejlesztett egy hub által összekötött megosztott memóriavezérlőt. Nem teljesen egyértelmű, hogy a hubra pontosan milyen memóriavezérlő csatlakozik: egyetlen négyirányú vagy pedig négy különálló. Ami biztos, hogy a négy végponthoz az elsődleges sávszélességfaló komponensek kapcsolódnak, úgy mint az L2 gyorstár és a ROP egységek. Minden más, a parancsfeldolgozó, a számolók és a textúrázók is csak a hubon keresztül érik el a memóriát. A videolejátszást gyorsító rész (Avivo HD, UVD2), a PCI Express és a CrossFire vezérlő, illetve a megjelenítésvezérlő is csak a hubot látja. Az AMD szerint ez a memóriafelosztásos módszer csökkenti a késleltetést és a fogyasztást is. Az új memóriavezérlő immár támogatja a GDDR5 szabványt, melynek elsődleges szerepe a sávszélesség növelése. Az új chipek lábanként 3,2–3,7 Gbps tempójú adatátvitelt tesznek lehetővé, vagyis chipenként 12,8–28 GB/s sávszélesség érhető el. Mindez nem csupán a teljesítmény fokozását szolgálja, hanem inkább a teljesítmény és a költségek közötti egészséges kompromisszum megteremtését. Ha ugyanis ugyanakkora sávszélesség kevesebb chippel is elérhető, akkor csökken a nyomtatott áramkör mérete, bonyolultsága és persze költsége, és nem mellékesen a fogyasztási keretet sem terhelik plusz memórialapkák. A GDDR5 a megbízhatóságot növelő, az átlagos felhasználó számára rejtve maradó funkciókat is kapott; minden tranzakció hibaellenőrzéssel párosul, és ha a vezérlő azt érzékeli, hogy a hibaarány elér egy küszöböt, akkor újra megtörténik a GPU és a RAM szinkronizációja.
Az NVIDIA-hoz hasonlóan az AMD is igyekszik hangsúlyozni, hogy az új chip már nem csak egy szimpla grafikus gyorsító, hanem ha GPGPU feladatokról, azaz általános jellegű számolnivalóról esik szó, akkor is egy komplett erőmű. Az RV770 órajeltől függően 1 teraFLOPs-os teljesítményével felülmúlja még az NVIDIA GT200-as chipet is, ráadásul számos optimalizációt is elvégeztek rajta (melyekről már szó esett: nagyobb gyorsítótárak, gyorsabb egészműveletek, gyorsabb memóriaműveletek), melyekkel az előző generációhoz képest is számottevően gyorsulnak a kalkulációk. (Az 1 teraFLOPs persze egyszeres pontosságú számításokra értendő, kétszeres pontosságnál 240 gigaFLOPs az idevágó érték.) A játékokra visszatérve: a nagy számítási kapacitást a jövőben nem csak a grafikánál használhatják ki, az AMD szerint a CPU erőforrásait jelentős mértékben lefoglaló mesterséges intelligencia is – részben – a GPU-ra költözhet, így nemcsak növelhető a gép által generált karakterek száma, hanem viselkedésüket sem kell előre kitalált minták permutációjával előállítani, helyette megnőhet a valós idejű döntések szerepe. A másik növekvő jelentőségű terület a fizikai modellezés. Az Ageia felvásárlásával az NVIDIA a PhysX API mellett tette le a voksát, az AMD viszont a szélesebb körben használt Havoktól licenceli az ehhez szükséges technológiát. A helyzet akkor válhat még érdekesebbé, ha majd az Intel is beszáll a videokártyák piacára, hiszen a Havok tulajdonosaként nem kétséges, melyik fizikai API-t fogja támogatni.
Az NVIDIA továbbra sem támogatja a DirectX 10.1-es változatát, mondván a 10.0-hoz képest olyan elhanyagolható a kiterjesztés, hogy felesleges vele foglalkozni. A kérdésben valószínűleg sosem fogunk teljesen tisztán látni, az AMD szerint azonban nem pusztán az szól a 10.1 mellett, hogy bizonyos esetekben állítólag 10–20 százalékos gyorsulás érhető el vele. Legalább ilyen fontos érvnek tartják, hogy vannak olyan összetett effektusok, amelyek sokkal könnyebben leprogramozhatók a kiterjesztésnek köszönhetően, vagyis munkát és időt takarítanak meg a fejlesztőknek. Hogy pontosan mi van a háttérben, nem tudjuk, de Malagában azt hallottuk, hogy a közeljövőben az eddigi tartózkodás ellenére mégiscsak gyarapodni fog a DirectX 10.1-kompatibilis címek száma. Itt említjük meg, hogy a SEGA is készül valamivel, amiről egyelőre nem árultak el semmi érdemit, de láthatóan nagy várakozásokat fűznek új játékukhoz.
Az RV770 funkciólista részét képezi az Avivo HD kiterjesztése is, amely az UVD2, azaz Unified Video Decoder 2 nevet viseli. Ez lényegében az AMD-nek az NVIDIA G92 és G94 chipjeiben megjelent funkciókra adott válasza, illetve annál még egy kicsit több is. Részét képezi a már ismerős Dual Stream Playback (NVIDIA-nál Dual Stream Decode Acceleration) technológia, amely lehetőséget ad két HD videó szimultán lejátszására, kép a képben módon. Fejlődött a videók dinamikus kontrasztjának beállítása is, továbbá színek, tónusok valós időben feljavított megjelenítése. Újdonság a DVD-ből Full HD (vagy ahhoz közeli PC-monitoros) felbontásra skálázás (például 720x576-ról 1920x1200-ra), amit az UVD2 a különböző videolejátszó szoftvereknél elvileg szebben jelenít meg. Bizonyára egyre többen örülnek majd az RV770-re épülő videokártyák esetében az új, 7.1 surround hangzást is átvivő HDMI csatlakozónak (192 kHz, 24 bit, AC3/DTS/Dolby True HD/DTS HD).
Eddig csak a teljesítménnyel kapcsolatos változtatásokról esett szó, ugyanakkor nem mehetünk el szó nélkül az RV770 energiagazdálkodási sémái mellett sem. Az NVIDIA a GT200-ban bemutatta az órajelkapuzást, amit a GPU-k esetében már nagyon régóta hiányoltunk. Az AMD is megvalósított valami ehhez hasonlót, vagyis mód van a chip egyes egységeinek energiatakarékos üzemmódba kapcsolására. Az RV770-ben található egy mikrokontroller, mely a GPU egyes részeit, illetve a PCI Express buszt figyeli, és ha lehetősége van rá, akkor órajelet csökkent a GPU és a memória esetében is, illetve mindezek alapján a ventilátort is szabályozza.
ATI Radeon HD 4850
A gyártó egyelőre csak egy új videokártya értékesítését kezdte meg, ez a Radeon HD 4850 (a HD 4870 kicsit később jön). A cég a HD 3800-asoknál egy újfajta modellszámozási sémát vezettet be, emiatt eltűnt a Pro és XT utótag, ellenben a Radeon HD elnevezés utáni, négy számjegyű kód utal az adott VGA sebességére. Az első számjegy a generációt jelképezi a PCI Express időszámítás szerint, a második a termékcsaládot határozza meg, az utolsó kettő pedig az ezen belüli relatív teljesítményviszonyokat hivatott tükrözni. Ebből következik, hogy a HD 4850 felfogható a régi rendszer szerinti 4800 Próként.
A két Radeon ezúttal is lényegében ugyanarra a felépítésre alapoz, de az órajelek, a hűtés és a felhasznált memóriachipek generációjukban eltérnek majd egymástól. A Radeon HD 4850 külsőre sokaknak igen ismerősnek tűnhet, ugyanis szinte teljes mértékben megegyezik a Radeon HD 3850-nel. A GPU 625 MHz-en, a memória pedig 1 GHz-en üzemel, a HD 4870 majd 750/1800 MHz-es órajelekkel kerül forgalomba.
A videokártyán található hűtés majdnem megegyezik a HD 3850-en is látott egyszlotos megoldással. Ez egy egyszerűbb, a GPU-t és a memóriákat együttesen beborító réz hűtőborda, ventilátora 2D-ben és 3D-ben egyaránt lassú és hangtalan, ami jól hangzik, de nem kellett még játszanunk sem ahhoz, hogy az egész videokártya felforrósodjon, még hozzáérni is alig lehet, ami a komponensek számára nem éppen ideális állapot. Az előző generációhoz képest viszont több lapátból áll a ventilátor, és a hűtőbordában található lamellák is sugárszerűen helyezkednek el, ami egyben azt is jelenti, hogy több levegő tud rajtuk átáramlani. Maga a NYÁK nagyon hasonlít a HD 3800-asokéhoz, néhány alkatrész odébb került, több lett a kondenzátor, de a legszembetűnőbb, hogy az összes memóriachip derékszögben helyezkedik el a GPU körül. A HD 4850 is CrossFireX-kompatibilis, tehát két CrossFire-csatlakozót találunk rajta. A videokártya szokás szerint két DVI-I és egy tévékimenettel rendelkezik, adnak hozzá HDMI adaptert is.
RV770-es GPU és a HD 4850-en található memória [+]
Az RV770-es chip alapterülete 260 mm², ez 40%-kal nagyobb, mint az RV670. Az igaz, hogy több tranzisztor jobban melegszik, de legalább nagyobb felületen oszlik el a hő (ha már pozitívumokat keresünk). A chip felirataiból nem tudunk meg túl sokat, érdekességként érdemes megemlíteni, hogy ez a lapka 2008 huszadik hetében készült, tehát valamikor május közepén, mondhatni még friss és ropogós. A GDDR5-ös chipek egyelőre nem túl gyakoriak (bár már a Samsung, a Hynix és a Qimonda is megkezdte a tömegtermelést), a HD 4850-en is csak szimpla GDDR3-as lapkákat találunk HYB18H512321BF-10 felirattal, ami 1 ns-os késleltetésre utal, ez éppen elegendő az 1000 MHz-es alapórajelhez.
Szimplán GeForce GTX
Built by NVIDIA GeForce GTX 260 [+]
Az NVIDIA újonnan bejelentett grafikus chipjével részletesen foglalkoztunk előző cikkünkben, most lássuk, hogy milyen köréje épülő videokártyákat találunk a boltok polcain. A GT200 egy nagyméretű chip, és ugyanez elmondható a köréje épülő GeForce GTX 280-ról és 260-ról is. A GTX 280, a csúcsok csúcsa, egy teljes értékű GT200-as lapkára épül 240 stream processzorral, 80 textúrázóval, 512 bites memóriavezérlővel és 1024 MB memóriával. A GTX 260-ra azok a GT200-as chipek kerülnek, melyek nem sikerültek tökéletesre a gyártás folyamán, de még van 192 darab ép stream processzoruk (8 TPC), 64 textúrázójuk, 7 ROP blokkjuk és ebből következően 7 memóriacsatornájuk (448 bites memóriavezérlő). A GTX 260-ra „csak” 896 MB memória kerül. A GeForce GTX 280 és a 260 külsőre szinte teljesen megegyezik egymással, csak egy kis különbséget lehet közöttük felfedezni: a 280-ason 8+6 tűs tápcsatlakozókat találunk, míg a 260-on két hattűsön keresztül kell tápot adni a VGA-nak.
A videokártyá(ko)n látható hűtés a 9800 GTX-en és a 9800 GX2-n megismert konstrukciók keveréke. A kártya szemből nagyjából úgy néz ki, mint a 9800 GTX, a kétszlotos csatlakozópanel egyik oldalán szellőzőnyílásokat látunk, innen indul el a nagy „motorháztető”, ami alatt a hűtőbordát találjuk, majd még beljebb haladva megpillanthatjuk a gyárilag 40%-os sebességen, csendben pörgő ventilátort. Ugyanakkor a túloldal már nem csupasz (mint a 9800 GTX), hanem ugyanúgy, mint a 9800 GX2-n, egy bordás burkot hordoz. A hűtőrendszert szétszedve látható is, hogy miért: a NYÁK mindkét oldalán vannak memóriachipek, amiket hűteni kell. A nyomtatott áramkör leginkább a G80-ra épülő GeForce 8800 GTX/Ultráéhoz hasonlít, de ez csak nagy vonalakban igaz, és leginkább amiatt, mert az óriási GPU látványa arra emlékeztet minket. A videokártya áramellátós része teljesen máshogy épül fel és a GTX 280/260-on oldalanként csak 8 memóriachipet találunk (a 8800 GTX/Ultrán 12 volt, de csak az egyik oldalon). Két-két chip alkotja a nyolccsatornás (crossbar) vezérlő egy-egy 64 bites ágát, így jön össze az 512 bites memóriavezérlő (8 x 32 bit). Ugyanakkor megmaradt a 3 utas SLI támogatásához szükséges SLI-csatlakozópár, és újra előkerült a RAMDAC-okat rejtő chip is, melyet a GPU-n kívül helyeztek el, valószínűleg annak már enélkül is óriási mérete miatt. A GT200-alapú videokártyákon két DVI csatlakozót és egy tévékimenetet találunk, furcsa, hogy a HDMI lemaradt (bár több gyártó pótolja ezt a hiányt).
A GPU és mellette az RV770-hez viszonyított mérete [+]
A GTX-ek alapjául szolgáló GT200-as lapka alapterülete több mint kétszerese a most megjelent RV770-ének. Ez persze áldozatokkal jár, gondoljunk csak a fajlagos gyártási költségekre, ami a chip méretének növekedésével egy bizonyos ponton túl exponenciálisan növekszik, hiszen minél nagyobb chipet kell legyártani, annál kevesebb fér egy szilíciumostyára, illetve annál nagyobb az esélye a meghibásodásra. Kétségtelen, hogy az NVIDIA a GTX-eket a csúcskategóriába szánja, lényegében úgy képzeli el ezt az egészet, hogy versenytársak nélkül bármilyen árat szabhat termékeinek, de ezzel csak részben lehet megmagyarázni egy ekkora chipet. Az már most biztosra vehető, hogy ezeket a videokártyákat nem fogják 50 000 forintért eladni, sokkal hamarabb ki fogják vonni a forgalomból, mint hogy erre az árszintre süllyednének.
A két GTX nemcsak az aktív részegységek számában, de órajeleiben is eltér egymástól. A GTX 280 GPU-ja 602, stream processzorai 1296, memóriája pedig 1107 MHz-en ketyeg, ezek az órajelek karcsúnak tűnnek a G92-alapú GeForce-okéhoz képest, de minél nagyobb egy chip, annál nehezebb azt magas órajelen járatni, fejlettebb órajel-disztribúcióra van szükség. A GTX 260 még ennél is alacsonyabb, 576/1242/999 MHz-es órajelekkel rendelkezik. Mindkét típuson Hynix gyártmányú, H5RS5223CFR jelölésű GDDR3-as memóriák vannak, a GTX280-on található maximum 1200, a GTX 260-on található pedig 1000 MHz-et bír el a gyártó adatai szerint.
Hosszra az új GTX megegyezik a 9800 GTX-szel és a Radeon HD 3870 X2-vel, tehát nem kell miatta új házat venni (feltételezve, hogy már előtte is valamelyik csúcskategóriás VGA-t birtokló felhasználóról van szó).
Összegző táblázat, tesztkonfiguráció és fogyasztás
VGA megnevezése | GeForce GTX 280 | GeForce GTX 260 | GeForce 9800 GTX | Radeon HD 4870 | Radeon HD 4850 | Radeon HD 3870 X2 |
GPU kódneve | GT200 | G92 | RV770 | R680 (2 x RV670) | ||
Gyártástechnológia | 65 nm (TSMC) | 65 nm (TSMC) | 55 nm (TSMC) | 55 nm (TSMC) | ||
Tranzisztorok száma | 1,4 milliárd | 734 millió | 956 millió | 2 x 666 millió | ||
GPU órajele | 602 / 1296 MHz | 576 / 1242 MHz | 675 / 1688 MHz | 750 MHz | 625 MHz | 2 x 825+ MHz |
Vertex shader egységek száma | 240 darab skalár stream processzor | 192 darab skalár stream processzor | 128 darab skalár stream processzor | 160 komplex/640 egyszerű skalár stream processzor | 2 x (64 komplex/256 egyszerű) skalár stream processzor | |
Pixelfutószalagok száma | ||||||
Pixel shaderek száma | ||||||
Textúrázók száma | 80 textúracímző, 80 textúraszűrő | 64 textúracímző, 64 textúraszűrő | 64 textúracímző, 64 textúraszűrő | 40 textúracímző, 40 textúraszűrő | 2 x 32 textúracímző, 2 x 16 textúraszűrő | |
ROP egységek száma | 8 blokk (32) | 7 blokk (28) | 4 blokk (16) | 16 | 2 x 16 | |
Támogatott PS- és VS-verzió | 4.0 / 4.0 | 4.0 / 4.0 | 4.1 / 4.1 | 4.1 / 4.1 | ||
Memóriavezérlő | 512 bites crossbar | 448 bites crossbar | 256 bites crossbar | 256 bites hub-vezérelt | 256 bites ring bus | |
Memória órajele | 1107 MHz | 999 MHz | 1100 MHz | 1800 MHz | 1000 MHz | 900 MHz |
Memória-sávszélesség | 141696 MB/s | 111888 MB/s | 70400 MB/s | 115200 MB/s | 64000 MB/s | 57600 MB/s |
Memória típusa | GDDR3 | GDDR3 | GDDR5 | GDDR3 | GDDR3 | |
Memória mennyisége | 1024 MB | 896 MB | 512 MB | 512 MB – 1 GB (?) | 512 MB | 2 x 512 MB |
HD-videó gyorsítás | PureVideo HD (VP2) | PureVideo HD (VP2) | Avivo HD (UVD2) | Avivo HD (UVD) |
A videokártyák kiszállításában ezúttal az Asus volt a leggyorsabb, tőlük szereztük be a GeForce GTX 280-at és az első Radeon HD 4850-et (de kaptunk az AMD-től is), míg az NVIDIA biztosította számunkra a GeForce GTX 260-at. Az Asus nem különösebben lepett meg minket a csomagolással és a tálalással sem, videokártyáihoz a gyártótól szokásos kellékeket kapjuk. A GeForce GTX 280 mellé csomagoltak egy driver CD-t, egy programos CD-t, egy leírást, egy CD/DVD-tartó tokot, egy PCIe-tápkábelt, egy S-Video/komponens átalakítót és egy szaga alapján műbőrnek tűnő egéralátétet. Sajnos ez elég kicsi, és a nagy melegben könnyen odaizzad az ember keze. A Radeon HD 4850 mellé a CD-ken, leíráson és kábeleken kívül CrossFire-csatlakozót és DVI/D-Sub, illetve DVI/HDMI átalakítót is mellékeltek. Az Asus videokártyáira 3 év garancia érvényes.
Videokártya / driver | Asus GeForce GTX 280 1024 MB (602/1296/1107 MHz) / Forceware 177.34 BBN GeForce GTX 260 896 MB (576/1242/999 MHz) / Forceware 177.34 Asus Radeon HD 4850 512 MB (625/1000 MHz) / Catalyst 8.6 XFX GeForce 9800 GTX 512 MB (675/1688/1100 MHz) / Forceware 175.16 XFX GeForce 8800 GT SLI Alpha Dog 512 MB (@ 600/1500/900 MHz) / Forceware 175.16 XFX GeForce 9600 GT SLI 512 MB (650/1625/900 MHz) / Forceware 175.16 Sapphire Radeon HD 3870 CF 512 MB (775/1125 MHz)/ Catalyst 8.5 Asus Radeon HD 3870 512 MB (775/1125 MHz)/ Catalyst 8.6 BBA Radeon HD 3850 256 MB CF (670/830 MHz)/ Catalyst 8.5 |
Processzor | Core 2 Quad QX9650 @ 3,33 GHz (2 x 6 MB L2 cache) |
Alaplap | Asus P5E3 Deluxe – Intel X38 chipset SLI: XFX nForce 790i Ultra |
Memória | 2 x 1024 MB Samsung DDR3, 1333 MHz-en 7-7-7-21 időzítésekkel |
Merevlemez | Samsung Spinpoint T166 500 GB (SATA, 7200 rpm, 16 MB cache) |
Tápegység | Chieftec 1000 watt |
Monitor | Samsung SyncMaster 305T Plus (30") |
Op. rendszer | Windows Vista Ultimate 32 bit SP1 |
Játékok
- Splash Damage/ID Software / Activision – Enemy Territory: Quake Wars; max beállítás, 8xAA
- Crytek / EA Games – Crysis; very high beállítás
- Epic Games / Midway – Unreal Tournament 3; max beállítás, DX10
- Valve / EA Games – HL2: Episode 2; max beállítás, 8xAA/16xAF játékból
- Massive Entertainment / Vivendi – World in Conflict; very high beállítás, compressed textures, 4xAA/16xAF játékból, DX9 és DX10
- Codemasters / Codemasters – Colin McRae: DiRT; ultra beállítás, 4xAA játékból
- Infinity Ward / Activision – Call of Duty 4: Modern Warfare; max beállítás, max AF, trilinear, 4xAA játékból
- UBIsoft / UBISoft – Rainbow Six Vegas; max beállítás
- Relic Entertainment / THQ – Company of Heroes Opposing Fronts; kézileg minden max, D3D10, 4xAA játékból
- Techland / N-Tec – Call of Juarez; high beállítás, 2048x2048-as árnyékminta, normal árnyékminőség, AA-játékból állítva
A meghajtóprogramokban a képminőségi beállításokat az NVIDIA videokártyáin „legjobb minőség”-re, a Radeonokon pedig a legszebbre kapcsoltuk, az anizotropikus szűrés (16x-os) végig be volt kapcsolva, így később csak az élsimítás mértékét állítgattuk, ahol a játék lehetőséget adott a beállításra, ott játékból, ahol nem, ott a meghajtóprogramból. A „Catalyst AI”-t alapállapotban hagytuk.
Az Enemy Territory: Quake Wars, HL2: Episode 2, Crysis, COD4 játékokban felvett demókat/replayeket használtunk a kártyák teljesítményének leméréséhez. További játékokban (Rainbow Six Vegas, Colin McRae DiRT) egy begyakorolt útvonalat jártunk be háromszor egymás után, miközben FRAPS-szel mértük az fps-eket. A három lefutott kör után az átlagot jegyeztük fel. A World in Conflictban, Call of Juarezben és a COH Opposing Frontsban a játékba beépített teljesítménytesztet futtattuk le, az UT3 esetében pedig a Shangri-la fly-by demót alkalmaztuk a mérések során.
A korábbi Radeonokkal is kipróbáltuk a Catalyst legújabb, 8.6-os verzióját, és csak minimális (1–2 fps) eltéréseket tapasztaltunk, szemben a meghajtóprogram mellé kiadott hibajavítási listában taglaltakkal. A Radeon HD 3870 és 3870 X2 esetében tapasztaltunk furcsaságokat, ugyanis volt néhány játék, melyekben a CrossFire rendszer a szimpla HD 3870 teljesítményénél több mint kétszer volt gyorsabb. Először arra gondoltunk, hogy a Catalyst 8.6 a ludas (azaz lassult a 8.5-höz képest), de miután a 3870 X2-vel megismételtük a méréseket és az eredmények nem változtak, lezártnak tekintettük a kérdést. Úgy tűnik, hogy a többkártyás rendszerek esetében nem csak lefelé, de felfelé is keletkezhetnek kiugró értékek.
A CrossFire-rel és SLI-vel elért eredményeket SLI a CrossFireX ellen című cikkünkből vettük kölcsön. Ezt azért fontos kiemelni, mert a tesztben szerepel több olyan grafikon, melyeken 0 szerepel az egyes rendszerek neve mellett – ez eredménytelen tesztre utal. A nulla jelentése valójában több minden lehet, például a játék használhatatlanul lelassult, driverhiba, fagyás, a gép újraindulása stb. jelentkezett, röviden összefoglalva értékelhetetlen eredmény született.
Próbálkoztunk a videokártyák GPGPU-s teljesítményének feltérképezésével, de a teszteredmények közlését végül elhalasztottuk, mert bár mindkét gyártó kínál ehhez szükséges programokat (gondoljunk a videokonvertáló alkalmazásokra vagy a Folding@home-ra), ezek egyrészt még bétás állapotban vannak, másrészt nem tudtuk őket úgy beállítani, hogy a végeredményeket össze tudjuk vetni egymással. Az valószínűleg senkinek nem mondana semmit, hogy a GTX 280 21 másodperc alatt konvertált át egy videót egyik formátumból a másikba, ha nincs mellette egy processzoros eredmény. Ugyanakkor a GPU-k felépítéséből következően evidens, hogy ezek a folyamszerű adatokkal dolgozó alkalmazások rengeteget profitálnak majd a videokártyák sok kis számolójából, egyáltalán nem véletlen, hogy mindkét gyártó energikusan reklámozza ezt a lehetőséget.
Az NVIDIA ezúttal nagy hangsúlyt fektetett a fogyasztás kérdéskörére; a GeForce GTX-ek órajele (a Rivatuner szerint) standard 2D-ben 300/600/100 MHz-re csökken, Low Power 3D-ben 400/800/300 MHz-re módosul, és csak játék közben (Performance 3D) emelkedik vissza a specifikációban megadott 602/1296/1107, illetve 576/1242/999 MHz-es órajelekig. A Radeon HD 4850-es is két visszaskálázott órajelet ismer, ez az 500/750 MHz és a 300/600 MHz. Látva a grafikont, az NVIDIA végzett jobb munkát, ugyanis az 1,4 milliárd tranzisztoros GT200 üresjáratban bizony kevesebbet fogyaszt, mint a HD 4850.
Terhelve feje tetejére áll az előbb látott eredménysor, ugyanis a HD 4850 a második helyet foglalja el, míg a GTX 200-asok, azok közül is inkább a 280 már SLI-verő fogyasztást produkál. Ehhez nincs is mit hozzáfűzni.
Szintetikus elemzés – I.
Fill-rate és textúrázás (2008-ban)
A Pure fill-rate tesztben a felület csak egy számban rögzített színt kap. A GeForce 200-asok itt a ROP blokkok számával együtt szépen skálázódnak. Érdekesség, hogy a HD 4850 lassabbnak bizonyul a HD 3870-nél, de ez az órajeleket figyelembe véve teljesen evidens. Napjaink játékában azonban ilyen esetek szinte sosem fordulnak elő. A Z-tesztben jól látható, hogy a GeForce-ok optimalizált Z/stencil-útvonallal rendelkeznek, bár erre is egyre ritkábban van szükség. A HD 4850 itt gyorsabb volt a HD 3870-nél, ami ismerve a tényeket (gyorsuló depth/stencil írás-olvasás) szintén nem ért minket váratlanul. A kétszeres gyorsulás valószínűleg valamelyik komponens (Z/stencil-cache vagy memória) szűkös áteresztőképessége miatt maradt el.
Textúrázásban a GeForce 200-asok nagyon brutálisak, a GTX 280 egy- és kéttextúrás esetben a 9800 GTX-nél kétszer gyorsabb. Itt a textúra-mintavételezés miatt van memóriamunka, amiben a GTX 280 igen jól áll. A háromtextúrás tesztben még mindig 100%-os a gyorsulás, de már csökkent a különbség, míg a négytextúrás esetben már „csak” 73%-os. A valóságban az 1–2 textúrás változat ritka, általában egy felületen több textúrát használnak a játékok. A másik oldalon talán izgalmasabb erről a területről beszélni, hiszen a Radeonok textúrázásban nagy hátrányban voltak a konkurenciához képest. Egytextúrás esetben a HD 4850 és a HD 3870 azonos eredményt ér el, ami már bizakodásra ad okot, hiszen a HD 4850 órajele alacsonyabb. Multitextúrázásban (2–4 textúra) megmutatkozik a HD 4850 egyértelmű fölénye, az egyes résztesztekben 26–38%-ot ver elődjére. Ne feledjük, hogy a HD 4850 memóriája is alacsonyabb órajelen jár.
Shaderek
Az első, vertex shaderes kört kiütéssel nyerték a Radeonok, bár a GeForce-ok esetében kétes eredmények születtek, hiszen a GT200-alapú videokártyák lassabbak voltak a G92-alapú 9800 GTX-nél. Ebben a menetben a HD 3870 gyorsabb volt, mint utódja, a 2.a körben az órajeleknek megfelelő volt a különbség, míg a 3.0 tesztben valami más szólt közbe.
DirectX 9-es textúrázásban ismét érdekes eredményeket kaptunk, ezúttal is csak a meghajtóprogram hibájára tudunk gondolni, elvégre a bundagenerátorban (Fur), melyben a szőrszálakat pixelenként számolja ki a GPU, a 9800 GTX alig volt lassabb, mint elviekben kétszer gyorsabb utódai. A Parallax Mapping tesztben a felületi domborúságokat itt is az izzasztó számolás határozza meg, a GeForce-ok esetében itt sem kaptunk értékelhető eredményeket. Nem úgy a Radeonoknál. A Fur tesztben majdnem 3-szoros, a Parallax Mapping tesztben pedig már 3,2-szeres volt a gyorsulás. Itt villantott a 800 felturbózott stream processzor.
Szintetikus elemzés – II.
A Rightmark DirectX 10-re írt verziójával folytattuk a tesztelést, az egyes résztesztek magyarázata itt található. A vertex shaderes teszt első körében, a földgömbös Earthben a leggyengébb beállításokat használtuk, ebben nincs feltételekhez kötött elágazásvezérlés, egy vertexhez 32 textúramintavételezés tartozik, számuk pedig 30 000. A nagyobb terhelésű Waves tesztben már komolyabb feltételes elágazásokat találunk, csúcspontonként 24 mintavételezésről beszélünk, ezekből összesen 1 122 000 van. A GeForce-ok esetében nem tűnik úgy, mintha ezúttal értékelhető eredményeket kaptunk volna. Az Earth tesztben a GTX 280 39%-ot vert a 9800 GTX-re, míg a Waves tesztben már csak 29%-ot, ezek alapján úgy tűnik, hogy a textúrázók száma erősen visszafogja a GT200-at, hiába sokkal nagyobb a memóriasávszélesség. Sőt, itt a GTX 260 már lassabb volt a G92-es GTX-nél. Az új Radeon ezekben a tesztekben csak 3–8%-kal volt gyorsabb elődjénél.
A Geometry Shader tesztek első menetében egy galaxist formáló részecskerendszert látunk, ahol egy GS négy vertexet formál, ebből lesz egy pontja a galaxisnak. Mi a legkisebb komplexitású, félmilliós rendszert választottuk olyan beállítással, melyben a Vertex Shaderek is besegítenek a geometriaiaknak. Érdemes megfigyelni, hogy míg a GeForce-ok esetében mérsékelt gyorsulást (18–23%) tapasztaltunk, addig az új Radeon szárnyalt, 75%-ot vert a HD 3870-re.
A Hyperlight fantázianevű hatás már sokkal összetettebb, használja a DirectX egyik újdonságát, a stream outputot. A GS és VS számolása után az eredményt újra a GS-ek kapják meg, és tovább dolgoznak a pufferben tárolt adatokon. Az első menetben kiszámolják a csóvák irányát, sebességét és növekedési vektorát, majd ezek alapján a második körben elkészül a kép. Mi ehhez is a GS-eket dolgoztattuk, így még összetettebb lett a számolás. Ebben a tesztben azért már domborítottak a GT200-asok is, illetve jól látszik, hogy mennyire le volt maradva a G92. A GT200-ban erőteljesen megnövelték a GS-hez szükséges regiszterfájlok és gyorsítótárak méretét, tehát az itt látható eredmények az elvárható kategóriába esnek. A HD 4850 „csak” 40%-ot ver a HD 3870-re, de mint látható, ez az eredmény már majdnem elégnek bizonyult a GT200 befogásához, egy kis órajelemelés (HD 4870), és kis chip utoléri a nagy szörnyet.
A Pixel Shadereket (PS) ezúttal is kétféle teszttel kínáltuk meg. Az első kettő ismerős lehet a korábbi DirectX 9-es elemzésekből, de továbbfejlesztették, és átírták őket DirectX 10-re. Textúrakezelésre koncentrálnak, az egyik bundaszerű és egyszerűbb (legfeljebb 30 textúrahívás pixelenként), a másik, az úgynevezett Steep Parallax Mapping már összetettebb (akár 100 textúrahívás pixelenként). Textúrázásról lévén szó az NVIDIA dominanciája érvényesül, a GT200 simán veri az amúgy is erős G92-t. Az AMD újdonsült chipje házon belül szépen szerepelt, a HD 4850 43%-kal bizonyult gyorsabbnak a HD 3870-nél, bár nem veszélyeztette az NVIDIA újdonságát.
Végezetül újabb két teszttel keményen megszámoltathatjuk a PS-eket. Itt minimális textúrahívás van, de rengeteg az összetett függvény. Az elsőben egy ásvány borítású nyulat kapunk, melynek minden pontjához két textúrahívás és 65 összetett matematikai függvény (például szögfüggvény) tartozik. A másodikban tűzbe borul a nyuszika és még keményebb lesz a számolás, pixelenként 130 függvénnyel kell számolni. Itt az NVIDIA ég nagyot, és már sokadszorra derül ki, hogy a Radeon HD 4850 kegyetlen erős, ha számolásról van szó. Elég, ha annyit mondunk, hogy a HD 4850 veri még a GeForce 9800 GTX SLI-t is. A stream processzorok két és félszeres szorzója nem érhető tetten, de azért a 70–100%-os gyorsulás ott van.
A szintetikus tesztekből azt a következtetést lehet levonni, hogy igazán nagyot csak az AMD alkotott. A GeForce GT200 textúrázásban és számolásban sem lett kétszer gyorsabb elődjénél, az igazán szignifikáns változás a stream outputot használó tesztben volt tettenérhető, máshol viszont elmaradt az elvárt teljesítmény, igaz, a GT200 így is rendkívül erős. Ezzel szemben az AMD RV770-es chipje számolásban 2–3-szor gyorsabb elődjénél, és sikerült javítaniuk az állandóan felemlegetett textúrázás sebességén is. Az AMD architektúrája kicsit kiegyensúlyozatlannak tűnik, mert túlságosan a számolás felé billen a mérleg, de ez nem probléma, ha a textúrázáshoz szükséges erőforrások elegendőnek bizonyulnak ahhoz, hogy ezt a területet többé ne kelljen felhozni az AMD chipek hátrányaként.
Tesztek – I.
Először az OpenGL és a DirectX 9-es játékokkal foglalkoztunk. ET:QW alatt a GTX 280 volt a leggyorsabb egychipes videokártya, a HD 4850 viszont majdnem utolérte a GTX 260-at. HL2:EP2-ben ugyanezt tapasztaltuk. Az RSV szép példája annak, amikor egy játékban a számolás dominál: a HD 4850 ott liheg a GTX 280 nyakán. A HD 3870 teljesítményére nincs magyarázatunk (összehasonlítva a 3870 CrossFire-rel). A COD4 már inkább az NVIDIA-nak kedvezett, de a HD 4850 sem szerepelt rosszul, végülis majdnem olyan gyors volt, mint a HD 3870 CrossFire. UT3 alatt nagyon úgy tűnik, hogy még nem a számolás a mérvadó, itt még a 9800 GTX is megelőzte a HD 4850-et, a GTX 280 40%-kal volt gyorsabb.
Tesztek – II.
Crysis alatt nem termett sok babér a Radeonoknak, de látva a GTX 260 eredményeit (alig gyorsabb a HD 4850-nél), itt inkább a gyengén teljesítő játékmotorról lehetne egy történetet írni.
A Call of Juarez volt az első játék, amiben a HD 4850 nem kisebb tettet hajtott végre, minthogy megverte a majdnem kétszer drágább GeForce GTX 260-at, és nem sokkal maradt le a GTX 280 mögött. Érdekesség, hogy a Catalyst 8.5-tel még tökéletesen működött a CrossFire, míg a HD 4850 esetében, amit már 8.6-tal teszteltünk, nem igazán akart beindulni. Ezért vagyunk kicsit szkeptikusak az AMD CrossFire-ös csúcs-VGA-s állásfoglalásával szemben.
COH:OF alatt sem sokkal maradt le a HD 4850 a GTX 260 mögött.
Tesztek – III.
World in Conflictban, bár a HD 4850 közel duplájára gyorsult elődjéhez képest, még ez is kevés volt a GT200 befogásához, bár itt se felejtsük el, hogy nagyon különböző árkategóriák képviselőit eresztettük össze.
A Colin McRae Rally DiRT is jobban szerette az új GeForce-okat, de a HD 4850 sem szerepelt le. A többkártyás bővítés hatékonyságát ez a játék megkérdőjelezi, az SLI és a CrossFire (a Catalyst 8.6-tal) is gyatrán szerepelt.
Konklúzió
Az olvasók valószínűleg észrevették, hogy olyan felbontásokat és beállításokat teszteltünk, melyeket a HD 4850-nek bruttó 40–45 000 forintos árával egyáltalán nem lenne kötelessége kihajtani. Ráadásul abban a „megtiszteltetésben” részesült, hogy teljesítményét a 2–4-szer drágább GeForce GTX 260-hoz és 280-hoz hasonlítottuk, ugyanis megtehettük, mert mint látható volt, ezen monstrumok mellett sem játszott alárendelt szerepet.
NVIDIA GT200: gyors, erős és drága... [+]
A GeForce GTX 280 a tesztek túlnyomó többségében a 9800 GTX-nél 40–90%-kal volt gyorsabb, amiről tudvalevő, hogy gyenge memóriavezérlős és raszterizálós része miatt a nagy felbontásokban lassabb a G80-ra épülő GeForce 8800 GTX-nél. Márpedig az NVIDIA azt ígérte, hogy a G80-nál közel kétszer gyorsabb chipet készít, ez azonban még a szintetikus tesztekben sem ütközött ki egy-két kivételtől eltekintve. Azt lehet mondani, hogy a GeForce GTX 280 tényleg gyors, jelenleg a leggyorsabb egychipes megoldás, de ezért az NVIDIA irreálisan magas felárat kér, természetesen jóval többre értékeli azt, mint amennyivel gyorsabb az alatta található videokártyáknál – persze ez megszokott ebben a szegmensben, a leggyorsabbnak presztízse van. Nem ejtettünk még szót a GeForce 9800 GX2-ről (tesztünkben a 9800 GTX SLI-nek felel meg), ami a GTX 280-nál olcsóbb, ugyanakkor sok esetben gyorsabb. Akármennyire is gyorsabb a 9800 GX2, mi nem titkoltan inkább az egychipes GTX 280-at választanánk, ugyanis esetében nem kell tartani skálázódásbeli problémáktól, illetve belső felépítése révén is biztosabbnak tűnik a jövőre nézve (ugyanakkor még nem tudhatjuk, hogy ezeknek a tényezőknek a kihasználása mikorra várható).
A GeForce GTX 260 természetesen lassabb volt a 280-nál, és evidens, hogy előnye a 9800 GTX-szel szemben nem volt akkora, mint a teljes értékű GT200-as chipet tartalmazó nagyágyúé. A GTX 260 nem a leggyorsabb címért vetélkedik, ami tükröződik az árcédulán is, azaz közel sem kérnek el akkora felárat érte, mint a GTX 280-ért. Ez a videokártya elvileg 399 dollár környékén indul (partnereinknél még nem kapható), ami kicsit felülárazottnak tűnik annak fényében, hogy a Radeon HD 4850 alig 200 dolláros áron kerül forgalomba, miközben a két kártya teljesítménye átlagban alig tér el egymástól. Ha nem lenne AMD, akkor a GTX 260 akár még meg is érné a 399 dollárt, így viszont nem ér annyit.
A Radeon HD 4850 egy szép kis pofon az NVIDIA-nak, ugyanis ezen az áron egészen idáig a GeForce 9800 GTX-et kínálta, ami valljuk be, már nem tekinthető komoly konkurenciának. Ezt az NVIDIA is látja, mert a pletykák szerint hamarosan kiadja a 9800 GTX+ típusjelzésű videokártyát, amely egy emelt órajelű 9800 GTX lesz: a tesztek alapján ilyen áron szerintünk ennek sincs sok keresnivalója a HD 4850 ellenében, amely ráadásul sokkal időtállóbbnak ígérkezik. Most az NVIDIA került kényszerhelyzetbe, mert nem képes felmutatni a HD 4850-nel versenyképes terméket, és arra, hogy ez a helyzet megváltozzon, egy darabig nincs is esély. A jóval funkciógazdagabb és gyorsabb HD 4850 ellen egy GT200-derivátumra lenne szükség, amiről már biztosan hallottunk volna ezt-azt, ha létezne...
Az AMD-nél most valami megváltozott, a grafikus chipeket fejlesztő mérnökcsapat és az eredményeket kommunikáló marketinggépezet korábban kívülről kissé bizonytalannak, dezorientáltnak tűnt, most azonban magabiztosan és összeszedetten készültek fel az újabb GPU-generáció piacra dobására. (Nem mellesleg színvonalas és szakmailag is tartalmas volt az a nemzetközi sajtókonferencia, ahol időben megkaptuk az RV770-nel kapcsolatos információkat és magát a tesztkártyát is.) A mérnöki oldalon végre belátták, hogy nem szabad az árral szemben úszni, felvették az NVIDIA által odavetett kesztyűt, és textúrázásban, illetve a ROP-os Anti-Aliasing vonalán is harcba szálltak. Mindehhez a hardver is nagyon jónak tűnik, pláne, ha az árakat is figyelembe vesszük. Az AMD részéről bemutatott 260 mm²-es, 55 nm csíkszélességű chip versenyben van az NVIDIA 576 mm²-es, 65 nm-es chipjével; látva a fogyasztást még borúsabban ítéljük meg az NVIDIA helyzetét. Igaz, a trónfosztás ezúttal is elmaradt, de szerintünk egyáltalán nem baj az, ha egy gyártó nem az abszolút sebességet, hanem a teljesítmény/ár arányt tartja elsődleges szempontnak. A friss adatokat és a teszteredményeket látva az NVIDIA hosszú idő után újra nehéz helyzetbe kerülhet, talán nehezebbe, mint korábban bármikor...
![]() | ![]() |
AMD ATI Radeon HD 4850 | AMD RV770 |
fLeSs és janpotocki
Az újdonsült videokártyákat az Asus Magyarország, az AMD és az NVIDIA bocsátotta rendelkezésünkre.