GeForce GTX 460: erre várunk két éve

GTX 460: ezzel kellett volna kezdeni

Az NVIDIA nemrégiben bemutatott, elvileg középre pozicionált GeForce GTX 465-öse nem aratott osztatlan sikert, több okból sem. Egyrészt egyáltalán nincs középkategóriás ára, másrészt a többi fontos mutató tekintetében is lemaradásban van a konkurenciához képest. Úgy tűnik, hogy ezt az NVIDIA is felismerte, ugyanis cikkünk megjelenését követően szinte azonnal esésnek indult a kártya ára. A kezdeti 80-90 000 forintról 65-70 000 közé csökkent, azonban sovány vigasz ez nekünk, hiszen még így is jóval drágább, mint szeretnénk. Tudomásul kell vennünk, hogy az USA-ban 200 dolláros, ugyanakkor az EU-ban 200 euróért kapható középkategóriás VGA idehaza az euró/forint átváltás miatt inkább a felsőbb szegmensben versenyez. Szeretnénk azt mondani, hogy jelen cikkünk főszereplője, a GTX 460 már valóban középkategóriás kártya, de a megjelenést követő árakat (60-65 000 forint) látva még odébb van a középkategória határától, azaz 40-50 000 forintos ártól. Nincs mit tenni, legfeljebb várhatunk az árak esésére. Mindezek ellenére a GeForce GTX 460-ról már elmondható, hogy ez az a kártya, amire sokan vártak.

A Fermit, azaz GF100 kódnevű architektúra köré épülő videokártyákat már jól ismerjük, a GeForce GTX 480 és GTX 470 igazi vadállatok lettek, de az is kiderült róluk, hogy nem igazán a PC-s piacra készültek. Tény, hogy videokártyák, és ennél fogva játszhatunk velük, de számos olyan funkciót támogatnak, amire a hétköznapi játékos felhasználóknak semmi szüksége, mégis többszörösen fizetnünk kell érte: először a pénztárnál, másodszor a mindennapokban a fogyasztási/melegedési mutatók miatt. Az NVIDIA hiába szeretné magának a GPGPU piac nagy részét, a PC-s videokártyákat sem hagyhatja teljesen figyelmen kívül, mert egyelőre ebből élnek. A GF100 alapvetően a GPGPU piacot célozta meg, tehát várható volt, hogy kijön egy olyan GPU is, ami a játékosok céljait szolgálja és ez lett a GF104. Képzeljük el a Fermit a duplapontosságú számolási sebesség, a gyorsítótárak és a ROP-blokkok számának megnyirbálása, illetve az ECC támogatásának megszüntetése után. Ezekre nincs szükség sem játék, sem az egyre terjedő videókonvertálás közben, ugyanakkor rengeteg tranzisztort takaríthatunk meg kiiktatásukkal. Nos, a GF104 ezt az irányt követi, tehát elmondhatjuk, hogy ez az első, ténylegesen PC-s játékosoknak szánt, DirectX 11-es NVIDIA GPU. Ez azonban még korántsem minden.


GF100 (GTX 465/470/480) és GF104 (GTX 460)

A GF104 nevében továbbra is Fermi, de az első, "nagy" Fermihez képest számos ponton megváltozott. Az új GPU felépítése hasonló az előzőéhez, de az erőforrásokat átcsoportosították. A GF100-ban található SM-ek (streaming multiprocesszorok) 32 számolót (CUDA-magot) tartalmaznak (2 blokkba rendezve), ezt a GF104-ben 48-ra növelték (3 blokk). Ha több az egyidejűleg elérhető számoló, akkor több utasítás végrehajtása válik lehetővé, ehhez azonban gyorsabb és hatékonyabb ütemezésre van szükség, és talán ez az a pont, amiben a GF104 jelentős előrelépésnek tekinthető. Az ütemezők számán nem változtattak, maradt kettő (SM-enként), de ezekhez egy helyett immár kettő-kettő dispatch egység (menetirányító) kapcsolódik, tehát így egy helyett egyszerre két utasítást képesek feldolgozni, azaz lényegében szuperskalár működésről beszélhetünk. A Fermi TLP alapú működése (Thread Level Parallelism), vagyis a szálszintű párhuzamos feldolgozás a GF104-ben kiegészült az ILP-vel (Instruction Level Parallelism), azaz az utasításszintű párhuzamos feldolgozással. A GF104 egyidejűleg maximum 4 végrehajtóegységet képes kihasználni a hétből, míg az eredeti GF100 maximum kettőt a hatból (melyek: kettő vagy három CUDA-blokk tizenhat számolóval, load/store-ok, SFU-k, interpolátorok, textúrázók). Ezt megfejelve duplájára, négyről nyolcra nőtt az SM-ekben található SFU-k (Special Function Unit) száma is, melyek a sin/cos/log/exp/sqr/stb. utasítások végrehajtásáért felelősek, és főleg az interpolációban segédkeznek.


GF100 és GF104

Mindennek köszönhetően a GF104 nem szimplán egy legyengített GF100, sőt, ami azt illeti, sokkal jobb annál. Namost a GPU- és a CPU-gyártóktól már megszokhattuk, hogy egyes esetekben letiltanak néhány részegységet. De mi a helyzet a GF104-gyel? A GF104 összesen két GPC-t (Graphics Processing Cluster) tartalmaz, melyekben egyenként négy SM található, tehát a GPU összesen nyolc SM-mel gazdálkodhat. SM-enként nyolc-nyolc textúrázóval ez 384 CUDA-számolót és 64 textúrázót jelent. A chip 256 bites memóriavezérlővel rendelkezik, ez 64 bites csatornákra oszlik, csatornánként két ROP-blokkal, tehát ez utóbbiból összesen 8 blokk, vagyis 32 egység áll rendelkezésére. További részletekbe menő elemzés korábbi hírünkben található.


GeForce GTX 460: végre! [+]

Az első GF104-re épülő kártya a GeForce GTX 460, ebben a nyolcból csak hét SM aktív, ebből következően 336 CUDA-maggal és 56 textúrázóval gazdálkodik. A kártya ajánlott GPU/stream processzor órajele 675/1350 MHz, a memória pedig 900 MHz-en (GDDR5 3600 MHz-en) ketyeg. Az NVIDIA láthatóan továbbra is hadilábon áll az órajelekkel, hiszen az AMD 40 nm-en már régen elérte a 850 MHz-et. Apropó, memória. A GTX 460-ból két verziót adnak ki: a drágábbikon 1 GB, az olcsóbbikon 768 MB memóriát találunk. A 768 MB-os verzión nem csak a memória mérete kisebb, de a memória csatlakozása is lassabb (256 helyett 192 bit), illetve kevesebb az aktív ROP-blokk (8 helyett 7), tehát figyeljünk, mert a 768 MB-os GTX 460 ténylegesen lassabb az 1 GB-os változatnál. Hogy mennyivel, arra a tesztek adnak választ.

VGA megnevezése Radeon HD 5850 Radeon HD 5830 Radeon HD 5770 GeForce GTX 465 GeForce GTX 460 GeForce GTX 275
GPU kódneve Cypress Juniper Fermi (GF100) GF104 GT200b
Gyártástechnológia 40 nm (TSMC) 55 nm (TSMC)
Tranzisztorok száma 2,15 milliárd 1,04 milliárd ~3 milliárd 1,95 milliárd 1,4 milliárd
GPU /
shader órajele terhelve
725 MHz 800 MHz 850 MHz 608 MHz
1215 MHz
675 MHz
1350 MHz
633 MHz
1404 MHz
GPU /
shader órajele üresjáratban
157 MHz 157 MHz 157 MHz 51 MHz
101 MHz
51 MHz
101 MHz
300 MHz
600 MHz
Számolóegységek száma 288 komplex és 1152 darab egyszerű stream processzor 224 komplex és 896 darab egyszerű stream processzor 160 komplex és 640 darab egyszerű stream processzor 352 db (11 x 32) skalár stream processzor 336 db (7 x 48) skalár stream processzor 240 db (10 x 24) skalár stream processzor
Textúrázók száma 72 textúracímző és -szűrő 56 textúracímző és -szűrő 40 textúracímző és -szűrő 44 textúracímző és -szűrő 56 textúracímző és -szűrő 80 textúracímző és -szűrő
ROP egységek száma 8 blokk (32) 4 blokk (16) 8 blokk (32) 768 MB: 7 blokk (28)
1 GB: 8 blokk (32)
7 blokk (28)
Támogatott DirectX-verzió 11 10
Memóriavezérlő 256 bites hubvezérelt 128 bites hubvezérelt 256 bites crossbar 768 MB: 192 bites crossbar
1 GB: 256 bites crossbar
448 bites crossbar
Memória órajele terhelve 1000 MHz (GDDR5) 1200 MHz (GDDR5) 802 MHz (GDDR5) 900 MHz (GDDR5) 1134 MHz (GDDR3)
üresjáratban 300 MHz 300 MHz 300 MHz 67 MHz 67 MHz 100 MHz
Max. memória-sávszélesség 128 000 MB/s 76 800 MB/s 102 656 MB/s 768 MB: 86 400 MB/s
1 GB: 115 200 MB/s
127 008 MB/s
HD filmek lejátszásának hardveres támogatása AVIVO HD (UVD 2) Purevideo HD (VP4) Purevideo HD (VP2)
TDP 151 watt 175 watt 108 watt 200 watt 768 MB: 150 watt
1 GB: 160 watt
219 watt

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

Előzmények

Hirdetés