GTX 460: ezzel kellett volna kezdeni
Az NVIDIA nemrégiben bemutatott, elvileg középre pozicionált GeForce GTX 465-öse nem aratott osztatlan sikert, több okból sem. Egyrészt egyáltalán nincs középkategóriás ára, másrészt a többi fontos mutató tekintetében is lemaradásban van a konkurenciához képest. Úgy tűnik, hogy ezt az NVIDIA is felismerte, ugyanis cikkünk megjelenését követően szinte azonnal esésnek indult a kártya ára. A kezdeti 80-90 000 forintról 65-70 000 közé csökkent, azonban sovány vigasz ez nekünk, hiszen még így is jóval drágább, mint szeretnénk. Tudomásul kell vennünk, hogy az USA-ban 200 dolláros, ugyanakkor az EU-ban 200 euróért kapható középkategóriás VGA idehaza az euró/forint átváltás miatt inkább a felsőbb szegmensben versenyez. Szeretnénk azt mondani, hogy jelen cikkünk főszereplője, a GTX 460 már valóban középkategóriás kártya, de a megjelenést követő árakat (60-65 000 forint) látva még odébb van a középkategória határától, azaz 40-50 000 forintos ártól. Nincs mit tenni, legfeljebb várhatunk az árak esésére. Mindezek ellenére a GeForce GTX 460-ról már elmondható, hogy ez az a kártya, amire sokan vártak.
A Fermit, azaz GF100 kódnevű architektúra köré épülő videokártyákat már jól ismerjük, a GeForce GTX 480 és GTX 470 igazi vadállatok lettek, de az is kiderült róluk, hogy nem igazán a PC-s piacra készültek. Tény, hogy videokártyák, és ennél fogva játszhatunk velük, de számos olyan funkciót támogatnak, amire a hétköznapi játékos felhasználóknak semmi szüksége, mégis többszörösen fizetnünk kell érte: először a pénztárnál, másodszor a mindennapokban a fogyasztási/melegedési mutatók miatt. Az NVIDIA hiába szeretné magának a GPGPU piac nagy részét, a PC-s videokártyákat sem hagyhatja teljesen figyelmen kívül, mert egyelőre ebből élnek. A GF100 alapvetően a GPGPU piacot célozta meg, tehát várható volt, hogy kijön egy olyan GPU is, ami a játékosok céljait szolgálja és ez lett a GF104. Képzeljük el a Fermit a duplapontosságú számolási sebesség, a gyorsítótárak és a ROP-blokkok számának megnyirbálása, illetve az ECC támogatásának megszüntetése után. Ezekre nincs szükség sem játék, sem az egyre terjedő videókonvertálás közben, ugyanakkor rengeteg tranzisztort takaríthatunk meg kiiktatásukkal. Nos, a GF104 ezt az irányt követi, tehát elmondhatjuk, hogy ez az első, ténylegesen PC-s játékosoknak szánt, DirectX 11-es NVIDIA GPU. Ez azonban még korántsem minden.
GF100 (GTX 465/470/480) és GF104 (GTX 460)
A GF104 nevében továbbra is Fermi, de az első, "nagy" Fermihez képest számos ponton megváltozott. Az új GPU felépítése hasonló az előzőéhez, de az erőforrásokat átcsoportosították. A GF100-ban található SM-ek (streaming multiprocesszorok) 32 számolót (CUDA-magot) tartalmaznak (2 blokkba rendezve), ezt a GF104-ben 48-ra növelték (3 blokk). Ha több az egyidejűleg elérhető számoló, akkor több utasítás végrehajtása válik lehetővé, ehhez azonban gyorsabb és hatékonyabb ütemezésre van szükség, és talán ez az a pont, amiben a GF104 jelentős előrelépésnek tekinthető. Az ütemezők számán nem változtattak, maradt kettő (SM-enként), de ezekhez egy helyett immár kettő-kettő dispatch egység (menetirányító) kapcsolódik, tehát így egy helyett egyszerre két utasítást képesek feldolgozni, azaz lényegében szuperskalár működésről beszélhetünk. A Fermi TLP alapú működése (Thread Level Parallelism), vagyis a szálszintű párhuzamos feldolgozás a GF104-ben kiegészült az ILP-vel (Instruction Level Parallelism), azaz az utasításszintű párhuzamos feldolgozással. A GF104 egyidejűleg maximum 4 végrehajtóegységet képes kihasználni a hétből, míg az eredeti GF100 maximum kettőt a hatból (melyek: kettő vagy három CUDA-blokk tizenhat számolóval, load/store-ok, SFU-k, interpolátorok, textúrázók). Ezt megfejelve duplájára, négyről nyolcra nőtt az SM-ekben található SFU-k (Special Function Unit) száma is, melyek a sin/cos/log/exp/sqr/stb. utasítások végrehajtásáért felelősek, és főleg az interpolációban segédkeznek.
Mindennek köszönhetően a GF104 nem szimplán egy legyengített GF100, sőt, ami azt illeti, sokkal jobb annál. Namost a GPU- és a CPU-gyártóktól már megszokhattuk, hogy egyes esetekben letiltanak néhány részegységet. De mi a helyzet a GF104-gyel? A GF104 összesen két GPC-t (Graphics Processing Cluster) tartalmaz, melyekben egyenként négy SM található, tehát a GPU összesen nyolc SM-mel gazdálkodhat. SM-enként nyolc-nyolc textúrázóval ez 384 CUDA-számolót és 64 textúrázót jelent. A chip 256 bites memóriavezérlővel rendelkezik, ez 64 bites csatornákra oszlik, csatornánként két ROP-blokkal, tehát ez utóbbiból összesen 8 blokk, vagyis 32 egység áll rendelkezésére. További részletekbe menő elemzés korábbi hírünkben található.
Az első GF104-re épülő kártya a GeForce GTX 460, ebben a nyolcból csak hét SM aktív, ebből következően 336 CUDA-maggal és 56 textúrázóval gazdálkodik. A kártya ajánlott GPU/stream processzor órajele 675/1350 MHz, a memória pedig 900 MHz-en (GDDR5 3600 MHz-en) ketyeg. Az NVIDIA láthatóan továbbra is hadilábon áll az órajelekkel, hiszen az AMD 40 nm-en már régen elérte a 850 MHz-et. Apropó, memória. A GTX 460-ból két verziót adnak ki: a drágábbikon 1 GB, az olcsóbbikon 768 MB memóriát találunk. A 768 MB-os verzión nem csak a memória mérete kisebb, de a memória csatlakozása is lassabb (256 helyett 192 bit), illetve kevesebb az aktív ROP-blokk (8 helyett 7), tehát figyeljünk, mert a 768 MB-os GTX 460 ténylegesen lassabb az 1 GB-os változatnál. Hogy mennyivel, arra a tesztek adnak választ.
VGA megnevezése | Radeon HD 5850 | Radeon HD 5830 | Radeon HD 5770 | GeForce GTX 465 | GeForce GTX 460 | GeForce GTX 275 |
---|---|---|---|---|---|---|
GPU kódneve | Cypress | Juniper | Fermi (GF100) | GF104 | GT200b | |
Gyártástechnológia | 40 nm (TSMC) | 55 nm (TSMC) | ||||
Tranzisztorok száma | 2,15 milliárd | 1,04 milliárd | ~3 milliárd | 1,95 milliárd | 1,4 milliárd | |
GPU / shader órajele terhelve |
725 MHz | 800 MHz | 850 MHz | 608 MHz 1215 MHz |
675 MHz 1350 MHz |
633 MHz 1404 MHz |
GPU / shader órajele üresjáratban |
157 MHz | 157 MHz | 157 MHz | 51 MHz 101 MHz |
51 MHz 101 MHz |
300 MHz 600 MHz |
Számolóegységek száma | 288 komplex és 1152 darab egyszerű stream processzor | 224 komplex és 896 darab egyszerű stream processzor | 160 komplex és 640 darab egyszerű stream processzor | 352 db (11 x 32) skalár stream processzor | 336 db (7 x 48) skalár stream processzor | 240 db (10 x 24) skalár stream processzor |
Textúrázók száma | 72 textúracímző és -szűrő | 56 textúracímző és -szűrő | 40 textúracímző és -szűrő | 44 textúracímző és -szűrő | 56 textúracímző és -szűrő | 80 textúracímző és -szűrő |
ROP egységek száma | 8 blokk (32) | 4 blokk (16) | 8 blokk (32) | 768 MB: 7 blokk (28) 1 GB: 8 blokk (32) |
7 blokk (28) | |
Támogatott DirectX-verzió | 11 | 10 | ||||
Memóriavezérlő | 256 bites hubvezérelt | 128 bites hubvezérelt | 256 bites crossbar | 768 MB: 192 bites crossbar 1 GB: 256 bites crossbar |
448 bites crossbar | |
Memória órajele terhelve | 1000 MHz (GDDR5) | 1200 MHz (GDDR5) | 802 MHz (GDDR5) | 900 MHz (GDDR5) | 1134 MHz (GDDR3) | |
üresjáratban | 300 MHz | 300 MHz | 300 MHz | 67 MHz | 67 MHz | 100 MHz |
Max. memória-sávszélesség | 128 000 MB/s | 76 800 MB/s | 102 656 MB/s | 768 MB: 86 400 MB/s 1 GB: 115 200 MB/s |
127 008 MB/s | |
HD filmek lejátszásának hardveres támogatása | AVIVO HD (UVD 2) | Purevideo HD (VP4) | Purevideo HD (VP2) | |||
TDP | 151 watt | 175 watt | 108 watt | 200 watt | 768 MB: 150 watt 1 GB: 160 watt |
219 watt |
A cikk még nem ért véget, kérlek, lapozz!