Revansot vesz az NVIDIA Fermi

Az NVIDIA új generációs Fermi architektúrája lassan eljut az árra érzékenyebb felhasználókhoz is, hiszen a mai napon hivatalosan is megjelent a GeForce GTX 460. Az új versenyző a GF104 kódnéven ismert lapkára épül, mely a nem túl sikeres GF100 után jelentősebb áttervezésen is keresztülment. Az eddig megjelent GeForce GTX 465, 470 és 480 messze nem nyűgözte le a világot. A csúcskategóriába nevező GTX 480 több hónapos késés után sem képes megközelíteni az AMD leggyorsabb megoldását, így az NVIDIA kénytelen volt az árakkal játszani, hogy a rendszerek versenyképesek legyenek. Nagyobb probléma, hogy a GF100-as GPU a korábbi partnereket sem győzte meg, így az XFX mellőzte a forgalmazását, míg a BFG feladta a harcot a VGA-piacon. A vállalatok számára túl költséges a rendszer forgalmazása, mivel a méretes lapka és a nyomtatott áramkör gyártása nagyon drága, miközben a termékek a felsőkategóriát képviselő Radeonokkal kénytelenek küzdeni.

Az NVIDIA tökéletesen látja a felmerült problémákat, ennek megfelelően a GF104-es lapka nem csak egy egyszerű csonkítás eredménye. A Fermit bemutató cikkből látható, hogy a GF100 elsősorban a HPC és a professzionális piacra készült, így számos olyan funkciót tartalmaz, amik attól függetlenül foglalják a tranzisztorokat, hogy a PC-sek számára előnyt jelentenének. A változtatások nagy része ezen a ponton érte az új GPU-t, hiszen kikerült az ECC támogatása és a dupla pontosság is csak egyetlen 16 utas CUDA feldolgozón van engedélyezve a streaming multiprocesszorokon belül. Természetesen figyelembe kell venni, hogy a GF104 nem a csúcskategóriát célozza meg, így a lapka mérete is jelentősen csökkent. A hivatalos adatról sajnos hallgat az NVIDIA, a távol-keleti kollégák viszont 360 mm²-es kiterjedést pletykálnak. Ez az érték ugyan még mindig nagyobb, az AMD Cypress 334 mm²-es paraméteréhez viszonyítva, azonban már nem reménytelen a versenyhelyzet megteremtése, mivel a kisebb chipeket kevésbé érinti a TSMC 40 nm-es gyártósorainak problémája. Nevezetesen itt arról van szó, hogy a waferen legyártott lapkák rendkívül eltérő fogyasztási adottságokkal rendelkeznek, ami nagyon megnehezíti a végleges specifikációk behatárolását. A GF104 esetében már reálisan el lehet gondolkodni egy dupla GPU-t alkalmazó kártyán is, hiszen válogatott chipek használatával tartható a szabványban előírt 300 wattos fogyasztási határ, továbbá az előállítási költség is a jelenlegi leggyorsabb GeForce GTX 400 kártyák szintjét képviselné. A kiszivárgott információk szerint már készül egy GTX 490 jelzésű termék, ami minden bizonnyal két GF104-es GPU-ra fog épülni.

A grafika az első

Az 1950 millió tranzisztorból álló GF104 esetében a streaming multiprocesszorok felépítése jelentős mértékben módosult. Az új egységek 32 helyett 48 darab úgynevezett CUDA magot tartalmaznak. A rendszer három csoportra lett felosztva, azaz 16 utas feldolgozókon lesznek párhuzamosan végrehajtva az utasításszavak. A CUDA mag felépítése nem változott, de a számuk növekedésével a feladatirányító egységek (dispatch) számát is növelni kellett. Az érdekesség az ütemezők számában rejlik, hiszen a GF100-hoz hasonlóan két egység maradt, de dispatch kimenetek megduplázásával a rendszer képes dual-issue módban működni, vagyis a feldolgozók közül az eddigi kettő helyet egyszerre négy etethető, ami azt jelenti, hogy a 16 utas CUDA magok három csoportja mellett a load/store, a speciális funkciók vagy a textúrázók is párhuzamosan dolgozhatnak. Már önmagában ezek a változások pozitív irányba löknék a grafikus feldolgozás esetében tapasztalható teljesítményt, de a speciális funkciókért felelő egységek száma is megduplázódott, azaz mostantól nyolc SFU-val kell számolni streaming multiprocesszoronként. Ez a módosítás főleg az interpoláció szempontjából fontos, hiszen ez enyhén szűkös pontnak mutatkozott a GF100 esetében.

Streaming multiprocesszor
Streaming multiprocesszor [+]

Sokak örömére a rendszer textúrázási képessége nem csökkent a nagyobb testvérhez viszonyítva. A GF104 streaming multiprocesszorjai nyolc-nyolc textúracímzőt és textúraszűrőt alkalmaznak, és egy-egy ilyen csatornához négy mintavételező tartozik. Az elsődleges gyorsítótár mérete is megmaradt 64 kB, ami a feladatnak megfelelően dinamikusan szétosztható egy 16 és egy 48 kB-os részre, attól függően, hogy mekkora megosztott memóriát igényelnek a CUDA magok. A másodlagos gyorsítótár kapacitása egyelőre ismeretlen, de a pletykák fél megabájtról szólnak. A lapka a nyolc darab streaming multiprocesszort két csoportra bontja, ennek megfelelően két darab GPC (Graphics Processing Cluster) lelhető fel. Ez azt is jelenti, hogy két raszter motorral kell számolni összesen nyolc PolyMorph motor mellett. Egyik egység képessége sem változott a GF100-hoz képest, azaz a GF104 órajelenként összesen 16 pixelt képes feldolgozni. Az utóbbi érték a magasabb felbontások esetén szűkös lehet a 32 darab blending egységre nézve, de kicsi az esélye annak, hogy új GPU-ra épülő kártyákat Full HD-s felbontás fölé vennék a potenciális vásárlók.

A GF104 logikai felépítése
A GF104 logikai felépítése [+]

A lapka memóriavezérlője 256 bites lesz, amely 64 bites csatornákra oszlik szét. Egy-egy csatornához két ROP blokk tartozik, így a rendszer összesen 8 darab ilyen egységet tartalmaz. A fedélzeti memória lehet GDDR3 vagy GDDR5 szabványú, de az utóbbi memóriachipek ára nem túl magas, így az előbbi lehetőséggel valószínűleg nem fognak élni a gyártók. A rendszer nagy része továbbra is az úgynevezett GPC, vagy közismertebb nevén shader frekvencián üzemel. A CUDA magok és a speciális végrehajtó egységek minden órajelnél, míg a textúrázók, a raszter, valamint a PolyMorph motorok minden második órajel mellett végeznek egy feladatot. A magórajel a ROP blokkokért és a másodlagos gyorsítótárért felel.

A DirectX 11-es API-t támogató GF104 először a GeForce GTX 460 névre keresztelt kártyán kap helyet. Az NVIDIA az új versenyzőnél egyetlen streaming multiprocesszort tilt le, így a termék 336 CUDA maggal és 56 textúrázócsatornával rendelkezik. A referenciaparaméterek szempontjából 675 MHz-es mag- és az 1350 MHz-es shaderórajelet szabtak meg a tervezők. A memóriabusz szélessége 192 bites, ami összesen 24 darab blending egységet jelent. A 768 MB kapacitású GDDR5 szabványra épülő fedélzeti memória effektív 3600 MHz-en ketyeg. Az adatok alapján kiszámítható, hogy a PCI Express 2.0-s foglalatba helyezhető kártya számítási teljesítménye 907 GFLOPS, míg a memória-sávszélessége 86,4 GB/s. A fogyasztás szempontjából is jelentős előrelépés történt, hiszen az új versenyző 160-170 wattos energiaigénnyel rendelkezik, így két darab hat tűs PCI Express tápcsatlakozón keresztül etethető. A referenciamodell ventilátora az eddigi beszámolók alapján még terhelés mellett is csendes, ami a nagyobb testvérek magasnak mondható zajszintjét tekintve szintén felüdülés. A kártya hátlapján a szokásos trió található, azaz a két DVI kimenetet a mini HDMI egészíti ki.

GeForce GTX 460
GeForce GTX 460 [+]

A GeForce GTX 460 MSRP ára 199 dollár, ami nagyon kedvezőnek mondható. Az NVIDIA a Radeon HD 5830-at jelölte meg fő konkurensként, hiszen az olcsóbb modellek szintén ezen az áron vásárolhatók meg. A két kártya átlagos teljesítménye a tesztek alapján hasonló. Az alacsonyabb felbontás a GeForce-nak tetszik, míg magasabb részletesség mellett szűkösnek bizonyul a fedélzeti memória mérete és annak sávszélessége. Fontos megjegyezni, hogy lesz 1 GB-os memóriával ellátott verzió is a GTX 460-ból. Ilyenkor a teljes 256 bites memóriabusz aktiválódik, amivel a blending egységek száma is 32-re nő. Ez a modell természetesen erősebb a referenciaváltozatnál, így az MSRP ár is 229 dollárra emelkedik. Az előzetesek szerint a gyártók többnyire a gyárilag tuningolt megoldásokhoz használnak 1 GB-os fedélzeti tárat, amelyek ezt az árszintet túllépik. Az erősebb verzió TDP fogyasztása is nagyobb 10-15 wattal.

Végre jó az irány

A GF100 után az NVIDIA pont azokat a változásokat hajtotta végre, amikre szükség volt. A GF104 egyértelmű, hogy ki lett gyúrva a grafikai számításokra, ami PC-s felhasználok és játékosok számára különösen fontos szempont, ugyanakkor ezt az általános számításokban mérhető teljesítmény csökkenésével fizették meg a zöldek. Az irány mindenképp jónak nevezhető, hiszen az új lapkából nem készül termék HPC szerverekbe, így tökéletesen lényegtelen a produkciója ezen a vonalon. Nagyon valószínű, hogy a később érkező GF106-os és GF108-as lapka is az új felépítésre épül, ami természetesen jó hír a piac számára, hiszen versenyképes megoldások vannak születőben, amelyek talán meggyőzik az AMD-t a Radeonok árazásának mérséklése felől. Az egyetlen probléma csak az idő, hiszen jelentős késésben van az NVIDIA fermis generációja, ám ahogy a mondás tartja: jobb később, mint soha.

Azóta történt

Előzmények

Hirdetés