Végre itt a középkategóriás Fermi

Hirdetés

Jó úton halad az NVIDIA afelé, hogy teljessé váljon a Fermi architektúrára épülő generáció. A korábban megjelent GF100-as és GF104-es lapkákat most a GF106 egészíti ki, mely a középkategóriát célozza meg a GeForce GTS 450 névre keresztelt versenyzővel. Az új GPU méretéről nincs hivatalos adat, de az eddigi információk és a képek szerint a kiterjedése 240 mm² körül alakul. A zöldek közvetlen ellenfélnek a múlt év végén megjelent 170 mm²-es Juniper lapkát tekintik, ám a konkrét termékek szintjén a Radeon HD 5770 teljesítményének elérése problémás, így az új GeForce tényleges ellenfele a HD 5750 lesz, amit a 129 eurós árazás is előrevetít. Ez az árcédula ugyan magasabb a konkurens megoldás átlagárához viszonyítva, de a GeForce GTS 450 az előzetes tesztek szerint némileg gyorsabb.

A GF106 gyakorlatilag a GF104 leszármazottjának tekinthető. A 40 nm-es gyártástechnológiával gyártott GPU egyetlen GPC (Graphics Processing Cluster) blokkot alkalmaz, amiben négy darab streaming multiprocesszor található. Egy ilyen egység 48 darab úgynevezett CUDA magot tartalmaz és ezek három csoportra lettek felosztva, azaz 16 utas feldolgozókon lesznek párhuzamosan végrehajtva az utasításszavak. A streaming multiprocesszorok két ütemezőt rejtenek, melyek két-két feladatirányító (dispatch) egységgel rendelkeznek, vagyis a rendszer képes dual-issue módban működni. Ez azt jelenti, hogy a feldolgozók közül egyszerre négy etethető, tehát a 16 utas CUDA magok három csoportja mellett a load/store, a speciális funkciók vagy a textúrázók is párhuzamosan dolgozhatnak. A GF104-hez hasonlóan megmarad a nyolc SFU, valamint a nyolc-nyolc textúracímző és textúraszűrő is. Természetesen egy-egy textúrázó csatornához négy mintavételező tartozik. Az elsődleges gyorsítótár mérete is 64 kB marad, ami a feladatnak megfelelően dinamikusan szétosztható egy 16 és egy 48 kB-os részre, attól függően, hogy mekkora megosztott memóriát igényelnek a CUDA magok. Az írható másodlagos gyorsítótár pontos kapacitása ismeretlen, de az architektúra sajátosságai miatt a 256 kB-os méret a legvalószínűbb.

A GF106 logikai felépítése
A GF106 logikai felépítése [+]

Mivel a lapka egyetlen GPC blokkot alkalmaz, így egy raszter motorral kell számolni négy PolyMorph motor mellett. A GF106 tehát órajelenként 8 pixelt képes feldolgozni, ami sok pixel kirajzolása esetén szűkös lehet a 24 darab blending egységre nézve. A lapka memóriavezérlője az NVIDIA hivatalos rajza szerint 192 bites lesz, amely 64 bites csatornákra oszlik szét. Egy-egy csatornához két ROP blokk tartozik, így a rendszer összesen 6 darab ilyen egységet tartalmaz. A fedélzeti memória GDDR3 vagy GDDR5 szabványú lehet. A GPU nagy része továbbra is az úgynevezett GPC, vagy közismertebb nevén shader frekvencián üzemel. A CUDA magok és a speciális végrehajtó egységek minden órajelnél, míg a textúrázók, a raszter, valamint a PolyMorph motorok minden második órajel mellett végeznek egy feladatot. A magórajel a ROP blokkokért és a másodlagos gyorsítótárért felel.

NVIDIA GeForce GTS 450
NVIDIA GeForce GTS 450 [+]

A GeForce GTS 450 192 CUDA magot és 32 textúrázó csatornát tartalmaz. A referenciaparaméterek tekintetében a kártya 783 MHz-es mag- és 1566 MHz-es shaderórajelen üzemel, a GDDR5 szabványra épülő 1 GB-os fedélzeti memória pedig 3600 MHz-es effektív frekvencián ketyeg. A memórialapkák 128 bites buszon kapcsolódnak a GPU-hoz, ami 16 blending egységet eredményez. Az adatok alapján kiszámítható, hogy a PCI Express 2.0-s foglalatba helyezhető termék számítási teljesítménye 601 GFLOPS, míg a memória-sávszélessége 57,6 GB/s. A fogyasztás szempontjából az új versenyző 106 wattos energiaigénnyel rendelkezik, így egy darab hat tűs PCI Express tápcsatlakozón keresztül etethető. A referenciamodell ventilátora az eddigi beszámolók alapján még terhelés mellett is csendes, de ez ebben a kategóriában megszokottnak mondható, hiszen a fogyasztás jól kezelhető szinten belül marad. A kártya hátlapján a szokásos felállás található, azaz a két DVI kimenetet a mini HDMI egészíti ki. Érdemes megjegyezni, hogy a GeForce GTS 450 a legolcsóbb olyan kártya, ami támogatja a dupla pontosság melletti számítást. Persze az elméletben biztosított 100 GFLOPS-os számítási teljesítmény nem éppen kimagasló, így aki tényleg komolyan gondolja ezt a szolgáltatást, az inkább ruházzon be egy combosabb VGA-ba.

Azóta történt

Előzmények

Hirdetés