GT200: az 1,4 milliárd tranzisztoros GPU

Az NVIDIA elképzelése

Az NVIDIA a mai nappal útjára indította legújabb GPU-generációját, a GT200-as kódnevű – nem túlzás, ha azt mondjuk – szörnyet, amely a másfél éves G80 után végre valóban előrelépést jelent, ellentétben az utóbbi időszak nem túl figyelemfelkeltő termékbevezetéseivel (vö. GeForce 9800 GTX). Forradalmi újításról azonban nem beszélhetünk, bár ez nem is csoda, hiszen a mérnökök mozgástere az utóbbi időben erősen beszűkült. A GT200-at úgy is fel lehet fogni, mint egy óriási, a piac egészét tekintve feleslegesen nagy és komplex grafikus processzort, de annak jelét is láthatjuk benne, hogy az NVIDIA biztosra akart menni az inkább a presztízs, mint az eladások miatt fontos csúcskategóriában. Az mindenesetre biztos, hogy a chip új fejezetet nyit ebben a szegmensben, az pedig több mint érdekes, hogy a készítők nem a GeForce 9800 GTX G92-es lapkájához hasonlítgatják a GT200-at, hanem az öregebb GeForce 8800 GTX alapját képező G80-hoz, ezzel is beismerve, hogy igazi fejlesztéseket jó ideig nem végeztek.

A GT200 le sem tagadhatná származását, igazán NVIDIA-s megoldásokat vonultat fel, elsősorban a szimpla erőre, a számok törvényére támaszkodik: „a több az gyorsabb, azaz jobb”. Az új generáció képviselőinek bemutatása és a tesztek előtt a GT200 architekturális újításaival foglalkozunk, a lényegi fejlődés egyes pontjait próbáljuk meg lehetőleg érthető módon tálalni. Jó, ha tisztázzuk már az elején, hogy a GT200 alapjában véve nagyban a G80-ra épül, ezért a fejlesztések megértéséhez elengedhetetlen, hogy ha nagy vonalakban is, de tisztában legyen az olvasó a G80 felépítésével.

A GT200 lényegében az NVIDIA második generációs unified shader, azaz egységesített shader architektúrája. Ez annyit jelent, hogy a GPU-ban nem különálló pixel és vertex feldolgozókat találunk, hanem olyan kis egységeket, az NVIDIA szóhasználatában stream processzorokat, melyek pixel és vertex, illetve a DirectX 10-ben bemutatkozó geometriai shaderek kiszámolására egyaránt alkalmasak. Ennek lényege, hogy a stream processzorok folyamatosan és egyfolytában teljes terhelés alatt képesek működni, nem fordulhat elő olyan eset, amikor egy vertex shaderekre jobban támaszkodó (játék)jelenetben a pixel shaderek pihennek, és fordítva. Az NVIDIA a GT200 elé azt tűzte ki célul, hogy a G80-nál akár kétszer gyorsabb legyen, bár a sebességnövekedés arányai az egyes komponensek és feladatok esetében (shaderek, ROP egységek, textúrázás stb.) eltérőek lehetnek.

Ismerve a G80 paramétereit (128 stream processzor, 32 textúracímző, 64 szűrő, 6 ROP blokk, 384 bites memóriabusz) ez nem tűnik bonyolult feladatnak; duplázzuk meg a különböző egységek számát – gondolná a laikus –, és meg van oldva. Ez azonban nyilvánvalóan nem ilyen egyszerű, hiszen vannak gyártástechnológiai korlátok, meg kell felelni a gyártás műszaki és gazdaságossági feltételeinek, illetve már a tervezéskor figyelembe veszik az előző generációval szerzett tapasztalatokat – minek például egy adott részegység számát megduplázni, ha egyszer már a korábbi mennyiség is bőven elegendő? Akkor tehát mit lehet tenni? Növeljük bizonyos részegységek számát (lehetőleg azokét, melyekből előreláthatólag többre lesz majd szükség), optimalizáljuk a jelenlegi működést, majd „reménykedjünk”, hogy a játékipar abba az irányba tart, ahol a mi architektúránk optimálisan működik. Az NVIDIA ezt tette.

Az NVIDIA igen szoros kapcsolatot tart fenn a játékfejlesztőkkel, és nem mellékes, hogy a diszkrét grafikus kártyák piacán vezető pozícióban van, ezért joggal feltételezi azt, hogy a jövőben megjelenő játékcímek az ő hardverét semmiképpen sem fogják hátrányos megkülönböztetésben részesíteni. Gondoljunk csak a DirectX 10.1-re, amit a Microsoft és az AMD is próbál nyomni, propagálni, de az NVIDIA továbbra sem támogatja ezt a kiterjesztést. Állítják, hogy a GT200 tervezése során fontolóra vették a DX 10.1 támogatásának implementálását, de miután konzultáltak a vezető játékfejlesztő cégekkel, elvetették az ötletet, mert azok úgy nyilatkoztak, hogy a DX10 kiterjesztése nem lényeges, ezért aztán inkább az architektúra sebességét csiszolták tovább.

Rátérve az architektúra főbb jellemvonásaira, illetve az újításokra, nézzük címszavakban, hogy mire számíthatunk:

  • a GeForce 8800 GTX teljesítményének kétszerese,
  • egy kiegyensúlyozottabb architektúra, mely a jövő játékait gyorsabban futtatja,
  • a geometriai shader, illetve stream output teljesítményének javulása a DirectX 10-es játékok miatt,
  • jelentősen továbbfejlesztett számítási kapacitás a CUDA alkalmazások és a fizika kiszámítása miatt,
  • a teljesítmény/fogyasztás hányadosának javulása.

A felsorolásból látható, hogy az első négy szempont lényegében egyazon paraméterhez kötődik, és ez a teljesítmény.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

Előzmények

Hirdetés