ATI R520: pletykák és cáfolatok

A Neowin.net egyik „jól értesült” fórumozója konkrét adatokat bocsátott közre az ATI tavaszra várt új grafikus processzoráról, az R520-ról. A specifikáció első pillantásra is furcsának tűnt, minthogy azonban több neves informatikai lap is lényegi kommentár nélkül utalt az adatokra, fontosnak tartjuk, hogy cáfoljuk a kacsának tűnő hír állításait, amely szó szerint a következőket tartalmazza:

  • 24 "Pipelines"
  • 32 Texture Units
  • 96 Arithmetic Logic Units (ALU)
  • 192 Shader Operations per Cycle
  • 700MHz Core
  • 134.4 Billion Shader Operations per Second (at 700MHz)
  • 256-bit 512MB 1.8GHz GDDR3 Memory
  • 57.6 GB/sec Bandwidth (at 1.8GHz)
  • 300-350 Million Transistors
  • 90nm Manufacturing
  • Shader Model 3.0
  • ATI HyperMemory
  • ATI Multi Rendering Technology (AMR)
  • Launch: Q2 2005
  • Performance: Over 3x Radeon X800 XT !!! (for single R520)
  • 16x stochastic FSAA
  • FP32 blending, texturing
  • Programmable Primitive Processor/Tesselator

A lista elején álló adat a pixelfutószalagokra utalhat, azonban a 32 textúrázó egység máris megcáfolja, hiszen a 24 többszörösének illene lennie. Az R420 kódnevű mag például 16 futószalagot és 32 textúrázó egységet tartalmaz.

96 ALU: elvileg egy textúrázó egység jelent egy ALU-t, amely 4 skalár komponenssel tud dolgozni (ATI esetében 3-4 és/vagy 1 komponenssel, az NVIDIA-nál engedélyezett a 2-2 felállás is – ez a Dual Issue). 96 = 4×24 vagy 3×32, vagyis higgyünk, amit csak akarunk. A Radeon X800-ban az ALU-k tekintetében az a helyzet, hogy egy futószalagon két ilyen négykomponenses ALU van, vagyis mindenki azt számít és nevez el ALU-nak, amit akar. 192 shader utasítás ciklusonként: 192 = 8×24 = 6×32 = 12×16, tehát ez sem valós szám, mert elvileg minden ALU minden körben elvégezhet egy shader utasítást (például összeadást), vagyis az X800 16×2 = 32 utasítást tud, de ha lebontjuk az ALU-kat még 2-re (mert jó esetben a 3-as vektor rész és az 1-es skalár rész is dolgozhat – Coissue), akkor máris 64-nél tartunk; míg ha a marketingosztály stílusában az ALU-kat az összes skalár komponensre (vagyis négyre) bontjuk le, akkor meg 16×2×4 = 128 jön ki. Feltehetően így okoskodott az információforrás is: 24 futószalag × szalagonként 2 ALU × ALU-nként 4 skalár komponens = 192 jött ki, ami persze hihetetlen, de már arcizmunk sem rezzen láttára.

300-350 millió tranzisztor, 90 nm-es csíkszélességgel, 700 MHz-es magórajelen: ez két Radeon X850 XT (a jelenlegi csúcskártya!) áramfelvételét és melegedését jelentené egyben... A mi verziónk: ha az ATI átáll a 32 bites shader precizitásra (ugyan ez nincs a paraméterek között, ám következik a Shader Model 3.0 alkalmazásából), akkor 16 futószalaggal egy NV40 méretű, azaz mintegy 200 millió tranzisztorból álló chip jön ki. Ha ezt feldúsítják még 8 futószalaggal, akkor reális a 300 millió kapu, de a 700 MHz egyáltalán nem! Ennyit maximum a 4 futószalagos, alacsony k-állandójú technológiával készülő, 0,13 mikronos RV360-ból lehet kicsalni intenzív hűtéssel. Nyolc futószalaggal a legnagyobb frekvenciát a 0,11 mikronos GeForce 6600 GT-k hozzák, olyan 620 MHz környékén. Már az is technológiai remekmű lesz, ha ezt eléri az ATI.

A memóriát tekintve is nagyon soknak tűnik az 1,8 GHz-es órajel. Ha ez GDDR4-et takar, és az effektív órajel négyszerese az alapórajelnek, akkor 450 MHz-es alapfrekvencia jön ki, ami 2,2 ns-os RAM-chipeket feltételez. Ha az 1800 MHz kétszeres szorzóval áll elő, akkor a 900 MHz-es alapórajel 1,1 ns-os lapkákat igényelne...

ATI Multi Rendering Technology (AMR): úgy tűnik, az ATI válaszol az NVIDIA SLI kétkártyás megoldására.

Bejelentés várható ideje: 2006 második negyedéve – reális, de nem ezekkel a paraméterekkel. Egy R520 chip teljesítménye: a Radeon X800 XT háromszorosa – hihetetlen.

Tizenhatszoros véletlenszerű FSAA: semmi extra, csavartak egyet a temporal AA-n, valószínűleg 2×8 mintapontos váltós temporal AA, de nincs az az ember, aki játék közben látná az eltérést a 8-szoros és a 16-szoros AA között.

32 bites lebegőpontos blending, textúrázás: az NVIDIA OpenEXR-támogatása „csak” 16 bites, de már az is visszafogja a csúcskártyákat például FarCry-ban – ennek ellenére hihető. Eddig éppen az volt a HDR fékezője, hogy az ATI nem tudott lebegőpontos blendinget.

Programozható primitívprocesszor/tesszalátor: nocsak, nocsak – efféle motor létezett valamelyik régebbi Radeonban. A 3D ponthalmazok háromszögekbe rendezését eddig a CPU végezte. Komoly geometriáknál (melyeket egy textúraolvasásra képes vertex shader bizonyosan kiprovokál) ezt bizonyosan át kell helyezni a GPU-ba, hiszen ha már maga egy rücskös fal 100-200 ezer poligonból épül fel, akkor komoly probléma adódhat.

  • Kapcsolódó cégek:
  • ATi

Azóta történt

Előzmények

Hirdetés