Hirdetés

Hamarosan jön a DirectX 11

Már nem kell sokat várni a Microsoft legújabb DirectX 11 API-jára, mely a Windows 7 év végi megjelenésével egyidőben startol, ennek megfelelően a grafikus processzorokat gyártó vállalatok gőzerővel fejlesztik a friss platformra épülő rendszereket. Ahogy közeledik az új generációs lapkák megjelenése, egyre több információ szivárog ki a mérnökökön keresztül. Persze jó esély van rá, hogy a tényleges specifikációkat csak a termék megjelenésének napján tudjuk meg, érdemes egy kevés figyelmet szentelni az eddig közölt adatoknak. Mielőtt azonban felelevenítenénk a pletykákat, tisztázzuk a DirectX 11 kapcsán felmerülő kompatibilitási kérdéseket.

x11

A Microsoft új API-jának fejlesztéseit a múlt év őszén megjelent írásunkban elemeztük, a kompatibilitás kérdésére azonban még soha nem tértünk ki, így – bepótolva az elmaradásunkat – most megvizsgáljuk a helyzetet. Nagyon fontos, hogy a DirectX 10 beköszöntével a Microsoft teljesen új alapokra helyezte a rendszert, átgondolva és lényegében megoldva az évek során felmerült problémákat. Természetesen az egyszerűsítés áldozatokkal is járt, ennek megfelelően a DirectX 10 API-ra írt kód semmilyen formában nem volt kompatibilis a korábbi verziójú API-kkal. Ez az áldozat mindenképp szükségszerű volt, hiszen a rendszer annyira bonyolulttá vált a shaderek bevezetésével, hogy nem lehetett tökéletesen kigyomlálni a visszafelé való kompatibilitás megőrzése mellett. Az új elvek kidolgozásánál azonban a rendszerprogramozók a jövőre is gondoltak, így mostantól minden új DirectX verzió az előző változat kiterjesztéseként funkcionál. Hasonlóképpen működik az OpenGL API kompatibilitása is.

Hirdetés

Egy egyszerű példán keresztül könnyen megérthető az új elvekre épülő DirectX működése. Tegyük fel, hogy egy DirectX 11 API-ra írt programot futtatunk a számítógépen. Amennyiben DirectX 11 kompatibilis grafikus processzor dolgozik a rendszerben, akkor az erőforrás teljesen megfelel az igényeknek, így a programkód tökéletesen lefut. DirectX 10 és 10.1-es hardver esetében már megkötéssel kell számolni, mivel a kód egyes részei nem értelmezhetők a rendszer számára. Ez természetesen a program futása szempontjából áthidalható probléma, azonban a kritikus részek egyáltalán nem, vagy – csúnyán fogalmazva – nem megfelelően fognak lefutni. A DirectX 10.1-es kártyák esetében ez képminőségbeli eltéréseket eredményez majd, a DirectX 10-es rendszerek viszont már teljesítménybeli hátrányokat is elkönyvelnek majd a komolyabb megjelenítésbeli hiányosságok mellett. Nagyon fontos megjegyezni, hogy program futásakor létrehozott erőforrás csak a támogatott API-ban leírt eljárásokat használhatja. Ez azt jelenti, hogy a GeForce rendszerek hiába támogatják a korrekt élsimításért felelős multisample accesst, ha nem működhetnek DirectX 10.1-es módban. Természetesen ez a HD Radeonok tesszellátor egységére is igaz, bár a Xenos-alapú technológia eleve nem kompatibilis a DirectX 11 megoldásával. Ha az is lenne, akkor sem működhetne. Ettől függetlenül persze a fejlesztők bármikor megkerülhetik az előbb említett problémákat, hiszen az NVIDIA kártyákhoz használható a CUDA, az AMD-s rendszerekhez pedig ott a Tesselation SDK.

A DirectX 11 friss eljárásaként számon tartott compute shadert is támogatják az „öregebb” rendszerek, azonban a programkód szokás szerint megszorításokkal fog futni. A DirectX 10.1 mellett ez képminőségbeli visszaesést jelent majd, a DirectX 10 rendszerek esetében pedig helyenként a sebesség is csorbát fog szenvedni.

Az előbbi kitérő után visszatérhetünk az írásunk eredeti témájához. A kiszivárgott információk szerint az AMD RV870 kódnéven fejlesztett DirectX 11-es rendszere áll a legjobban, így várhatóan a Windows 7 megjelenésével egyidőben fog startolni. A lapka minden bizonnyal 40 nm-es gyártástechnológiával fog készülni, és az AMD szokásos stratégiájának megfelelően 200 és 230 mm² között lesz a mérete. Valószínűleg marad a 80 utas végrehajtó tömb is, amiből az előbb említett magméretbe 20-22 darab fér el, ez megfelelő órajel társaságában 2,4-2,6 TFLOPS teljesítményt fog biztosítani. A ROP blokkok száma is növekedni fog, így jó esély van rá, hogy az RV870 512 bites memóriavezérlővel érkezik majd, ehhez nyolc darab blokk szükséges 64 bites csatornákkal, de érdekes alternatíva lehet még a 384 bites buszszélesség is, amihez hat ROP blokk szükséges. Az AMD rendszere azonban nem tagolt felépítésű, így vélhetőleg nem spórolható sok tranzisztor az utóbbi, „csonkított” megoldással.

Az NVIDIA természetesen megtépázott becsületéért is küzd, így teljes erőbedobással fejlesztik a GT300 kódnéven érkező rendszert. A legutolsó információk szerint a DirectX 11 kompatibilis lapka az idei év negyedik negyedévében érkezik, és a TSMC 40 nm-es gyártósorairól kerül majd le. A stratégiáról megoszlanak a vélemények, hiszen sokan feltételezik, hogy az NVIDIA is átáll a kisméretű chipekre, ezt azonban nem olyan könnyű kivitelezni, hiszen az AMD nem a kis méret miatt nyerte az aktuális rendszerek csatáját, hanem fontos szempont volt az is, hogy az RV770 minden egyes négyzetmilliméteréhez brutális teljesítmény társult. A realitás talaján maradva az NVIDIA mérnökei valószínűleg a 430-450 mm²-es méretet célozzák meg, ami az RV870-hez viszonyítva nem ideális, de megfelelő teljesítménnyel párosítva bármi lehet. A GPGPU piac felé tett erős érdeklődés miatt jó esély van rá, hogy megmarad streamalapú felépítés, ám várhatóan komoly módosításokra is sor kerül. A DirectX 11 következtében a tesszellátor beépítése erősen ajánlott, emellett a textúrázókat is át kell dolgozni, hiszen a Gather4 kompatibilis rendszer csatornánként négy mintavételezőt követel, míg a mostani GeForce chipek mindössze eggyel rendelkeznek. Ideális variáció, ha a GT200 TPC (Texture Processor Cluster) blokkjai három helyett négy streaming shader processzorral működnek majd, míg a felújított textúrázó blokkok száma maradhat kettő. Ha az NVIDIA sikeresen kozmetikázza a felépítést, akkor 16-18 TPC blokk is elférhet a lapkában, ami 512-576 stream processzort jelent. A 20 TPC blokkal elérhető 640 shader egység sem kizárt, de ehhez nagyon komoly átalakítás szükséges, különben nem fér bele a lapka a 450 mm²-ébe. A ROP blokkok számát is meg kell növelni minimum 12-re, ez 32 bites csatornákkal 384 bites buszszélességet eredményez, ami GDDR5 memóriákkal párosítva megfelelő sávszélességet teremt. A számítási teljesítmény 2,8 és 3,2 TFLOPS körül lehet majd, de fogalmazhatunk úgy is, hogy érdemes a mérnököknek az utóbbi értéket megcélozni, ha versenyezni akarnak az azonos gyártástechnológián is jóval kisebb RV870-nel. A GT200-féle úgymond „haszonmentes forgalmazás” nyilván nem fér bele még egyszer az üzleti modellbe. Jelentősen át kell még dolgozni az új GeForce Double precision teljesítményét is, hiszen a GT200 a dupla pontosságú adatokat az elméleti teljesítmény 1/12-éval képes számolni, míg az AMD már az RV670-től kezdve 1/5 sebességgel dolgozik.


Pat Gelsinger és a Larrabee

Az AMD és az NVIDIA mellett az Intel is beszáll a diszkrét grafikus kártyák piacára. A Larrabee kódnevű rendszerről már sok információ kiderült, a konkrét magszám azonban még mindig hétpecsétes titok. Az architektúra talán legfontosabb része a Binned Rendering névvel illetett technológia, melyet a chip a leképzéshez használ. A legfrissebb információk szerint az első Larrabee lapka 45 nm-es gyártástechnológiával készül, a mérete pedig 600 mm² körül lesz. A megjelenés legjobb esetben az év legvégén esedékes, de inkább a jövő év eleje a reálisan tartható időpont. Ilyen felépítésű chippel még nem igazán lehetett találkozni a PC-s piacon, így nagyon nehéz megtippelni a konkrét paramétereket, de a Pentium MMX lapka méretéből kiindulva az első Larrabee 32-48 processzormagot tartalmazhat. Érdekes információ, hogy az Intel csak a textúrázást oldja meg fix funkciós egységgel, így előfordulhat, hogy a tesszellátort is emulálni fogják. Az általános felépítés miatt ez természetesen megfelel a DirectX 11 követelményeinek, csak teljesítmény szempontjából nem biztos, hogy jó megoldás. Eleve érdemes megjegyezni, hogy az egyes API-k támogatása az eszközillesztőn keresztül megoldható, azonban az emulált funkciók esetenként rendkívül költségesek lesznek. Mindenesetre az Intel nagyon bízik a rendszerben, melynek 300 mm-es szilíciumostyája a múlt héten lencsevégre is került. A Larrabee számítási teljesítményét is homály fedi, de 2 és 3 TFLOPS közé tehető.

Érdekes lesz tehát a DirectX 11 megjelenését követő időszak. Alapvetően három eltérő koncepció került terítékre, melyek hűen bizonyítják, hogy mennyire eltérő a cégek felfogása a jelenlegi helyzetről. És akkor még nem említettük, hogy az S3 is dolgozik az Excalibur architektúrán, mely szintén támogatja a DirectX 11-et, és várhatóan a belépőszint mellett az alsó-középkategóriás piacra is nevez majd.

Azóta történt

Előzmények

Hirdetés