Hát igen, elviekben gondoskodik róla, sőt ha pont olyan adatfolyamokon kell dolgoznia, amik nagy mértékben függetlenek egymástól, akkor még ki is lehet használni 649GFLOPS-ot, mondjuk egy jó kis CUFFT-vel. Az a baj ezzel, hogy a játékok nem ilyenek, mert rengeteg függés van az adatfolyamban mert igen sok a giccses játék, túl vannak effektezve, ez többszöri újraszámolást, soros utasításfeldolgozást feltételez, ahol minden lépésnek meg kell előznie az utána lévőt, nem lapolódhatnak át,ez szimpla vezérlésfüggés, itt valóban tökmind1 a mem sávszéélessége. A másik meg az az eset, ha az egyes fázisokon belül lehetséges lenne a párhuzamosság fokát növelni, de a számításokat párhuzamosan végző részegységek közt adatfüggés van, vagyis az egyiknek a másik által termlet adatra kell várnia(meghosszabított randevú), és nem mind1, hogy mennyit vár ilyenkor, főleg ha memintenzív számításokról van szó(szűrés,anti aliasing, különféle képkorrekciós számítások nagy méretű textúrákkal) és ez igen összetett lehet, többszörös függések is kialakulhatnak, és még ehhez hozzájön a szálak nyilvántartási költsége, szinkronizációs számítások, ami meigint plusz memóriaidő. Ezért egy idő után az adatbusz telítődik, és a már adatra váró, szabad shadereket sem lehet inicializálni, és itt romlik le nagyon a mag kihasználtsága, mert a forgalom akkorára nő, hogy eldugítja teljesen a memvezérlőt. Ez már néha annyira komplex függéseket eredményez, hogy úgy lehet feloldani a gordiuszi csomót, hogy egyszerűen kivágod az összes lapot a rákba a memóriából, és újraütemezel mindent. Tipikus példa erre a g92 vergődése Crysisban 1650x1050 16xAA 16xAF mellett, vagy a 3870-eké pár játékban. Mindkettővel mértem, szinte az összes driverrel, és a min fps mindíg 0 volt! Úgy nézett ki a gamma, hogy egyszer ment pár másodpercig 10 fpsen, aztán 5 másodperc mosolyszüntet, aztán 10 fps és igy tovább. Ugyanez GTX-el 21 fps stabilan, akadás nélkül, csak nagyon ritkán ment 20 alá, min aszsem valami 15 volt. Sőt gx2 is detto ugyanez csak ott annyi a különbség, hogy 60-70 fps a max. Próbálkoztam persze mem órajel emelésével, de annyit ért mint halottnak a csók, még ddr4 2500nál sem 3870-nel sem, 0 hatása volt erre a jelenségre.
Az meg már más káposzta, hogy nem is nagyon foglalkoznak a progamozók azzal, hogy megfelelően HW-hez illesztett kódot generáljanak, kivétel ezalól persze a lobbi, de még itt sem egészen teljesül ez, mert alapvető korlátai vannak, illetve ha valamit villanatni akarnak vagy ha célhardverről van szó, ahol konkrétan a minél hatékonyabb kód generálása követelmény. A sw fejlesztők általában úgy állnak hozzá a dolghoz, hogy a HW egyre nagyobb teljesítményű lesz, és ezért nem kell törödniük erőforrás kezelési problémákkal, ők megírják, a gyártók legyártják, te meg vedd meg jó drágán, és az sem érdekes, hogy ez milyen hatásfokkal működik, mennyi a fenntartási költsége, milyen gyorsan avluel stb. Emiatt jelenleg ott tartunk, hogy a HW-t kell illeszteni az alkalmazásokhoz.










több ilyen USBs kütyüt lehetne csinálni.








(512bit+GDDR5)
így "helyesebb"![;]](/dl/s/v1.gif)





















