Nos, a ray-tracing elég "tág fogalom", benne van a árnyékok és tükröződések által "élethű-szerű", de egyébként kezdetlegestől a sokkal komplexebb, és már eléggé élethűig sokminden. (Aztán jön a radiosity, ami még 1-2 nagyságrenddel erőforrás-igényesebb, stb.)
Ami a real-time ray-tracinget illeti, PC-s demókban is találkozni ilyennel, persze kis felbontáson, egyszerű scene-nel, stb. Egy Cell proci meg már nagyfelbontásban is tudja ezt. Több ilyen (dual-Cell blade-eket tartalmazó rackek) meg már elég összetett dolgokra képes, real-time. [link] Szóval nem egészen felel meg a valóságnak az, hogy eddig nem létezett erre alkalmas hardver (szuperszámítógépeket nem számolva)! Az más kérdés, hogy az IBM nem adná olyan olcsón a dual-Celles blade lapokat (amik nagyjából megfelelhetnek egy ilyen Caustic chipnek), mint talán a cikkbeli termék ára lesz.
"az eljárás erőforrásigénye végett"
Végett = valaminek céljából, tehát ide a miatt illik.
shabbarulez: "ez pedig nagy valószínűséggel egy végletekig leegyszerűsített SIMD tömbproci lehet. Gondolom csak olyan utasítások kerültek az SIMD egységbe aminek Ray-trace esetében használható, így egy viszonylag 1xű SIMD egységből igen sok ráférhet egy szílicium darabra."
Ezzel a GPU-k jellemző felépítését adtad meg, amik korlátozottan alkalmasak ray-tracingre. (Persze a nyers erő által gyorsabbak itt is, mint egy sima CPU, de pl. a Cell 6x gyorsabb erre, mint egy G80, holott utóbbinak 2x akkora a peak FLOPS értéke.)
A ray-tracingnél nagyon sok, többnyire skalár számítást kell végezni, sugaranként (itt egyben threadenként) teljesen eltérő patternben. Azaz biztosítani kell a threadenkénti független, egymást nem akadályozó ugrásokat. Az egyszerű SIMD tömbök ebben (is) gyengék.
Egy sok, de egyszerű CPU-t tartalmazó tömb tűnik erre a legalkalmasabbnak. Tehát első ránézésre a Larrabee, csak éppen teljes értékű (hétköznapi CPU kódot futtatni kepes még nem túl nagy veszteséggel) CPU magból nem fér el túl sok jelenleg egy érelmes méretű chipen. Továbbá a Larrabee architektúrája nem kényszeríti rá a memória-sávszéllel való spórolásra a programozót (mivel minden mag közvetlenül hozzáfér a memóriához), és a cache-ből is kevesebb fér el benne a jóval nagyobb helyigénye miatt, mint lokális S/DRAM-ból. Ergo, marad a Cell, az CPU-magoknál jóval kisebb, de önálló SPE-ivel (azonos csíkszélesség mellett többszörös magszám!). 
[ Szerkesztve ]