A Microsoft még márciusban beszélt először az új Xboxról, amely Project Helix kódnéven fut. A vállalat nagyon sok konkrétumot nem közölt a hardver képességeiről, de már akkor megemlítették, hogy az alkalmazott grafikus vezérlő alapvetően a Work Graphs API-ra lesz tervezve. Utóbbit a jelenleg elérhető modernebb GPU-k is támogatják, de az új rendszer által biztosított modell annyira más, hogy az érkező dizájnok a specifikus optimalizálásokkal jóval gyorsabban dolgozhatják fel a kapcsolódó kódokat.
Így tesz majd az új Xbox is, ugyanis a rendszerchipet beszállító AMD teljesen újragondolta a GPU ütemezését. Erre azért lesz szükség, mert amerre megy a Work Graphs API, oda nem túl optimális az a kötött ütemezési modell, amit a mai hardverek kínálnak. A jelenlegi feldolgozás úgy néz ki, hogy a CPU előkészíti a rajzolási parancsot, azt betölti a parancspufferbe, majd onnan bejut a GPU-ba, ahol a parancsmotor megkapja. Itt lesz kvázi értelmezve, hogy mit is kell csinálni vele, vagyis a grafikus vezérlő fő ütemezője dekódolja a parancsot, és meghatározza, hogy melyik feldolgozóra kerül. Ehhez kapcsolódóan ellenőrzi, hogy megvannak-e szabad erőforrások a végrehajtáshoz, és ennek figyelembe vételével eldönti a futtatandó konkurens wave-ek számát, illetve a futószalaggal való szinkronizációt.
A klasszikus feldolgozási modell addig nem jelent gondot, amíg kevés, viszonylag nagy kernel fut, illetve a munkamenet jól követhető, azaz nem túl dinamikus a hardveren belüli munkavégzés folyamata. A legtöbb cím még figyelembe veszi ezeket a tényezőket, de egyre több grafikus motor lépdel a megszokott, kevés és nagy batchekről a sok, kicsi és változó batchek felé. A masszív változásokhoz persze nyilván szükséges a szoftveres háttér megalkotása is, de pont ezért jött a Work Graphs API.
A jövőben arra számít a Microsoft, hogy a munkafolyamatok drasztikusan eltérők lesz, amelyek a mostaninál jóval finomabb szemcsézettségű ütemezést kívánnak majd meg a hardver oldalán. Itt mondjuk a cég nem árul zsákbamacskát, lényegében azért hozták a Work Graphs rendszert, hogy ennek az iránynak letegyék az alapjait, tehát igazából csak ezt az utat kínálják fel a fejlesztők számára. Ilyen formában nem túl nehéz megjósolniuk, hogy merre megy majd az ipar, de az is látszik, hogy általánosan is erre van igény.
Ez a jövőkép azonban egy problémát eredményez a mai GPU-kon, ugyanis a Work Graphs által dinamikusan generált munkák visszafutnak a parancsmotorhoz. Az tehát kétélű fegyver, hogy ezekhez nem szükséges a processzor beavatkozása. Egyrészt jó, mert így a CPU oldalán nem keletkezik terhelés, másrészt valahol rossz, mert így a GPU saját magának adhat feladatot, és konkrétan ezt nem limitálja a rendelkezésre álló processzoridő, vagyis egy bizonyos feladatmennyiségen túl a fő parancsmotor válik szűk keresztmetszetté. Ez azért nem túl szerencsés helyzet, mert a parancsmotorok szempontjából minden GPU igen hasonló teljesítményű egy termékcsaládon belül. Ezt a részét ugyanis a hardvereknek a gyártók nem igazán skálázzák, méghozzá azért nem, mert a manapság megszokott feldolgozási formák mellett hamarabb válik limitálóvá a rendelkezésre álló processzoridő.
A hardveres skálázás hiánya a végeredményt tekintve ahhoz vezet majd, hogy az amúgy rendkívül eltérő teljesítményű, egy termékcsaládon belüli GPU-k között igencsak kicsivé válik a különbség, ha a fő parancsmotor limitálni fogja a Work Graphs működését. Ez abból ered, hogy ha a munka kiadása lesz a szűk keresztmetszett, akkor egyszerűen nem lesz elegendő kiszámítandó feladat a feldolgozóknak.
Információink szerint a Microsoft az új Xbox esetében gondolt erre, és a rendszer GPU-ja a fő parancsmotor mellé úgynevezett lokális parancsmotorokat is bevet, amelyek egy-egy multiprocesszorra fókuszálnak csak. Ilyen formában, amikor a GPU magának generálna feladatot, az elvégzendő munka ütemezése nem a fő parancsmotorig jut vissza, hanem csak a lokálisig, vagyis a hardveren belül jóval nehezebben alakulhat ki szűk keresztmetszett a GPU front-endjének területén.
Bár az újítás főleg a Work Graphs működésére fókuszál, és azt teszi nagyon hatékonnyá, bizonyos szempontból a meglévő kódokra is akár jelentős hatása lehet. Az egyik olyan terület, ami profitálhat belőle az a sugárkövetés, ugyanis a manapság alkalmazott futószalag nagyon rossz hatékonysággal fut a GPU-kon. Ennek az oka az, hogy a sugárkövetés többlépcsős folyamat és mindegyik lépcsőn új munkaelemeket generálhat. Az ember azt gondolná, hogy ez nem gond a GPU majd párhuzamosan mindent megold, de a valóság nem is lehetne távolabb ettől, mert a munkavégzés inkább gráfjellegű.
A jelenlegi sugárkövetés sebességét tehát nagyban meghatározza az, hogy az egyes futószalaglépcsők között mennyi feladatindítás keletkezik. Ezek ugyanis mind igénybe veszik a parancsmotort, ráadásul kifejezetten dinamikus munkaterheléssel, amit a mai GPU-k ugyan megoldanak, de nem igazán erre lettek tervezve. A Microsoft új konzolján ugyanakkor ez a dinamikus munkaterhelés nem egy részegységet vesz célba, hanem a lokális parancsmotorok felosztják egymás között a feladatot. Ennek köszönhetően a teljes munkavégzés kvázi megszervezésében jóval kisebb valószínűséggel alakul ki szűk keresztmetszet, vagyis inkább a feldolgozómotorok nyers teljesítménye határozza majd meg azt, hogy a hardver milyen gyorsan végzi el a sugárkövetéses effektek számítását.
Az egész kifejezetten nagy paradigmaváltás, főleg ahhoz viszonyítva, ahogy ma a GPU-k tipikusan működnek, de egy új konzol esetében elvárható, hogy alapvetően az iparági trendeket figyelembe véve készül, és ilyen szempontból okozhat meglepetést.

