Működik az aszinkron compute a GeForce-okon is

Ahogy egyre többen kutatják a DirectX 12 lehetőségeit, úgy kerülnek elő az olyan extra adatok, amelyek segítenek megérteni az aktuális hardverek aszinkron compute melletti teljesítményét. A legújabb adatokat a Microsoft DirectX 12-es N-body példaprogramjának AMD által módosított verziója szolgáltatja, amelynek eredményeit Carsten Spille, a PC Games Hardware újságírója mérte egyelőre önszorgalomból, így a linkelt oldalra még nem került fel, de a Beyond3D fórumának egyik topikjába megtalálható.


[+]

Az ábrán világosan látszik, hogy az aszinkron compute által biztosított teljesítményelőny alapvetően függ a munka nagyságától. Az eredeti program alapértelmezetten 16 384 részecskét szimulál, ami természetesen a mai játékokat figyelembe véve erősen túlzó, de mivel ez egy példaprogram, az extrém szituációk is beleférnek. A részecskék számát növelve az aszinkron compute által realizált előny csökkenni kezd. Ezen belül is egy bizonyos szint után például a Fiji cGPU inkább lassul a futószalagok párhuzamos végrehajtásától, ami lehet a meghajtó kiforratlansága is, vagy esetleg a példaprogramot nem paraméterezték úgy, hogy a Fiji ezt a szituációt megoldja. Persze a 65 536 részecske szimulálása még tíz éven belül sem lesz norma a játékokban.

Ami igazán érdekes, az az alapértelmezett paraméterezéshez használt részecskeszám csökkentése. 8192 darab részecske szimulálása már sokkal közelebb áll ahhoz a határhoz, amennyivel az érkező játékok fognak számolni, bár még így is nagyon soknak mondható. Ilyenkor a tesztelt Radeonok lapkától függően 10-20% közötti gyorsulást érnek el az aszinkron compute aktiválásától, de meglepetés, hogy a tesztelt és erre alkalmas Kepler és Maxwell architektúrára épülő GeForce-ok is ténylegesen kimutatható 1-4% közötti gyorsulást érnek el. Ez nagyon fontos, mivel ez az első program, ami gyakorlatilag bizonyítja azt az eddig csak sejtett feltevést, hogy bizonyos szituációkban működik az aszinkron compute a GeForce-okon is. A gyorsulás mértéke ugyan nagyon csekély, de mérhető.

A program alapján az is látszik, hogy az aszinkron compute paraméterezésénél nincs általánosan jó irány. A beállítások lehet, hogy az egyik grafikus vezérlőnek kedveznek, de a másiknak nem. Talán ezért szabott meg túl kemény specifikációkat a Microsoft, mert előre látták ezt a problémát. A specifikációikkal gyakorlatilag ki akarják kényszeríteni, hogy a cégek az Xbox One IGP-jének képességeit másoló hardvert tervezzenek a jövőben, így egyszerűbbé válhat az aszinkron compute általános paraméterezése a fejlesztők számára.

Azóta történt

Előzmények

Hirdetés