Most már nagyon kiaknázná az IGP-ket az Intel

A DirectX 12 már évek óta kínál erre lehetőséget, de egyelőre egy fejlesztő sem nyúlt ehhez.

Az Intel kiadta az egyik, idei GDC-re tervezett előadását, amely így annak ellenére is megtekinthető, hogy a rendezvény elmaradt. A vállalat újdonságról itt nem beszél, pusztán felidézik, hogy a DirectX 12-ben van olyan lehetőség, amellyel az IGP teljesítmény befogható egy dedikált GPU mellett. Erről anno a Microsoft is beszélt, tehát az iparág valószínűleg tud róla, csak senki sem használta eddig.

Mint ismeretes a DirectX 12 a multiadapter tekintetében három opciót kínál. Persze az API szintjén ez csak kettő, mert a WDDM-en keresztül biztosított szabványos AFR egy komplex funkció, amihez kell a gyártók direkt támogatása is az adott meghajtókon belül, de ez is működik, számos játék használja. Direkten alkalmazásból azonban két lehetőség van a több erőforrás kezelésére. Az egyik az LDA, azaz a linked display adapter, ami leginkább akkor hasznos, ha az egyes erőforrások képességei nem térnek el jelentősen egymástól. Ilyen formában a programon belül implementálhatók különböző feladatelosztási rendszerek, például az AFR is, vagy esetleg az SFR.

Az EMA, vagyis az explicit multiple adapter az érdekesebb, ugyanis ilyenkor jelentős különbség mellett is megoldható az erőforrások teljesítményének összeadása, de ezt a módot sokkal nehezebb kezelni, mivel olyan feladatokat kell találni a feldolgozás elosztása szempontjából, amelyek megfelelnek számos adatmozgással kapcsolatos korlátnak.

Hirdetés

[+]

Az Intel szerint az utóbbi rendszer nincs igazán kihasználva, miközben ezzel a processzorokban található IGP befogható lenne a dedikált GPU-k mellé. A vállalat emiatt felvázolt pár ötletet, hogy mire lehetne alkalmazni az IGP erejét.

Számos megoldás helyből kiesik, hiszen a PCI Express interfész teljesítménye és késleltetése túl magas, hogy reálisan működő eljárások szülessenek, de bizonyos compute feladatok jól elválaszthatók a grafikai futószalagoktól, így utóbbiakon dolgozhatna az erős GPU, míg előbbieknek megfelel az IGP. A lényeg annyi, hogy tipikusan olyan feladatot kell találni, ahol elég csak egy másolási művelet a PCI Express csatolón keresztül. Hogy mire lehetne ezt használni? Például útkereséshez, árnyékok számításához, a geometria deformáláshoz, vagy éppen bizonyos, leginkább részecskefizikai szimulációkhoz. Igazából amelyik compute futószalag végrehajtható aszinkron módban, és egyirányú másolási művelettel megoldható a több erőforrás kezelése, arra működhet ez a modell.


[+]

Az Intel készített egy DirectX 12 kiterjesztést is, ami arra szolgál, hogy a fejlesztő képes legyen az IGP órajelét maximalizálni, ha éppen ez lényeges szempont. Mint ismeretes az Intel processzormagjai megosztják a TDP fogyasztási keretüket az integrált grafikus vezérlővel, így ha utóbbi dolgozik, akkor előbbieknek vissza kell fogniuk magukat, ugyanakkor a vállalat a hardverét egy egyensúlyi helyzetre állítja be, ami nem lenne nagy baj, ha a rendszer képes lenne gyors és finomszemcsés órajelváltásra, de ezt egyelőre még nem sikerült elérni. Ilyen formában jobb ha a fejlesztő a programból utasítja az IGP-t arra, hogy mikor kell maximális órajelre kapcsolni. Ekkor persze a processzormagok számára minimalizált működés lesz beállítva, tehát az is lényeges, hogy mikor kell ezt az állapotot megszüntetni.

A vállalat a Microsoft nBody példaprogramján mutatta be a koncepciót, amely tipikusan az aszinkron compute képességet hivatott prezentálni. Ilyen formában tökéletes alapnak tekinthető a módosítás szempontjából, és az Intel úgy írta át a programkódot, hogy a szimuláció egy HD Graphics 530-as IGP-n fusson, miközben a leképezésért egy AMD Radeon RX 480 felelt. Ezzel a két fő feladat két különálló erőforráson lett végrehajtva.


[+]

Kérdés, hogy ha ez ilyen jó, akkor miért nem nyúltak már hozzá az IGP rejtett erőforrásaihoz a fejlesztők? Ennek az oka leginkább az, amit az Intel is kiemel a prezentáció végén. A PCI Express interfésznek megvannak a maga korlátjai, főleg a 3.0-s verziónak, amely x16-os módba is 16 GB/s-os sávszélességet biztosít. Az érintett demóprogram négymillió részecskével dolgozik, amelyek 64 MB-ot igényelnek, vagyis egy másodpercbe belül 256 adatmásolás fér bele. Ha a részecskék száma megduplázódik, akkor a lehetséges másolások száma a felére esik. Szintén számolni kell azzal, hogy számos konfiguráció x8-os PCI Express 3.0-s interfészt használ, és itt nem csak a kisebb gépekre kell gondolni, mert a mobil piacon tipikus gyártói trükknek számít feláldozni a sávok felét még az erősebb notebookokon is, csak azért, hogy a platformdizájn kisebb legyen, így szép vékony mobil gépet kaphat a vásárló.

Szóval a fentiek évek óta jó ötletnek számítanak, igen hasznos lenne kihasználni a processzorokban található IGP-t, de a PCI Express 3.0 az elvi lehetőségeket erősen korlátozni tudja, és ez a fő oka annak, amiért nem ugrott rá még az iparág erre az hosszú ideje elérhető lehetőségre. De talán az Intel előadása meghozza az áttörést, néha amúgy sem árt elismételni, hogy mire képesek az explicit API-k, hátha az egyes funkciókról már megfeledkeztek a fejlesztők.

  • Kapcsolódó cégek:
  • Intel

Azóta történt

Előzmények

Hirdetés