Hirdetés

Most már nagyon kiaknázná az IGP-ket az Intel

A DirectX 12 már évek óta kínál erre lehetőséget, de egyelőre egy fejlesztő sem nyúlt ehhez.

Írta: Abu85
Forrás: PROHARDVER!
2020-03-25 16:45

Az Intel kiadta az egyik, idei GDC-re tervezett előadását, amely így annak ellenére is megtekinthető, hogy a rendezvény elmaradt. A vállalat újdonságról itt nem beszél, pusztán felidézik, hogy a DirectX 12-ben van olyan lehetőség, amellyel az IGP teljesítmény befogható egy dedikált GPU mellett. Erről anno a Microsoft is beszélt, tehát az iparág valószínűleg tud róla, csak senki sem használta eddig.

Mint ismeretes a DirectX 12 a multiadapter tekintetében három opciót kínál. Persze az API szintjén ez csak kettő, mert a WDDM-en keresztül biztosított szabványos AFR egy komplex funkció, amihez kell a gyártók direkt támogatása is az adott meghajtókon belül, de ez is működik, számos játék használja. Direkten alkalmazásból azonban két lehetőség van a több erőforrás kezelésére. Az egyik az LDA, azaz a linked display adapter, ami leginkább akkor hasznos, ha az egyes erőforrások képességei nem térnek el jelentősen egymástól. Ilyen formában a programon belül implementálhatók különböző feladatelosztási rendszerek, például az AFR is, vagy esetleg az SFR.

Az EMA, vagyis az explicit multiple adapter az érdekesebb, ugyanis ilyenkor jelentős különbség mellett is megoldható az erőforrások teljesítményének összeadása, de ezt a módot sokkal nehezebb kezelni, mivel olyan feladatokat kell találni a feldolgozás elosztása szempontjából, amelyek megfelelnek számos adatmozgással kapcsolatos korlátnak.

Hirdetés

[+]

Az Intel szerint az utóbbi rendszer nincs igazán kihasználva, miközben ezzel a processzorokban található IGP befogható lenne a dedikált GPU-k mellé. A vállalat emiatt felvázolt pár ötletet, hogy mire lehetne alkalmazni az IGP erejét.

Számos megoldás helyből kiesik, hiszen a PCI Express interfész teljesítménye és késleltetése túl magas, hogy reálisan működő eljárások szülessenek, de bizonyos compute feladatok jól elválaszthatók a grafikai futószalagoktól, így utóbbiakon dolgozhatna az erős GPU, míg előbbieknek megfelel az IGP. A lényeg annyi, hogy tipikusan olyan feladatot kell találni, ahol elég csak egy másolási művelet a PCI Express csatolón keresztül. Hogy mire lehetne ezt használni? Például útkereséshez, árnyékok számításához, a geometria deformáláshoz, vagy éppen bizonyos, leginkább részecskefizikai szimulációkhoz. Igazából amelyik compute futószalag végrehajtható aszinkron módban, és egyirányú másolási művelettel megoldható a több erőforrás kezelése, arra működhet ez a modell.

[+]

Az Intel készített egy DirectX 12 kiterjesztést is, ami arra szolgál, hogy a fejlesztő képes legyen az IGP órajelét maximalizálni, ha éppen ez lényeges szempont. Mint ismeretes az Intel processzormagjai megosztják a TDP fogyasztási keretüket az integrált grafikus vezérlővel, így ha utóbbi dolgozik, akkor előbbieknek vissza kell fogniuk magukat, ugyanakkor a vállalat a hardverét egy egyensúlyi helyzetre állítja be, ami nem lenne nagy baj, ha a rendszer képes lenne gyors és finomszemcsés órajelváltásra, de ezt egyelőre még nem sikerült elérni. Ilyen formában jobb ha a fejlesztő a programból utasítja az IGP-t arra, hogy mikor kell maximális órajelre kapcsolni. Ekkor persze a processzormagok számára minimalizált működés lesz beállítva, tehát az is lényeges, hogy mikor kell ezt az állapotot megszüntetni.

A vállalat a Microsoft nBody példaprogramján mutatta be a koncepciót, amely tipikusan az aszinkron compute képességet hivatott prezentálni. Ilyen formában tökéletes alapnak tekinthető a módosítás szempontjából, és az Intel úgy írta át a programkódot, hogy a szimuláció egy HD Graphics 530-as IGP-n fusson, miközben a leképezésért egy AMD Radeon RX 480 felelt. Ezzel a két fő feladat két különálló erőforráson lett végrehajtva.

[+]

Kérdés, hogy ha ez ilyen jó, akkor miért nem nyúltak már hozzá az IGP rejtett erőforrásaihoz a fejlesztők? Ennek az oka leginkább az, amit az Intel is kiemel a prezentáció végén. A PCI Express interfésznek megvannak a maga korlátjai, főleg a 3.0-s verziónak, amely x16-os módba is 16 GB/s-os sávszélességet biztosít. Az érintett demóprogram négymillió részecskével dolgozik, amelyek 64 MB-ot igényelnek, vagyis egy másodpercbe belül 256 adatmásolás fér bele. Ha a részecskék száma megduplázódik, akkor a lehetséges másolások száma a felére esik. Szintén számolni kell azzal, hogy számos konfiguráció x8-os PCI Express 3.0-s interfészt használ, és itt nem csak a kisebb gépekre kell gondolni, mert a mobil piacon tipikus gyártói trükknek számít feláldozni a sávok felét még az erősebb notebookokon is, csak azért, hogy a platformdizájn kisebb legyen, így szép vékony mobil gépet kaphat a vásárló.

Szóval a fentiek évek óta jó ötletnek számítanak, igen hasznos lenne kihasználni a processzorokban található IGP-t, de a PCI Express 3.0 az elvi lehetőségeket erősen korlátozni tudja, és ez a fő oka annak, amiért nem ugrott rá még az iparág erre az hosszú ideje elérhető lehetőségre. De talán az Intel előadása meghozza az áttörést, néha amúgy sem árt elismételni, hogy mire képesek az explicit API-k, hátha az egyes funkciókról már megfeledkeztek a fejlesztők.

Hozzászólások (59)

Kapcsolódó cégek:
Intel

Azóta történt

Jön az OpenCL és az OpenGL a DirectX 12 API-ra

A Collabora a Microsofttal együttműködve tenné futtathatóvá az egyes, OpenGL és OpenCL programokat, a megfelelő implementációval nem rendelkező rendszereken.
Még egy ballasztot ledobott magáról az Intel

A MaxLinear 150 millió dollárt fizet a cégnek az otthoni piacra fókuszáló, vezeték nélküli hálózati eszközöket kiszolgáló üzletág egy részéért.
2,5 gigabites módban nem mindig lesz jó az Intel 2,5 gigabites Ethernet adaptere

A Foxville kódnevű fejlesztésnél csomagvesztésre figyelt fel a cég. A gondot hardveresen fogják javítani, de csak az év második felében.
Visszavetheti az USB4 implementálását a Thunderspy

Még ha a gyártók nem is akarnak tudomást venni róla, nagyon is látják, hogy milyen súlyos rést sikerült ütni a pajzson.

Előzmények

A Rocket Lake-S-ben hozza a PCI Express 4.0-t az Intel

A platform elvileg az év legvégén érkezne, de a sokat csúszó Comet Lake-S miatt nem tudni, hogy a régi útitervek élnek-e még.
A DirectX 12 Ultimate összeházasítja a konzolt a PC-vel

A Microsoft új API-ja egy funkciószint alá vonja a már tesztelhető újdonságokat.
Mindkét explicit API-t támogatja a Red Dead Redemption 2?

A nem végleges verzióban választható a DirectX 12 és a Vulkan is, információink szerint utóbbi számított az elsődleges célpontnak.
A DirectX 12-n is megoldja a fejlesztők legnagyobb gondját az AMD

A Vulkan Memory Allocator mintájára itt a DirectX 12 Memory Allocator, amely leegyszerűsíti a memóriamenedzsmentet.

Hirdetés

Most már nagyon kiaknázná az IGP-ket az Intel

Hirdetés

Azóta történt

Jön az OpenCL és az OpenGL a DirectX 12 API-ra

Még egy ballasztot ledobott magáról az Intel

2,5 gigabites módban nem mindig lesz jó az Intel 2,5 gigabites Ethernet adaptere

Visszavetheti az USB4 implementálását a Thunderspy

Előzmények

A Rocket Lake-S-ben hozza a PCI Express 4.0-t az Intel

A DirectX 12 Ultimate összeházasítja a konzolt a PC-vel

Mindkét explicit API-t támogatja a Red Dead Redemption 2?

A DirectX 12-n is megoldja a fejlesztők legnagyobb gondját az AMD

Egyedivé varázsolja a HBM4-et a TSMC

Tisztázta a Valve a Steam Machine HDMI-paráját

(x) MSI Modern 15 notebook – munkára tervezve

Mi a labubu? – és pár fontos dolog, amire idén rágugliztál

Dollármilliárdokért vesz egy kritikus AI-összetevőt a Marvell

Kiadta Sam Altman a parancsot: bajban a ChatGPT!

H﻿i﻿rd﻿eté﻿s﻿

Most már nagyon kiaknázná az IGP-ket az Intel

H﻿ir﻿d﻿e﻿tés

Azóta történt

Előzmények

Hirdetés

Hirdetés