Új alapokra helyezi GPU-it az Imagination

Az IMG A-Series jelentős, bizonyos szempontból megdöbbentő változásokat vezet be a Furian architektúrához viszonyítva.

Az Imagination az utóbbi években annyira halmozta a sikereket az ultramobil GPU-k piacán, a legutóbbi, Furian kódnevű architektúrájuk ugyan nem számított rossz megoldásnak, de túl sokan nem is licencelték, ami egyértelműen probléma a cég számára. Ebben nyilván nagy szerepet játszik az, hogy az ARM egyre erősebben próbálja csomagban eladni a processzormagjait, illetve a GPU IP-it, tehát túl könnyű helyzete azért nincs a cégnek, a Qualcomm pedig a saját Adreno dizájnját fejleszti, így nem is gondolkodnak külsőleg licencelt megoldásban. Ráadásul a céggel az Apple is szakítani akart, de azóta gyanúsan nagy a csend a két érintett között, így elképzelhető, hogy titokban azért sikerült megegyezniük.

Kérdés, hogy ilyen ellenszélben mire lehet menni. Sok út persze nincs az Imagination előtt, menni kell előre, és ennek tudatában a cég bejelentette az IMG A-Series jelölésű, Albiorix kódnevű architektúrát, amely új alapokkal megy neki a konkurenseknek.

Hirdetés

Az IMG A-Series egy nagy váltás, teljesen új utasítás-architektúráról van szó, ami fontos dolog lehet a jövőre vonatkozó skálázás szempontjából, de ennél is érdekesebb, hogy a kifejezetten sokat változott a dizájn is. Itt meglepő döntést hozott a cég, ugyanis az látható volt, ahogy növelték a multiprocesszoron belüli a feldolgozás szélességét, a Rogue ebből a szempontból 16 utas volt, míg a Furian 32, de utóbbinak volt egy olyan verziója is, amely 40 utas egységet kínált, aminek nem igazán lett sikere, de kétségtelenül elérhető volt a fejlesztés.

Az IMG A-Series egy derekas váltással 128 utas feldolgozóra ugrik. Ez egy bátor döntés, ha egy szóval kellene jellemezni, elvégre mindez azt jelenti, olyan szálcsoportokkal kell majd etetni a multiprocesszort, amelyek 128 elemet dolgoznak fel egyszerre. Szokás szerint minden ilyen dizájnbeli döntésnek van valami előnye és hátránya. Az erősen szálszintű párhuzamosságra operáló multiprocesszorok esetében a legnagyobb hátrány mindig az, hogy van-e annyi feldolgozandó munkaelem, amelyek ráküldhetők a rendkívül széles egységre, méghozzá úgy, hogy kellő mennyiségű szál van azonos szemcsézettségű csoportokba rendezve. Ez ahhoz szükséges, hogy optimálisan át lehessen lapolni a memória-elérés késleltetését, és ehhez eléggé átgondolt ütemezést érdemes alkalmazni, hiszen egyszerűvé kell tenni az optimalizálást a fejlesztők számára.

Az Imagination trükkje a PDS (programmable data sequencer), amely biztosítja az erőforrások menedzselését, így lefoglalja a szükséges regiszterterületet, illetve a helyi adatmegosztásba betölti azokat az adatokat, amelyeket valószínűleg igényelni fog a futtatás előtt álló folyamat. Ezek nagyon fontos tényezők, ugyanis az ilyen széles multiprocesszorok tipikus problémája az erőforrás-allokáció során jön elő, amikor nem tudnak annyi azonos szemcsézettségű csoportot betölteni, hogy átlapolható legyen a memóriaelérés, de a PDS megpróbálja ezt a hátrányt minimalizálni.


[+]

A fenti hátrány mellett azért igen jelentős előnyt ad az IMG A-Series furcsa kialakítása, nem véletlen ment erre az Imagination, ugyanis ilyen felépítéssel rendkívül sok ALU építhető be egységnyi lapkaterületbe. Ráadásul erre a cég tudatosan rá is játszott, ugyanis a multiprocesszor 128 utas feldolgozója csupán az egyszerűbb műveleteket támogatja, például a 16 és 32 bites lebegőpontos FMA, valamint a 8 bites integer operációkat, a komplex feladatok számára pedig be van építve egy 32 utas feldolgozó. Ebben van ráció, ugyanis bizonyos operációk eléggé ritkák a mai programkódokban, vagyis elég egy másodlagos futószalaggal kiszolgálni őket, amivel még kedvezőbb lehet a rendelkezésre álló tranzisztorbüdzsé felhasználása.

[+]

A textúrázásért felelős rendszer is megváltozott, egyrészt lényegesen jobb lett az anizotropikus szűrés minősége, másrészt a minták szűrése mostantól nem a textúrázó gyorsítótár után, hanem előtt történik meg. Ennek azért van haszna, mert így a szűrt minták kerülnek tárolásra, vagyis azok újrafelhasználása nem visz el további számítási kapacitást. A blending is átalakult, illetve konkrétan megjelent a blending egység, így ezt már hardveresen oldja meg az új architektúra.

Érdekesség még a Hyperlane technológia, amely lehetővé teszi az egyes feladatok teljes izolálását a GPU-n belül, ami biztonsági, illetve teljesítményre vonatkozó tényező szempontjából is lényeges érték, hiszen így teljesen függetlenített feladatfolyamok futhatnak ugyanazon a hardveren úgy, hogy nem zavarják egymást. Ez leginkább a beágyazott rendszerek piacán lehet hasznos, hiszen ott igen reális igény lehet az egyes, konkurens munkafolyamatok teljes izolálása, az pedig csak hab a tortán, hogy ez közel lineáris teljesítményvesztés árán történhet meg. Az Imagination szerint a maximum nyolc Hyperlane-t lehet támogatni, vagyis ennyi független munkafolyamatok futhat egymás mellett egy GPU IP-n.


[+]

Az IMG A-Series dizájnra számos konfiguráció épül majd. Az AXT sorozat jelenti a csúcsot, itt minden részegységből a legjobb lesz beépítve. A számozás tekintetében az Imagination próbál nagyon egyszerű modellt alkalmazni. Az AXT 64-2048 például azt jelenti, hogy kompromisszummentes rendszerről van szó, amely órajelenként 64 texel és 2048 darab FP32 operációt biztosít. A számok mindenhol ezekre a teljesítményadatokra fognak utalni, de a jelölés már nem, ugyanis az AXM és az AXE rendre a középkategóriát, illetve a belépőszintet jelenti, vagyis nem feltétlenül kapják meg az összes funkciót.

Azóta történt

Előzmények

Hirdetés