Majdnem egy éve írtunk arról, hogy összevonja gyorsítóarchitektúráit az AMD, amelyre akkor UDNA néven utaltak. Anno erről nagyon keveset lehetett tudni, de közeledve a váltáshoz egyre több információ szivárog ki.
Hirdetés
Maga az összevonás nem jelenti azt, hogy teljesen egységes lesz a dizájn a végfelhasználói piacra, illetve a szerverekbe szánt gyorsítók között. Ellenben ugyanaz lesz az architektúra, tehát az alapvető építőblokkok fognak megegyezni, viszont a gyorsítótárak és a regiszterek kapacitása, pár egyéb dolog mellett még eltérhet.
Információink szerint a fő változás a multiprocesszoron belül az egyszerűsítés lesz, amit elsődlegesen a teljesen újratervezett cache-rendszer indukál. A jelenlegi RDNA dizájnhoz viszonyítva annyi a lényeg, hogy a WGP jellegű kialakítás megváltozik, így egy multiprocesszorban nem két CU lesz, hanem maga a CU lesz az önálló multiprocesszor. Ilyen formában viszont a korábbi CU is megváltozik, vagyis 64 helyett 128 utas, azaz 4096 bites, multiprecíziós SIMD motor fog tartalmazni. Ezen túlmenően a legtöbb különálló gyorsítótár megszűnik a multiprocesszoron belül, helyette egy nagyobb, rendkívül gyorsan elérhető cache lesz majdnem mindenre. Utóbbit valószínűleg kisebb részekre lehet majd osztani, ha a munkafolyamat ezt kívánja.
Úgy tudjuk, hogy az AMD elsődlegesen az AI feladatok miatt alakítja át a dizájnt, illetve a cache-rendszert, utóbbi szempontból valamelyest NPU-sítják a GPU-t. Ez annyit tesz, hogy a multiprocesszor olyan gyorsítótárat kap, amely minden korábbinál méretesebb, illetve nagyobb sebességgel érhető el, vagyis jó alapot biztosít arra, hogy megpróbálják az AI munkafolyamatok adatigényét teljesen a lapkán belül kiszolgálni. Azt is megtudtuk, hogy ennek tervezésében szerepet játszottak a processzordizájnokon dolgozó mérnökök, illetve a Xilinx szakemberei is. Persze ez egy nagyobb cégnél normálisnak számít, elvégre az AMD GPU-s mérnökei más jellegű, gyakorlatilag GPU-khoz illeszkedő cache-rendszereket terveztek eddig, miközben annyira kezd eltolódni a munkafolyamat a compute és AI irányba, hogy ezek kevésbé teljesítenek jól. Emiatt célszerű a következő generációhoz olyan mérnökök segítségét figyelembe venni, akik a compute irányú vagy akár AI fókuszú megközelítések hardveres implementációjában is otthonosan mozognak. Ez nem az első ilyen kooperáció lenne cégen belül, többek között az Infinity Cache-t is CPU-s mérnökök tervezték meg az RDNA 2-höz, mivel a GPU-s mérnökök nem kifejezet szakértői a victim cache-nek, hiszen klasszikus értelemben nem számít grafikai szempontból optimális iránynak.
Összegezve az UDNA koncepció egy olyan váltásnak tűnik, ahol az RDNA és a CDNA jellemvonásait úgy egyesítik, hogy AI munkafolyamatokra kigyúrt dizájn szülessen. Ráadásul nagyon is AI fókuszú, amely a tipikus, grafikai szempontból optimális hardverimplementációkat elveti. Ez a szerverpiac igényeit figyelembe véve teljesen logikus, ott eleve erre megy a CDNA is, de az RDNA azért még erőteljesen grafikai fókuszúnak számít. Ugyanakkor az AMD meglátása az, hogy a jövőben a komplex grafikai effekteket nem számolni, hanem becsülni fogja a GPU, méghozzá neuronháló segítségével. Ez a koncepció már régóta lebeg a piac szeme előtt, elvégre ebben a modellben egy-két éven belül el lehet jutni olyan effektek megjelenítéséhez, amelyek a hagyományos, szimulált iránnyal csak 10-20 éves távon valósíthatók meg. Csak azért nem kezdett el erre menni az iparág, mert a mai VGA-k még mindig grafikai fókuszúak a felépítést tekintve, illetve a szükséges API-k sincsenek kész. Viszont a Microsoft komoly lépéseket tesz ebbe az irányba, vagyis a szoftveres háttér nagyon is készül, és könnyen lehet, hogy a következő generációtól kezdve a hadveres alapok is idomulnak hozzá.
