Hirdetés

Összevonja gyorsítóarchitektúráit az AMD

Az RDNA és a CDNA után jön az UDNA! De miért?

A Tom's Hardware érdekes riportot közölt az AMD, gyorsítóarchitektúrákra vonatkozó terveiről, és az információkat Jack Huynh szolgáltatta, aki a szóban forgó üzletág vezetője.

Hirdetés

Az egyik legfontosabb adat a jövőre vonatkozóan, hogy idővel egy architektúrává olvad össze az AMD megközelítése, vagyis nem lesz külön VGA- és HPC-piacra tervezett dizájn, ahogy most az előbbire az RDNA, utóbbra pedig a CDNA, helyettük az egységes UDNA jön. A kérdés itt az, hogy miért, hiszen más jellegű munkát igényel a grafikai és az AI feladat, nem véletlen, hogy az NVIDIA is két eltérő dizájnt használ ezekre, hiszen készül egy HPC-re szabott architektúra, majd abból egy átszabott verzió a többi piacra.

Ha megnézzük, akkor az AMD ugyan szétválasztotta a GCN után ezek tervezését, de olyan radikálisan azért manapság már nem különböznek a multiprocesszorok, amennyiben az RDNA 3 és a CDNA 3 összehasonlításában szemléljük a változásokat. Mint ismeretes az RDNA 3 legalapvetőbb feldolgozótömbje a saját skalár egységgel dolgozó, 64 utas, azaz 2048 bites, multiprecíziós SIMD motor. Ezzel szemben a CNDA 3 szintén saját skalár egységéhez 32 utas, azaz 1024 bites, multiprecíziós SIMD motor tartozik. Más szempontok szerint, pusztán funkcionálisan is kezdenek hasonlítani egymásra képességek, mindkettőben van mátrixfeldolgozó, ráadásul hasonló a memóriamodell. Ergo a GCN végétől számított szétválasztás óta, amikor azért jóval nagyobb volt az RNDA és a CDNA között a különbség, ez a két eltérű út, három generáción belül eljutott oda, hogy lényegében csak a vektor- és mátrixmotorok szélessége különbözik, a támogatott adattípusokkal egyetemben. Még egy-két generáció és ezek az eltérések is megszűnnek, vagyis az UDNA, az RDNA és a CDNA aktuális fejlődési irányát tekintve egy logikus evolúciós lépcső.

Felmerülhet a kérdés, hogy akkor mi értelme volt a szétválasztásnak? Erre az a válasz, hogy pár éve, konkrétan az első generációs RDNA és CDNA dizájnnál jelentős volt a különbség. Pusztán a két dizájn által megcélzott piaci irányok fejlődnek úgy, hogy a jövőben nagyon hasonló hardvert igényelnek majd. Valószínűleg idővel az NVIDIA is összevonja az egy generáción belüli eltérő dizájnjait, hiszen ott is egyre kisebbek az eltérések, egy ponton túl annyira jelentéktelenné válnak, hogy nincs értelme két fejlődési utat fenntartani, ha azok végeredményben nagyon hasonló képességű hardvereket eredményeznek. Persze ettől még a normál és professzionális területek jellegzetes különbségei megmaradhatnak, többek között dupla pontosságnak inkább csak az utóbbi szegmensben van szerepe, de erre még egységes alapok mellett is nagyon egyszerű kicsit eltérő multiprocesszort tervezni, ehhez nem szükséges teljesen különálló architekturális. Hasonló lehet a helyzet az AI miatt folyamatosan befutó új adattípusokkal is.

Jack Huynh azt nem árulta el, hogy az egységesítés mikor mehet végbe. Az biztos, hogy nem a következő körben, hiszen ha titkolják is, azért ismert már, hogy érkezik még legalább egy új RDNA és CDNA iteráció. Valószínű az is, hogy a Xilinx felvásárlása átírta a távlati terveket, ugyanis az AMD olyan technológiákhoz jutott, amiket hasznosítani lehet GPU-ban. Többek között ilyen például Block FP16, ami a hagyományos FP16-os adattípushoz viszonyítva, nyolc elemre levetítve, 128 helyett csak 72 bitnyi információt dolgoz fel, mivel a 8 bites exponens a nyolc elem szintjén közös, vagyis azt elég egyszer tárolni, az eltérő mantisszát pedig lehet nyolcszor. Ezzel nagyjából hozható a 16 bites lebegőpontos feldolgozáshoz hasonló pontosság, miközben a feldolgozás sebessége a 8 bites lebegőpontos operációk szintjéhez lesz közel. És ez igen könnyen implementálható GPU-ba is, ráadásul eleve célként van kitűzve az egységes szoftveres ökoszisztéma a Xilinx hagyományos hardverei, illetve az AMD gyorsítók között.

  • Kapcsolódó cégek:
  • AMD

Előzmények

Hirdetés