Hirdetés

Részletezte neuronháló gyorsítójának képességeit az ARM

Az ML IP a Trillium projekt részeként érkezik a piacra, és a partnerek már idén el is érhetik.

Még február közepén mutatkoztak be az ARM gépi tanulásra szánt IP-i, amelyek a Trillium projekt részeként jönnek. A vállalat akkor túlságosan részletesen nem ment bele az érkező fejlesztések felépítésébe, de most ezt bepótolták, igaz egyelőre csak az úgynevezett ML (Machine Learning) processzor erejéig.

Az ARM alapvetően azért döntött a célhardver mellett, mert igazából se a CPU, se a GPU nem elég hatékony a feladatra. Bár a saját architektúráikat lassacskán léptetik ebbe az irányba, egy specifikusan megtervezett neuronháló gyorsító, sokkal kedvezőbb alapot kínál. Az ML IP lényegében ezt hivatott megvalósítani, és alapvetően egy olyan fejlesztésről van szó, ami hatékony konvolúciót, illetve adatmozgatást, valamint megfelelő programozhatóságot biztosít.


[+]

Az ML IP maximum 16 darab úgynevezett compute motorból állhat, amelyek egyenként egy 128 bites MAC egységen keresztül képesek feldolgozni a számításokat. Az ARM 8 bites kvantált fixpontos adattípusokat támogat, ami a neuronháló gyorsítók esetében tipikusnak számít. Mindegyik compute motornak a része egy PLE (programmable layer engine), ami az architektúra flexibilitását biztosítja, ugyanis a gépi tanulás viszonylag gyorsan fejlődik, és erre az ARM ezzel az egységgel aktívan tud reagálni, például új operációkat beépíteni. Emellett a PLE közvetlenül megkapja a MAC feldolgozó eredményeit, amelyeken dolgozhat tovább, mielőtt visszaírja azokat a compute motorokhoz kapcsolódó SRAM-ba. Utóbbi egyébként szintén egy nagyon fontos tényező, mivel a gépi tanulásra jellemző, hogy az adatok mozgatása több energiába kerül, mint maga a számítás, és a skálázható SRAM segítségével, az adott feladathoz szabható, hogy melyik compute motor mennyi erőforrást kapjon, így biztosítva azt, hogy az adatmozgások minimalizálva legyenek, és lehetőleg kevésszer kelljen a lapkán kívüli memóriához nyúlni. Ezzel nem csak sebességet lehet nyerni, hanem a fogyasztás is csökkenthető.


[+]

Az ARM az ML processzor esetében 7 nm-es node-on 3 TOP/W-nál is nagyobb hatékonyságot céloz, a teljesítmény szempontjából pedig a 4,6 TOP/s a dizájn tervezett elméleti határa.


[+]

A szoftveres háttér szempontjából a rendszer támogatja az Android NNAPI-ját, illetve az ARM saját heterogén NN platformját. Utóbbival az Android mellett a beágyazott Linux operációs rendszerek is célozhatók.


[+]

Az ARM az ML IP-jét még idén elérhetővé teszi az érdeklődők számára. Azt nem tudni, hogy el lesz-e nevezve maga a fejlesztés, valószínűleg nem, ezt az örömöt a cég meghagyja a partnereknek.

  • Kapcsolódó cégek:
  • ARM

Azóta történt

Előzmények

Hirdetés