A Huawei AI technológiáját adó Cambricon saját AI gyorsítóval jelentkezik

Az MLU100 a mobil fókuszú architektúra felskálázott verziója, de ez csak a kezdet.

A Cambricon nem valószínű, hogy túl ismert cég az olvasóink körében, de ha megemlítjük, hogy a HiSilicon Kirin 970 SoC NPU-jának hardveres alapját biztosítják, akkor már el lehet helyezni őket. Az érintett cég számára az említett lapkában található, Cambricon-1A jelzésű IP volt az első fejlesztés, de ennél azért jóval nagyobb távlatokban gondolkodnak, többek között készül már a Cambricon-1M IP is, amit valószínűleg szintén a HiSilicon fog használni egy 7 nm-es node-on készülő rendszerchiphez.

A Cambricon azonban nem csak a licencelésre fókuszálnak, hanem saját lapkákat is tervezne a szerverpiacra, és az első ilyen fejlesztésük az MLU100 lesz, ami alapjaiban a Cambricon-1A IP kiterjesztése, és a gépi tanulás dedukció szakaszára koncentrál.

Az MLU100 a TSMC 16 nm-es node-ján készül, és x16-os PCI Express interfészbe helyezhető gyorsító formájában lehet bevetni. Két variánst kínál majd a cég, amelyek csak a DDR4 szabványú, 256 bit szélességű, 102,4 GB/s-os memória-sávszélességgel elérhető fedélzeti tárban különböznek: az egyiken 16, míg a másikon 32 GB memória lesz. Természetesen az ECC támogatása alapfunkció.

A lapka dizájnjáról nem sokat lehet tudni. Az architektúra az MLUv01 kódnevet viseli, a feldolgozók számítási kapacitása pedig az 1 GHz-es alapórajel mellett 64 TFLOPS 16 bites lebegőpontos, valamint 128 TOPS 8 bites fixpontos kalkulációknál. A Cambricon kínál egy nagy teljesítményű módot is, ami 1,3 GHz-re növeli az órajelet. Ilyen esetben az előbbi paraméterek rendre 83,2 TFLOPS-ra és 166,4 TOPS-ra nőnek, viszont a fogyasztás 80 wattról 110 wattra ugrik, vagyis a hardver végeredményben veszít a hatékonyságából. Alapvetően a megrendelő döntheti el, hogy a nyers teljesítmény vagy a hatásfok a fontosabb.

Az MLU100-as gyorsítókat már lehet rendelni. Kétféle hűtési kivitel van, egy passzív kialakítású a pengeszerverekre szabva, illetve egy aktív megoldás a hagyományosabb konfigurációkhoz.

A Cambricon a háttérben már tervezi az MLU200-at is, ami már a tréning szakaszra is komolyabb figyelmet szentel, de erről ezen kívül nagyon keveset tudni. Valószínűleg itt már valamelyik 7 nm-es node van megcélozva, így az alapot a Cambricon-1M IP szolgáltathatja. Utóbbi a partnereknek hamarosan elérhető lesz, ráadásul háromféle teljesítményszinten: 2, 4 és 8 TOPS, 5 TOPS/wattos hatékonysággal, ami nagyon kellemesnek mondható.

Azóta történt

Előzmények

Hirdetés