Lassan felnő a Huawei a kínai AI igényekhez

Így már az sem fog számítani, hogy az USA bizonyos gyorsítók szállítását megengedné.

Hónapok óta furcsa csata zajlik az USA és Kína között, ami azzal kezdődött, hogy a Trump-adminisztráció visszaengedte Kínába az NVIDIA H200-at. A zöldek szerint azonban a tényleges szállítások még nem történtek meg, és Kína a szóban forgó termékek importját sem engedélyezte, tehát az egész ügy annak ellenére nem halad, hogy szigorúan elméletben nincs akadálya a H200-zal való kereskedelemnek.

A bizonytalanság miatt az NVIDIA elengedte AI gyorsítóinak kínai eladásait, és inkább azokra a piacokra fókuszálnak, ahol garantálható eladásokat lehet produkálni. Felmerül azonban a kérdés, hogy Kína miért vált annyira magabiztossá, hogy már a nyugati hardverek importja iránt sem érdeklődnek? Nos, erre a Huawei érkező fejlesztései szállíthatják a választ, ugyanis a Reuters exkluzív riportja szerint kínai cég jelentős újításokkal készül idén, aminek hála a ByteDance és az Alibaba is az éppen készülő, Ascend 950PR gyorsítóban gondolkodik.

Az egyik legfontosabb tényező, hogy a Huawei Ascend 950, 960 és 970 sorozatú fejlesztései egy új, hibrid SIMD/SIMT feldolgozást vezetnek be, így ezek az újabb hardverek közelebb kerülnek egy olyan párhuzamosítási formához, ami jobban illeszkedik a CUDA meglévő végrehajtási modelljéhez. És itt fontos megérteni, hogy nem az a gond, hogy a kódok CUDA-ban vannak írva, onnan ugyanis akár egyszerű is lehet a portolás. Ez főleg igaz a magas szintű kódokat és sztenderd operációkat használó AI keretrendszerekre, mint a PyTorch vagy a TensorFlow. Ha a célzott hardver működése hasonló ahhoz, amit az eredeti kód megkövetel, akkor az nagyon kedvező alap a másik rendszerre való portolásra. Utóbbi például a korábbi Ascend hardverekkel meglehetősen nehézkes volt.

Ez a váltás sok kínai ügyfelet győzhet meg, ugyanis a friss gyorsítókhoz érkező CANN Next, vagyis a Huawei AI fejlesztőkörnyezetének új verziója közelebb került a CUDA végrehajtási modelljéhez, így a meglévő CUDA kódok jóval egyszerűbben portolhatók rá.

A fentiek mellett az első érkező új gyorsító, az Ascend 950PR is kifejezetten erősnek tűnik. Támogatja az FP32, HF32, FP16, BF16, FP8, MXFP8, HiF8 és MXFP4 adatformátumokat, 2 TB/s-os tempót kínál a gyorsítókat összekötő interfésze, 128 GB-nyi, HiBL 1.0 nevű, 1,6 TB/s-os HBM memóriát kap, miközben a lapka számítási teljesítménye 8 és 4 bites lebegőpontos formátummal rendre 1 és 2 PFLOPS lesz. Ennek érkezik az év végén egy erősebb, Ascend 950DT kiadása is, ami már 144 GB-nyi, HiZQ 2.0-s, 4 TB/s-os HBM memóriát kínál.

A Huawei igazán erős ajánlata az Atlas 950 SuperPoD lesz, amely legfeljebb 8192 darab Ascend 950DT gyorsítót tartalmazhat, így a 8 és 4 bites lebegőpontos formátummal kalkulált számítási teljesítmény rendre 8 és 16 EFLOPS lesz. Ezt a rendszert a partnerek az év végén érhetik majd el.

A kínai vállalat a következő év végére tervezi az Ascend 960-at, amely szinte minden paraméter szempontjából minimum megduplázza az Ascend 950DT képességeit, és erre jön a 2028-as esztendő végén az Ascend 970, amely az Ascend 960 számítási teljesítményét duplázza majd. A Huawei itt nagyon gyors fejlesztési lépcsőkben gondolkodik, ami érinti az Atlas rendszerek skálázását is. Többek között a másfél év múlva érkező Atlas 960 SuperPoD már nem 8192, hanem maximum 16 384 darab Ascend 960 gyorsítót tartalmazhat, vagyis a 8 és 4 bites lebegőpontos formátummal kalkulált számítási teljesítmény rendre 32 és 64 EFLOPS-ra nő.

Hirdetés

Azóta történt

Papíron mindenkit lehagyna az új technológiájával a Huawei

A LogicFolding nevű eljárás azonban csak az iparági irányokat követi, majd kiderül, hogy mekkora sikerrel.

Előzmények

Elégedetlen lenne az NVIDIA AI gyorsítóinak tempójával az OpenAI?

A Reuters exkluzív riportja szerint alternatívákat keres a cég a gépi tanulás következtetés szakaszára.

Végleg kitiltaná a Huawei-t az EU a hálózatkiépítésből

A ZTE is érintett, komoly tagállami viták kerekedhetnek abból, ha jogszabály születik.

A HBM elérhetősége korlátozza a kínai AI gyorsítókat

Sok Huawei Ascend 910C készülhetne elméletben, de nincs elég memória hozzájuk.

Még idén érkezik az új Huawei Ascend gyorsító

Az Ascend 920C kihasználhatja az USA szigorodó exportkorlátozásait.