Prezentálta a Rubin CPX-et az NVIDIA

A fejlesztés a nagy kontextusú AI munkafolyamatokhoz alkalmazkodik.

Az NVIDIA bejelentette a Rubin CPX nevű rendszerét, amely célirányosan a nagy kontextusú AI munkafolyamatokhoz, ezen belül is a gépi tanulás következtetés szakaszára lett optimalizálva. Ez a vállalat termékskáláján egy új kategóriát is jelent, amely a korábbinál nagyobb kontextusablakot tesz lehetővé, jobb sebességgel, illetve a videók teljes hosszában való feldolgozásával.

Hirdetés

Az új, négy-négy NVENC és NVDEC részegységgel felszerelt Rubin CPX GPU az NVIDIA szerint 30 PFLOPS-os teljesítményre képes FP4 adattípussal, miközben az 512 bites buszon kapcsolódó, 30 GHz-es effektív órajelen üzemelő GDDR7-es memória kapacitása 128 GB.

A vállalat a rendszert a Vera Rubin NVL144 CPX platformon belül kínálja majd, amelyben egy úgynevezett compute tray meglehetősen hibrid kialakítást használ, mivel a két darab Vera CPU mellé négy Rubin GPU kerül, míg a Rubin CPX GPU-ból nyolc darab lesz a rendszerben, szintén nyolc ConnectX-9 NIC mögé kötve. Egy teljes Vera Rubin NVL144 CPX rack számítási teljesítménye így elérheti a 8 EFLOPS-ot FP4 adattípussal, miközben a memória összesített tempója 1,7 PB/s lehet.

[+]

A rendszerből készül egy speciálisabb dual rack konfiguráció is, amely az egyik rackben a klasszikus VR NVL144 compute trayt alkalmazza, a másikban pedig a VR CPX verzió sorakozik fel. Utóbbi annyiban különbözik az előző bekezdésben taglalt dizájntól, hogy hiányzik a négy darab, hagyományos Rubin GPU belőle. Ez nyilván koncepció, ezeket a másik rack tartalmazza. Ennek a dual rack kialakításnak, a Vera Rubin NVL144 CPX platformhoz viszonyítva az az előnye, hogy 100 helyett 150 TB kapacitású, összesített memória áll rendelkezésre.

Az NVIDIA Rubin CPX rendszerek a következő év során lesznek elérhetők.

Előzmények