A már megjelent gyorsítóin kapcsolt ki néhány részegységet a Tenstorrent

A Blackhole p150a és p150b megoldások 20 darab Tensix magtól búcsúztak, és nem tudni, hogy miért.

Még az előző év tavaszán írtunk a Tenstorrent Blackhole sorozatú gyorsítóiról, amelyeket a cég AI munkafolyamatokhoz tervezett. A fejlesztések meg is jelentek, de nemrég történt velük egy nagyon érdekes dolog. Lényegében a kiadásuk után változtatta meg a specifikációt a gyártó, ami cseppet sem nevezhető szokványosnak.

A konkrétumokat tekintve a Blackhole p150a és p150b modellekről van szó. Ezek között az a különbség, hogy előbbi aktív, míg utóbbi pengeszerverek légáramlatához tervezett passzív hűtést használ. Technikailag tehát ugyanarról a hardverről van szó, csak a kialakítások az eltérő környezetekhez idomul.

Eredetileg a Blackhole p150a és p150b is egységesen 16 darab nagy RISC-V, illetve 140 darab Tensix magot tartalmazott, a lapkába épített SRAM kapacitása pedig 210 MB volt. A Tenstorrent most ezen változtatott, így innentől kezdve a szóban forgó hardvereket 120 darab Tensix maggal, valamint 180 MB-os SRAM-mal szállítják. Utóbbi paraméterezés megegyezik a Blackhole p100a dizájnnal, csak utóbbiról hiányzik a négy darab 800G-s QSFP-DD port.

Minden más paraméter változatlan, így marad a x16-os PCI Express 5.0, a 32 GB-nyi GDDR6 memória, továbbá az órajelek sem módosultak. A fenti változtatás azonban így is azzal jár, hogy a BLOCKFP8 formátummal a maximális elméleti számítási kapacitás 774-ről 664 TFLOPS-ra csökkent.

A már eladott hardverek esetében a v19.5.0-s firmware biztosítja a részegységek kikapcsolását, és ez nagyjából 1-2%-os lassulással járhat. Nem is ez a gond, mivel ilyen csekély tempóváltozás bőven hibahatáron belül van. A problémát az adja, hogy a Tensix magok számának módosításával az egyes specifikusan megírt alkalmazásokat is módosítani kell az optimális futási teljesítmény eléréshez.

A Tenstorrent nem magyarázta meg, hogy mi tette szükségessé a specifikáció utólagos finomhangolását.

Előzmények