Mindenre jó csodaprocesszort fejleszt a Tachyum

A Prodigy Universal Processor mellett nagy ígéretek vannak, így sok kérdést vet fel.

Az idei Hot Chips rendezvényen a Tachyum bejelentette a Prodigy Universal Processort, amelyet egy mindenre jó megoldásként aposztrofáltak, így a CPU-k mellett elvileg jobb a GPU-knál, illetve a Google TPU-nál.

A fejlesztés 7 nm-es node-on készül, 290 mm²-es kiterjedése lesz, és ebbe 64 processzormag fért bele, amelyek 4 GHz-en fognak üzemelni, de kerül még a lapkába nyolc darab DDR4/DDR5-ös, valamint két, opcionálisan használható HBM3-as memóriacsatorna, amelyeket 32 MB-os megosztott L3 gyorsítótár, 72 darab PCI Express 5.0-s sáv, illetve két 400GE vezérlő egészít majd ki. A fogyasztást 180 wattra becsülik a tervezők, és az egész 66 x 66 x 1 mm-es FCBGA tokozásban érkezik.

A Tachyum szerint egy mag 2 TFLOPS-os teljesítményre képes, vagyis 64 maggal 128 TFLOPS-ról beszélhetünk. Ugyanakkor ez az adat a mátrix műveletekre vonatkozik, pusztán a szimpla pontosság melletti elméleti lebegőpontos teljesítmény egy mag tekintetében 256 GFLOPS, ami 64 magra levetítve 16 TFLOPS-ot jelent. Ennél érdekesebb, hogy maga a processzormag technikai értelemben egy in order elvű megoldás, ami az utasításokat szigorúan a beérkezésük sorrendjében dolgozná fel, de bevetésre kerül egyrajta dinamikus kódoptimalizáció szoftveres szinten, ami lényegében egy alternatív megoldás arra, hogy ne kelljen az utasítások sorrendtől független végrehajtásáért felelős out of order logikát hardveresen implementálni.


[+]

Az előadáson a fentiek miatt nem véletlenül merült fel az a kérdés, hogy mennyire hasonlít ez az Intel Itaniumra. Tulajdonképpen eléggé, de a Tachyum szerint az Intel rosszul állt hozzá anno a problémához, ugyanis kiadtak egy hardvert annak reményében, hogy hátha megírják hozzá a fordítót. Ezzel szemben a Prodigy Universal Processort fordítva fejlesztették, így a fordító köré építettek egy hardvert.

Az ígéretek abból a szempontból erősek, hogy a Tachyum szerint a fejlesztésük a SPECint/fp tesztekben, egy szálon gyorsabb a 2,5 GHz-es Xeonoknál, holott az x86 emulációjának teljesítményvesztesége a saját bevallásuk szerint is 40%. A meglévő x86-os binárisok futtatására egyébként a QEMU-t használják.

A hardver egyébként még messze van, de annyit már lehet látni, hogy a Tachyum gyakorlatilag két olyan koncepcióból indult ki, amelyekre az Intel már épített egy-egy termékcsaládot. Ergo ezek papíron tényleg kecsegtetők, de végül mind tudjuk, hogy az Itanium és a Larrabee, illetve utóbbi Xeon Phi nevű utódjai hol végezték. És egyiknél sem arról volt szó, hogy az Intelnek nem voltak meg az anyagi forrásai, nem voltak szakembereik, vagy éppen nem tudtak kellő szoftveres hátteret biztosítani. Egyszerűen nem minden, papíron jónak tűnő ötlet ültethető át a gyakorlatba. Ettől függetlenül a Tachyum bizakodó, ráadásul vannak támogatóik is az IPM Group lévén, amely a szlovák kormány részvétele mellett ajánlott fel 25 millió dollárt a projektre.

Azóta történt

Előzmények

Hirdetés