Leleplezte a Ponte Vecchio teljesítményét az Intel

Egyelőre persze nagyrészt csak számokban, de ezek is elég fontos adatoknak számítanak.

Az Intel jó ideje fejleszti már a Ponte Vecchio kódnevű dizájnt, amelynek felépítése az év elején már ki lett fejtve, illetve korábbról a gyorsítótárak kapacitása is ismert adat volt, és a vállalat most a Hot Chips 34 rendezvényen árult el további részleteket a rendszerről, amelynek keretében konkrétan ismerni lehet a várható számítási teljesítményt.

A kékek szerint a teljes kiépítésű Ponte Vecchio 52 TFLOPS-ot biztosít szimpla és dupla pontosság mellett, az XMX operációk esetében pedig 419 TFLOPS-ra lehet számítani TF32, 839 TFLOPS-ra BF16 és FP16, illetve 1678 TOPS-ra Int8 adattípussal.

[+]

Az érkező gyorsító abból a szempontból nagyon különlegesnek számít, hogy SIMT és SIMD módban egyaránt képes működni. A GPGPU-knál tipikusan a SIMT modellt szokás alkalmazni, mert olyan elképesztő mennyiségű adat feldolgozása történik, amit iszonyatosan nehéz manuálisan optimalizálni a feldolgozáshoz ideális vektorokat. Persze ilyen ötlettel már előállt az Intel régebben – a megboldogult Larrabee kapcsán , de most annyival jobb a helyzet, hogy ha a SIMD mód nem is feltétlenül lesz mindig használható, a Ponte Vecchio esetében ott van menekülőútként a SIMT opció. Ettől függetlenül a vállalat erőteljesen hangsúlyozza, hogy a CPU-ra írt kódokat SIMD módra egyszerűbb lesz átültetni, ami önmagában igaz, a kérdés az, hogy skálázódni fognak-e, vagy inkább érdemes átírni ezeket SIMT modellre.

Az Intel kezdésként egy DPC++ Compatibility Tool nevű eszközkészletet is mellékelni fog, aminek a legfontosabb eleme a SYCLomatic. Ez a CUDA kódokat automatikusan SYCL kóddá alakítja, és itt 90-95%-ban jó eredményre lehet számítani, a kód egyes részeinél lehetnek gondok, amelyek optimalizálását manuálisan kell befejezni. Itt annyiban segít a gyártó, hogy automatikusan generált fájl információkkal látja el a fejlesztőket a további teendőkről, ami hozzájárul ahhoz, hogy a lehető legtöbb teljesítményt hozzák ki a portból. Ez a koncepció rendkívül hasonlít az AMD-féle HIPify eszközre, de annyival kedvezőbb a helyzet, hogy azzal ellentétben nem HIP kódot ad, hanem iparági sztenderdnek számító SYCL-t, ami aztán elég sok hardverre átvihető még a HIP-pel ellentétben.

Az Intel fő fegyvere egyébként a szoftveres fronton az iparági sztenderdekhez való ragaszkodás lesz. A CUDA kódokról való portolás fontosságát nyilván nem kell megmagyarázni, de az AMD-vel ellentétben nem egy saját, úgymond nyíltabb platformot hoztak létre, hanem ahol lehet, ott tényleg a szabványokra próbálnak építeni, és ez önmagában imponáló lehet majd a piac számára.

  • Kapcsolódó cégek:
  • Intel

Azóta történt

Előzmények

Hirdetés