Hirdetés

Vélemény: a gépi tanulás indokolta az Intel és az Altera házasságát?

Még 2014-ben volt róla szó, hogy az Intel FPGA-val turbózzak fel az új Xeonokat, és idén a vállalat fel is vásárolta az FPGA-kat fejlesztő Alterát, ráadásul nem is olcsón. A felvásárlás mögött sok koncepció húzódhat, főleg akkor, amikor az Intel általános gyorsítókkal is kitömné a Xeonokat. Ez részben a növekvő igények lefedése, részben pedig az AVX-szel kapcsolatos koncepció problémáira való reagálás.

Hirdetés

Az Intel korábban egyértelműen úgy képzelte el az iparág jövőjét, hogy a processzormagok széles, akár 1024 bites SIMD tömböt kapnak, amelyből eddig 256 bit meg is valósult az AVX2 által. Később érkezik az AVX-512F, amely már 512 bites SIMD tömböt tesz lehetővé, és nem kizárt, hogy egyszer elérjük az 1024 bitet. A gond ott keletkezik, hogy a programozók nem feltétlenül látják ezt az irányt olyan jónak, amilyennek az Intel látta anno. A szélesebb SIMD kezelése egyre nehezebb az x86 utasításarchitektúrában (ISA) lefektetett meglehetősen gyenge hatásfokú alapok mellett, és elég kevés hajlandóság mutatkozik arra, hogy a programozók kezeljék a manuális többszálú feldolgozást, az előbetöltést, illetve emellett még küzdjenek a kevés regiszterrel. Van olyan terület ahol persze megéri, de előfordulhat, hogy akár az assembly szintig is le kell menni, hogy a befektetés elfogadható mértékű gyorsulást hozzon. Ez nem tipikusan a SIMD kiterjesztés általános problémája, hanem inkább az x86-é, ugyanis amikor ezt az ISA-t megtervezték, akkor még álmodni sem lehetett olyan igényekről, amelyekkel ma szembesül az iparág, figyelembe véve a fizika törvényei által erősen behatárolt fejlesztési irányokat is.

A jövőben az egyik legnagyobb fejlődés előtt a gépi tanulás áll, amely már ma is fontos terület, de az újabb hardverek kialakításánál már tényleg komoly figyelmet kap. Ennek az iránynak a legdrágább funkciója a mátrixszorzás (GEMM), és ez teszi ki a futtatási idő 89-95%-át. Egy jó gépi tanulásra tervezett hardvernek tehát rendkívül hatékonyan kell végrehajtania a mátrixszorzást.

Az Intel számára az Altera egy kifejezetten kedvező irány erre a területre, mert az FPGA-k mátrixszorzás mellett ha nem is olyan gyorsak, mint a GPU-k, a hatékonyság szempontjából nagyjából megegyező szinten állnak. Nem mellesleg már léteznek OpenCL-es BLAS (Basic Linear Algebra Subprograms) könyvtárak, akár nyílt forráskóddal is, tehát ezek futtatását meg lehet oldani az Altera FPGA-ival, így az Intel egy hatékony belépőt nyert a gépi tanulás területére.

Más gyorsítókban is el lehet persze gondolkodni, és úgy tudjuk létezik is erre vonatkozóan több kutatás is az Intelnél, így a Xeonok esetleg speciális numerikus koprocesszort is kaphatnak kifejezetten a gépi tanulás igényeihez kialakítva. Ezt az irányt akár kombinálni is lehet az FPGA-k integrálásával, tehát a lehetőségek az Altera felvásárlásával megnőttek. Ráadásul ezek reálisan megfontolható, alapjaiban a kor problémáihoz tervezett lehetőségek, amelyeket nem határolnak be egy majdnem 40 évvel korábban kialakított ISA korlátai. Ezt figyelembe véve már nem is tűnik soknak az a 16,7 milliárd dollár, amibe az Altera került. Ez izgalmas összecsapásokat is rejt, mert ugyanarra a problémára eléggé eltérő hardveres koncepciókat fogunk majd látni a különböző gyártóktól.

Hirdetés

  • Kapcsolódó cégek:
  • Intel

Azóta történt

Előzmények

Hirdetés