Új GPU-kkal törne csúcsra a Tesla K80

Az NVIDIA hivatalosan is bejelentette a Tesla K80 jelzésű gyorsítót, amely a vállalat HPC-piacra szánt koncepcióitól eltérő módon nem egy, hanem két GPU-val dolgozik. A rendszer alapjaiban a GeForce GTX Titan Z nyomtatott áramköri lapjának módosítására épül, és hivatalosan két darab GK210-es GPU található rajta.

Hirdetés

A TSMC 28 nm-es gyártástechnológiáján készülő GK210 alapvetően egy új GPU, ugyanis az NVIDIA áttervezte az alapjául szolgáló GK110-et. Mint ismeretes a Kepler architektúrát az NVIDIA nem tipikusan a HPC-piac igényeihez igazította. Ennek megfelelően egy borzasztóan regiszterszegény architektúráról van szó, amely sok esetben nem képes az összes feldolgozóját adattal etetni, mivel nincs elég nagy megosztott regiszterterület az SMX modulokon, azaz a streaming multiprocesszorokon belül.

Nagyon jellemző erre az architektúrára, hogy az elméleti számítási teljesítményének a harmadát is elveszti bizonyos kódok esetén, ami nem feltétlenül jó az ügyfelek számára. Ennek érdekében az NVIDIA a GK210-et úgy konfigurálta, hogy egy SMX modulokon belül ne csak 256 kB-os, hanem 512 kB-os közös regiszterterület legyen. Mindemellett az SMX-ek 64 kB-os L1 gyorsítótárai is 128 kB-osak lettek. Ezt megfejeli még az is, hogy az L1 gyorsítótár tempója a kétszeresére gyorsult. Ezek nagyon kritikus fejlesztések voltak, mert hozzásegítik a programokat, hogy az elméleti számítási teljesítmény reálisan elérhető legyen.

A fenti módosításokkal természetesen megnőtt a GK210 tranzisztorszáma is a GK110-hez viszonyítva, de erről az értékről az NVIDIA még nem beszélt. Az új lapkában összesen 2880 darab szimpla pontosságú és 960 darab dupla pontosságú számításokra alkalmas stream processzor található, emellett természetesen az 1,5 MB-os másodlagos gyorsítótárt nem érte változás, illetve a 384 bites memóriabusz is megmaradt.

A Tesla K80 esetében nem aktív az összes SMX, így ezekből kettő mindig letiltásra kerül. Ez végeredményben lapkánként összesen 2496 darab szimpla pontosságú és 832 darab dupla pontosságú számításokra alkalmas stream processzort jelent, miközben a 384 bites memóriabuszhoz 12-12 GB memória kapcsolódik.

Az újdonság 5 GHz-es effektív órajelen üzemelő GDDR5 szabványú VRAM-ot kap, az ECC nélküli memória-sávszélesség pedig GPU-nként 240 GB/s lesz. A GK210 jelzésű lapka 562 MHz-es magórajelen ketyeg, amihez 875 MHz-es GPU Boost tartozik. A fogyasztás szempontjából a friss versenyző 300 wattos TDP kerettel rendelkezik.

A Tesla K80 elméleti számítási teljesítménye 5,61 TFLOPS szimpla és 1,87 TFLOPS dupla pontosság mellett. A termék az AMD FirePro S9150 ellenfele lesz, amely rendre 5,07 és 2,53 TFLOPS-os értékekkel rendelkezik, tehát az NVIDIA üdvöskéje szimpla pontosság mellett alkothat. Viszont a Tesla K80-nak nincs publikus ára, mivel hivatalosan is az NVIDIA-tól lehet rendelni. Erre azért van szükség, mert a szabványos hűtőrendszerek nem képesek 300 wattos hőmennyiséget elvezetni, így a vállalat segít a megfelelő szerverek tervezésében.

A GK210 egyébként nem tűnik logikus fejlesztésnek, de valójában nagyon is az. Ez a Kepler revízió GPGPU-s szempontból lényegesen jobb paraméterezéssel rendelkezik, mint a GM204-ben bemutatott Maxwell architektúra, márpedig a HPC-piacon az általános számítások vannak a figyelem középpontjában, tehát ebből a szempontból kell kiszolgálni az igényeket. Elképzelhető, hogy egy jó ideig a GK210 lesz az új Tesla gyorsítók alapja.

Hirdetés

Azóta történt

Előzmények

Hirdetés