Az NVIDIA a GTC Japan alkalmával bejelentette, hogy jön egy új, Tesla családba tartozó gyorsító, amely már a Turing architektúrára épül, és technikailag a Tesla P4 utódjának számít, így a célterülete elsődlegesen a gépi tanulás dedukció szakasza lesz.
Hirdetés
Az újdonság főbb paramétereit az alábbi táblázat részletezi:
Típus | Tesla T4 |
---|---|
GPU kódneve | TU104 |
GPU Boost órajel | 1590 MHz |
CUDA magok száma | 2560 |
Integer CUDA magok száma | 2560 |
Tensor magok száma (ALU) | 320 (20480) |
Memória mérete | 16 GB |
Memóriabusz | 256 bit |
Memória típusa | GDDR6 |
Effektív memória-órajel | 10 GHz |
Memória-sávszélesség | 320 GB/s |
TDP fogyasztás | 70 watt |
Szimpla pontosság melletti számítási teljesítmény |
8,1 TFLOPS |
8 bites fixpontos számítási teljesítmény |
32,4 TOPS |
Felezett pontosság melletti tensor teljesítmény |
65 TFLOPS |
8 bites fixpontos tensor teljesítmény |
130 TOPS |
4 bites fixpontos tensor teljesítmény |
260 TOPS |
A friss fejlesztés paramétereiből látható, hogy miről is van szó. Az x16-os PCI Express 3.0-s interfészbe helyezhető újdonság passzív hűtést és félmagas kialakítást kapott. Aktív hűtés nélkül persze nem képes működni, de célzott szerverek esetében amúgy is van kellő mértékű légszállítás a megfelelő hőmérsékleten tartáshoz. A rendszer rendelkezik még egy kísérleti, 1 bites fixpontos móddal is a tensor magok tekintetében, de ez egyelőre nem élvez teljes támogatást, leginkább csak próbaképpen van benne, viszont az NVIDIA elérhetővé teszi, ha erre az adott partnernek szüksége lenne, vagy le akarná tesztelni. A szoftveres hátteret az NVIDIA TensorRT Hyperscale platformja biztosítja, illetve érkezik majd a CUDA 10-es verziója is.
A Tesla T4 elérhetőségéről még nincs adat, ahogy az listaáráról sem.