NVIDIA GTC 2012: bemutatkozott a legnagyobb Kepler

Két új Tesla termék érkezik

Az NVIDIA idén nem halasztotta el a GTC 2012 (GPU Techology Conference) rendezvényt, mely viszonylag sok újdonságot hozott, és némi betekintést enged abba, hogy a cég miképp képzeli el a jövőt. Jen-Hsun Huang rögtön a megnyitón elsütött számos puskaport, így belevágva a közepébe már most megemlítjük, hogy a várakozásoknak megfelelően idén lesznek új Tesla kártyák, de az NVIDIA még e kategórián belül is kettészeli a piacot. Ez konkrétan azt jelenti, hogy lesz egy K10 és egy K20 jelzésű termék, melyek különböző szegmenseket céloznak meg, és ennek megfelelően a képességeik is gyökeresen eltérnek.

Hirdetés

A Tesla K10 jellemzése az egyszerűbb, ugyanis az alapokat a nemrég megjelent GeForce GTX 690 adja. Ennek megfelelően két darab GK104-es GPU lesz a kártyán, melyek egyenként 1536, azaz összesen 3072 CUDA magot jelentenek. A GPU-khoz 4-4 GB fedélzeti tár kapcsolódik, melyek rendelkeznek ECC-támogatással. A memória-sávszélesség egyetlen GPU felé, ECC nélkül 160 GB/s, ami azt jelenti, hogy a GDDR5 szabványú memórialapkák 5 GHz-es effektív órajelen üzemelnek. A grafikus processzorok magórajele 744 MHz, így a termék egy-egy GPU-ja 2,29 TFLOPS-os tempóra képes, ami összesítve 4,58 TFLOPS-ot jelent.

A Tesla K10 érdekessége, hogy bár támogatja a dupla pontosságot, de egyáltalán nem jeleskedik benne. GPU-nként mindössze 95 GFLOPS-os teljesítmény érhető el, ami a teljes kártyára nézve csak 190 GFLOPS. Ennél a korábbi generációs Fermi architektúrára épülő Tesla terméke is jóval többre képesek, emellett a GeForce GTX 680-as tesztből már kiderült, hogy a GK104 a bonyolult számításokért nem rajong. Utóbbi annak köszönhető, hogy a megosztott memória CUDA magokra leosztott tempója nem túl masszív. Egészen pontosan a GK104 0,33 bájt/FLOP-os értékkel rendelkezik, miközben a korábbi Tesla termékekben használt GF100-as GPU 1 bájt/FLOP-ot tud.

NVIDIA Tesla K10
NVIDIA Tesla K10

Az NVIDIA az előző bekezdésben említett korlátokkal nyilván tisztában volt, amikor megálmodták a Tesla K10-et, így a terméket nem is ajánlják mindenhova. Ettől függetlenül szeizmikus számításokra, jel- és képfeldolgozásra, illetve videoelemzésre nagyon is jó lehet. Szintén előnyös, hogy a Tesla K10 már támogatja a PCI Express 3.0-s interfészt. A felhasználók ennek sok hasznát nem láthatták az asztali termékeknél, de a szerverekben a gyorsabb csatoló tényleges előnyt jelent.

Sokkal érdekesebb termék lesz a Tesla K20, ami lényegében az (igazán) új generációs Tesla. Ez a kártya a még fejlesztés alatt álló GK110-es GPU-ra épít, mely a TSMC 28 nm-es gyártástechnológiájával készül, és ennek ellenére a valaha épített legnagyobb kiterjedésű grafikus processzor. A tranzisztorszám 7,1 milliárd, vagyis tényleg óriási lehet a lapka. Sajnos az NVIDIA a felépítést túlzottan nem részletezte, így csak annyit lehet tudni, amennyi a chipet ábrázoló fotóból látszik.

A GK110-es GPU
A GK110-es GPU [+]

A fenti képen látható, hogy az SMX modulok öt csoportba vannak szervezve, és egy-egy csoportban három modul lesz. Ez összesen 15 darab SMX-et jelent. Ezek képességei nem teljesen egyeznek meg a GK104-ben található verzióval, mivel a GK110 esetében az NVIDIA már erősen épít a dupla pontosság melletti teljesítményre. Ettől függetlenül a legnagyobb Kepler SMX moduljában is 192 darab CUDA mag található 32 darab speciális funkciókért felelő egységgel. Ez összesen 2880 CUDA magot jelent a teljes lapkára nézve. Az NVIDIA azonban elmondta, hogy az év végén megjelenő Tesla K20-ban szinte biztos nem lesz aktív az összes SMX. Az előzetes adatok szerint 13 vagy 14 modullal érdemes számolni, függően a kihozatal alakulásától.

NVIDIA Tesla K20
NVIDIA Tesla K20 [+]

Mivel a végső termék paramétere még sok dologtól függ, így konkrétan számolni sem lehet, de az NVIDIA elmondta, hogy a GF100 lapkára épülő aktuális csúcs-Tesla teljesítményéhez képest az új Tesla K20 háromszor gyorsabb lesz dupla pontosság mellett. Ez egyrészt adódik a jóval több feldolgozóból, illetve az új architektúra hatékonyabb munkavégzéséből. A vállalat kiemelte, hogy a GK110 a dupla pontosság melletti mátrixszorzást (DGEMM) 80-85%-os hatékonysággal végzi, míg a GF100 itt 65%-os értékre volt képes. A Kepler tehát javított, de kérdés, hogy mire lesz ez elég a konkurens architektúrákhoz viszonyítva. Az Intel Knights Cornerről tudjuk, hogy 1 TFLOPS-os tempóra képes DGEMM mellett, de a hatékonyságát már nem ismerjük, míg ugyanitt az AMD GCN architektúrájára épülő, Tahiti kódnevű fejlesztése 90%-nál is nagyobb hatékonysággal dolgozik. Persze a Tesla K20 dupla pontosság melletti elméleti teljesítményéről még semmit sem lehet tudni, így jelenleg felesleges belemenni bármilyen számolgatásba.

A Tesla kártyák esetében mindig fontos, hogy az NVIDIA-nak bele kell férnie a 225 wattos TDP keretbe, amit a Tesla K10 teljesít is, hiszen jelentősen alacsonyabb órajelen működnek a GK104-es GPU-k. A Tesla K20 esetében a fogyasztásról még nincs pontos adat, de nagy az esély rá, hogy ennél a terméknél 225 wattnál lesz meghúzva a határ. A GK110-es lapka memóriabuszáról hivatalosan nem sokat tudni, de a pletykák 384 bites buszról szólnak. Az NVIDIA az új lapka esetében egyelőre csak a Tesla vonalán gondolkodik, de utaltak rá, hogy lesz belőle Quadro verzió. Egy GK110-es GeForce-ról azonban semmi hír, és nagyon valószínű, hogy ilyen termék nem is lesz, mivel a legnagyobb Kepler a HPC-piac igényeit helyezi előtérbe.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

Előzmények

Hirdetés