Az NVIDIA az ígéretéhez híven bemutatta az új, Ampere architektúrát használó GeForce-okat. Konkrétan egy GeForce RTX 3090, 3080 és 3070 nevű modell érkezik a következő hetekben. A vállalat meglehetősen visszafogottan osztotta meg a tényleges adatokat, így nagyon sok konkrétumot nem lehet még leírni. Elvileg a két legnagyobb modell ugyanazt a GA102-es GPU-t használja, míg a legkisebb egy visszafogottabb GA104-es kódnevű verziót. Ezeket a zöldek ugyan nem erősítették meg, de a gyártópartnereiktől ilyen információkat kaptunk, tehát valószínűleg helytállók.
Mindegyik lapka a Samsung 8 nm-es gyártástechnológiáján készül, az NVIDIA szerint egy olyan node-on, amit specifikusan rájuk optimalizáltak. A legnagyobb GPU-ban 28 milliárd tranzisztor található, de a kiterjedése még nem nyilvános.
Az Ampere fő fejlesztései között a sugárkövetés és az AI feldolgozás állt, így új RT, illetve tensor feldolgozókat kap, továbbá bevezetésre kerül az RTX IO is. Utóbbinak semmi köze az RTX-hez, a vállalatnak egy ideje szokása mindenre ráaggatni ezt a jelzőt, de a lényeg az, hogy ezek olyan speciális részegységek, amelyek képesek tehermentesíteni a processzormagokat a tárolt, tömörített adatok kicsomagolásakor. Az NVIDIA szerint a PCI Express 4.0 adatátviteli teljesítményével akár 24 processzormagra is szükség lenne a tartalmak, kifejezetten gyors SSD-kről való kikódolásához, de ezt az RTX IO megoldja a GPU-n belül, a többletterhelése pusztán fél processzormag környékén lehet. Itt előkertül a Microsoft DirectStorage API-ja, amiről főleg az Xbox Series X konzol kapcsán hallottunk, a Velocity architektúra részeként. Most már szinte biztos, hogy ez valamikor megérkezik PC-re, és akkor ahhoz szükséges hardveres szintű támogatás is, ezt biztosítja az RTX IO.
Az érkező VGA-k tekintetében az alábbi táblázat részletezi az ismert specifikációkat:
Típus | 3070 | 3080 | 3090 |
---|---|---|---|
GPU kódneve | GA104 | GA102 | GA102 |
Architektúra | Ampere | ||
GPU Boost órajel |
1,73 GHz | 1,71 GHz | 1,7 GHz |
CUDA magok száma | 5888 | 8704 | 10496 |
Elméleti számítási teljesítmény (FP32) | ~20 TFLOPS | ~30 TFLOPS | ~36 TFLOPS |
Memória típusa | GDDR6 | GDDR6X | GDDR6X |
Memóriabusz | 256 bit |
320 bit |
384 bit |
VRAM kapacitása |
8 GB | 10 GB |
24 GB |
NVLINK támogatás | nincs |
nincs | van (2 kártya) |
TGP fogyasztás | 220 W |
320 W |
350 W |
PCI Express tápcsatlakozók | 8 tűs | 8+8 tűs | 8+8 tűs |
PCI Express csatoló |
x16-os PCI Express 4.0 |
Ami furcsa lehet az a számítási teljesítmény növekedése. Ezzel kapcsolatban megtudtuk, hogy az Ampere architektúra multiprocesszorai a Turinghoz képest órajelenként kétszer annyi 32 bites lebegőpontos műveletet is képesek lehetnek elvégezni. Arra viszont nem kaptunk választ, hogy ez a képesség mindig használható-e, vagy csak bizonyos esetenként. Az elmúlt évek AMD és NVIDIA GPU-dizájnjaira jellemző volt, hogy kifejezetten általánosra voltak tervezve, így a bennük rejlő aritmetikai és logikai egységeket a lehető legtöbb esetben próbálták elérhetővé tenni. Ugyanakkor régebben számos trükközés volt ezen a szinten bizonyos co-issue vagy dual-issue feldolgozókkal, amikor a nyers számok tekintetében sok feldolgozó került az adott multiprocesszorba, de egy részüket ritkán lehetett használni. Nem is kell olyan messzire menni, az Intel grafikus fejlesztései még ma is ilyenek. Ha az Ice Lake IGP Gen11-es dizájnját nézzük, akkor az 512 darab shader részelemmel rendelkezik, de a programkódok jó részében ennek csak a felét tudja hasznosítani. A számítási teljesítményben viszont az Intel leszámolja neki az elméleti maximumot, hiszen bizonyos kódok mellett képes lehet rá a hardver. Az Ampere vizsgálatánál itt feltétlenül szükség lenne egy részletesebb leírásra, amely kifejtené, hogy a multiprocesszorokon belül az lebegőpontos feldolgozók pontosan hogyan vannak bekötve, vagy megduplázták-e a regiszterek és a gyorsítótárak kapacitását, hogy ki tudjanak szolgálni kétszer annyi részegységet.
Az NVIDIA szerint a GeForce RTX 3070 gyorsabb a GeForce RTX 2080 Ti-nél, miközben az ára 500 dollár lesz. A GeForce RTX 3080 a GeForce RTX 2080 kétszeresét fogja kínálni 700 dolláros áron, míg a GeForce RTX 3090-re vonatkozóan nincs semmilyen összehasonlítást biztosító adat, de az ára 1500 dollár lesz. Ezeket az átlagos előlépéseket az NVIDIA mérte 4K-s felbontáson számos, grafikailag intenzív játékban, de a konkrét beállítások ismeretlen, így nem tudni, hogy aktív volt-e az egyes programokban a DLSS vagy a sugárkövetés.
A termékek közül a GeForce RTX 3080 és 3090 szeptemberben, míg a 3070 októberben érkezik.