NVIDIA GeForce GTX 1060 – GP106 félpénzen

Nagyrészt egy felezett GP104 lett a GP106. A kérdés csupán az, hogy teszi-e mindezt fél sikerrel? A tesztből kiderül!

A Pascal GP106-os GPU

Mielőtt nekifognánk a GeForce GTX 1060 kártya ismertetésének, az új GPU-ról, a friss architektúráról, valamint a kapcsolódó szolgáltatásokról szóló részletes bevezető nem véletlenül marad ki ebből a cikkből is, hiszen korábban több alkalommal írtunk ezekről (Az NVIDIA bemutatta a GP104-es GPU-ra épülő GeForce-okat; Játékos szemszögből is előrelépés a Pascal; Bevezetés az NVIDIA Pascal architektúra rejtelmeibe; 249 dolláros árcédulával rajtol az NVIDIA GeForce GTX 1060).

Hirdetés

Egy rövid összefoglaló azonban mindenképp hasznos, ha a főbb tulajdonságokról születik, így tesztünk első része az ismerkedés a GeForce GTX 1060-as videokártyákra kerülő, GP106-os grafikus vezérlővel. Annak ellenére, hogy a GP106 már nem részegységek letiltása révén éri el a megcélzott paramétereket, a hasonlóság testvérével, a GP104-gyel kísérteties: számolóegységek tekintetében hajszálpontosan felezett mása a nagyobb változatnak.

A GP106 blokkdiagramja
A GP106 blokkdiagramja [+]

A GPU ugyanúgy a TSMC 16 nm-es FF+, azaz FinFET node-ján készül. Magában a lapkában 4,4 milliárd tranzisztor található és ez 200 mm²-es lapkaterületbe fért be, ebbe 10 darab streaming multiprocesszort sikerült beépíteni, amit az NVIDIA SMP-nek jelöl, ami a Pascal streaming multiprocesszor rövidítése. Egy ilyen streaming multiprocesszor a GP104-gyel megegyezően 96 kB-os Local Data Share tárolóval rendelkezik, 128 darab CUDA magot tartalmaz.

A textúrázási képességek területén sincs változás, egy SMP ugyanis két darab textúrázó blokkot tartalmaz, ezekhez egyenként egy 24 kB-os kapacitású írható és olvasható L1 gyorsítótár tartozik, amelyet természetesen a CUDA magok is használhatnak. Egy ilyen részegység egyébként négy darab textúrázócsatornát rejt, amely szűrt mintákkal is képes visszatérni. A 10 db SMP-vel mindez 1280 CUDA magot és 80 textúrázócsatornát eredményez.

A GP106 chipje
A GP106 chipje [+]

A magméret és a tranzisztorszám sem arányosan csökkent a GP104-hez képest, hiszen a memóriavezérlő és a relatíve sok tranzisztort elhasználó L2 cache sem feleződött, csak háromnegyed méretűre zsugorodott. Mindemellett a változatlan PCI Express vezérlő, valamint a járulékos részegységek is igényelnek némi szilíciumterületet.

Memóriavezérlő tekintetében az NVIDIA továbbra is maradt a crossbarnál. A GP106 192 bites szélességű buszt használ, ami hat darab 32 bites szegmensből áll. Mindegyikhez 8 darab ROP és 256 kB L2 cache tartozik. Mivel összesen 6 szegmens van, ez 48 blending és 192 Z mintavételező egységet eredményez, illetve 1,5 MB kapacitású, megosztott L2 gyorsítótárat tartalmaz tehát összességében a lapka, amit mindegyik streaming multiprocesszor elérhet és a CUDA magok írhatnak is bele.

A GP104 SMP-je
A GP106 SMP-je [+]

A Pascal architektúra túlságosan nem változott a setup területén, így a GP104 esetében már látott megoldást alkalmazza a GP106 is. Az NVIDIA továbbra is egy raszteres és egy úgynevezett PolyMorph részre vágja a setup motort. Az előbbi egységből kettő található a lapkában, azaz egy raszter motor öt darab streaming multiprocesszor ellátásáról gondoskodik. A raszter motor órajelenként 16 pixelt képes feldolgozni, ami a teljes lapkára nézve 32 pixelt jelent. Ez okozhat olyan eseteket, amikor a rendszer képtelen lesz etetni 48 blending egységet, így olyan lesz a teljesítmény, mintha csak 32 blending egység lenne a lapkában. Az előbbiek mellett a GP104-hez viszonyítva változás még, hogy a GP106 órajelenként feleannyi, azaz kettő háromszöget képes feldolgozni.


Az új multiprojekciós motor [+]

A streaming multiprocesszorokban található PolyMorph motor továbbra is a geometriával kapcsolatos munkálatokat végzi. Mivel 10 darab SMM található a GP106-ban, így értelemszerűen ez ugyanennyi PolyMorph motort eredményez. Maga a részegység 16 nézőpozícióba képes továbbítani a geometriát. Ennél fontosabb, hogy lehetővé teszi az egymenetes sztereó 3D-t, vagyis úgy számolható sztereó 3D-s képkocka, hogy a geometriát kettő helyett csak egyszer kell kiszámolni. Ez a virtuális valóság szempontjából vitathatatlanul hatalmas előny.


A Delta Color Compression [+]

A Maxwellhez viszonyítva javult az NVIDIA saját Delta Color Compression technikája, amely még takarékosabban bánik a sávszélességgel. Ezt lényegében két új veszteségmentes tömörítési technika bevezetésével éri el, az eddigi egy mellé. Ez is teljesen megegyezik a GP104-nél látott megoldással.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

Előzmények

Hirdetés