NVIDIA GeForce GTX 1050 Ti – a legkisebb Pascal

Leteszteltük a GP107-re épülő, belépőszintű GeForce videokártyát, és kellemesen csalódtunk.

A Pascal és a GP107

Mielőtt nekifognánk a GeForce GTX 1050 Ti kártya ismertetésének, az új GPU-ról, a friss architektúráról, valamint a kapcsolódó szolgáltatásokról szóló részletes bevezetőtől e cikk keretein belül most eltekintenénk, hiszen korábban több alkalommal írtunk ezekről (Az NVIDIA bemutatta a GP104-es GPU-ra épülő GeForce-okat; Játékos szemszögből is előrelépés a Pascal; Bevezetés az NVIDIA Pascal architektúra rejtelmeibe; Leleplezte az olcsó pascalos GeForce-okat az NVIDIA), csak ismételni tudnánk magunkat.

A főbb tulajdonságokról azonban mindenképp hasznos egy összefoglaló, így tesztünk első részében megismerkedünk a GeForce GTX 1050 Ti videokártyákra kerülő, GP107-es grafikus vezérlőchippel. Annak ellenére, hogy a GP107 már nem részegységek letiltása révén éri el a megcélzott paramétereket, a hasonlóság testvéreivel, a GP104-gyel, GP106-tal és a GP102-vel kísérteties: számolóegységek tekintetében azonban jócskán tetten érhető a csökkenés.

A GP107 blokkdiagramja
A GP107 blokkdiagramja [+]

A GPU itt már a Samsung 14 nm-es LPP node-ján készül. Magában a lapkában 3,3 milliárd tranzisztor található és ez 132 mm²-es lapkaterületbe fért be, ebbe 6 darab streaming multiprocesszort sikerült beépíteni, amit az NVIDIA SMP-nek jelöl, ami a Pascal streaming multiprocesszor rövidítése. Egy ilyen streaming multiprocesszor a GP104-gyel megegyezően 96 kB-os Local Data Share tárolóval rendelkezik, 128 darab CUDA magot tartalmaz.

Hirdetés

A textúrázási képességek területén sincs változás, egy SMP ugyanis két darab textúrázó blokkot tartalmaz, ezekhez egyenként egy 24 kB-os kapacitású írható és olvasható L1 gyorsítótár tartozik, amelyet természetesen a CUDA magok is használhatnak. Egy ilyen részegység egyébként négy darab textúrázócsatornát rejt, amely szűrt mintákkal is képes visszatérni. A 6 darab SMP-vel mindez 768 CUDA magot és 48 textúrázócsatornát eredményez.

A GP107 chipje
A GP107 chipje [+]

A magméret és a tranzisztorszám sem arányosan csökkent a GP106-hoz képest, hiszen a memóriavezérlő és a relatíve sok tranzisztort elhasználó L2 cache sem feleződött, csak kétharmad méretűre, 1024 kB-osra zsugorodott. Mindemellett a változatlan PCI Express vezérlő, valamint a járulékos részegységek is igényelnek némi szilíciumterületet.

Memóriavezérlő tekintetében az NVIDIA továbbra is maradt a crossbarnál. A GP107 128 bites szélességű buszt használ, ami négy darab 32 bites szegmensből áll. Mindegyikhez 8 darab ROP és 256 kB L2 cache tartozik. Mivel összesen 4 szegmens van, ez 32 blending és 128 Z mintavételező egységet eredményez, illetve 1 MB kapacitású, megosztott L2 gyorsítótárat tartalmaz tehát összességében a lapka, amit mindegyik streaming multiprocesszor elérhet és a CUDA magok írhatnak is bele.

A GP107 SMP-je
A GP107 SMP-je [+]

A Pascal architektúra túlságosan nem változott a setup területén, így a GP104 és a GP106 esetében már látott megoldást alkalmazza a GP107 is. Az NVIDIA továbbra is egy raszteres és egy úgynevezett PolyMorph részre vágja a setup motort. Az előbbi egységből kettő található a lapkában, azaz egy raszter motor három darab streaming multiprocesszor ellátásáról gondoskodik. A raszter motor órajelenként 16 pixelt képes feldolgozni, ami a teljes lapkára nézve 32 pixelt jelent. Ez már nem okozhat olyan eseteket, amikor a rendszer képtelen lesz etetni 32 blending egységet (mint a GP106-nál), így ahhoz képest kiegyensúlyozottabb lesz a teljesítmény. Az előbbiek mellett a GP104-hez viszonyítva változás még, hogy a GP107 (és a GP106 is) órajelenként feleannyi, azaz kettő háromszöget képes feldolgozni.


Az új multiprojekciós motor [+]

A streaming multiprocesszorokban található PolyMorph motor továbbra is a geometriával kapcsolatos munkálatokat végzi. Mivel 6 darab SMM található a GP107-ben, így értelemszerűen ez ugyanennyi PolyMorph motort eredményez. Maga a részegység 16 nézőpozícióba képes továbbítani a geometriát. Ennél fontosabb, hogy lehetővé teszi az egymenetes sztereó 3D-t, vagyis úgy számolható sztereó 3D-s képkocka, hogy a geometriát kettő helyett csak egyszer kell kiszámolni. Ez a virtuális valóság szempontjából vitathatatlanul hatalmas előny, habár a GTX 1050 Ti teljesítménye ehhez a területhez már gyengécske.


A Delta Color Compression [+]

A Maxwellhez viszonyítva javult az NVIDIA saját Delta Color Compression technikája, amely még takarékosabban bánik a sávszélességgel. Ezt lényegében két új veszteségmentes tömörítési technika bevezetésével éri el, az eddigi egy mellé. Ez is teljesen megegyezik a GP102/GP104/GP106-nál látott megoldással.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

Előzmények

Hirdetés