AMD Trinity megateszt: APU újratöltve

3. A Trinity újításai
1. Régi tervek új APU-ja 2. Erőltetett menet 3. A Trinity újításai 4. A Piledriver v1 fejlesztései 5. Új platform új foglalattal: Virgo és FM2 6. Az első fecske: ASUS F2A85-V PRO 7. Tesztkonfig, specifikációk 8. Deneb, Llano, Bulldozer, Trinity 9. A négy muskétás – eredmények 10. A négy muskétás – további eredmények 11. Fogyasztás 12. Renderelés, tömörítés 13. Videóvágás, szerkesztés 14. Videókódolás, egyéb 15. Játékok (CPU) 16. Crysis Warhead, DiRT 3, Anno 2070 (IGP) 17. Battlefield 3, Deus Ex, Batman, Starcraft 2 (IGP) 18. ComputeMark, LuxMark v2.0, Handbrake (OpenCL) 19. Az A10-5800K APU gyors tuningja 20. Végszó
Írta: Oliverda
2012-10-02 19:22

Hirdetés

A Trinity újításai

A moduláris Bulldozer mikroarchitecktúra kidolgozása után az AMD előtt állt egy következő nagy feladat: a Piledriverrel olyan szintre javítani a teljestmény/fogyasztás mutatót, hogy az leválthassa a Llanókban alkalmazott K12 felépítést a 2. generációs Trinity APU-kban. Ez elsősorban a fogyasztás lejjebb tornászását jelenti, másodsorban olyan csiszolásokat, amelyek az egy órajel alatt valóban végrehajtható utasítások számát növelik. Mindebből természetesen az ugyancsak Piledriver-alapra építkező, következő FX és Opteron CPU-k is profitálni fognak, melyek bár nem tartamaznak integrált grafikus magot, órajeleiket feljebb lehet tolni vagy még több modult lehet egy lapkába építeni. Mivel az APU-k és a klasszikus sokmagos CPU-k igényei túl széles skálát fednek le, kétféle Piledriver modul készült: a Trinity szerényebb követelményeinek megfelelő Piledriver v1 és a teljesítményorientált v2, mely az újabb FX és Opteron modellekben kap majd helyet. Mindkét modulra építkező lapkákban közös, hogy az órajelelosztás energiaigényét csökkentették a Cyclos által kidolgozott Resonant Clock Mesh technológiára alapozva.

Mint a képen látható, a Bulldozer fogyasztásának 15-35%-áért maga az órajelhálózat a felelős. A Resonant Clock Mesh – amelynek a Trinity az első kereskedelmi forgalomba került megvalósítása – jelentősen csökkenti ezt a fogyasztási tényezőt, ami azonos órajelen kisebb TDP-t, illetve azonos TDP mellett magasabb órajelet jelent. Ennek köszönhetően a AMD termékpalettáján is megjelent az eddigi 25 és 35 W mellett a 17 W-os kategória, lehetővé téve számukra teljesítményorientáltabb ultrahordozható laptopok építését.

A Resonant Clock Mesh megvalósítása a Bulldozer meglevő órajelrendszerére épült a Piledriverben; a Cyclos szerinti optimalizációkkal a következő generációkban akár meg is duplázható a fogyasztási megtakarítás.

[+]

Mindemellé a Llano energiamenedzsmentjét is tovább csiszolták. A Trinity-t az elődhöz hasonlóan elsősorban a mobil szegmensbe szánják, ahol minden egyes wattnak rendkívüli jelentősége van az akkumulátoros üzemidő szempontjából.

[+]

Alapvető változás, hogy míg a Llano esetében a GPU egy fix fogyasztási kerettel rendelkezett, így annak órajelét a rendszer nem tudta megemelni még akkor sem, ha az épp belefért volna a TDP-keretbe, addig a Trinity a terhelés függvényében már dinamikusan szabályozza az éppen felhasználható értékeket a CPU-magok és a GPU között, ergo az utóbbi üzemi frekvenciája megemelhető, ha szükséges és belefér a keretbe.

[+]

A rendszer vezérlője is változásokon esett át. A Llanónál minden egyes lehetséges magi aktivitáshoz (melyek száma 100 körüli) hozzárendeltek egy fogyasztási mutatót, ami alapján az energiagazdálkodási modul képes volt pontosan kiszámolni az éppen aktuális fogyasztást. A Trinity ezt kiegészítve gyors transzformációkkal, termikus számítások alapján modellezi a hőmérsékletet is, mely adatok felhasználásával gyorsabb órajelváltás mehet végbe. Mindezen felül további lépések is történtek az energiagazdálkodás terén a Piledriver köré építhető infrastruktúrákban:

az integrált északi híd dinamikusan állítható órajelei mellé megjelent a rendszermemória órajelének állítási lehetősége is. Két ilyen lépcsőt ismer a rendszer, a gyári órajel mellett az alacsony NB-aktivitás esetén beállítható visszavett ütemet;
az integált PCI Express 2.0 vezérlőt is bevonták a fogyasztás csökkentésébe, mivel az kihasználatlanság esetén képes visszaskálázni az eszközökhöz rendelt nagysebességű (x16, x8 vagy x4) kapcsolatot akár x1-re is, a többi vonalat ideiglenesen lekapcsolva. Többféle metódust is kínál erre a vezérlő, de a legrugalmasabbak csak AMD grafikus kártyákkal működnek együtt;
az integrált kétcsatornás memóriavezérlő támogatja az 1,25 V alapfeszültségű LPDDR3 memóriamodulokat is.

[+]

A Trinity integrált északi hídja átdolgozásra került a Llanóéhoz képest: a legnagyobb változást a Garlic és az Onion buszok RMB-re (Radeon Memory Bus) való lecserélése, valamint a 2. generációs IOMMU (IOMMU v2) beépítése jelenti:

a mindkét irányba 128 bit széles Fusion Control Link ad koherens hozzáférést az IGP-nek a CPU-rész által kezelt memóriához, az I/O-csatornákhoz, továbbá a CPU-nak hozzáférést az IGP-nek dedikált memóriarészhez;
a mindkét irányba 256 bites Radeon Memory Bus révén közvetlenül kapcsolódik az IGP memóriavezérlője a két 64 bites memóriacsatornához;
az IOMMU v2 (I/O Memory Management Unit) immár lehetőséget ad arra, hogy a diszkrét kártyák (grafikus kártyák, nagyteljesítményű hálózati kártyák stb.) transzparens módon, a CPU-éval azonos virtuális->fizikai címfordítási mechanizmuson keresztül, de annak közreműködése nélkül érjék el a rendszermemóriát.

[+]

A grafikus mag jelentősnek mondható változáson esett át, mely így tulajdonképpen már a Northern Islands (Cayman – HD 6900) termékcsalád részének tekinthető. A fő különbség a Llano APU IGP-jéhez képest, hogy a szuperskalár shader processzorok úgynevezett VLIW5 felépítését VLIW4-re váltották a mérnökök. Ez összességében jobb kihasználást jelent, illetve a Cayman örökségeként számos értékes technológia is bevetésre került.

Egy shader tömb 16 darab szuperskalár shader processzort rejt, melyhez 32 kB-os Local Data Share, valamint egy 8 kB-os, csak olvasható gyorsítótárral rendelkező textúrázó blokk tartozik. Utóbbi négy darab Gather4-kompatibilis csatornát alkalmaz, melyek csak szűrt mintákkal térnek vissza. Az interpoláció a DirectX 11-es Radeonokhoz hasonlóan emulált, ám a rendszer itt sok optimalizációt kapott, így relatív kevés erőforrás szükséges az interpolálás végrehajtásához. Az új Trinity APU IGP-jében összesen 6 darab shader tömb van, amelyek egy blokkra vannak fűzve. Ez a blokk természetesen egységes Ultra-Threading Dispatch Processzorra támaszkodik. A tömbök közötti adatmegosztást továbbra is egy nagysebességű, 64 kB-os (Global Data Share) tárterület biztosítja.

[+]

Az IGP setup motort is a Caymantől örökölte annak minden előnyével együtt. A tesszellátor az AMD Gen8-as megoldása lesz, míg a raszter motor órajelenként 16 képpontot dolgoz fel. Az igazán értékes újítás azonban a tile-based load balancing, ami a hierarchikus Z algoritmus túlterhelését akadályozza meg. A rendszer a raszterizálást hierarchikus Z nélkül hajtja végre a teljes képkockát több egyenlő méretű, viszonylag kicsi mozaikra osztva. Természetesen itt számos szabályt be kell tartani biztosítva a renderelés sorrendjét. A hierarchikus Z algoritmus a mozaikokon lesz lefuttatva, amelyeket tovább lehet küldeni vagy éppen el lehet dobni, ha nem tartalmaznak látható információt. Ez az elgondolás tesszellálásnál lehet hasznos, mivel a hierarchikus Z motor könnyen túlterhelhető, ami esetenként elég sok problémát jelenthet.

[+]

A memóriavezérlőhöz egy 128 kB kapacitású, csak olvasható másodlagos gyorsítótár és két ROP-blokk kapcsolódik. Ez így összesen 8 blending és 32 Z mintavételező egységet eredményez. Itt a Caymantől megörökölt újítás, hogy a blokkok jelentős fejlődésen mentek keresztül, így a Llano IGP-jéhez képest kétszer gyorsabban végzik a 16 bites unorm és snorm operációkat, valamint a 32 bites lebegőpontos utasítások feldolgozása akár négyszer gyorsabb is lehet. Némi egyenetlenség azért maradt a rendszerben, mivel a raszter motor órajelenként 16 képpontot dolgoz fel, ami sok 8 blending egységhez, de utóbbi inkább legyen túletetve, minthogy adatra várjon.

[+]

A Trinity IGP-je abból a szempontból érdekes a Llano megoldásához viszonyítva, hogy a shader processzorok száma 400-ról 384-re csökkent, miközben a textúrázó csatornák száma 20-ról 24-re nőtt. Alapvetően azonban a változás minden szempontból előnyös, ugyanis a Trinity szuperskalár shader processzorainak felépítése kedvezőbb, mivel hatékonyabban "etethetők". További fontos adalék, hogy a Trinity APU IGP-je az integrált megoldások között elsőként támogat dupla pontosságot. Ebben a módban a rendszer teljesítménye az elméleti számítási tempó tizenhatod részével egyezik meg.

A cikk még nem ért véget, kérlek, lapozz!

Kapcsolódó cégek:
ASUS
AMD

Azóta történt

Az AMD ventilátort nélkülöző, néma, Trinity HTPC rendszert mutatott be

A gyártó a japán piacon demonstrálta a koncepció képességeit.

Hír 2012-10-03 62
Az ASRock öt alaplappal durrant alá a Trinity APU-nak

Az újdonságok között ATX és microATX méretű modellek vannak, a felszereltségük pedig egész jónak mondható.

Hír 2012-10-04 42
A Gigabyte is kiszolgálta a Trinity APU-t

A vállalat hat alaplapot készített, melyek az AMD összes vezérlőhídját bevetik.

Hír 2012-10-04 22
Megkezdődött a Trinity APU extrém tuningja

Első nekifutásra 7317,74 MHz jött össze folyékony nitrogén bevetésével.

Hír 2012-10-08 25

Előzmények

Intel Ivy Bridge i3 teszt: a legkisebb "i"-s számít!

Alaposan leteszteltük a népszerű Intel Core i3 sorozat két új, immáron Ivy Bridge alapú tagját.

Elemzés 2012-09-28 292
AMD Trinity: szintet lép a vállalat fúziója

Az új APU személyében érkezik a heterogén módon programozható lapkák új generációja.

Elemzés 2012-05-15 455
A régóta várt Intel Ivy Bridge tesztje

A vadonatúj, 22 nanométeres csíkszélességre épülő Core i7-3770K processzor járt nálunk.

Elemzés 2012-04-23 424
AMD A8-3870K, a szorzózármentes APU

Leteszteltük az AMD tuningosoknak szánt, jelenleg legerősebb Socket FM1-es APU-ját, a szorzózármentes Llanót.

Teszt 2012-02-29 291

Percről percre

20 ezer új munkást visz Eindhovenbe az ASML

it Hatalmas politikai feszültséget okozott az ASML és a holland kormány nézeteltérése, de most úgy néz ki, hogy jelentős bővítésbe kezdenek Eindhovenben.

Közel 1 billió dollárt vesztettek a big tech óriásai

it Nagyot kaszáltak a shortolók, az úgynevezett Magnificent 7 közel 1 billió dollárt veszített a piaci értékéből a múlt héten.

Nagyon gyorsan betilthatja az EU a TikTok újítását

it Amennyiben nem kap megfelelő válaszokat, az EU már csütörtökön betiltja a TikTok Lite jutalmazási programját.

AMD Trinity megateszt: APU újratöltve

Hirdetés

A Trinity újításai

Azóta történt

Az AMD ventilátort nélkülöző, néma, Trinity HTPC rendszert mutatott be

Az ASRock öt alaplappal durrant alá a Trinity APU-nak

A Gigabyte is kiszolgálta a Trinity APU-t

Megkezdődött a Trinity APU extrém tuningja

Előzmények

Intel Ivy Bridge i3 teszt: a legkisebb "i"-s számít!

AMD Trinity: szintet lép a vállalat fúziója

A régóta várt Intel Ivy Bridge tesztje

AMD A8-3870K, a szorzózármentes APU

Percről percre

20 ezer új munkást visz Eindhovenbe az ASML

Közel 1 billió dollárt vesztettek a big tech óriásai

Nagyon gyorsan betilthatja az EU a TikTok újítását

Készül a Galaxy S24 FE

EA Play - Napokon belül elérhető lesz a Star Wars Jedi: Survivor

Eredeti dizájnnal tér vissza idén a Nokia 225 4G

Magyar feliratozással jön a Senua's Saga: Hellblade II

Holnap mutatkozik be a HMD Pulse Pro

Illaoi karakterére fókuszál a 2XKO legújabb előzetese

Pletyka: Gagyi volt, beszünteti az Apple a FineWoven kiegészítők gyártását

Hirdetés

AMD Trinity megateszt: APU újratöltve

Hi﻿rde﻿t﻿é﻿s﻿

A Trinity újításai

Azóta történt

Előzmények

Percről percre

Hir﻿d﻿e﻿t﻿é﻿s

Hirdetés

Hirdetés