Keresés

Hirdetés

Új hozzászólás Aktív témák

  • #65675776

    törölt tag

    válasz Lolka Bolka #13 üzenetére

    A DDR3 és egyéb asztali modulok esetén a modul sávszélességét szokás megadni. GDDR-ek esetén a kivezetésenkéntit.

    atti_2010: Az ugye nem probléma, hogy a GDDR-ek is a DDR-ekből származnak? A GDDR5 (és a GDDR4) pl a DDR3 egy kicsit másabb megvalósításban.

  • #65675776

    törölt tag

    válasz Lolka Bolka #17 üzenetére

    Egyébként memóriamodulok esetén a chip sávszélessége is azonos. VGA-kra szánt RAM-ok esetén már csak azért is adnak meg máshogy sávszélességet, mert eléggé változatos, hogy melyik GPU-ban milyen memóriavezérlő van. Ráadásul nem is cserélhetőek a chipek*, ergo a kártya sajátja, hogy mekkora sávszélességet biztosít.

    * - Még mielőtt valaki azt mondaná, hogy nem igaz: tisztában vagyok vele, hogy le lehet forrasztani, és másikat felrakni. De maga a rendszer nem úgy van kitalálva és felépítve, hogy azt az átlagjúzer maga megcsinálná. Ahogy azzal is tisztában vagyok, hogy (nagyon)régen léteztek bővíthető memóriájú VGA-k, szóval nem kell belikelni egyetlen S3 Trio vagy Virge képet sem.

    [ Szerkesztve ]

  • #65675776

    törölt tag

    válasz atti_2010 #19 üzenetére

    Kíváncsi lennék azoknak mekkora lenne az implementálási költsége. Illetve, hogy a valóságban is olyan jók-e, mint papíron. Láttunk már példát rá, hogy nem. Az RDRAM is milyen jól hangzott, csak éppen semmi nem profitált érdemben belőle, ráadásul a messze olcsóbb DDR RAM igen hamar lelépte. Kérdés most is az lesz az új technológiák esetén, hogy mennyire skálázhatóak. A DDR nagyonis annak bizonyult. A memóriacellák gyakorlatilag a mai napig ugyanazok, a DDR3-1600 ugyan úgy 200MHz-es cellákkal dolgozik, mint a DDR-400. Mégis elég jelentős a teljesítménykülönbség, mert csak a frontendet kellett cserélgetni, fejleszteni előttük. A RAMBUS esetén meg minden fejlesztés a korábbi megoldás teljes kukázásával járt eddig.

  • #65675776

    törölt tag

    válasz ukornel #33 üzenetére

    Nagy igényt majd a komolyabb IGP-vel megáldott APU-k fognak támasztani a memóriaalrendszer felé. A mostaniak köszönik bőséggel elvannak a mostani RAM-okkal és vezérlőkkel. CPU-knak meg gyakorlatilag hótmindegy, csak legyen sok RAM a gépben. Egyáltalán nem szűk keresztmetszet a RAM sávszélesség. Még a Trinity sem profitál belőle érdemben DDR3-1866 felett. [link]

    A Micron meg sokat ér az esetleges RAMBUS RAM-jaival, ha azt nem fogja kezelni semmi. A keresztlicencmegállapodás meg inkább tudható be a hosszú jogi csatározás lezárásának, mint érdemi fejlesztési lépésnek.

    dezz: Az AMD nem gyárt memóriamodulokat. Ahogy pl a Corsair sem. Utóbbi cég mondjuk kb semmit sem gyárt.

    [ Szerkesztve ]

  • #65675776

    törölt tag

    válasz dezz #36 üzenetére

    De, mérvadó, mert jelenleg elérhető, és a leginkább memóriaignyes APU. A Kaveri tényleg más kérdés, ott lesz először igazán értelme a gyors RAM-nak. Viszont annál sem lesz akkor akülönbség RAM és RAM között, mint a két 7750 között. Az ok egyszerű: a dVGA-k esetén egy csak és kizárólag a GPU-t szolgáló, és ahhoz optimalizált memóriavezérlő van. APU esetén ez messze nem igaz most sem, és a Kaveri esetén sem lesz az. A memóriavezérlő elérését továbbra is a CPU-n keresztül bonyolítja a rendszer. Valószínűleg GGDR5-tel sem lett volna annyival gyorsabb az IGP-je, mint a 7750 GGDR5-ös verziója a DDR3-ashoz képest.

    Az XDR és XDR2 is RAMBUS RAM, ahogy az RDRAM is az volt.

  • #65675776

    törölt tag

    válasz Thrawn #39 üzenetére

    2133MHz felett ahogy nézem a Kaveri sem skálázódik.
    Minden esetre érdekesen számolnak százalékot arrafelé. Utolsó táblázatban hatalmas baromság van emiatt:

    "2400 Mhz Advantage over 2133 Mhz 98,09%"

    Ezt miből deriválták ki? Minimumban van 1fps, ami testvérek között is 3,3%. Maximumban 5fps, ami 10,87%. Áltaban meg még csökkent is az fps 1,94%-kal. A 98,09% úgy adódik, hogy 2400MHz-en ennyi az fps a 2133MHz-hez viszonyítva. Nem növekmény.

    2133MHz előnye átlag fps-ben az 1866MHz-hez viszonyítva 8,67%, miközben a memóriasávszélesség 14,3%-kal emelkedett. Mondjuk még mindig jobb, mint amit a Trinity mutatott, de azért még messze nem az igazi.

    Az egész iromány egyetlen konklúziót mutat: 2133MHz feletti RAM-oknak még mindig nincs értelme alapórajelen használt rendszereknél. De az 1866 és 2133 közötti különbség sem indokolja a jelentősen drágább RAM beszerzését.

    Plusz egy darab alkalmazást tartalmazó vizsgálatot nagyon nem neveznék tesztnek. Arról nem is beszélve, hogy még csak arra sem képesek, hogy rendesen leírják a MHz-et.

    dezz: Hiába egyenjogúak, ha az IGP felé feleslegesen hosszan jut el az információ. Egy dVGA esetén a GPU gyakorlatilag közvetlenül kapcsolódik az IMC-hez, míg Kaverinél nem. Ráadásul Kaverinél mindig is ottt lesz az egyenjogú konkurens CPU, ami bármikor elvehet tőle sávszélt, vagy megszakítást. A megosztott címtér meg ezen nem sokat segít.

    ukornel: A konzolok SoC-ja nem igazán összevethető még a Kaverivel sem, mert az egyensúly teljesen más irányba van eltolva. Mind a két új konzol esetén az IGP a domináns, szinte minden annak van alárendelve. A CPU szinte csak arra van, hogy szervezzen a háttérben. A memóriamodell is eltér emiatt.

    Amit írtál a Knights Landinggel, az érdekes kérdés. Az valóban tudna mit kezdeni a nagyobb sávszéllel, ahogy egy hasonló AMD APU is. Viszont utóbbi esetén csak akkor éreznéd ezt az előnyt ha G34-be lene tokozva, ott meglenne a négy csatorna. Itt ugyanis már az is számítana, hogy órajelciklusonként hány memóriaparancs adható ki. A mostani asztali AMD IMC-k esetén ez maximum kettő, G34-ben lehetne négy is. Asztali szinten a különbség pár százalék, egy ilyen APU sokkal inkább profitálna belőle.

    Ami miatt asztalra ilyen APU nem várható az a rendszerarchitektúra. Az asztali alkalmazások az erős CPU-kra azért támaszkodnak, a nyolc Jaguar mag kevés lenne nekik, főleg ha a mai szinten marad a többszáló feldolgozás (azaz kb szinte sehol). Egyszerűen nem tudnák kiszolgálni játékok alatt az IGP-t. Szóval cooprocesszorként lehetne létjogosultsága. Kellemetlen, hogy asztali vonalon nincs olyan FX sem, amiben lenne két aktív HT link, ami ehhez szükséges. A Kaveriben meg ugye a korábbi Fusion APU-khoz hasonlóan nincs is HT. Az egész okfejtés alapvetően persze a játékokra van kihegyezve, ha valaki bányászásra akarná használni a gépét, akkor jó lehetne egy ilyen APU. Otthoni feladatok többi részére nemigazán.

    De a lényeg igazából az, hogy a most adott lehetőséggel a programozók hogy tudnak élni, ha akarnak egyáltalán. Az admirális által linkelt iromány akkor lett volna igazán érdekes ha mondjuk Mantle-lel is lemérték volna a BF4-et. Gyanítom, hogy azon esetben jelentősen nagyobb lett volna a gyorsulás a közvetlenebb hw elérés miatt. Erre majd esetleg viszatérhetünk ha megérkezik a Mantle patch. Esetleg a Thief megjelenésekor.

    [ Szerkesztve ]

  • #65675776

    törölt tag

    válasz ukornel #43 üzenetére

    A linkelt kép egy AMD sajtóanyag. Szerinted abban fog szerepelni olyasmi, hogy esetleg csökken a teljesítmény?

    Melyik részét nem érted? A socket G34 a mostani MCM Opteronok tokozása, amelyben két lapka van egymás mellett. Így lesz a két kétcsatornás memóriavezérlőből négycsatornás. K10 óta az AMD processzorokban valóban két független memóriavezérlő van, amelyek működhetnek együtt (ganged mód) vagy külön (unganged mód). Ganged módban a két vezérlő egyként viselkedik, mintha egy darab 128 bites vezérlőd lenne. Ebben az esetben egyszerre csak egy utasítást tud végrehajtani a vezérlő. Unganged módban két független 64 bites vezérlőként működnek, ekkor mind a kettő végre tud hajtani egy-egy utasítást. Értelem szerűen ha a négycsatornás kiépítésnél Unganged módban megy a két vezérlő, akkor ott egyszerre négy utasítás hajtódhat végre egyszerre. Összevetve egy mostani asztali CPU/APU-val ez akár 4x többletet is jelenthet, mai a reakcióidő csökkenéset hozza, méghozzá akár jelentős mértékben is. Egy IGP számára ez elég sokat jelenthet.

  • #65675776

    törölt tag

    válasz dezz #45 üzenetére

    Tekintve, hogy a GPU-kban olyan sok cache azért nincs, így azzal, hogy egy akármilyen, és AMD esetén tipikusan nem éppen alacsony késleltetésű, cache közbeiktatása mindenképpen növeli a késleltetést. A tobb magos CPU esetén ez olyan hatalmas mértékben nem befolyásolja a dolgokat, mert eleve mindig ott van az L" vagy akár L3 cache, másrészt a sávszéligény és a késleltetésre való érzékenység is jelentősen kisebb.

    Az tiszta sor, hogy a CPU igénye kisebb, de nem is igazán az a lényeg, hogy csökkenti az IGP számára elérhető sávszélességet, hanem hogy rendszeresen megszakítja az IGP felé irányuló adatforgalmat, ami miatt az IGP várakozni kényszerül. Persze lehet ezen javítani egy szép nagy cache közbeiktatásával.

    A sajtóanyagok relevanciája érdekes kérdés, de tipikusan eltúlozzák a jelentőségét mindennek. Ráadásul ott sem tudni semmit a futtatás körülményeiről. A linkelt iromány több sebből vérzik, érdemes megvárni a többi oldal valódi tesztjeit.

    Kérdés, hogy a négy csatorna hogyan szerveződik. A linkelt hsz alapján hiába a négy csatorna, egyszerre maximum két utasítást tud végrehajtani a vezérlő. Igazából csak azért van a 4x32 bit, mert egy GDDR5 chip 32 bites buszt használ.

    ukornel: Elég csúnya mikro vagy komolyabb lagokat okozhat ha nem folyamatos az adatáramlás az IGP (vagy bármilyen GPU) felé. Szóval ha kevesebb szálon olvas, akkor bizony lehet bottleneck. Ha szépen szét van szórva a memóriában a sok-sok adat, akkor ez elég komoly probléma lehet. Ahogy sok eltérő objektum esetén is.

    Aztán persze lehet, hogy tévedek. De a GDDR5 és a többi GDDR is azért használ inkább csak 32 bites buszt, mert így azonos sávszélesség mellett több csatorna van ahonnan/ahova olvasni/írni tud a GPU. A sűrű fillér és a ritka forint tipikus esete.

  • #65675776

    törölt tag

    válasz dezz #48 üzenetére

    Egy dolog, hogy Cache-ből dolgozik, de a cahce-be nem csak úgy beleteleportálódik az adat, azt bizony ki kell olvasni a memóriából, és oda szükség szerint vissza is írni. Csak mivel a CPU-kban jó nagy cache-ek vannak ritkábban kell a fizikai RAM-hoz nyúlni. Egy GPU a kis cache-ek miatt is folyamatosan basztatja a VRAM-ot. Plusz ugye sokkal gyorsabban változnak a szükséges adatok.

    DDR3 esetén minden chip 64 bit széles, a modul szélessége nem a chipek számától függ.

Új hozzászólás Aktív témák