Hirdetés

Új hozzászólás Aktív témák

  • Raymond

    titán

    válasz rudi #75 üzenetére

    Nem szamit nagyon. Ha lenne program amivel tudnad allitani a 6600GT-nel akkor latnad hogy meg annyi kulonbseg sem lenne mint a 9550-nel (ami szinten nem volt valami sok).

    Egy grafikus chip nem vegez rengeteg random memory access-t mint egy CPU. A grafikus kartyan nagy mennyisegu adatot kell olvasnod minel gyorsabban, de ezek az adatok egy helyen vannak (textura, render target, zbuffer stb.) igy jon kepbe a maximalisan kihasznalt burst. Egy CPU-nal viszont rengeteg kulonbozo feladat van feldolgozva egy idoben es mivel a cache merete veges, igy minel gyorsabban kell elerni a rendszermemoriaban kulonbozo helyen levo es kulonbozo feladatokhoz tartozo adatokat. Nem mindegy hogy valami 6ns-on belul elerheto (L2 cache) vagy csak 60+ns-on belul. Foleg ha rengeteg ilyen olvasas van. Egy CPU-nal is latszik a kulonbseg ha valami olyan feledatot hajt vegre ami egy GPU feladatahoz hasonlit (stream processing) - lasd a P4 videokodolasat. Hiaba verte agyon egy A64 jatekokban vagy mas general purpose code feldolgozasban, ott ahol a lehetoleg legtobb mennyisegu adat tovabitasa es annak SIMD feldolgozasa volt a fontos ott meg mindig gyorsabb volt a P4. Ott a kesleltetes nem szamit, ugyanugy mint egy GPU-nal.

    Nem csak a crossbar vagy valamelyik masik resz eszi meg a kesleltetest, hanem maga az egesz belso architektura. Az egyes feldolgozasi lepeseknel van annyi belso cache hogy amikor egy feldolgozando adat hianyzik es az a memoriabol le van kerve (ami rohadt messze van a GPU szemszogebol), de addig az egyseg dolgozhat X masik dolgon. Amikor a hianyzo adat odaer, akkor van befelyezve az eredeti feladat. Ezt meg a Turbo Cache chip-eknel is aranylag sikeresen vegzik el, pedig ott a texturazas a rendszermemoriabol tortenik es az meg meszebb a GPU szamara van mint a local RAM.



    [Szerkesztve]

Új hozzászólás Aktív témák