Hirdetés

Új hozzászólás Aktív témák

  • Petykemano

    veterán

    válasz lezso6 #41633 üzenetére

    A kompos példámban egy forduló egy órajelciklus. Így nem kell belékeverni az adhoc választott sebességet.

    Mert valójában is amikor jön egy 64 adatos wave, az bekerül a CU egyik SIMD16-os csövébe, ami 4 órajelciklus alatt (4 fordulóval) tud végezni a csomaggal.

    A kompos példában csak az a kérdés merül föl (ami a kamionosnál soha nem merülhetne fel), hogy miért is kell 64 autónak.összeállnia egy jegyhez.

    Ezt válaszoltad: Wave64 - throughput. Ha nem így lenne, akkor a csoportok (wavek) kezelése több adminisztrációs erőforrást igényelne. (Mondjuk több rajzolási parancsot? Több regisztert, buffert, azélesebb ütemezőt)

    Rendben. De amikor eljut egy wave (64) a CU-ba akkor ott miért nem lehet azt egy helyett egyszerre 4 SIMD16-ra ráküldeni - hisz ugyanaz az utasítás. Egy CU miért nem tudja a neki leküldött wave-eket a saját erőforrásain optimálisan vágrehajtani a wave tényleges elemszámától függően?

    A másik kérdést, hogy miért nem szélesebb a SIMD feldolgozó megválaszoltad. Köszi

    Találgatunk, aztán majd úgyis kiderül..

Új hozzászólás Aktív témák