Hirdetés

Új hozzászólás Aktív témák

  • dezz

    nagyúr

    válasz P.H. #437 üzenetére

    Visszatérve még erre:
    ''- 2 db 32 bites adder/multiplier -> 4 db 32 bites adder/multiplier
    - 1db 64 bites adder/multiplier -> 2 db 64 bites adder/multiplier
    - 1 db 80 bites adder/multiplier -> 1 db 80 bites adder/multiplier''

    Nos ugye felvetettem, hogy ebben az esetben kihasználhatnák ezt az FPU kód superscalar végrehajtásában, 2+x telj. elérve (+ pl. a 2. 64 bites, ill. 2-4. 32 bites egység más-más utasítást hajthatna végre SSE-ben is), de erről nem szól a fáma. Talán itt a megoldás:
    [kép]
    Nagyban: [link]
    Ezen ugye az látható, hogy 1-1 egész - adott műveletet végző - egység lett 128 bites. 1x64 bitnél nyilván csak a fele működik...
    Csak nem értem a 128 bites FADD-ot és FMUL-t, amik ugye sima FPU-s egységek.
    Egyébként működhet egyszerre az összes egység? Gondolok itt kevert SSE+FPU kódra.
    Ja, meg még egy dolog: ha csak 2 SSE egység van, és 4 órajel alatt végeznek, akkor effektíve 2 órajelenként lehet új műveletet indítani, nem? Közben asszem ''rájöttem'': 4-ből csak 1-ben van ide vonatkozóan használatban az egység, 1 a load, és 2 a store? Akkor már értem, mire jó a több portos cache. :D

    akosf: Nagyszerű, de hogy lesz ebből 1.5x telj. (fp), azonos, vagy épp alacsonyabb órajelen?

    [Szerkesztve]

Új hozzászólás Aktív témák