Keresés

Hirdetés

Új hozzászólás Aktív témák

  • frescho

    addikt

    válasz Abu85 #48 üzenetére

    Ami itt igazan faj, az a prefetch es leginkabb a dekoder. A steam rollerben nem veletlenul fogjak duplazni. Az jo kerdes, hogy mit hivunk egy magnak, de anno a tobb integer feldolgozo beepitesenel sem kezdtek elnevezni a processorokat, hanem elneveztek szuperskalarnak. Az elvet az AMD kiterjesztette, ezert hajlok leginkabb arra, hogy inkabb modulokrol beszeljek, mint magokrol, tehat az FX-6 az 3 modulos. 1 modul egy "szuper-szuper skalar" cimet is kaphatna, vagy CMT modulnak is lehetne hivni. A CMT-vel bevezetett modulon beluli magok kozotti fugges miatt viszont nem hivnam magnak azt, amit az AMD magnak hiv.

    Mar irtam, hogy nem a FlexFP a gond szerintem, hanem a dekoder reszleg, ami nem tudja megfelelo sebesseggel kihordani az ujabb tal rizst a konyhabol a ket gyerekenek, hogy a te hasonlatod vigyem tovabb.

    "Ha az integer feladatokat nézed, akkor a Bulldozer modul kapott egy extra integer clustert, vagyis logikus, hogy két integer clusterrel jöhet 80% plusz." Erre reagaltam, hogy ez elmeleti 80%. A szamitasaiknak a fele erheto el a gyakorlatban atlagolva. Valamiert az az erzesem van folyamatosan, hogy az AMD a jovonek probal tervezni, de valamiert a jelenben nem tudja ugy eladni a termekeit, ahogy kellene.

    https://frescho.hu

  • P.H.

    senior tag

    válasz Abu85 #48 üzenetére

    Ezt már többször olvastam tőled, hogy a "úgy tervezték a FlexFP-t, hogy szétváljon, ha nem AVX kódot kap.". Nem, nem így tervezték; nem, nem válik szét, sőt 'össze sem kapcsolódik', ha AVX kódot futtat.

    Ez a FlexFP sematikus rajza szerintük:

    4 db 128 bites végrehajtó, közülük 2 dolgozik alapvetően egész számokon (MMX) és 2 lebegőpontos számokon (FMAC). Ezenkívül 3 bír speciális feladatkörrel, olyannal, amelyet semelyik másik nem tud ellátni, tehát szükségszerűen mindkét szálat ki kell szolgálják »egyszerre« (pl. csak az FSTORE tud memóriába írni, az XBAR adattípustól függetlenül vektorelemeket átrendezni, ...).
    Továbbá egyrészt ott a "Only 1 256-bit operation can issue per cycle, however an extra cycle can be incurred as in the case of a FastPath Double if both micro ops cannot issue together." mondat, csakhogy szinte az összes AVX utasítás Fastpath Double, azaz 2 db - ebben az esetben 128 bites - micro op-ra fordul le.
    Másrészt ha az egyik szál 128 bites (akár SSE-)műveletének szüksége van egy L2-ben (18-21 órajel), L3-ban vagy rendszermemóriában levő adatra, akkor a fél FlexFP ne működjön, hanem várja meg azt, vagy addig hajtsa végre teljes mellszélességgel a másik szál készen álló utasításait, amelyeknek nem kell várnia adatokra?

    A legegyszerűbb eset a leggyorsabb is egyben, ugyanaz az elv, mint a HT-nél, itt is órajelenként felváltva kapja meg az egységes FP-ütemező a 2 szál utasításait. Amely műveletek bemeneti értéke rendelkezésre áll, azokat végrehajtja (nem téve különbséget a thread-ek között); ha több ilyen van utasítás van, amely adott pillanatban készen áll a futtatásra, akkor a legrégebben bekerülteket indítja.
    Átalában az AVX utasítások két 128 bites felének egyszerre érkezik meg a bemeneti adata (előző utasítástól vagy a memóriából, mivel magonként 2 AGU van a két 128 bites memóriaolvasásnak), de ha 2 AVX utasításnál (= 4 db 128 bites félnél) áll fenn ez egyszerre, mert mondjuk két különböző szálból valók (a 2 magban 4 AGU van), akkor egy-egy FMAC egymás után futtatja le az adott utasítás két felét, az egyenlőség elvét követve.
    Ez minden ütemező működési elve, legyen szó akár egy egyszerű egyszálas OoO-ütemezőről is. Minden más elv csak lassítana rajta, vagy a statikus/dinamikus működési ("szétválik"/"összekapcsolódik") váltás feleslegesen növelné a tranzisztorigényt és eredménye se lenne; egyszerűen csak az FP-ütemező nem tesz különbséget a két szál között, csak egy adag 128 bites micro op-ot lát és kezeli őket.

    [ Szerkesztve ]

    Arguing on the Internet is like running in the Special Olympics. Even if you win, you are still ... ˙˙˙ Real Eyes Realize Real Lies ˙˙˙

Új hozzászólás Aktív témák