Keresés

Hirdetés

Új hozzászólás Aktív témák

  • dezz

    nagyúr

    válasz Oliverda #7098 üzenetére

    "Ezt nem is tudtam." :DDD

    Látod! :))

    "Viszont legjobb tudomásom szerint sehol nincs szabály vagy megkötés arra, hogy hány FP SIMD vagy INT ALU egységnek kell meglennie ahhoz, hogy magnak lehessen nevezni egy egységet."

    Szerintem sincs, de a magszámot te hoztad fel, miközben én a végrehajtóegységek számát vetettem össze a cache-méretekkel, amiből azt vontam le, hogy az Orochi alapvetően egy szerveres "konfiguráció".

    "A Sandy Bridge-t négymagosként árulja az Intel, a négymodulos Bulldozer-t meg nyolcmagosan fogja majd az AMD."

    Pedig szerintem jobb lett volna annyi magosként, ahány modul van benne... Mert úgy core-2-core gyorsabbra jött volna ki, így viszont ugyanezen az alapon lassabb lesz, ami kevésbé pozitív. Szerinted egyébként mi okuk ennek ellenére az INT "magok" alapján való besorolásra? Úgysem a magszám alapján vásárolnak az emberek, hanem a teljesítmény alapján...

    "Ezen felül még mindig azt mondom, hogy nagyon eltérő (lesz) a két architektúra."

    Oké, de a végrehajtóegységek száma azért eléggé meghatározó. Nyilván a körítés áteresztőképességével együtt, ami azonos órajelen nagyjából egyforma. Innentől már inkább a megcélzott terület alkalmazásainak "memória-intenzivitása" kezd meghatározó lenni. A legtöbb desktop alkalmazás beéri kisebb cache-sel.

    "Az órajelekről még szinte semmit sem tudunk az utóbbi esetében, pedig ez nem éppen egy elhanyagolható dolog."

    Csak ugye annyit, hogy un. speedracer konstrukció, azaz kimondottan magas órajelekre tervezték. A hírek szerint 3 GHz fölött lesz a kezdő órajel. De szerintem azért nem lesz a SandyB-k legmagasabb órajelének duplája az itteni felső határ.

    "A Bulldozer-nél az L2 is elég szerves részt képez"

    Igen, mivel modul szinten osztott, de a méretének nem kell feltétlenül kőbe vésetten 2 MB-nek lennie.

    "Amennyiben nem csak a feljebb linkelt írás 6. oldalát olvastad el, akkor gyanítom, hogy tudnod kellene, hogy valószínűleg lesz natív 2 modulos megoldás is 4MB L3 cache-vel. Ott van az utolsó oldalon a hivatalos slide."

    A többit is olvastam és persze a slide-ot is láttam már korábban. De bevallom őszintén, megfeledkeztem róla. Ugyanakkor, azok nem külön chipek, hanem mag- és L3 letiltás esetei. Bár így is olcsóbbak lesznek, de olcsónak szerintem így sem lehet majd őket nevezni.

    "Nem valószínű mert a Trinity-ben csak 2 modul lesz, és mint tudjuk ezek ketten összesen durván 62.0 mm² terültet foglalnak el. Marad még elég hely az egyéb részegységeknek így is bőven."

    Attól függ, mekkora lapkaméretet céloznak meg és mekkora terület lesz ebből az IGP. (Meg aztán ez már Next Gen./Enhanced Bulldozer alapú lesz.)

    "Ezek szinte ugyanakkora területtel rendelkeznek. Vagy hol kellene itt lennie a 100%-nak? Úgy értetted, hogy 1 Bulldozer modul + 2 MB L2 területben durván a 100%-a 2 Llano mag + 2x1 MB L2 területének? Mert ez még így kb. igaz is."

    No és ez hogy jön ki? Úgy, hogy 1 Llano mag + 1x1 MB L2 által elfoglalt területhez képest +100% területet foglal el 1 Bulldozer modul + 2 MB L2. Ezek után illő lesz nem hogy 80%-kal, hanem legalább 120%-kal gyorsabbnak lennie (az 1 Llano maghoz képest). Más szóval, legalább ugyanannyira gyorsnak lennie, de inkább méggyorsabbnak, mint az ugyanakkora területet elfoglaló 2 Llano mag (+2x1 MB L2).

    De ez nem lesz könnyű, mert az utóbbinál 2x3=6 a max. INT IPC és 2 SIMD FADD + 2 SIMD FMUL egység van, egy Bulldozer modulnál pedig 4[*] a max. INT IPC és ugyanannyi FADD és FMUL egység van, amik egy FMAC egységen belül talán csak FMA műveletkor működhetnek egyszerre. Igaz, a Bulldozernek valószínűleg magasabb lesz az órajele.

    (* A Branch Fusion által azt hiszem, ehhez hozzájön még 1-2, ugyanakkor maga a branch általában kieső ciklusokkal jár.)

    Hát, kíváncsian várom az eredményeket... És persze drukkolok. Nyilván ezt néztem ki következő konfigomnak... :)

Új hozzászólás Aktív témák