Hirdetés

Keresés

Aktív témák

  • perla

    csendes tag

    válasz DcsabaS #233 üzenetére

    1. ? Az rdramnak mi koze a kompatibilitashoz? Szerintem semmi. Amugy tobb mellekvagany is van/volt, van amelyik a kompatibilitasi uton (pl. a topikindito cikk is errol szol), van amelyik nem (pl. itanium).

    2. Ez igaz, marmint hogy sse2 stb.-t nem korlatozza. Tobbi reszet a procinak igen. Szal ez azt jelenti, hogy ha nem optimalizalsz (pl. siman c-ben programozol), akkor azok korlatozva lesznek, ha optimalizalsz akar optimalizalt konyvtarak hasznalataval, akar sajat koddal, akkor nem leszel korlatozva.

    3. Persze, ezt abszolut nem huzza vissza. Itt csak arra probaltam utalni, hogy a SIMD a legjobban a 3 kozul a G5-ben van megoldva, masodik a p4, harmadik az amd64.

    4. Ok, tovabbra se ertem, hogy jott a sznobsag a proci sebesseghez. Meg ez, hogy valaki villogott vele, nekem azt jelenti, hogy hallottal mar rola. De nem hasznaltad, nem fejlesztettel ra, szal nem tudod osszehasonlitani massal. Nyilvan, ha nem igy van, akkor visszavonom, bar szerintem ha valaki kiprobalja a G5 simd extensionjet es osszehasonlitja a p4-evel, akkor egyreszt le kell essen az alla, meg akkor tudnia kell, hogy mirol beszelek.

    5. Nem gondolnam, hogy kivulallo vagyok a temaban, epp kepfeldolgozassal foglalkozom, es epp sse2 meg altivec optimalizalast csinalok, sima 2 processzoros gepeken meg 16-32 processzoros clusteren. Nem erzed butasagnak, elfecserelt idonek szuperszamitogepen nem optimalizalt kod futtatasat? Amugy az oke, hogy az egyet merek, kettot osztok feladathoz nem kell tul nagy szamitasi teljesitmeny, es a ganyolt program is megoldja (es ettol ez meg lehet tok tudomanyos, szamtalan olyan tudomany, illetve feladat van, amihez nem kell szamitasi teljesitmeny). Pl. Idojarast szimulalni viszont nem fogsz igy. Real-time kepfeldolgozasi feladatok se mennek igy. Amennyire en tudom (bar szuperszamitogep nem volt meg a kezemben, de cluster igen) szokas valamilyen api-t hasznalni, amiben optimalizalt fuggvenyek vannak, amit a kododban hasznalhatsz. Ily modon a kodod is optimalizalt. Amugy nem is ertem, minek allok le ezen vitazni. Azt akarod nekem bemeselni, hogy senki senmmilyen feladatra nem hasznal optimalizalt kodot? Ez nyilvanvalo hulyeseg. Szerinted soha senki nem hasznalt meg sse2-t? De meg csak egy libraryt se, ami optimalizalva volt? Es en fantazialok? Az, hogy te nem hasznalsz, az nem jelenti azt, hogy mas se hasznal. Tok sok optimalizalt library van. Akar ha csak egy FFT-t nezek, szerinted mindig mindenki leall ezt ujra megirni, vagy hasznalnak egy mar letezot? Ha esetleg letezot hasznalnak, akkor vajon egy gyorsabb, simd utasitasokat hasznalot fognak hasznalni, vagy direkt egy lassabbat? Ehh...

    6. Ok, vilagos, en is erre gondoltam, azt hittem, valamirol kimaradtam. Mondjuk erdekes, hogy itt talalsz peldat, amit clusteren erdemes futtatni, bar gondolom, hogy szerinted itt se hasznal senki sse2-t, ugye?

  • Fiery

    veterán

    válasz DcsabaS #233 üzenetére

    ''Opteron: architekturalis okokbol nem fogy ki belole a savszelesseg tobb procis kialakitasnal, ami egyreszt jo szervereknel, masreszt nagyon gyors klasztereket lehet belole osszerakni (szimulacios szamitasokhoz), es megvan a lehetoseg arra is, hogy a tobb core-os verziok hasznalhatok legyenek az eredetileg az 1 core-os verziokhoz keszult alaplapokban (ismet csak kompatibilitas).''

    Iszonyu pongyolan fogalmazol, raadasul elfelejted, hogy a processzorok szamanak novelesevel (egy rendszeren belul) problemat jelent a cache-ek konzisztenciajanak megorzese is.

    Az Opteron pedig valoban jobban teljesit tobbprocesszoros rendszerekben, mint mondjuk egy Xeon vagy Athlon MP -- azonban ne feledjuk el azt sem, hogy ennel sokkal-sokkal jobban is lehetne csinalni.


    Fiery

Aktív témák