Hirdetés
- Intel Core i5 / i7 / i9 "Alder Lake-Raptor Lake/Refresh" (LGA1700)
- NVIDIA GeForce RTX 4080 /4080S / 4090 (AD103 / 102)
- Samsung LCD és LED TV-k
- Nem lesznek olcsók az új, ARM-os és windowsos notebookok
- OLED TV topic
- Milyen Android TV boxot vegyek?
- Prezentálta óriásmemóriáját a Micron
- Multimédiás / PC-s hangfalszettek (2.0, 2.1, 5.1)
- AMD GPU-k jövője - amit tudni vélünk
- Milyen egeret válasszak?
Hirdetés
Új hozzászólás Aktív témák
-
#95904256
törölt tag
Ezt az adatvesztést elkerülendő scatter / gather dologról még nem hallottam. Úgy tudom lesz belőle foglalatos szerver processzor ami Xeon kompatibilis, így akár Windows-t is lehet majd futtatni rajta. Nem hiszem, hogy a Windows kódja ilyenekkel lenne megtömve, szóval itt hiányzik valami info. Egy 72 magos szörnyeteget szívesen megnéznék.
-
MongolZ
addikt
"A vállalat megemlítette, hogy rendkívül specifikus kódra lesz szükség ahhoz, hogy a hatékonyság megfelelő legyen."
Jajj, ne...
-
arn
félisten
itanium szagu... ha erosen kell ra optimalizalni, mitol lesz jobb, mint a tobbi gpgpu?
facebook.com/mylittleretrocomputerworld | youtube.com/mylittleretrocomputerworld | instagram.com/mylittleretrocomputerworld
-
alcsa
senior tag
Eloszor azt olvastam, hogy Kings Landing .
-
Fiery
veterán
Pl. a megosztott memoria es a near memoria miatt. Amig nem jelenik meg az AMD Zen alapu, 16 CPU-magos APU-ja, addig nem lesz semmi a piacon, ami konkurenciat tudna tamasztani a KNL-nek. A legkozelebbi eselyes, kvazi hasonlo felepitesu cucc a Kaveri lehetne, csak annak meg nagyon kicsi a GPGPU teljesitmenye, sajnos Ha olyan specifikus feladatrol van szo, ahol a megosztott memoriaval rengeteget lehet nyerni, akkor a KNL-re megerheti az optimalizacio. De ez nagyon-nagyon specifikus feladat, ergo nagyon kevesen fognak ezzel foglalkozni, legalabbis kezdetben.
Az egyebkent erdekes fejlemeny lenne, ha az nVIDIA is eloallna egy hasonlo APU-val. Tulajdonkeppen mindene megvan hozza, csak ossze kellene rakni a LEGO kockakat
-
derive
senior tag
Az "asztali" kiadasban par Skylake mag is helyet kap, azon fut a Win, ez meg kvazi GPUs feladatokat gyorsit.
-
Abu85
HÁZIGAZDA
Állítólag azért van ez, mert a Knights Landingben jóval kevesebb a cache (0,5+2,5 MB vs 0,5 MB) és több a szál (2 vs 4) egy magra levetítve. Pluszban kétszer szélesebb a SIMD is, és ezek miatt nagyságrendekkel nagyobb a cache-miss lehetősége, mint a hagyományos Xeonoknál ugyanazzal a kóddal. Ezért kell erre speciálisan figyelni. Egyébként ebből nem lenne gond, ha kitömhetnék a lapkát úgy 700 MB-nyi L2 gyorsítótárral, de erre nincs lehetőség, szóval a programozóknak kell kiemelten figyelni a cache-miss elkerülésére.
(#3) arn: A Knights Corner után a piac is felfogta, hogy nincs ingyen ebéd. Felesleges lenne megint előhozni, hogy jó a mostani kód, mert a Knights Corner esetében kiderült, hogy nem jó. A Knights Landingnél az igazat kell mondani.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
LordX
veterán
"Többek között az egyik legfontosabb szempont a cache-miss elkerülése, ugyanis ilyen esetben a processzormodulok az új adatok betöltésével akár el is veszthetik a feldolgozásra váró információkat."
Ez azért durva, egy adatvesztéses hiba nagyon magasra teszi a bekerülési szintet. Ha már az elején pofánvágjuk a tanuló programozót, akkor korán elveszíti a kedvét, és nem sok expert fog kikupálódni, aki használni is tudja.
-
Fiery
veterán
"Többek között az egyik legfontosabb szempont a cache-miss elkerülése, ugyanis ilyen esetben a processzormodulok az új adatok betöltésével akár el is veszthetik a feldolgozásra váró információkat."
Ez szerintem nem stimmel. Hogyan lehetne egy x86 processzoron belul elvesziteni egy adatot? Egy 2 szalas processz futasa kozben, ha az egyik szal az egyik modulra esik, a masik meg a masikra, akkor ha az egyiken valamit matat a thread, a masik nem tud rola? x86 processzorban ez keptelenseg, a KNL pedig nem mas, mint egy specialisan kialakitott x86 CPU. Ez nem GPU vagy egyeb furcsasag, ez egy CPU.
-
Abu85
HÁZIGAZDA
Ha jól értettem, akkor arról van szó, hogy az x86-ot sok évtizeddel korábban tervezték és nem arra, hogy valaha is lesz több szál a CPU-kban. Éppen ezért nagyon merev a memóriaműveleteket és a koherencia kezelése a többi data-parallel architektúrához viszonyítva. Minél több a mag a lapkában, annál nehezebb a megszokott programozási modellt tartani, így az átláthatóság érdekében szigorúan definiált bemenetekre, kimenetekre és aszinkron memóriamásolásokra kell átállni. Ezzel jól kontrollálható a chipen belüli kommunikáció sok szállal is. A scatter esetén szálanként 32 sor íródik felül a gyorsítótárban, és ezeket gather esetén egyszerre kell beolvasni. Ha nem kontrollálod ezeknek a írását és olvasását, akkor a túl kevés L2 cache miatt rengeteg lesz a cache-miss.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Abu85
HÁZIGAZDA
A memóriában meglesz az adat. A gond az, hogy a cache-ben nem lesz ott, vagyis újra be kell tölteni. Ez jelentősen lassítja a hardvert, hacsak ez ellen a programozó nem tesz. Az Intel csak elmondta, hogy hogyan lehet tenni ellene.
Adatvesztést egyébként nem írtam, csak azt, hogy a cache-ből elvész az adat.
De egyébként beleírtam a hírbe ezt, hogy egyértelműbb legyen.[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
Fiery
veterán
Ezt irtad az eredeti hirben:
"ilyen esetben a processzormodulok az új adatok betöltésével akár el is veszthetik a feldolgozásra váró információkat."
Akarhogy probalod mosdatni magad, akkor is azt irtad, hogy adatvesztes lep fel a processzoron belul. Ami hulyeseg. Nem kell a politikus rizsa, nem kell megmagyarazni mindent "Elb***tam, javitottam" -- ennyi eleg lenne. Csak az nem hibazik, aki nem dolgozik.
-
bitblueduck
senior tag
válasz #06658560 #18 üzenetére
nem mond ellent annak, hogy nem arra találták ki, nem úgy tervezték.
An open mind is like a fortress with its gates unbarred and unguarded.