Hirdetés
- Azonnali informatikai kérdések órája
- NVIDIA GeForce RTX 5070 / 5070 Ti (GB205 / 203)
- Fejhallgató erősítő és DAC topik
- Milyen notebookot vegyek?
- Kormányok / autós szimulátorok topikja
- AMD K6-III, és minden ami RETRO - Oldschool tuning
- Adatmentés - HDD - SSD - Flash
- Milyen videókártyát?
- TCL LCD és LED TV-k
- Melyik tápegységet vegyem?
Új hozzászólás Aktív témák
-
Fiery
veterán
Kicsit tulzas a par ezer mag. A legdurvabb Xeon Phi SKU-ban is csupan 61 db MIC mag van, max. 1.33 GHz-es orajelen, a Xeon Phi kartya igy 300W TDP-t ad ki. Ha ezt leosztjuk 100W-ra (Intel mainstream desktop/mobil CPU-nal a TDP ennel tobb nem nagyon lesz mar), es atrakjuk fejben 14 nanora, akkor sem igen kepzelheto el 20-25 MIC magnal tobb (kezdetben), hacsak nem nyomjak le az orajelet 1 GHz alá. Mas kerdes, hogy ennyi mag mire lesz eleg. 800-1000 GFLOPS kellene minimum, hogy kompetitiv legyen a cucc a Carrizo GCN iGPU-ja elleneben.
-
Fiery
veterán
A GT3/GT3e pepitaban: ha nem tudsz rendes, hatekony termeket gyartani, akkor pakolj be egy halom magot alacsony orajelen, amit le tudsz gyartani, mert processzben elonyod van; es valahol feluton elvagy a cuccal vegul. Ertsd: nem lesz olyan gyors, mint amire elvben szamitani lehetne, de eleg jo mar a megcelzott piacnak.
-
Fiery
veterán
válasz
#65675776 #63 üzenetére
Hogyne, egy "APU" annyit fogyaszt, mint egy Tahiti dGPU, hat persze
100 W-nal tobb nem lehet a teljes CPU package, de inkabb 80 W kornyekere varhato, az Intel-fele trendeket figyelembe veve. Az a baj, hogy azt feltetelezed, hogy szuksegszeruen kalyhanak kell lennie egy iGPU-nak, ha tul sok mag van benne. Nem, nem feltetlenul. Egy megfeleloen modern processzen, egy megfeleloen alacsony orajelen egy boszme nagy iGPU is tud baromi keveset fogyasztani, lasd pl. Haswell-ULT GT3. Tudom, annak a teljesitmenye nem oriasi, de a teljesitmeny/fogyasztas mutatoja nem rossz. Az Intel prociknal a fogyasztas akkor szalad el, amikor nagyon felnyomjak az orajelet (2.5+ GHz), ezert sem mennek az iGPU-k tul magas orajelen. A MIC-nel is meg lehet -- velhetoen -- ugyanezt oldani, plusz ott mar 14 nanon fog ketyegni az iGPU is. Majd meglatjuk.
-
Fiery
veterán
-
Fiery
veterán
"csak a kritikus részekben vannak ASM utasítások"
Ez teljesen normalis. Mint ahogy az OpenCL-t hasznosito szoftverekben is csak a kritikus reszeken van OpenCL kod.
"Azért nincs ASM AMD kártyákra, mert minden 3. évben kijön egy gyökeresen új ISA, és dobhatnád ki az egész kódodat a francba"
Ettol me'g lehetne. Mindenki dontse el, hogy ilyen feltetelek mellett is megeri-e neki a fejlesztes assemblyben. Egyebkent a "minden 3. évben" es a "gyökeresen" egyutt eleg nagy tulzas. A VLIW5 architektura a Radeon HD 2900 XT-vel jelent meg 2007-ben. Azt facelifteltek, ugy szuletett a VLIW4 -- ami nem gyokeresen eltero architektura -- a Radeon HD 6970-nel 2010-ben. Az igazi uj generacio a GCN, ami 2012-ben jelent meg, tehat mondjuk 5 evente van gyokeresen uj architektura. A GCN2 (vagy mas neven GCN 1.1) sem gyokeresen uj architektura, csak faceliftelt, es velhetoen az is ki fog tartani cca. 2017-ig, kisebb-nagyobb patchelgetesekkel. Az nVIDIA-nal ugyanez a helyzet, a G80 (2006) ota, azzal egyutt is eddig 3 generacio volt, a Tesla, a Fermi meg a Kepler, de ez utobbi 2 vita targya lehetne, hogy mennyire gyokeresen ternek el.
-
Fiery
veterán
"A MIC magok nem kompatibilisek a mai fő magokkal. Hiába az x86 akkor sincs bináris kompatibilitás a normál és a MIC magok között. Ennek az az oka, hogy az x86 memóriamodelljét módosítani kellett hogy a rendszer skálázódjon."
Igen, ezt tudom, de akkor hogyan fog a Knights Landing bebootolni egy oprendszert? Ha pedig az be fog tudni, akkor a Skylake MIC magjai is kepesek lehetnek ra -- elvileg. Es onnantol vagy az a szitu, hogy a MIC magokat "okositjak" fel mondjuk egy Quark szintjere, vagy az oprendszer kernelet modositjak, hogy a MIC magokat is be tudja sorolni a normal x86 magok koze vagy mellé. Ez utobbi erdekelne engem, azaz hogyan lehet megoldani azt, hogy a MIC magokat is lehessen barmilyen celra hasznositani Windows alatt, direkt threadinggel, direkt x86 (akár assembly) programozassal.
-
Fiery
veterán
Koszonom az elismero szavakat
"Ha direkten szálakat futtatok, akkor nincs szinkronizáció? Annak nincs overheadje, akár kézzel történik (-> extra meló), akár az oprendszer csinálja (túl általános célú -> gyenge perf)? Nem véletlenül van context meg command queue - pontosan erre."
Miert kellene az oprendszer szalkezelesenek lassunak lennie? A Knights Landing be tud majd bootolni egy oprendszert, tehat valamilyen szinten az oprendszer fogja kezelni es utemezni a MIC magokat. Ha a Knights Landingnel ezt megoldjak, akkor miert ne oldhatnak meg a Skylake-nel vagy a Goldmont-nal is?
Az assembly hogyan mukodik x86-on? Yasm peldaul? No rocket science. GCN-re, Keplerre, az Intel GenAkarmennyijeire nincs assembly, pontosabban nem nyilt a rendszer. MIC-re -- ha az Intel egy kicsit is okosan csinalja -- lesz x86 assembler, jo esellyel a Yasm is tud majd forditani ra.
"Ilyen alacsony szinten ma már senki nem dolgozik komolyan"
Mi ennel alacsonyabb szinten is dolgozunk komolyan. Pl. kodgenerator, direkt gepi kodu programozas, stb. De persze tudom, hogy a fejlesztok 99%-a nem mereszkedik idaig, tudom hogy kisebbsegben vagyunk. Az extrem optimalizaciohoz azonban a legjobb megoldas mindig az, ha nem kell OpenCL, D3D, OpenGL es hasonlo overheadekkel vacakolni. A Mantle sem veletlenul szuletett, ott is az overheadet probaljak lekuzdeni.
-
Fiery
veterán
A programozo oldalarol me'g egyszerubb lenne, ha nem kene contextekkel, device-okkal, command queue-kkal es hasonlokkal vacakolni, hanem direktben lehetne programozni a GPU-t. Nem mondom, hogy AVX-512 assemblyvel feltetlenul, de egy egyszeru libraryval meg lehetne oldani az egeszet, nem kene az OpenCL overheadje oda. Aki meg feketeoves, az programozhatja direktben a MIC-et.
Szamomra 2 alapveto kerdes maradt a MIC kapcsan, talan Te tudod a valaszt ezekre:
1) Hanyszoros multithreadinget kapnak a Skylake MIC magok?
2) Vajon az operacios rendszer (foleg Windows) szamara elerhetoek, lathatoak lesznek-e kozvetlenul a MIC magok? Vajon a kernel tud-e utemezni szalakat a MIC magokra? Az alapjan, hogy a Knights Landing-en elvileg fel fog tudni bootolni egy oprendszer, siman elkepzelhetonek tartom, hogy a Skylake magjai is teljes(ebb) x86 magok lesznek, mint a Knights Corner eseteben. Mas kerdes, hogy az oprendszer utemezojet adott esetben modositani lenne celszeru, hogy ne pakoljon oda csipcsup szalakat, hanem csak bizonyos feladatokat utemezzen a MIC magokra. Sci-fi ez az egesz, vagy van benne racio?
-
Fiery
veterán
En nem mondtam, hogy egyszeruen fog menni az Intelnek a 7 es 10 nano, csak hogy dolgoznak rajta. Hol volt abban optimizmus, amit irtam? A 14 nano pedig kesz kell hogy legyen, maskepp nem lesz belole Broadwell az igert (kicsit arrebb csusztatott) idopontra. Mas kerdes, ha kicsit me'g faragni kell a Broadwellen, hogy jobb legyen a kihozatal, de maga a processz kesz.
-
Fiery
veterán
"A gyártástechnológiai előnyük lassan el fog olvadni, hiszen 10nm alá nem lehet menni."
Ezt honnan veszed? Az Intel mar most is fejleszti a 10 es 7 nm-es processzeit, leven hogy a 14 nm-rel mar kesz vannak.
Megjegyzem, ez a MIC-es megoldas a computing vonalon is erdekes tavlatokat nyit. Pl. nem kell OpenCL-lel vacakolni, hanem direktben lehet AVX-512-vel programozni, kihasznalva _egyszerre_ a hagyomanyos x86 CPU magok es a MIC magok teljesitmenyet, aggregaltan.
Új hozzászólás Aktív témák
- ÁRGARANCIA!Épített KomPhone Ryzen 7 5700X3D 32/64GB RAM RTX 5070 12GB GAMER PC termékbeszámítással
- Intel Core i5 3470 confidential Ivy bridge Quad Core
- Honor X8 128GB, Kártyafüggetlen, 1 Év Garanciával
- BESZÁMÍTÁS! Gigabyte B450 Aorus R7 5800X 32GB DDR4 512GB SSD RTX 4060Ti 16GB Zalman N5 MF CM 650W
- Telefon felvásárlás!! Apple Watch Series 9/Apple Watch Ultra/Apple Watch Ultra 2
Állásajánlatok
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest
Cég: CAMERA-PRO Hungary Kft.
Város: Budapest