- HiFi műszaki szemmel - sztereó hangrendszerek
- Épített vízhűtés (nem kompakt) topic
- TCL LCD és LED TV-k
- Intel Core i5 / i7 / i9 "Alder Lake-Raptor Lake/Refresh" (LGA1700)
- AMD K6-III, és minden ami RETRO - Oldschool tuning
- RAM topik
- Fujifilm X
- Fejhallgató erősítő és DAC topik
- AMD Ryzen 9 / 7 / 5 9***(X) "Zen 5" (AM5)
- Milyen asztali (teljes vagy fél-) gépet vegyek?
Új hozzászólás Aktív témák
-
#06658560
törölt tag
Én csak arról beszéltem volna, hogy nem lett volna értelmesebb, kompakt összekötése a magoknak, hogy a késleltetést alacsonyabban tartsák? Mert így egyszerre két egység tudja vizsgálni a kérést, hogy adatot kér egy harmadik, úgy meg a drótozás kérdése, mennyinek adják ki. Kisebb egységekben gyors a körbeérés, nagyobbakban meg a mostaninál nem lassabb több mag esetén sem.
Apropó: azt mi alapján lehet eldönteni, melyik megoldás éri meg jobban: az adott egység kér adatot máshonnan, vagy a másik egységnek átadja a sajátját kérés nélkül, s dolgozik tovább más szegmenssel?
-
LordX
veterán
Szerintem viszont pont össze fognak érni - szoftver oldalról a "CPU" és "GPU" mindig is különböző lesz (pont mivel másra való), még akkor is ha egy chipbe lesz (van..) integrálva, viszont mindkét 'szálon' néha-néha bejöhet egy-egy olyan utasítás, ami a másiknak kedvez jobban.
El tudok képzelni egy olyan jövőbeli APU-t, amin a CPU AVX(-szerű) utasításait GCN(-szerű) végrehajtóegységekre ütemeznek, a GPU meg kap pár bitshuffle / integer / akármi utasítást, amit a proci integer egységei hajtanak végre. Ilyen esetben már persze nem lehet azt mondani, hogy ez a rész a CPU az meg a GPU.
-
Abu85
HÁZIGAZDA
válasz
julius666 #18 üzenetére
A minőség az eléggé függ a szoftvertől is. De a GPU-k is mennek felépítésben a procis irányba. A GCN CU már úgy néz ki, mint egy RISC processzor. A CPU-k is mennek egy picit GPU-s irányba pl. AVX2. Összeérni sosem fognak, mert más szempontok alapján kell tervezni őket a hatékony működéshez, de az letagadhatatlan, hogy a logikai felépítésük egyre hasonlóbb.
-
julius666
addikt
Videó kódolásra a rengeteg compute shader nem igazán jó architektúra. A gpukba jelenleg bedrótozott gyorsítok meg energiahatékonyság szempontjából lehet hogy jók, azon túl viszont buták, túl merevek (nem skálázódnak) és minőség terén sem biztos hogy kielégítő amit kitolnak magukból (nyilván felhasználási terület kérdése).
A cikkben tárgyalt cucc viszont nem hangzik rá rossznak.
-
Abu85
HÁZIGAZDA
válasz
#06658560 #16 üzenetére
Az magok önmagukban nem foglalkoznak a másik maggal. Ha kell egy gather, akkor az kikérésre kerül, de a rendszer ezt monitorozza. Ha egy adat ép olyat akar felülírni, amit éppen kér egy másik mag, akkor előbb annak a másik magnak a kérése teljesül, majd aztán felül lesz írva.
Ahogy Andrew Richards megmondta régebben a Larrabee fejlesztésével való tapasztalatai alapján: az x86-os processzormagok nagyon mereven kezelik a memóriaműveleteket és a koherenciát. Ez logikus, mivel amikor az ISA-t tervezték pár évtizeddel ezelőtt abszolút nem is volt belekalkulálva, hogy valaha is 60 mag lesz egymás mellett. Még arra sem gondoltak, hogy kettő lesz. Az Intel azért van ezekre a trükkökre kényszerítve, mert ragaszkodnak az x86-hoz.
Ahogy láthatod az NV és az AMD GPU-it, teljesen más a tervezési norma. Az ISA-t folyamatosan az igényekhez igazítják, mert ez a hatékony működés alapja. A cacheszervezés is elképesztően más. Az Intelnél a Knights Corner egy magon belül tartalmaz egy 32 kB-os utasítás és egy 32 kB-os adat cachet, és a magokhoz tartozik 256 kB L2, ami összesen 32 MB L2 jelen esetben. A GK110 például teljesen más. Ott egy magban van egy 48 kB-os csak olvasható cache, amit kiegészít egy 64 kB-os L1, ami szétosztható háromféleképpen (16/48, 32/32, 48/16), emellett van még Az L2 összesen 1,5 MB. A Tahiti szintén más. Ott egy magban van egy 64 kB-os LDS egy 16 kB-os L1, és négy mag között meg van osztva egy 16 kB-os csak olvasható és egy 32 kB-os utasítás gyorsítótár. Az L2 pedig összesen 768 kB.
Elképesztő a kontraszt, ami az AMD/NVIDIA és az Intel között van. Teljesen más a tervezés iránya. Persze az AMD-nek és az NV-nek könnyebb, mert náluk ott az évtizedes tapasztalat, még ha az AMD ezt az ATI-val vette is. Az Intel most tanulja mit-hogyan-merre. -
#06658560
törölt tag
Ha jól értem amint egy egységnek kell valami a nem saját memóriából, akkor kiküldi mindkét irányba a kérést, amit a szomszédjai megvizsgálnak, majd ha nincs náluk továbbküldik. Egész addig, amíg valaki nem visít, hogy megvan, küldöm. Az vagy mindkét irányba küldi, vagy azon irányba, amerről előbb érkezett neki a kérés, a másik irányba meg egy nulljelet esetleg. Nem érné meg faszerkezetben kivitelezni a kapcsolatokat? A klasszikus tervezzünk kutatóbázis alapon a maximális út rövidebb lenne. Miért nem azt választották?
-
válasz
lionhearted #14 üzenetére
Hát még neked
Bocsi, de nem hagyhattam ki
-
-
-
onereborn
tag
Egy mezei Sandy Bridge rendszerben is futhat vagy csak xeon cpukkal fog együttműködni.
Ez még sehol sem jött le.Mert az AMD és az nVIDIA a GPGPU számítást nem csak nagyvállalati környezetre fejleszti - természetesen abban a kategóriában több szolgáltatás található, mint egy mezei otthoni számítógépnél.
-
Abu85
HÁZIGAZDA
Nem kell ide csicsa a lényeg látszik.
Inkább az AMD gyűrűse. A HUB-os más. A gyűrűst a magas késleltetés miatt lecserélték. Ez egyébként itt is probléma volt a Knights Ferry-vel. Ezért osztották négy blokkra a rendszert. Bár mindegyik mag elérheti az összes memóriavezérlőt, de törekednek arra, hogy a legközelebbit használják. Mire 25-30 megállón átmegy az adat az 25-30 órajel. Persze ez a négy szál miatt annyira nem nagy gond itt, de majd a Skylake-ben gázos lesz, mert ott a procimagok igen érzékenyek arra, hogy mennyit késik az adat, és ez a gyűrűs busz általános átka.
Azokat nem ismerem, de hasonló lehet, mint a DGEMM. A DGEMM azért terjed, mert az Intel szerint ez a mérvadó. Az AMD és az NV szerint ez csak egy adat, ahogy a többi is, és nem szabad belőle általánosítani.
-
MongolZ
addikt
Az Intel gyakornokai szép kis képeket dobtak össze Paintben az előadást megelőző éjszaka
Nekem egyből az AMD hubos megoldása jutott eszembe a diagramról. Jók a megérzéseim?
Valamiért nem hiszem, hogy az Intel (első körben) komoly alternatíva lehet az AMD és az nV számára. Technikailag. Az üzletpolitikájukat ismerve pedig nagy jövőt jósolok neki.
Egyébként S/C/ZGEMM hatékonyság ismert (C és Z mennyire releváns)?
-
LordX
veterán
Kíváncsi lennék egy GCN - MIC - Kepler összehasonlításra, compute irányból.
-
válasz
lionhearted #2 üzenetére
Okok, ezért (is) gyorsítókártya
De van egy két dolog, ahol párhuzamos számításokra lehet szükség.
Lesz-e mainstream kategóriában is szerepe, vagy csak nagyvállalati eszközként tekintsünk rá? -
-
Gyorsítókártya lesz, ez rendben, de mit fog tudni gyorsítani?
Új hozzászólás Aktív témák
ph A Knights Corner kódnevű fejlesztés jelentős változásokat is bevet az eredeti koncepcióhoz képest.
- AKCIÓ!!! GAMER PC: Új RYZEN 7 5700/5800X +RX 6800 16GB GDDR6 +Új 16-32GB DDR4! GARANCIA/SZÁMLA!
- HP ProDesk 600 G4 SFF PC, 8. generációs i3 Quad Gore CPU
- AKCIÓ!!! GAMER PC: Új i5-14400F (10 mag/16 szál) + RX 6800 16GB GDDR6 + Új 16-32GB DDR4! GAR/SZÁMLA!
- Asztali Számitógép/Intel Core i7-11700/AMD RX 6600-XT/
- BESZÁMÍTÁS! MSI B450M R5 5500 16GB DDR4 512GB SSD GTX 1070 8GB Rampage SHIVA Kolink KL 500W
- ÁRGARANCIA!Épített KomPhone Ryzen 5 4500 16/32/64GB RAM RX 6600 8GB GAMER PC termékbeszámítással
- LG 65" C1 OLED - 4K 120Hz 1ms - NVIDIA G-Sync - FreeSync Premium - HDMI 2.1 - PS5 és Xbox Ready!
- Logitech G513 - 5.000Ft (apró hibás)
- Motorola E40 64GB, Kártyafüggetlen, 1 Év Garanciával
- Csere-Beszámítás! Huawei Matebook D15 R7 3700U / 8GB DDR4 / RX Vega 10 / 150GB SSD
Állásajánlatok
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest
Cég: Laptopszaki Kft.
Város: Budapest