- Igencsak szerény méretekkel rendelkezik az Aetina Xe HPG architektúrás VGA-ja
- Miniképernyős, VIA-s Epomaker billentyűzet jött a kábelmentes szegmensbe
- Különösen rendezett beltér hozható össze a Cooler Master új házában
- A középkorra és a pokolra is gondolt az új AMD Software
- Új gyártástechnológiai útitervvel állt elő a TSMC
Hirdetés
-
Mozgásban az Arena Breakout: Infinite (PC)
gp A korábban csak mobilokra/tabletekre megjelent FPS hamarosan PC-n is elérhető lesz.
-
Érkezőben a Poco M6 4G
ma 5G-s és 4G-s Pro modell már van, hamarosan lesz Poco M6 4G-s alapváltozat is.
-
AMD Radeon undervolt/overclock
lo Minden egy hideg, téli estén kezdődött, mikor rájöttem, hogy már kicsit kevés az RTX2060...
Új hozzászólás Aktív témák
-
addikt
Gyorsítókártya lesz, ez rendben, de mit fog tudni gyorsítani?
A kicsire nem adunk... a nagyot meg leszarjuk!
-
őstag
-
addikt
válasz lionhearted #2 üzenetére
Okok, ezért (is) gyorsítókártya
De van egy két dolog, ahol párhuzamos számításokra lehet szükség.
Lesz-e mainstream kategóriában is szerepe, vagy csak nagyvállalati eszközként tekintsünk rá?A kicsire nem adunk... a nagyot meg leszarjuk!
-
LordX
veterán
Kíváncsi lennék egy GCN - MIC - Kepler összehasonlításra, compute irányból.
-
MongolZ
addikt
Az Intel gyakornokai szép kis képeket dobtak össze Paintben az előadást megelőző éjszaka
Nekem egyből az AMD hubos megoldása jutott eszembe a diagramról. Jók a megérzéseim?
Valamiért nem hiszem, hogy az Intel (első körben) komoly alternatíva lehet az AMD és az nV számára. Technikailag. Az üzletpolitikájukat ismerve pedig nagy jövőt jósolok neki.
Egyébként S/C/ZGEMM hatékonyság ismert (C és Z mennyire releváns)?
[ Szerkesztve ]
-
Abu85
HÁZIGAZDA
Nem kell ide csicsa a lényeg látszik.
Inkább az AMD gyűrűse. A HUB-os más. A gyűrűst a magas késleltetés miatt lecserélték. Ez egyébként itt is probléma volt a Knights Ferry-vel. Ezért osztották négy blokkra a rendszert. Bár mindegyik mag elérheti az összes memóriavezérlőt, de törekednek arra, hogy a legközelebbit használják. Mire 25-30 megállón átmegy az adat az 25-30 órajel. Persze ez a négy szál miatt annyira nem nagy gond itt, de majd a Skylake-ben gázos lesz, mert ott a procimagok igen érzékenyek arra, hogy mennyit késik az adat, és ez a gyűrűs busz általános átka.
Azokat nem ismerem, de hasonló lehet, mint a DGEMM. A DGEMM azért terjed, mert az Intel szerint ez a mérvadó. Az AMD és az NV szerint ez csak egy adat, ahogy a többi is, és nem szabad belőle általánosítani.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
onereborn
tag
Egy mezei Sandy Bridge rendszerben is futhat vagy csak xeon cpukkal fog együttműködni.
Ez még sehol sem jött le.Mert az AMD és az nVIDIA a GPGPU számítást nem csak nagyvállalati környezetre fejleszti - természetesen abban a kategóriában több szolgáltatás található, mint egy mezei otthoni számítógépnél.
-
Abu85
HÁZIGAZDA
válasz onereborn #12 üzenetére
Tulajdonképpen a Xeon Phi-nek a host processzor mindegy. Ha van a gépben egy PCI Express slot, amibe belerakható, és az OS support is megoldott, akkor nincs akadálya a működésnek. Ha van 5000-8000 dollárod, akkor akár otthonra is lehet venni egyet.
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
őstag
-
addikt
válasz lionhearted #14 üzenetére
Hát még neked
Bocsi, de nem hagyhattam ki
A kicsire nem adunk... a nagyot meg leszarjuk!
-
#06658560
törölt tag
Ha jól értem amint egy egységnek kell valami a nem saját memóriából, akkor kiküldi mindkét irányba a kérést, amit a szomszédjai megvizsgálnak, majd ha nincs náluk továbbküldik. Egész addig, amíg valaki nem visít, hogy megvan, küldöm. Az vagy mindkét irányba küldi, vagy azon irányba, amerről előbb érkezett neki a kérés, a másik irányba meg egy nulljelet esetleg. Nem érné meg faszerkezetben kivitelezni a kapcsolatokat? A klasszikus tervezzünk kutatóbázis alapon a maximális út rövidebb lenne. Miért nem azt választották?
-
Abu85
HÁZIGAZDA
válasz #06658560 #16 üzenetére
Az magok önmagukban nem foglalkoznak a másik maggal. Ha kell egy gather, akkor az kikérésre kerül, de a rendszer ezt monitorozza. Ha egy adat ép olyat akar felülírni, amit éppen kér egy másik mag, akkor előbb annak a másik magnak a kérése teljesül, majd aztán felül lesz írva.
Ahogy Andrew Richards megmondta régebben a Larrabee fejlesztésével való tapasztalatai alapján: az x86-os processzormagok nagyon mereven kezelik a memóriaműveleteket és a koherenciát. Ez logikus, mivel amikor az ISA-t tervezték pár évtizeddel ezelőtt abszolút nem is volt belekalkulálva, hogy valaha is 60 mag lesz egymás mellett. Még arra sem gondoltak, hogy kettő lesz. Az Intel azért van ezekre a trükkökre kényszerítve, mert ragaszkodnak az x86-hoz.
Ahogy láthatod az NV és az AMD GPU-it, teljesen más a tervezési norma. Az ISA-t folyamatosan az igényekhez igazítják, mert ez a hatékony működés alapja. A cacheszervezés is elképesztően más. Az Intelnél a Knights Corner egy magon belül tartalmaz egy 32 kB-os utasítás és egy 32 kB-os adat cachet, és a magokhoz tartozik 256 kB L2, ami összesen 32 MB L2 jelen esetben. A GK110 például teljesen más. Ott egy magban van egy 48 kB-os csak olvasható cache, amit kiegészít egy 64 kB-os L1, ami szétosztható háromféleképpen (16/48, 32/32, 48/16), emellett van még Az L2 összesen 1,5 MB. A Tahiti szintén más. Ott egy magban van egy 64 kB-os LDS egy 16 kB-os L1, és négy mag között meg van osztva egy 16 kB-os csak olvasható és egy 32 kB-os utasítás gyorsítótár. Az L2 pedig összesen 768 kB.
Elképesztő a kontraszt, ami az AMD/NVIDIA és az Intel között van. Teljesen más a tervezés iránya. Persze az AMD-nek és az NV-nek könnyebb, mert náluk ott az évtizedes tapasztalat, még ha az AMD ezt az ATI-val vette is. Az Intel most tanulja mit-hogyan-merre.Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
julius666
addikt
Videó kódolásra a rengeteg compute shader nem igazán jó architektúra. A gpukba jelenleg bedrótozott gyorsítok meg energiahatékonyság szempontjából lehet hogy jók, azon túl viszont buták, túl merevek (nem skálázódnak) és minőség terén sem biztos hogy kielégítő amit kitolnak magukból (nyilván felhasználási terület kérdése).
A cikkben tárgyalt cucc viszont nem hangzik rá rossznak.
-
Abu85
HÁZIGAZDA
válasz julius666 #18 üzenetére
A minőség az eléggé függ a szoftvertől is. De a GPU-k is mennek felépítésben a procis irányba. A GCN CU már úgy néz ki, mint egy RISC processzor. A CPU-k is mennek egy picit GPU-s irányba pl. AVX2. Összeérni sosem fognak, mert más szempontok alapján kell tervezni őket a hatékony működéshez, de az letagadhatatlan, hogy a logikai felépítésük egyre hasonlóbb.
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
LordX
veterán
Szerintem viszont pont össze fognak érni - szoftver oldalról a "CPU" és "GPU" mindig is különböző lesz (pont mivel másra való), még akkor is ha egy chipbe lesz (van..) integrálva, viszont mindkét 'szálon' néha-néha bejöhet egy-egy olyan utasítás, ami a másiknak kedvez jobban.
El tudok képzelni egy olyan jövőbeli APU-t, amin a CPU AVX(-szerű) utasításait GCN(-szerű) végrehajtóegységekre ütemeznek, a GPU meg kap pár bitshuffle / integer / akármi utasítást, amit a proci integer egységei hajtanak végre. Ilyen esetben már persze nem lehet azt mondani, hogy ez a rész a CPU az meg a GPU.
[ Szerkesztve ]
-
#06658560
törölt tag
Én csak arról beszéltem volna, hogy nem lett volna értelmesebb, kompakt összekötése a magoknak, hogy a késleltetést alacsonyabban tartsák? Mert így egyszerre két egység tudja vizsgálni a kérést, hogy adatot kér egy harmadik, úgy meg a drótozás kérdése, mennyinek adják ki. Kisebb egységekben gyors a körbeérés, nagyobbakban meg a mostaninál nem lassabb több mag esetén sem.
Apropó: azt mi alapján lehet eldönteni, melyik megoldás éri meg jobban: az adott egység kér adatot máshonnan, vagy a másik egységnek átadja a sajátját kérés nélkül, s dolgozik tovább más szegmenssel?
Új hozzászólás Aktív témák
- Beszámítás! GB H610M i5 13400F 32GB DDR4 1TB SSD RTX 3070Ti 8GB MONTECH AIR 1000 Lite Corsair 650W
- Beszámítás! GB H610M i5 13400F 16GB DDR4 250GB SSD RTX 3070Ti 8GB MONTECH AIR 100 Lite Chieftec 700W
- Beszámítás! ASRock H510M i7 10700F 16GB DDR4 500GB SSD RTX 3070 8GB Rampage Shiva Seasonic 650W
- Beszámítás! ASRock H310CM i5 9400 16GB DDR4 240GB SSD RTX 2070 8GB Rampage Shiva ZALMAN 500W
- Beszámítás! ASRock H310CM i5 9400F 16GB DDR4 250GB SSD GTX 1660 Super 6GB ZALMAN S2 TG ZALMAN 500W