- Minimalista külsejű, combosnak tűnő léghűtést tol ki a gyárkapun a Cooler Master
- Bizonyos ASUS alaplapok megrongálhatják a videokártyánkat
- A következő években válaszolna az Intel az AMD-féle 3D V-Cache-re
- Az Final Fantasy-re fókuszál a friss Arc meghajtó
- Méri még a legforróbb pontot az új GeForce generáció
- Gyorsan Snapdragonnal: Acer Swift 14 AI tapasztalatok
- Vezetékes FEJhallgatók
- TCL LCD és LED TV-k
- Apple notebookok
- Akciókamerák
- A hivatalos árnál jóval többe kerülhetnek az új GeForce-ok
- Milyen asztali médialejátszót?
- NVIDIA GeForce RTX 4080 /4080S / 4090 (AD103 / 102)
- NVIDIA GeForce RTX 5080 / 5090 (GB203 / 202)
- Mini-ITX
Új hozzászólás Aktív témák
-
Abu85
HÁZIGAZDA
válasz szabi80sz #16 üzenetére
Az a baj, hogy egy külső buszra alapozni nagyon nem jó, mert a külső fizikai összeköttetés mindig lassú. Nem is a throughputban kapod a nagy büntit, hanem a késleltetésben. A fejlesztőknek figyelni kell arra, hogy a PCI Expressnek komoly határai vannak. Persze a GPU általi x86 virtuális memória támogatásának még ennél is nagyobb határa, hogy egyelőre nem támogatja egyetlen OS sem. A Win 8 lesz valamennyire erre felkészítve. 2012-ben nem sok esélyt látok, hogy ebből a konzumer szint profitáljon. 2013-ban is csak elvétve. 2014-ben már beindulhat a nagyüzem, és a PCI Express sem jelent hátrányt, mert az NV és az AMD is komoly integráláson dolgozik. Ezzel a CPU és a GPU rész lapkán belül kommunikál, ami minden külső linknél jelentősen gyorsabb. Ha minden jól megy, akkor 2015-re a Skylake-kel csatlakozik a bulihoz az Intel is, és az ARM is hasonló elképzeléssel fejleszt.
[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
dezz
nagyúr
válasz szabi80sz #12 üzenetére
1.a.: Ha 5ms az egész, azt eleve nem érdemes GPU-ra ültetni... Hacsak nem sokszor fog lefutni, de akkor meg nem kell minden alkalommal fordítás, ami itt a lassú. Az egyes műveletek előtti inicializálás ehhez képest kvázi elhanyagolható. Nem tudom, mi ebben a butaság... Ha mégis úgy gondolod, írd le légyszi, miért.
1.b.: Nem lehet, hogy valamit rosszul csináltál, hogy lassabb FirePron, mint Ionon?
2.: Nem, maga az OpenCL-es számítások. Itt vannak pl. lenox OpenCL-es programjai. 1 mp-en belül megy is a ray-trace, stb. Ja, és teljesen jól fut mindkét platformon. Néztem az SDK programocskáit is, illetve az Nvidia programjait is, hasonló a helyzet.
4. Ha kimondottan DP-re van szükség, ami speciális esetekben fordul elő (a hétköznapokban csak pl. mandelbrotnál jött volna jól nagyobb zoomokhoz), amúgy is érdemes megfelelő kártyát használni. Ha máshonnan ollózol át kódot, amiben van double, de nincs rá igazán szükség, le lehet cserélni floatra.
5. Jó, akkor mondjuk úgy, hogy gyártó-függő. Csak Nvidia hw-en működik. (A platform-függetlenbe általában beleértik a gyártó- és hw-függetlenséget is.)
+1: Ez nem feltétlen igaz. Pl. lenox Nvidián írt kódjai is teljesen jól futnak Radeonon is, különösebb időráfordítás nélkül.
Ezt írta erről: "Ionon es firepro-n nem probaltam, nekem eddig ugy altalaban futottak mindenhol, beleertve intel procit es fusion aput az nv (geforce, quadro, tesla) es amd (radeon) videokartyak mellett. Probaltam az amd sdk-val is es az nv sdk-val is, eddig nem jott ki kulonbseg. Illetve olyan kulonbseg azert volt, hogy a work itemeket az nv driver mindig szepen kiosztotta, az amd meg neha elbaszta, ugyhogy azt explicite be kellett allitani, hogy multiprocesszoronkent mennyi thread legyen, es ugy mar ment mindketton."
Ja, és 7.: a rekurzió amúgy is lassú, bár nyilván kényelmes."X+: A PCI-E 3 rengeteget gyorsítana a rendszeren (még akkor is, ha nem függ a virtuális memória tőle)"
Gyorsít, de közel sem annyit (legalábbis latencyben), mint amikor egymás mellett van a CPU és a GPU, tehát a PCIe teljesen kimarad és csak egy memcopy az egész. Nem beszélve arról, amikor erre sem lesz szükség.
"márpedig az Amd nem nagyon foglalkozik a PCI-E 3-mal.."
Nem-e? A GCN támogatja. A jövőre megjelenő Sepang és Terramar CPU-k is támogatják. Igaz, ezek Opteronok, de aki ugye "komolyan gondolja", annak belefér. Arról az AMD egyelőre nem beszél, hogy a Trinity támogatja-e, de ha a Sepang és a Terramar igen, akkor ez miért ne tenné? Az AM3+ marad 2.0 (2.1?). (Az eredeti tervek szerint ennek is átvette volna a helyét az FM2. Bár nincs kizárva, hogy 2012H2-ben erre is kijön egy 4+ modulos Piledriver, amikor az AM3+ már a végét járja).
[ Szerkesztve ]
-
dezz
nagyúr
Egyelőre csak néhány ponthoz szólnék hozzá.
1.: na ja, a 0 ms-nél minden lassabb, de egy kicsit kevés az adat. Hány ms a lényegi kód és mennyi az OpenCL inicializálás? De végülis mindegy is, nem olyan feladatokat szoktak OpenCL-be ültetni, amiknél az utóbbi több, mint az előbbi...
És miért pont Ion? Szerintem egy CPU is gyorsabb annál, vagy nem?
2.: Érdekes, találkoztam pár OpenCL alapú programmal (mármint nem pár soros), amik 1 mp-en belül indulnak. Hacsak nem néhány mp az egész művelet, ez nem gond...
4., DP: ha fut is valahogy, nem megoldás...
5.: Meg azért, mert az OpenCL platformfüggetlen! (A PCIe-s dologra Abu már reagált.)
6.: Ez mondjuk nem csoda...[ Szerkesztve ]
-
Abu85
HÁZIGAZDA
Nem kell a virtuális memóriához PCI Express 3.0. Jó az 1.0 is akár, csak nem gyors. A Keplernek I/O virtualizáció kell, mert az NV nem rendelkezik x86 licencel.
Az AMD GCN is támogatja a virtuális memóriát:[ Szerkesztve ]
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
Új hozzászólás Aktív témák
Állásajánlatok
Cég: Marketing Budget
Város: Budapest