- NVIDIA GeForce RTX 4060 / 4070 S/Ti/TiS (AD104/103)
- AMD vs. INTEL vs. NVIDIA
- Fujifilm X
- Gaming notebook topik
- AMD Navi Radeon™ RX 9xxx sorozat
- Kormányok / autós szimulátorok topikja
- NVIDIA GeForce RTX 5080 / 5090 (GB203 / 202)
- 3D nyomtatás
- AMD K6-III, és minden ami RETRO - Oldschool tuning
- Milyen videókártyát?
Új hozzászólás Aktív témák
-
Taragas
aktív tag
Hát akkor lehet temetni a diszkért piacot. Pedig volt benne lehetőség, hogy APU+dVGAval alkossanak... De ezt már nem fogjuk megérni. Ezek után nem csodálkoznék, ha bejelentenék, hogy nem lesz dual graphics támogatás a trinitynél sem már, mert minek.(főleg ilyen átnevezett 6670-el
). Bocsi az offért, de egyre jobban kezdek csalódni az egészben.
-
huskydog17
addikt
Elnézést az értetlenkedésért, de a dVGA-k esetében miért nincs értelme? Sokkal több kakaó van bennük? Esetleg a PCI-E busz miatt keletkező nagy késleltetés a hátráltató tényező? (Csakhogy tiszta legyen a kép.)
Elméletben a dVGA-knál is lehetne hozni ugyanazt a sebességet, mint az integrált termékek esetében? -
huskydog17
addikt
Köszi a kiegészítést!
A diszkrét VGA- közül akkor tehát az Evergreen szériától (AMD oldalon) felfelé már gond nélkül mennének a HSA alkalmazások, csak lassan ha jól értem. Milyen hardver szükségeltetik ahhoz, hogy a HSA-ban (pl. BOLT) megírt alkalmazások a full speed-en menjenek? Itt említetted, hogy a Llano esetében hiányzik egy úgynevezett MMU. Ez pontosan mit takar és mekkora sebességvesztéssel jár?
-
huskydog17
addikt
Az már világos, hogy a Java-hoz hasonlítható leginkább. A Java RE azonban minden CPU-n gond nélkül megy. A HSA is ilyen lesz vagy ehhez lesz valami spéci hardverkövetelmény? Az eddigi infók alapján nekem az jön le, hogy a HSA működéséhez az OpenCL API teljes körű támogatása elengedhetetlen. Tehát a HSA-nál a CPU továbbra is mindegy, de mellé kell egy OpenCL-t támogató VGA/IGP?
A táblázatból több minden van, ami nem világos. Például:
A Serial CPU gondolom a hagyományos CPU módot takarja, vagyis itt kizárólag a CPU számol. Mellette a következő két oszlop neve sem mond semmit. Az OpenCL-nél az első változatnál a -C kapcsoló mit jelöl?
Ha jól értelmezem a grafikont, akkor az OpenCL -C a leggyorsabb mód, de a HSA Bolt esetében több lépcső kimarad, gondolom innen a sebességlöket. -
DRB
senior tag
Azt hogy API csak úgy általánosságban értettem(vagy valami ilyesmi
), pl, mint hogy egy program nem fér közvetlenül a hardverhez(GPU-hoz, CPU-hoz, stb) hanem "valamin" keresztül(nem a driver), pl dx, vagy .net, vagy mitom' én még mi. Ilyen értelemben ez is így működik? Ha jól veszem ki a válaszod igen, de mondom nem vagyok programozó, így ha kérhetnék kicsit még hétköznapibb megfogalmazást, csak az fog megvilágosítani.
-
lenox
veterán
Amugy akkor szerintem az lehet a megfejtes, hogy ha egyseges cimter van, akkor ahhoz kepest jobb a teljesitmeny, mintha nem hasznalnak a gpu gyorsitast, mivel akkor tobb projektnel eri meg gpu gyorsitast alkalmazni.
Olyan szempontbol nem lenyegtelen, hogy ez az aktualis technika, ami gyorsan valtozik, szoval azert, mert 2 evvel ezelott valaki mondott valamit, aminek alatamasztasara csinalt egy merest, az ma mar egy masik allitas, vagy hasonlo, de mas kornyezetben megfogalmazodo allitas alatamasztasara nem biztos, hogy alkalmas. Egyebkent azt a reszt azert gondolom vetted, hogy rakhatsz a pcie buszra dugott gpu memoriajara is egyseges cimteret, attol gyorsabb nem lesz, igy ez a ket dolog, nevezetesen az egyseges cimter es hogy pcie buszra kell-e dugni az accelerator kartyat teljesen fuggetlen dolog, tehat az egyikre hivatkozni, hogy a masikra vonatkozo allitast tamasszunk ala, ez teljesen ertelmetlen.
Amugy visszaterve az elozo peldara, 2 evvel ezelott opencl-lel olyan 1.5-2 GB/sec koruli effektiv mem-gpu mem bandwidth-t lehetett elerni, es egy dual proc workstation-ben olyan 9-10 GB/sec effektiv memory bandwidth-t, kb ilyen arany latszik a linkelt grafikonon. Jelenleg egy Z800 workstationben kb. 5.5-6 GB/sec mem-gpu mem bandwidth-t lehet elerni, meg mindig 9-10 GB/sec memory bandwidth mellett, szoval a bottleneck joval kisebb, mint amit a grafikon mutat. A PCIE3-at meg nem mertem ki, de elvileg kb. duplazodik a sebesseg. A mem bandwidth pedig olvasasra 15 GB/sec, irasra 6 GB/sec dual proc SB-nel, szoval amig ez a problema meg nem javul, addig bizonyos esetekben egal, mas esetekben pedig 30% a performance hit a PCIE busznal, ha megjavul, akkor gondolom allando 30% lesz. De ez mar regen nem az, mint a kezdeti 2 vs 10. Persze latency meg mindig van, ami alkalmazastol fuggoen vagy erdekes, vagy nem, amiket en csinalok, azoknal foleg nem, az Adobe-nal is foleg nem.
Az egyseges cimter, meg koherens memoria meg killer feature, de nem teljesitmeny szempontjabol, illetve csak ugy teljesitmeny szempontjabol, hogy olyanok is hasznalnak altala gpu gyorsitast, akik amugy nem tennek.
Kivancsi leszek a stacked memory-ra, de nekem valahogy nagyon nehezen elkepzelhetonek tunik, hogy 64 MB cache-t csinaljon valaki, pedig az mar nagyon-nagyon minimum.dezz: Kivancsi leszek, ha igy lesz, akkor szuper lesz, de nekem hirtelen nem jut eszembe jobb otlet, minthogy cache-sel lehet ezt ertelmesen megcsinalni, akkor meg a cache mennyisege hatarolja be a jol megoldhato feladatokat.
-
lenox
veterán
Ok, en ezt mashol mas mondatokkal latom, meg ahol ez a mondat van, ott vesszo van a performance es a portability kozott, szoval szerintem 'performance portability' egyutt nincs.
Amugy akkor ez egy tevedes. A memcached key lookup nyilvan akkor mukodne jol diszkret gpu-n, ha nem kell odatranszferalni, nem tudom ki csinalta a grafikont, de ennek igy semmi ertelme sincs, meg 5870, az mikor volt mar?
A kovetkezo lepes nem a chipre integralt gyors memoria lesz? Ahhoz gondolod, hogy pcie buszon fog menni az adat a main memorybol? Szerintem erdemes tul latni a marketinganyagon. A pcie busz okozta bottlenecknek nem az egyseges cimter a megoldasa, azt pcie busszal is meg lehet oldani, es majd csodalkoznal, hogy hol gyors, hol meg lassu a programod, annak megfeleloen, hogy hova tudtad foglalni a buffered. Ujra el lehet vitatkozni ezen, de az teny marad, hogy gyors memoriat csak megfelelo meretu cache-sel lehet valamennyire kivaltani, ami draga, ugyhogy nem valoszinu, hogy elterjed. Ha pedig van gyors memoria, akkor azt megkulonboztetve kell kezelni a lassutol, legalabbis ha performance-t akar az ember. Ha portability fontosabb, akkor persze lehet egyseges.
Új hozzászólás Aktív témák
Hirdetés
ph Az 1.0 draft specifikációk elkészültek, így létrejött a HSA alapítvány is, amelybe több cég is belépett.
- NVIDIA GeForce RTX 4060 / 4070 S/Ti/TiS (AD104/103)
- Nintendo Switch 2
- AMD vs. INTEL vs. NVIDIA
- iPhone 16e - ellenvetésem lenne
- Futás, futópályák
- Kerékpárosok, bringások ide!
- Android alkalmazások - szoftver kibeszélő topik
- Samsung Galaxy S21 FE 5G - utóirat
- Óvodások homokozója
- Samsung Galaxy A56 - megbízható középszerűség
- További aktív témák...
- LG 27GN800P - 27" IPS - 2560x1440 - 144 hz 1ms - NVIDIA G-Sync - AMD FreeSync - HDR 10
- Külföldi csomagszállítás Packeta csomagpontokon keresztül!
- Csere-Beszámítás! Asus Tuf Gamer laptop! R5 3550H / GTX 1650 / 8GB DDR4 / 500GB SSD
- DDR5 8/ 16/ 32GB 4800-5600MHz SODIMM laptop RAM, több db- számla, garancia
- Telefon felváráslás!! Xiaomi 13T, Xiaomi 13T Pro, Xiaomi 14T, Xiaomi 14T Pro
Állásajánlatok
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest