Keresés: - [Re:] Az NVIDIA lát fantáziát a HPC-specifikus lapkákban?

Hirdetés

Legfrissebb anyagok

PROHARDVER! témák

Mobilarena témák

IT café témák

GAMEPOD témák

LOGOUT témák

Keresés

Új hozzászólás Aktív témák

#31 namaste tag Abu85 #30

Új Válasz 2015-11-27 20:35:43 #31
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

namaste

tag

válasz Abu85 #30 üzenetére

A virtuális ISA-nak az a célja, hogy minél általánosabb, hordozhatóbb legyen, ne kötődjön a hardverhez.
Az egyeztetésen csak a hardver ISA-ban kell megegyezniük, a szoftvereseknek tudniuk kell a fordító optimalizáláshoz mennyi órajel alatt, milyen késleltetéssel hajt végre egy-egy utasítást. Nem hiszem, hogy a szoftveresek megmondják, mennyi tranzisztorból legyen az ALU, vagy a hardveresek megmondják mi legyen a PTX-ben, a fordító hogyan fordítson natív kódra.
A tranzisztorok 3.37%-a miatt nagy a fogyasztás?
Amúgy a Fiji nem jó példa, mert az energiahatékonysága a Maxwellhez hasonló. Ebben benne van a HBM, vagy a Nano órajel és feszültség visszavétele is.
#29 namaste tag Abu85 #28

Új Válasz 2015-11-26 19:51:50 #29
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

namaste

tag

válasz Abu85 #28 üzenetére

És ezt te így eldöntöd? Majd a piac eldönti kell-e neki. Persze 1:2 jó lenne, 1:3 elmegy, 1:4 hááát, 1:8 mivan?, 1:32 képfeldolgozásra, neurális hálózatra, játékra jó lesz.
Ez csak egy példa volt egy FP64-es utasításra. Vannak olyan utasítások amit egy az egyben lehet fordítani natív kódra, és vannak amelyeket nem. Ha egy újabb hardver újabb utasításokat hoz és nincs rá PTX utasítás, akkor az azt jelenti, hogy a PTX nem korlátozza a mikroarchitektúrát. A hardver mérnökök szabadon* alakíthatják az utasításkészletet, a GPU felépítését, a szoftveresek eldöntik lesz új PTX utasítás a következő verzióban vagy nem és megírják hozzá a fordítót.
* Inkább egyeztetve és kompromisszumokat kötve az igények (piac), a technikai lehetőségek figyelembevételével.
Az a komplex ütemezés, ami
- viszonylag kevés tranzisztor igényel,
- nem is használják DX11-ben
és emiatt sokat fogyaszt a GPU ... Hát, nem is tudom ...
A nagy fogyasztást inkább rá lehet fogni azokra a részekre, amelyek működnek is: CU/ALU, TMU, ROP, belső busz, cache, memóriavezérlő.
#26 namaste tag Abu85 #25

Új Válasz 2015-11-25 18:19:43 #26
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

namaste

tag

válasz Abu85 #25 üzenetére

Jó, de ez nem jelenti azt, hogy "Az NV nem tervez DP-re". Ezt akkor lehetne mondani, ha a Pascalt is csak 1/32 FP64 : FP32 aránnyal hozná ki.
A driver egy "fma.f64 d, a, b, c" PTX utasításból egy "fma.f64 r0, r1, r2, r3" natív utasítást fordít. Ennek mi köze van ahhoz, hogy milyen a mikroarchitektúra? Ezt az utasítást a hardver végrehajthatja dedikált FP64 ALU-n, vagy multiprecíziós ALU-n.
Ez magyarázhatja a GCN magas fogyasztását. Persze hogy elölről kezdték a tervezést, mert kukázták a VLIW architektúrát.
#19 #06658560 törölt tag Abu85 #16

Új Válasz 2015-11-24 18:18:00 #19
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#06658560

törölt tag

válasz Abu85 #16 üzenetére

Megint nehezen megy a gondolkodás: logikailag abból, hogy X teljesítményre képes a Radeon, hol következik, hogy az eladásoknak n-szeresére kellett nőniük?
#18: Figyelembe véve a trendeket a Top500.org adatai alapján, az NV mintha nagyon dominálna. Az a szumma 0,6% gyorsító részesedés júniushoz mérten csökkent, nem igazán azt mutatja, hogy hú de sikeres lett a piac körében.
#17 Fiery veterán Abu85 #16

Új Válasz 2015-11-24 17:53:09 #17
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz Abu85 #16 üzenetére

... vagy maradsz a Teslanal, mert mar van kesz CUDA-s szoftvered Az elet nem olyan fekete-feher, mint amilyennek lefested. Ez nem ugy mukodik, hogy ha pont ekkora energia keretben pont ilyen teljesitmeny kell, akkor csak megveszed a vasat es orulsz neki. Barcsak igy lenne. De ez nem egy videokartya, hanem egy HPC gyorsito. Ezen (FirePro) nem fut el akarmi, mint egy videokartyan egy tetszoleges D3D/OpenGL jatek. Me'g egy meglevo OpenCL kod sem feltetlenul fog futni vagy eleg jol futni egy FirePron, a Hipify meg hasonlo slideware pedig erosen a jovo zeneje.
#15 #06658560 törölt tag Abu85 #14

Új Válasz 2015-11-24 17:40:10 #15
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#06658560

törölt tag

válasz Abu85 #14 üzenetére

"Számok nincsenek, csak annyi, hogy tízszeresére nőttek az eladások egy év alatt. De ez logikus, mert csak a FirePro S9150 és S9170 képes 2,5 TFLOPS-is DP-re"
És a kettő milyen logikai kapcsolatban van egymással?
#13 Fiery veterán Abu85 #11

Új Válasz 2015-11-24 17:11:54 #13
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz Abu85 #11 üzenetére

"Azért a FirePro S9150/S9170 eléggé sikeres lett"
Mihez kepest? Es valojaban ez mit jelent? Urban legend, vagy vannak eladasi szamok is a birtokodban, mindket gyartotol (AMD, nVIDIA) ?
"Sosem adtak el még annyit FirePro gyorsítót, mint mostanában"
Ha jol tudom, nem olyan reg me'g nagyjabol 0-t adtak el, legalabbis ha a "FirePro gyorsito" kifejezest nem a workstation FirePro-kra ertjuk, hanem a kifejezetten HPC kartyakra. Ahhoz kepest 2x vagy 5x annyit eladni valojaban mennyire szep teljesitmeny? Nagyon nem mindegy, hogy 10% piaci reszesedesrol lep valaki 50%-ra, vagy 0,1%-rol 0,5%-ra. Es egyebkent is, mennyi az annyi? Hany db kelt el?
"addig az AMD 7-8 TFLOPS-ot céloz DP-ben ugyanakkora TDP kereten belül."
Celozni mindig is tudtak, sosem a slideware volt a gyengeseguk. Varjuk ki, hogy mikorra keszulnek el egy 7+ DP TFLOPS gyorsitoval, es addigra mi lesz a konkurencia. Ja, es kene egy API is, amivel meg lehet hajtani rendesen a cuccot. Megjegyzem, akarmennyire is kifejezetten a HPC piacra tervezi a gyorsitojat az AMD, nem tartom realisnak 2x nagyobb teljesitmeny/fogyasztas mutato elereset a Pascal alapu Teslakhoz kepest, csupan azert, mert kivagjak a GPU-bol a HPC piacon ertektelen reszeket.
"Nyilván az NV most úgy van vele, hogy nulláról újratervezni nem lenne ideális az egész hardvert"
Igen, mert az nVIDIA-nal tudnak szamolni, es ismerik a piaci viszonyokat Nem pedig igernek egy hatalmas maszlagot, es utana jon a szokasos kesoi piaci debutalas es -- az igeretekhez kepest -- harmatos termek.
"Egy 7 TFLOPS DP-s FirePro portolás szükségessége nélkül simán váltópont"
Eloszor nezzuk meg azt a konkret termeket, ami tenyleg 2x nagyobb DP teljesitmenyt nyujt, mint a legdurvabb Tesla ill. Xeon Phi.
#12 #06658560 törölt tag Abu85 #11

Új Válasz 2015-11-24 17:08:10 #12
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra

#06658560

törölt tag

válasz Abu85 #11 üzenetére

"Azért a FirePro S9150/S9170 eléggé sikeres lett. Sosem adtak el még annyit FirePro gyorsítót, mint mostanában. A következő körben simán nagy sanszuk van, mert amíg az Intel és az NV 3-4 TFLOPS-os gyorsítóval jön, addig az AMD 7-8 TFLOPS-ot céloz DP-ben ugyanakkora TDP kereten belül."
Szép és jó, de gyorsan utána nézve (top500.org volt kéznél) ennek ellenére is nagyon kicsi a piaci részesedésük. Pénzügyi eredmények sem voltak túl fényesek, mintha túl nagy haszonkulccsal nem tudtak volna dolgozni.