Legfrissebb anyagok

PROHARDVER! témák

Mobilarena témák

IT café témák

GAMEPOD.hu témák

LOGOUT.hu témák

Keresés

Hirdetés

Az USA vizsgálja a RISC-V kínai terjedésének kockázatát

ph A Kereskedelmi Minisztérium egyelőre csak felméri a helyzetet, egyelőre nem látni, hogy tudnak-e bármit is tenni.
Lenovo Essential Wireless Combo

lo Lehet-e egy billentyűzet karcsú, elegáns és különleges? A Lenovo bebizonyította, hogy igen, de bosszantó is :)
Xbox Game Pass [2024] - A májusi lista

gp Az elkövetkező időszakban többek között megkapjuk a Kona II Brume című játékot.

Új hozzászólás Aktív témák

#11 Abu85 HÁZIGAZDA Fiery #9

Új Válasz 2015-11-24 16:55:01 #11
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Fiery #9 üzenetére

Azért a FirePro S9150/S9170 eléggé sikeres lett. Sosem adtak el még annyit FirePro gyorsítót, mint mostanában. A következő körben simán nagy sanszuk van, mert amíg az Intel és az NV 3-4 TFLOPS-os gyorsítóval jön, addig az AMD 7-8 TFLOPS-ot céloz DP-ben ugyanakkora TDP kereten belül. Nyilván az NV most úgy van vele, hogy nulláról újratervezni nem lenne ideális az egész hardvert, az Intel meg elkölti a tranyók 70%-át gyorsítótárra/buszokra, tehát nekik arányaiban nagyon kevés tranyó marad a regiszterekre és a valós feldolgozókra. Egy 7 TFLOPS DP-s FirePro portolás szükségessége nélkül simán váltópont, mivel kétszeres lesz a hatékonysága a többi gyorsítóhoz képest DP-ben. Ezt addig fent is tudják tartani, amíg az Intel és az NV nem dönt úgy, hogy nulláról újrakezdik a tervezést.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#14 Abu85 HÁZIGAZDA Fiery #13

Új Válasz 2015-11-24 17:23:41 #14
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Fiery #13 üzenetére

Számok nincsenek, csak annyi, hogy tízszeresére nőttek az eladások egy év alatt. De ez logikus, mert csak a FirePro S9150 és S9170 képes 2,5 TFLOPS-is DP-re. Ennek a közelében nincs senki ilyen fogyasztáson.
Az NV nem tervez DP-re. Egyszerűen az architektúráikba nehezen építhető multi-precision ALU. Az NV integerre, FP32-re és FP64-re külön ALU-kat használ, és nem azért, mert ez jó, hanem azért, mert 2005-ban meghoztak olyan döntéseket, amelyekhez a PTX miatt muszáj ragaszkodniuk. Az AMD 2008-ben úgy döntött, hogy nulláról tervezik meg a hardvert. Csak emiatt ennyire erősek DP-ben a mostani rendszereik. Nekik a DP beépítése a teljes lapkaterületet csak 6%-kal növeli meg. Eközben az NV-nek ez a GK210 esetében +40%.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#16 Abu85 HÁZIGAZDA #06658560 #15

Új Válasz 2015-11-24 17:49:35 #16
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz #06658560 #15 üzenetére

Például az, hogy ha szükséged van 220-240 watt között 2,5 TFLOPS DP-re, akkor vagy a FirePro S9150/S9170-et választod vagy semmit.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#18 Abu85 HÁZIGAZDA Fiery #17

Új Válasz 2015-11-24 17:58:26 #18
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Fiery #17 üzenetére

A HPC-piacon az SC15 alatt pont arról volt szó, hogy nagyobbrészt vannak OpenCL alkalmazások, mert nem akarják magukat zárt platformhoz kötni az érintettek. Erről nyugodtan megkérdezheted Vincent Hendriksent, aki pont portolásokkal foglalkozik.
Az AMD cuccát a piac nem fogadta jól. A legtöbben azt akarják, hogy az egész legyen nyílt, például a SYCL által. Most azzal nincs előrébb a piac, hogy az AMD a hardveres előnyét kihasználva a saját CUDA-jába zárja az egészet. Lehetséges, de csak az fog történni, hogy az egyik kútból a másikba esünk. A valós megoldás a SYCL.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#25 Abu85 HÁZIGAZDA namaste #22

Új Válasz 2015-11-25 09:25:56 #25
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz namaste #22 üzenetére

Mert azzal az alappal, amin dolgoznak nagyon nehéz DP-t csinálni komoly tranzisztormennyiség beáldozása nélkül. Emiatt elmennek a Pascalnal is egy GPU-val 2 TFLOPS-ig és az lesz a plafon. Két GPU-val kapsz majd 4 TFLOPS-ot a csúcs-Teslával.
Viszont a hardveres ISA-t érdemes annyira közel tervezni a vISA-hoz, amennyire lehet. Különben a hatékonyság nem lesz elég jó.
Igen, de a GCN esetében az AMD úgy döntött, hogy nulláról tervez. Ezért tudnak olyan dolgokat megcsinálni, amit más nem.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#28 Abu85 HÁZIGAZDA namaste #26

Új Válasz 2015-11-26 16:48:15 #28
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz namaste #26 üzenetére

Aki nem tervez 2:1-es DP-re, az valójában nem tervez DP-re.
Ehhez az utasításhoz nincs köze, de a mai vISA-kban kb. 200 utasítás van, míg a hardveres ISA-kban kb. 300-400. Természetesen az a legjobb, ha mindegyik vISA utasításra van egy direkt hardveres utasítás, amivel az helyettesíthető. Emiatt a hardvert részben a PTX-hez kell igazítani, ami megköti a mérnökök kezét.
A GCN azért fogyaszt sokat, mert rendkívül komplex, már-már a processzorokhoz mérhető az ütemezése. Emellett tele van olyan képességekkel, amelyek beépítéséig más még el sem jutott. A Pascal részben ezeket hozza.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#30 Abu85 HÁZIGAZDA namaste #29

Új Válasz 2015-11-27 09:33:01 #30
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz namaste #29 üzenetére

Nem én döntöm el, de nyilván egyértelműen az a hardver lesz előnyben, ami 2:1-es DP-t tud, mert az jóval hatékonyabban csinálja meg, mint a 4:1-es vagy 8:1-es opció.
Az egyeztetés már azzal jár, hogy megbeszélik a lehetséges kompromisszumokat, hogy mi legyen a jó a teljes csomagnak.
- azért 300 millió tranzisztort nem neveznék kevésnek. Nagyjából ennyi megy el a Fiji-ben az ütemezésre. Ennek jó része a finomszemcsés preempció.
- a DX11 elavult, viszont az előnyösebb ütemezés az új API-kban, is többet ad. Például a Vulkan és a DX12 specifikációival csak a GCN tud mixált wavefront interleavinget és multi engine concurrency-t.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.