Legfrissebb anyagok

PROHARDVER! témák

Mobilarena témák

IT café témák

GAMEPOD.hu témák

LOGOUT.hu témák

Hirdetés

Letartóztatták a bitcoin-Jézust

it Amerikai adókerülés vádjával, Spanyolországban tartóztatták le a bitcoin-Jézusként ismert Roger Vert.
Senua's Saga: Hellblade II - Íme a végleges gépigény

gp A folytatás megjelenéséig kicsivel több mint két hetet kell már csak várnunk.
AMD Radeon undervolt/overclock

lo Minden egy hideg, téli estén kezdődött, mikor rájöttem, hogy már kicsit kevés az RTX2060...

Új hozzászólás Aktív témák

#1 velizare nagyúr

Új Válasz 2015-11-19 10:35:45 #1
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

velizare

nagyúr

fijiből nem készült firepro igaz? akkor a hpc szegmensbe az nvidia szállíthat először hbm(2)es gpu-t?
az nvlink a konzumer szegmensben is maradhat kétgpus kártyáknál? arról esetleg van hír, hogy kívülre is kivezetnék, és leváltaná az sli hidat?

Tudod, mit jelent az, hogy nemezis? Az érintett, erősebb fél kinyilatkoztatása a méltó büntetés mértékét illetően. Az érintett fél jelen esetben egy szadista állat... én.
#2 Xantor tag velizare #1

Új Válasz 2015-11-19 10:47:28 #2
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Xantor

tag

válasz velizare #1 üzenetére

Fiji-ből nem készült FirePro, s már valószínűleg nem is fog...

A józan ész olyan ritka manapság, hogy lassan a "szuper erő" kategóriájába sorolható...
#3 stratova veterán

Új Válasz 2015-11-19 11:10:01 #3
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

stratova

veterán

Várhatóan a 32 bites, vagyis a szimpla pontosság melletti tempó negyede vagy nyolcada áll majd rendelkezésre.
Ez egy vállalható kompromisszumnak tűnik. Nvidia és AMD termékei közül utoljára Kepler tudott 1/3-as arányt felmutatni, GCN 1.0 Tahitije 1/4-et, GCN 1.1 Hawaii 1/8-at GCN 1.2 Tonga ill. Fury 1/16-ot míg Maxwell 1/32-t.
Pardon elvileg a FirePro S sorozatban 1/2 az arány Hawaii (és Grenada) esetében, de ha ezt is kétféleképpen tudják konfigurálni mi a gátja annak, hoyg a játékos ill mobil piacra szánt variánsok komolyabb csonkítást kapjanak egy esetlegesenjobb játékteljesítmény/fogyasztás mutató reményében?

[ Szerkesztve ]
#4 #06658560 törölt tag

Új Válasz 2015-11-19 11:31:21 #4
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

#06658560

törölt tag

Az 1TB/s vs. 80GB/s sávszél komoly dilemma lesz programozáskor.
#5 stratova veterán #06658560 #4

Új Válasz 2015-11-19 11:32:03 #5
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

stratova

veterán

válasz #06658560 #4 üzenetére
#6 Fiery veterán stratova #3

Új Válasz 2015-11-19 11:57:36 #6
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz stratova #3 üzenetére

Mi koze az FP64 teljesitmenynek a jatekokhoz ill. a mobil piachoz? Az, hogy mestersegesen korlatozzak az FP64 teljesitmenyt, nem a fogyasztas miatt van, hanem a termek szegmentalas okan. A fogyasztas lejjebb szoritasa pedig megoldott minden modern Radeonon az orajel es Vcore finom szabalyozasaval.
A hirhez: esetleg erdemes lenne arrol is irni, ebben a hirben vagy egy kulon hirben/cikkben, hogy mire es hogyan lehet hasznalni az FP16-ot. Milyen szamitasi feladatoknal jon ez jol? Mi varhato az AMD reszerol az FP16 kapcsan? A Pascal mennyivel gyorsabban hajtja vegre az FP16 szamitasokat, mint az FP32-t?

[ Szerkesztve ]
#7 Fiery veterán #06658560 #4

Új Válasz 2015-11-19 11:59:41 #7
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz #06658560 #4 üzenetére

Nyilvan aki egy (vagy tobb) 2 GPU-s Teslat vasarol csillio Ft-ert, az nem hulye, hanem pontosan tudja, hogy mit vesz, es azt hogyan fogja tudni meghajtani. A 2 GPU-t osszekoto szuk csatornara remek megoldas, ha a 2 GPU fuggetlen adatokon dolgozik. Eddig is boven volt a fejlesztoknek lehetosege figyelembe venni az ilyen architekturalis limiteket, pl. a szálak ill. work-groupok kozotti kommunikacio mar regota megoldott. Ha a maximalis teljesitmenyt akarod elerni, mar most is igyekszel CU-n (SP-n) belul maradni. Ha pedig egy fejleszto ehhez mar hozzaszokott, nem nagy kaland egy GPU-n belul maradni.

[ Szerkesztve ]
#8 lenox veterán stratova #3

Új Válasz 2015-11-19 12:01:32 #8
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

válasz stratova #3 üzenetére

Amennyire en ertem HPC temaban a double precision sebesseg nem elsodleges, mert vagy single-t vagy keverve single-t es double-t hasznalnak (sok single, keves double), de hogy konzumer graphicson kivul mire kell a half, azt nem annyira ertem.
#9 stratova veterán Fiery #6

Új Válasz 2015-11-19 12:01:47 #9
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

stratova

veterán

válasz Fiery #6 üzenetére

Hmm úgy rémlik korábban arról volt szó, hogy mivel Kepler/Maxwell szervezése más, így ott tényleges megtakarítás lehet az FP64 teljesítmény csökkentése. De nem tudom ez mennyire lenne igaz GCN-re, amellett hogy bevett szokás a Vcore és órajelmérséklés, emiatt is kérdeztem.

[ Szerkesztve ]
#10 Fiery veterán stratova #9

Új Válasz 2015-11-19 12:04:11 #10
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz stratova #9 üzenetére

A fizikailag is limitalt FP64 vegrehajtasi teljesitmeny rengeteg tranzisztort sporol. De hogy a tranzisztor sporolas vagy a fogyasztas minimalizalas-e az oka a Maxwellnel a durvan megvagott FP64 teljesitmenynek, azt nem tudom. Az viszont teny, hogy a konzumer piacnak tok mindegy az FP64 teljesitmeny, sot, a legtobb esetben az sem problema, ha nem is tamogatja a GPU az FP64-et (ld. Intel).
A GCN kapcsan pedig az biztos, hogy oriasi tranzisztor mennyiseget es igy lapkateruletet is lehetne sporolni a Hawaii/Grenada kapcsan, ha nem lenne ilyen utos az FP64 teljesitmeny. Az AMD reszerol a Hawaii/Grenada egy jol lathatoan kompromisszumos megoldas. Valojaban jobb lett volna 2 verziot kesziteni ebbol a GPU-bol, egyet a konzumer piacra, egyet pedig a HPC piacra. De ugyanez a kompromisszum figyelheto meg az nVIDIA-nal is, csak naluk kicsit tobb penz befolyik a HPC piacbol, igy ott kevesbe ervagas, hogy relative olcson kell eladni a bazinagy es mestersegesen korlatozott FP64 teljesitmenyu GPU-kat a konzumer piacra (ld. GK110).

[ Szerkesztve ]
#11 #06658560 törölt tag Fiery #7

Új Válasz 2015-11-19 12:05:08 #11
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

#06658560

törölt tag

válasz Fiery #7 üzenetére

Az rendben van, viszont ez a nagy lépcső azt eredményezi, hogy potenciálisan kevésbé éri meg egy ilyet venni két egy GPU-s megoldás helyett. És inkább egymástól függetlenül párhuzamosítható, mint egymással átszőtt szálakban kell gondolkodni. Az egységesen kezelhető memória hiánya a problémám így.
#12 lenox veterán #06658560 #11

Új Válasz 2015-11-19 12:08:51 #12
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

válasz #06658560 #11 üzenetére

Ezt nem annyira ertem. Teszem azt egy gpus tesla 4000, ket gpus 6000, es a ket gpusnal az eddigiekhez kepest van olyan opcio, hogy az egyik adatait a masik 80 GB/sec-es sebesseggel eleri. Szoval a ket gpus olcsobb, mint 2 egy gpus (mondjuk altalaban tdp limit miatt nem ketszer gyorsabb, hanem pl. pont 1.5-szor), ellenben csak 1 kartyahelyet foglal, tehat ugyanakkora helyre 1.5-szer akkora teljesitmenyt tudsz berakni. Miert erne meg akkor kevesbe ilyet venni?

[ Szerkesztve ]
#13 Abu85 HÁZIGAZDA velizare #1

Új Válasz 2015-11-19 12:12:00 #13
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz velizare #1 üzenetére

Az NVLINK-et csak az IBM processzorai támogatják. Az Intel/AMD nem, tehát PC-be nem jó. Esetleg olyan formában lehetséges, hogy az NV készít egy PCI Express NVLINK vezérlőt, amelyhez csinálnak megfelelő portokat az alaplapon, de ilyenkor a kiadott kártyák nem használhatók PCI Express portokban.
(#6) Fiery: Ezekről elszórva írtunk korábban.
Az FP16 ott jön jól, ahol nem szükséges az a pontosság, amit az FP32 ad. Ez még a játékokra is jellemző lesz, mert a DX12 pont támogatja.
Az AMD a GCN3 óta támogatja az FP16-ot. Egy CU 64 FP32-es, vagy 128 FP16-os műveletre képes. Magyarul az FP16 kétszer gyorsabb elméletben.
A Pascal esetében is az lesz bevezetve, amit az AMD bevezetett a GCN3-ban. Ott is kétszer gyorsabb lesz elméletben az FP16, mint az FP32.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#14 Madárpók aktív tag

Új Válasz 2015-11-19 12:14:24 #14
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Madárpók

aktív tag

Sok helyre elég a szimpla pontosság, ahol kell egy kevés duplával megtámogatva, de pl. iteratív megoldást kívánó problémáknál, mátrixok diagonalizálásánál komolyan kellhet a dupla pontosság.
#15 Fiery veterán #06658560 #11

Új Válasz 2015-11-19 12:14:28 #15
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz #06658560 #11 üzenetére

"Az rendben van, viszont ez a nagy lépcső azt eredményezi, hogy potenciálisan kevésbé éri meg egy ilyet venni két egy GPU-s megoldás helyett."
Ez legyen azoknak a problemaja, akik ezzel foglalkoznak Eleg jo valasztek van HPC megoldasbol (pl. FirePro S, ugyebar), nem kotelezo 2 GPU-s Teslat venni.
A GPGPU programozas amugy is arrol szol, hogy ha lehet, egymastol fuggetlen adatokat adj a GPU-nak, feldolgozasra. Ha teljesen fuggetlen, oriasi mennyisegu adatot tudsz adni a GPU-nak, az a legjobb, minden GPU szamara. Pl. egy 1 gigapixeles foto, aminek minden pixelet le kell sotetiteni egyforman 50%-kal, na ez egy tuti melo a GPU-knak
"Az egységesen kezelhető memória hiánya a problémám így."
Arra a Knights Landing lesz az igazi megoldas Viccet felreteve, egy sima 1 GPU-s videokartyan sem celszeru a memoriabol ossze-vissza olvasgatni/irni, mert agyonvagja az elerheto teljesitmenyt. A compute feladatoknal le vannak osztva a lapok, es torekedni kell arra, hogy mindenki csak a sajat portajan sepregessen. Azaz, pl. egy 64 CU-s GPU eseteben kepzeletben oszd fel a memoriat 64 szeletre, minden CU kap egy szeletet, es oda garazdalkodik (ir/olvas). Ez az idealis leosztas, minden mas lassitja a feldolgozast. Az, amit egyesek kommunikalnak egyes hirportalokon, hogy a GPU-knak csak odaadod az adatokat, es mindent megoldanak maguktol, az csupan a naiv, favago megoldas. Nyilvan van olyan feladat, aminel ez is mukodik (lasd fentebb a foto feldolgozasi pelda), de sajnos sok esetben nagyon komolyan oda kell figyelni az adott platform architekturalis jellemzoire. Ezert sem mindegy, hogy egy compute kodot milyen vason futtatsz, es ezert sem problema az, ha van egy specialis architekturalis jellemzoje egy GPU-nak. Sok esetben elobb valasztjak ki a hardvert, es utana irjak meg hozza a compute kodot, figyelembe veve az osszes hardveres jellemzot/sajatossagot. Es ezert is nehez a compute teljesitmenyt portolni, ahogy Abu is mondta mar kb. parezer alkalommal
#16 #06658560 törölt tag lenox #12

Új Válasz 2015-11-19 12:39:25 #16
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

#06658560

törölt tag

válasz lenox #12 üzenetére

Egyrészt nem feltétlen látom, hogy az ár így alakulna, másrészt a fogyasztáskorlát miatti sebesség is beleszól játékba, ami egy kártyán jobban bottleneck, mint kettőn, külön-külön.
#17 lenox veterán #06658560 #16

Új Válasz 2015-11-19 12:53:38 #17
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

válasz #06658560 #16 üzenetére

K40 3000, K80 4500 es elvileg a K80 legalabb masfelszer gyorsabb, de inkabb kicsit jobb. En ugyanezt varnam az ujabbnal is.
#18 polika senior tag Fiery #6

Új Válasz 2015-11-19 13:23:36 #18
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

polika

senior tag

válasz Fiery #6 üzenetére

Azt írják majdnem mindenütt hogy az FP16-al a deep learning gyorsítását várják, mert ott nem szükséges ennél nagyobb pontosság, viszont "darabszámra" baromi sokat kell számolni. És mivel nagyon jól párhuzamosítható még ideálisabb lenne GPU-ra, ha a gyorsítókártya ennél a precíziónál dupla teljesítményt produkálna.
Én ahogy látom NV megint időben reagált egy valós piaci igényre, és emiatt megint baromi sok megrendelésük lesz ebben a szegmensben (manapság ezek deep learninges cuccok menőnek számítanak és nagyon sok helyen próbálják bevetni őket...)
Nem tudom hogy AMD alszik, vagy neki is lesz egy ilyesmire kihegyezett dizájnja, vagy inkább más piaci szegmensre pályáznak, maradnak a mérnöki feladatoknál ahol szükséges a nagy pontosság, esetleg Abu többet tud
#19 icp1970 senior tag

Új Válasz 2015-11-19 13:45:25 #19
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

icp1970

senior tag

Nagyin ígéretesen hangzik.
#20 TESCO-Zsömle félisten polika #18

Új Válasz 2015-11-19 13:55:13 #20
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

TESCO-Zsömle

félisten

válasz polika #18 üzenetére

Nem tudom hogy AMD alszik, vagy neki is lesz egy ilyesmire kihegyezett dizájnja
Ha jól vetem ki Abu szavaiból, nekik már van a piacon ilyen dizájnjuk a GCN3 formájában.

Sub-Dungeoneer lvl -57
#21 szabi80sz tag polika #18

Új Válasz 2015-11-19 16:51:36 #21
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

szabi80sz

tag

válasz polika #18 üzenetére

Tényleg a deep learning-ben lesz jelentős a 16 bit. Ebben eddig is jobb volt az nVidia. Saját tapasztalat. A gond az AMD-nél szoftveres és hardveres. Korábban írtam nekik ez ügyben és megköszönték. Azóta jönnek az újabb és újabb előre mutató fejlesztéseik a(z általam is) leírt gyengeségeiket próbálják kiküszöbölni. Most legutóbb a Cuda vs OpenCl-es gondot próbálták megoldani ( [link] ), sajnos azért mert szükséges volt (mert az OpenCl nagyon gyenge a Cuda-hoz képest) . Én már annyit költöttem AMD-s videokártyákra, hogy nem merek már beruházni AMD gpu-ra.. Elolvastam a marketinget régebben is (itt a prohardver-en), bevásároltam és a valóság mindig siralmas volt.. folyamatosan csalódnom kellett a teljesítményben, pedig elméletben mindig szebbek voltak a számok, a gyakorlatban pedig egyéb korlátok akadtak.. Már nem merek AMD-vel próbálkozni, mert csak marketing oldalon látom a teljesítményt, meg a fórumos szájhősökben, a valóságban sajnos nem.
#22 Abu85 HÁZIGAZDA polika #18

Új Válasz 2015-11-19 16:54:31 #22
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz polika #18 üzenetére

Fiji használható deep learningre, de nagy probléma a memória kapacitása. Viszont FP16-ban 16 TFLOPS-ot tud, ami ma magasan a legjobb.
(#10) Fiery: Az extra tranyó dizájntól függ. Az AMD-nél például kétféle CU van. Egy normál multi-precision ALUs, és egy limitált. Előbbi tud 2:1-es FP32 : FP64-et, vagyis fele teljesítménnyel DP-t, míg utóbbinál nincs DP.
A normál tömb ugyanazon a node-on nagyjából +6%-kal foglal több helyet, mint a limitált.
A probléma a DP-vel nem az, hogy 6%-ot nem éri meg bevállalni, hanem rohadt nehéz olyan multi-precision ALU-t csinálni, ami 4:2:1 arányban tud FP16 : FP32 : FP64-et csak 6%-kal nagyobb lapkaterület igénylésével.
Az Intel például az inaktív 4:1-es DP-je nagyjából +15%-os extra. Az NV esetében pedig a DP ALU a Kepler óta különálló feldolgozó.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#23 Fiery veterán Abu85 #22

Új Válasz 2015-11-19 17:22:54 #23
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz Abu85 #22 üzenetére

Koszi az infot. Azt szeretnem me'g megkerdezni, hogy a Fijinel mire van ahhoz szukseg, hogy az altalad emlitett FP16 kepessegeket munkara lehessen fogni? Mert az OpenCL azt jelzi, hogy nem tamogatja a cucc az FP16-ot. A hamarosan megjeleno Crimson driverben debutal az FP16 az AMD OpenCL drivereben?
#24 Goblin12 őstag

Új Válasz 2015-11-19 18:07:29 #24
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Goblin12

őstag

A HBM2 memóriákat a Samsung vagy a Hynix fogja szállítani, erről csak később születik majd döntés. Mivel a Samuval még perben vannak, így nagyon nagy valószínűséggel Hynix lesz.
Jesszus, végig olvastam amit össze írtatok a téma még érdekel is, de ez már a mély víznél is mélyebb.
#25 Abu85 HÁZIGAZDA Fiery #23

Új Válasz 2015-11-19 19:43:24 #25
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Fiery #23 üzenetére

A DX12 driverben tuti benne van, mert a Fable Legendsben az UE4 FP16-os hardvereken FP16-os formátumokat használ. A többin pedig FP32-eseket. Ezért nyer némi extrát a GCN3 a GCN1/GCN2-höz képest.
Az OpenCL driverben szerintem csak a FirePro esetében van benne. Az előrébb jár a radeonos drivernél. A sima Catalystben biztosan nincs.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#26 cheatergs senior tag

Új Válasz 2015-11-19 20:10:52 #26
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

cheatergs

senior tag

Na, talán most már vki megválaszolja, ha múltkor nem, szal: ez az FP16 az az FP16, aminél mindenki pofozta az Nv-t az FX-ek idején?

Mindig minden mindegy
#27 Fiery veterán Abu85 #25

Új Válasz 2015-11-19 20:51:36 #27
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Fiery

veterán

válasz Abu85 #25 üzenetére

Koszi, sajnos a Fiji alapu FirePro egyelore feher hollo kategoria. A FirePro S9150 pedig nem tamogatja az FP16-ot:
[[ Device Properties: ]]
Device Name: Hawaii
Video Adapter: AMD FirePro S9150 (FireGL V)
Device Type: GPU
Device Vendor: Advanced Micro Devices, Inc.
Device Version: OpenCL 1.2 AMD-APP (1573.4)
Device Profile: Full
Driver Version: 1573.4 (VM)
[[ Half-Precision Floating-Point Capabilities: ]]
Correctly Rounded Divide and Sqrt: Not Supported
Denorms: Not Supported
IEEE754-2008 FMA: Not Supported
INF and NaNs: Not Supported
Rounding to Infinity: Not Supported
Rounding to Nearest Even: Not Supported
Rounding to Zero: Not Supported
Software Basic Floating-Point Operations: No
[[ Device Extensions: ]]
...
cl_khr_fp16: Not Supported
cl_khr_fp64: Supported
...
Persze lehet, hogy ez egy regi driver, es az ujabbakkal mar megy az FP16 a Hawaii/Grenada alapu FireProkon is (?) Mindenesetre bizom benne, hogy az AMD hamarosan a Fury szerian is engedelyezi az FP16-ot, az ugyanis egy nagyon erdekes feature lenne -- legalabbis szamomra.

[ Szerkesztve ]
#28 mThomm csendes tag

Új Válasz 2015-11-20 16:43:39 #28
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

mThomm

csendes tag

Első nekifutásra sikerült Pacalnak olvasni
#29 Abu85 HÁZIGAZDA Fiery #27

Új Válasz 2015-11-20 16:54:43 #29
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz Fiery #27 üzenetére

Nincs is Fiji Firepro.
Az S9150 nem támogatja, mert a GCN2-ben nincs FP16.
Tonga, Fiji vagy Carrizo kell, mert ezekben van GCN3. Sajna az FP16 GCN3-only fícsőr.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.