Hirdetés
- Milyen TV-t vegyek?
- Azonnali VGA-s kérdések órája
- Fejhallgató erősítő és DAC topik
- Dell notebook topic
- Hővezető paszták
- AMD K6-III, és minden ami RETRO - Oldschool tuning
- Vezetékes FÜLhallgatók
- Vezeték nélküli fülhallgatók
- Milyen asztali (teljes vagy fél-) gépet vegyek?
- Milyen asztali médialejátszót?
Új hozzászólás Aktív témák
-
namaste
tag
A virtuális ISA-nak az a célja, hogy minél általánosabb, hordozhatóbb legyen, ne kötődjön a hardverhez.
Az egyeztetésen csak a hardver ISA-ban kell megegyezniük, a szoftvereseknek tudniuk kell a fordító optimalizáláshoz mennyi órajel alatt, milyen késleltetéssel hajt végre egy-egy utasítást. Nem hiszem, hogy a szoftveresek megmondják, mennyi tranzisztorból legyen az ALU, vagy a hardveresek megmondják mi legyen a PTX-ben, a fordító hogyan fordítson natív kódra.A tranzisztorok 3.37%-a miatt nagy a fogyasztás?
Amúgy a Fiji nem jó példa, mert az energiahatékonysága a Maxwellhez hasonló. Ebben benne van a HBM, vagy a Nano órajel és feszültség visszavétele is. -
namaste
tag
És ezt te így eldöntöd? Majd a piac eldönti kell-e neki. Persze 1:2 jó lenne, 1:3 elmegy, 1:4 hááát, 1:8 mivan?, 1:32 képfeldolgozásra, neurális hálózatra, játékra jó lesz.
Ez csak egy példa volt egy FP64-es utasításra. Vannak olyan utasítások amit egy az egyben lehet fordítani natív kódra, és vannak amelyeket nem. Ha egy újabb hardver újabb utasításokat hoz és nincs rá PTX utasítás, akkor az azt jelenti, hogy a PTX nem korlátozza a mikroarchitektúrát. A hardver mérnökök szabadon* alakíthatják az utasításkészletet, a GPU felépítését, a szoftveresek eldöntik lesz új PTX utasítás a következő verzióban vagy nem és megírják hozzá a fordítót.
* Inkább egyeztetve és kompromisszumokat kötve az igények (piac), a technikai lehetőségek figyelembevételével.Az a komplex ütemezés, ami
- viszonylag kevés tranzisztor igényel,
- nem is használják DX11-ben
és emiatt sokat fogyaszt a GPU ... Hát, nem is tudom ...
A nagy fogyasztást inkább rá lehet fogni azokra a részekre, amelyek működnek is: CU/ALU, TMU, ROP, belső busz, cache, memóriavezérlő. -
namaste
tag
Jó, de ez nem jelenti azt, hogy "Az NV nem tervez DP-re". Ezt akkor lehetne mondani, ha a Pascalt is csak 1/32 FP64 : FP32 aránnyal hozná ki.
A driver egy "fma.f64 d, a, b, c" PTX utasításból egy "fma.f64 r0, r1, r2, r3" natív utasítást fordít. Ennek mi köze van ahhoz, hogy milyen a mikroarchitektúra? Ezt az utasítást a hardver végrehajthatja dedikált FP64 ALU-n, vagy multiprecíziós ALU-n.
Ez magyarázhatja a GCN magas fogyasztását. Persze hogy elölről kezdték a tervezést, mert kukázták a VLIW architektúrát.
-
namaste
tag
A GK110-tól lehet párhuzamosan több kernelt futtatni, lásd Hyper-Q.
(#14) Abu85
"Az NV nem tervez DP-re."
Miért ne tervezne?"... amelyekhez a PTX miatt muszáj ragaszkodniuk."
A PTX-nek semmi köze a hardverhez, az egy virtuális utasításkészlet, amit olyan GPU natív kódra fordítanak, amilyen GPU-n a program éppen fut. A GPU mikroarchitektúrájához meg végképp semmi köze nincs.Amit írsz a GCN ALU-ról, abból az jön le, hogy az FP32 utasításokat is FP64 pipeline-on számolja.
Új hozzászólás Aktív témák
- ÚJ OMEN Transcend 14 - 14"2.8K OLED 120Hz - Ultra 7 155H - 16GB - 1TB - RTX 4060 - Win11 - 3 év gari
- LG 35WN75C-B - 35" Ívelt VA - 3440x1440 - 100Hz 5ms - USB Type-C 60W - AMD FreeSync - HDR 10
- Tablet felvásárlás!! Apple iPad, iPad Mini, iPad Air, iPad Pro
- Telefon felvásárlás!! iPhone X/iPhone Xs/iPhone XR/iPhone Xs Max
- Telefon felvásárlás!! Samsung Galaxy A20e/Samsung Galaxy A40/Samsung Galaxy A04s/Samsung Galaxy A03s
Állásajánlatok
Cég: Promenade Publishing House Kft.
Város: Budapest
Cég: NetGo.hu Kft.
Város: Gödöllő


