Hirdetés
-
Lenovo Essential Wireless Combo
lo Lehet-e egy billentyűzet karcsú, elegáns és különleges? A Lenovo bebizonyította, hogy igen, de bosszantó is :)
-
Augusztustól nagyot változik a Shein élete
it Onnantól kezdve lesz a platformra érvényes az EU-ban a DSA, így számos kötelezettséget vesz a vállára a Shein.
-
Nézzük élőben az iD@Xbox Showcase legújabb adását!
gp Akik kedvelik az indie játékokat, azoknak érdeme lesz követniük a bejelentéseket.
Új hozzászólás Aktív témák
-
Meteorhead
aktív tag
Ezt csak én tartom egy nagy szamárságnak?
Intel reklámozza olyan fene nagyon, hogy OpenCL-ben írjanak játékokat. (Mondjuk ezt nem is értem hogyan lehetne egy egész motort felhúzni C-s compute API-ra, de biztos meg lehet oldani.) Ott maximálisan megoldott, hogy ki legyen használva az AVX akármelyik verziója, hiszen a fordító skalár kódot is ráhúz az AVX sávokra, felismeri a gather/scatter műveleteket és be tudja illeszteni az adott hardverhez illeszkedő leggyorsabb műveleteket AVX verziótól függően.
Ugyanezt meg tudná csinálni C++AMP-ban, hiszen minden valamirevaló compiler ismeri az AVX összes verzióját és felismeri azokat a triviális műveleteket amiket használni lehet. Nem hiszem el, hogy csak explicit ASM utasításokkal lehetne értelmesen használni AVX-et.
Akkor meg hol a gond? Minden valamirevaló nyelv/API lehetőséget ad a kihasználására.
-
Meteorhead
aktív tag
Pedig van, csak a válasz mint mindig: attól függ.
Egy 100, vagy 400 elemű vektor feldolgozását nem akarod az IGP-vel csináltatni, mert túl sok meló beizzítani a contextet, nomeg a memória késleltetés is nagyobb. A CPU már rég végzett volna a feladattal. Ott viszont AVX-szel negyedelni lehet a feldolgozási időt. Ez csak egy példa, de vannak más esetek is, amikor azért nem rossz, ha van AVX, és minél okosabb, annál jobb.
Az a vonal, amit a Skylake fog követni, hogy a lapka 70%-a IGP az tetszik. Legyen 2, nagyon max 4 mag HT-vel, és a többi legyen IGP meg fixed function. AMD-nek a bulldozer elképzelése sem volt rossz, 1 modul 2 integer egységgel, és osztozzanak a lebeőpontos ALU-n. A CPU-nak egyre inkább karmester szerepe lesz, csak drivert fog bözgetni, memóriacímeket számol, és egyre kisebb lesz játékok alatt az FPU terhelése. Ha az egész játékmotort kirakják IGP-re (ami felé haladunk), egy darab lebegőpontos műveletet nem fog elvégezni. A program counter léptetéséhez integer egység kell, méghozzá gyors. Szóval az AMD-s "Hyper Threading" elv tetszett, csak bedrótozni nem tudták. Kaveri már itt is hozott sokat, külön decode mindkét integernek, stb. de mire felhozzák jó szintre, addigra architektúrát fognak váltani.
Új hozzászólás Aktív témák
- BESZÁMÍTÁS! Gigabyte AORUS MASTER RX 6800XT 16GB GDDR6 videokártya garanciával hibátlan működéssel
- ASUS ROG STRIX RTX 3070 TI O8G GAMING OC - csúcskategória garanciával
- PowerColor Red Dragon Radeon RX 5700 XT 8GB
- ZOTAC GeForce GTX 1080 AMP Edition 8GB GDDR5X 256bit
- EVGA GeForce GTX 1080 Ti FTW3 GAMING 11GB GDDR5X 352bit (11G-P4-6696-KR) Videokártya