Keresés

Hirdetés

Új hozzászólás Aktív témák

  • Meteorhead

    aktív tag

    Ezt csak én tartom egy nagy szamárságnak?

    Intel reklámozza olyan fene nagyon, hogy OpenCL-ben írjanak játékokat. (Mondjuk ezt nem is értem hogyan lehetne egy egész motort felhúzni C-s compute API-ra, de biztos meg lehet oldani.) Ott maximálisan megoldott, hogy ki legyen használva az AVX akármelyik verziója, hiszen a fordító skalár kódot is ráhúz az AVX sávokra, felismeri a gather/scatter műveleteket és be tudja illeszteni az adott hardverhez illeszkedő leggyorsabb műveleteket AVX verziótól függően.

    Ugyanezt meg tudná csinálni C++AMP-ban, hiszen minden valamirevaló compiler ismeri az AVX összes verzióját és felismeri azokat a triviális műveleteket amiket használni lehet. Nem hiszem el, hogy csak explicit ASM utasításokkal lehetne értelmesen használni AVX-et.

    Akkor meg hol a gond? Minden valamirevaló nyelv/API lehetőséget ad a kihasználására.

  • Meteorhead

    aktív tag

    válasz Abu85 #2 üzenetére

    Ezt értsem úgy, hogy lesz olyan HSA runtime ami képes lesz OpenCL-hez hasonlóan hordozható x86_64 kódot fordítani tiszta CPU esetben?

    Van valami infó arról Intel miért nem akar belépni a HSA konzorciumba? Skylake-nek nagyon jót tenne.

  • Meteorhead

    aktív tag

    válasz LordX #16 üzenetére

    Pedig van, csak a válasz mint mindig: attól függ.

    Egy 100, vagy 400 elemű vektor feldolgozását nem akarod az IGP-vel csináltatni, mert túl sok meló beizzítani a contextet, nomeg a memória késleltetés is nagyobb. A CPU már rég végzett volna a feladattal. Ott viszont AVX-szel negyedelni lehet a feldolgozási időt. Ez csak egy példa, de vannak más esetek is, amikor azért nem rossz, ha van AVX, és minél okosabb, annál jobb.

    Az a vonal, amit a Skylake fog követni, hogy a lapka 70%-a IGP az tetszik. Legyen 2, nagyon max 4 mag HT-vel, és a többi legyen IGP meg fixed function. AMD-nek a bulldozer elképzelése sem volt rossz, 1 modul 2 integer egységgel, és osztozzanak a lebeőpontos ALU-n. A CPU-nak egyre inkább karmester szerepe lesz, csak drivert fog bözgetni, memóriacímeket számol, és egyre kisebb lesz játékok alatt az FPU terhelése. Ha az egész játékmotort kirakják IGP-re (ami felé haladunk), egy darab lebegőpontos műveletet nem fog elvégezni. A program counter léptetéséhez integer egység kell, méghozzá gyors. Szóval az AMD-s "Hyper Threading" elv tetszett, csak bedrótozni nem tudták. Kaveri már itt is hozott sokat, külön decode mindkét integernek, stb. de mire felhozzák jó szintre, addigra architektúrát fognak váltani.

Új hozzászólás Aktív témák