Keresés

Hirdetés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz Fiery #9 üzenetére

    Azért a FirePro S9150/S9170 eléggé sikeres lett. Sosem adtak el még annyit FirePro gyorsítót, mint mostanában. A következő körben simán nagy sanszuk van, mert amíg az Intel és az NV 3-4 TFLOPS-os gyorsítóval jön, addig az AMD 7-8 TFLOPS-ot céloz DP-ben ugyanakkora TDP kereten belül. Nyilván az NV most úgy van vele, hogy nulláról újratervezni nem lenne ideális az egész hardvert, az Intel meg elkölti a tranyók 70%-át gyorsítótárra/buszokra, tehát nekik arányaiban nagyon kevés tranyó marad a regiszterekre és a valós feldolgozókra. Egy 7 TFLOPS DP-s FirePro portolás szükségessége nélkül simán váltópont, mivel kétszeres lesz a hatékonysága a többi gyorsítóhoz képest DP-ben. Ezt addig fent is tudják tartani, amíg az Intel és az NV nem dönt úgy, hogy nulláról újrakezdik a tervezést.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz Fiery #13 üzenetére

    Számok nincsenek, csak annyi, hogy tízszeresére nőttek az eladások egy év alatt. De ez logikus, mert csak a FirePro S9150 és S9170 képes 2,5 TFLOPS-is DP-re. Ennek a közelében nincs senki ilyen fogyasztáson.

    Az NV nem tervez DP-re. Egyszerűen az architektúráikba nehezen építhető multi-precision ALU. Az NV integerre, FP32-re és FP64-re külön ALU-kat használ, és nem azért, mert ez jó, hanem azért, mert 2005-ban meghoztak olyan döntéseket, amelyekhez a PTX miatt muszáj ragaszkodniuk. Az AMD 2008-ben úgy döntött, hogy nulláról tervezik meg a hardvert. Csak emiatt ennyire erősek DP-ben a mostani rendszereik. Nekik a DP beépítése a teljes lapkaterületet csak 6%-kal növeli meg. Eközben az NV-nek ez a GK210 esetében +40%.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz #06658560 #15 üzenetére

    Például az, hogy ha szükséged van 220-240 watt között 2,5 TFLOPS DP-re, akkor vagy a FirePro S9150/S9170-et választod vagy semmit.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz Fiery #17 üzenetére

    A HPC-piacon az SC15 alatt pont arról volt szó, hogy nagyobbrészt vannak OpenCL alkalmazások, mert nem akarják magukat zárt platformhoz kötni az érintettek. Erről nyugodtan megkérdezheted Vincent Hendriksent, aki pont portolásokkal foglalkozik.

    Az AMD cuccát a piac nem fogadta jól. A legtöbben azt akarják, hogy az egész legyen nyílt, például a SYCL által. Most azzal nincs előrébb a piac, hogy az AMD a hardveres előnyét kihasználva a saját CUDA-jába zárja az egészet. Lehetséges, de csak az fog történni, hogy az egyik kútból a másikba esünk. A valós megoldás a SYCL.

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz namaste #22 üzenetére

    Mert azzal az alappal, amin dolgoznak nagyon nehéz DP-t csinálni komoly tranzisztormennyiség beáldozása nélkül. Emiatt elmennek a Pascalnal is egy GPU-val 2 TFLOPS-ig és az lesz a plafon. Két GPU-val kapsz majd 4 TFLOPS-ot a csúcs-Teslával.

    Viszont a hardveres ISA-t érdemes annyira közel tervezni a vISA-hoz, amennyire lehet. Különben a hatékonyság nem lesz elég jó.

    Igen, de a GCN esetében az AMD úgy döntött, hogy nulláról tervez. Ezért tudnak olyan dolgokat megcsinálni, amit más nem.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz namaste #26 üzenetére

    Aki nem tervez 2:1-es DP-re, az valójában nem tervez DP-re.

    Ehhez az utasításhoz nincs köze, de a mai vISA-kban kb. 200 utasítás van, míg a hardveres ISA-kban kb. 300-400. Természetesen az a legjobb, ha mindegyik vISA utasításra van egy direkt hardveres utasítás, amivel az helyettesíthető. Emiatt a hardvert részben a PTX-hez kell igazítani, ami megköti a mérnökök kezét.

    A GCN azért fogyaszt sokat, mert rendkívül komplex, már-már a processzorokhoz mérhető az ütemezése. Emellett tele van olyan képességekkel, amelyek beépítéséig más még el sem jutott. A Pascal részben ezeket hozza.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz namaste #29 üzenetére

    Nem én döntöm el, de nyilván egyértelműen az a hardver lesz előnyben, ami 2:1-es DP-t tud, mert az jóval hatékonyabban csinálja meg, mint a 4:1-es vagy 8:1-es opció.

    Az egyeztetés már azzal jár, hogy megbeszélik a lehetséges kompromisszumokat, hogy mi legyen a jó a teljes csomagnak.

    - azért 300 millió tranzisztort nem neveznék kevésnek. Nagyjából ennyi megy el a Fiji-ben az ütemezésre. Ennek jó része a finomszemcsés preempció.
    - a DX11 elavult, viszont az előnyösebb ütemezés az új API-kban, is többet ad. Például a Vulkan és a DX12 specifikációival csak a GCN tud mixált wavefront interleavinget és multi engine concurrency-t.

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák