Keresés

Hirdetés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz namaste #22 üzenetére

    Mert azzal az alappal, amin dolgoznak nagyon nehéz DP-t csinálni komoly tranzisztormennyiség beáldozása nélkül. Emiatt elmennek a Pascalnal is egy GPU-val 2 TFLOPS-ig és az lesz a plafon. Két GPU-val kapsz majd 4 TFLOPS-ot a csúcs-Teslával.

    Viszont a hardveres ISA-t érdemes annyira közel tervezni a vISA-hoz, amennyire lehet. Különben a hatékonyság nem lesz elég jó.

    Igen, de a GCN esetében az AMD úgy döntött, hogy nulláról tervez. Ezért tudnak olyan dolgokat megcsinálni, amit más nem.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz namaste #26 üzenetére

    Aki nem tervez 2:1-es DP-re, az valójában nem tervez DP-re.

    Ehhez az utasításhoz nincs köze, de a mai vISA-kban kb. 200 utasítás van, míg a hardveres ISA-kban kb. 300-400. Természetesen az a legjobb, ha mindegyik vISA utasításra van egy direkt hardveres utasítás, amivel az helyettesíthető. Emiatt a hardvert részben a PTX-hez kell igazítani, ami megköti a mérnökök kezét.

    A GCN azért fogyaszt sokat, mert rendkívül komplex, már-már a processzorokhoz mérhető az ütemezése. Emellett tele van olyan képességekkel, amelyek beépítéséig más még el sem jutott. A Pascal részben ezeket hozza.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • Abu85

    HÁZIGAZDA

    válasz namaste #29 üzenetére

    Nem én döntöm el, de nyilván egyértelműen az a hardver lesz előnyben, ami 2:1-es DP-t tud, mert az jóval hatékonyabban csinálja meg, mint a 4:1-es vagy 8:1-es opció.

    Az egyeztetés már azzal jár, hogy megbeszélik a lehetséges kompromisszumokat, hogy mi legyen a jó a teljes csomagnak.

    - azért 300 millió tranzisztort nem neveznék kevésnek. Nagyjából ennyi megy el a Fiji-ben az ütemezésre. Ennek jó része a finomszemcsés preempció.
    - a DX11 elavult, viszont az előnyösebb ütemezés az új API-kban, is többet ad. Például a Vulkan és a DX12 specifikációival csak a GCN tud mixált wavefront interleavinget és multi engine concurrency-t.

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák