Hirdetés

Új hozzászólás Aktív témák

  • Abu85

    HÁZIGAZDA

    válasz Fiery #12957 üzenetére

    Nem én számoltam ki. Dally mondta korábban, de elvben nézzük meg mi is: ha a GCN-t számítjuk, akkor 28 nm-en 1 TFLOPS-hoz 8 CU kell (1 GHz-es órajelen, ami normává válik). Ennyit ~24 mm2-be lehet ma beépíteni, mert egy CU ~3 mm2. Ekkora területre ma 4 MB-nyi SRAM helyezhető 28 nm-en. Persze 5 MB-ról volt szó, de változók az architektúrák, tehát könnyen lehet, hogy Dally nem a GCN-t vette elő. Az alapvető mondandója viszont igaz.

    Az AVX is OpenCL-lel használható ki a legjobban, ugyanúgy, mint az IGP-k. Ezért erősítette meg az OpenCL támogatását az Intel, mert több fejlesztő jelezte, hogy sokkal hosszabb kódot kell írni TBB+intrinsics mellett, ami lassabb lesz. Persze az OpenCL-lel sincsenek kibékülve a fejlesztők, de az MS dolgozik a C++AMP fejlesztésén. Az felkínálhat egy arany középutat.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

Új hozzászólás Aktív témák