Hirdetés

Keresés

Hirdetés

Új hozzászólás Aktív témák

  • DraXoN

    addikt

    válasz Oliverda #81 üzenetére

    Most pont az intel próbálkozik majd az APU-k koncepciójával (legalábbis a nem jut eszembe nevű, 3D stackinges "chipletes" cpu-jával).. AMDnél kicsit nagyobbak, bár nekik is tört már bele a bicskájuk abba, hogy új irányba próbálták vinni a piacot.. de most ők fogják ezt a szekeret tolni, persze, ha kell AMDnek is ott lesz a hardver hozzá.

    The human head cannot turn 360 degrees... || Ryzen 7 5700X; RX580 8G; 64GB; 2TB + 240GB + 2TB || Samsung Galaxy Z Flip 5

  • DraXoN

    addikt

    válasz Oliverda #83 üzenetére

    A foveros vonalra gondoltam (rákeresve), nem is kimondottan "csak" a GPU, hanem több másik cél gyorsító egység is lesz tudtommal benne a többféle cpu mellett... persze.. ez még csak erősen koncepció, az első generáció is szerintem inkább csak "demo" szinten jelenik majd meg.. De mintha régebben lett volna róla szó, hogy mindenhez (amihez lehet) célegységeket kap a hatékonyabb működés érdekében (ebbe beleértve a GPU-t is) ... persze, szoftverben ez még keményebb dió lehet majd mint "csak a gpu"-t használni heterogénen a cpu-k mellett... így nem kimondottan "apu koncepció" a dolog, csak nem jutott eszembe a neve a fejlesztésnek. De az "út" szempontjából itt próbál majd evezni a dolog a nagyobb hatékonyság miatt (legalábbis megpróbál(na?)).. más kérdés, a szoftveres rész sehol sincs hozzá, persze még a hardver is hiányzik (az első generáció "nem is teljes" csak egy összelegózás egyenlőre)

    annyi előnye lehet, hogy ez nem a "csúcskategóriába" indulna mint eredetileg az amd fusionja akart még a kezdetén (és várta oda mindenki, majd lett "pofáraesés") ... persze a programozók és meglévő enginek/fordítók (nem csak játékokra értem) erősen korlátozzák majd a kihasználási hajlandóságot (szokás szerint).

    [ Szerkesztve ]

    The human head cannot turn 360 degrees... || Ryzen 7 5700X; RX580 8G; 64GB; 2TB + 240GB + 2TB || Samsung Galaxy Z Flip 5

  • arn

    félisten

    válasz Oliverda #81 üzenetére

    Mit? 16 helyett lesz 32 mag... csakhogy pcn eleg szarul skalazodik minden, a sokszalusitas mindig egy nyug. Olyan 32-64 magnal elerik a platform eszszerusegenek hatarait. Mit csinalnak utana? X86 alapon en nem latok tul sok potencialt, vmi gyokeresen uj megoldas kell. Nem lesz a single core teljesitmeny 10-20x gyorsabb rovid idon belul.

    Az apu fele viszi az iranyt az is, hogy tobbminden fixfunkcios, vagy erosen parhuzamositott nem x86 egysegeken fut, ahelyett, hogy a sok cpumagot hasznalnak (videos feladatok, raytrace, ai stb).

    nem az apu koncepcioval volt a baj anno, hanem a koritessel es a talalassal, idozitessel. A feladat az lesz, hogy eptitenek ki hidat a gpu es az apu kozott, hogy osszemossak a hatarokat, es egysegesen programozhato legyen. Onnantol a jelenlegi cpumagok csak egy iranyitofeladatokat ellato vmi lesz, a jelentosege csokken.

    az intelnek nyilvanvaloan nem erdeke az x86 ellen dolgozni, de az amdnek annal inkabb es a konzolos, es egyeb egyeni koncepcios tapasztalatukat hasznalni is fogjak erre a celra. Itt nem is a technologiai eszszeruseg fog donteni, hanem az ms-intel hegemonia megtorese, mert onnantol megvalosulna a platformfuggetlenseg.

    a masik ut erre, hogy szimplan minden eroforrasigenyes dolog felhobe koltozik, es a pc meg egy erosebb tablet/mobile szeru hw lesz, es az erdekes architekturakat majd szerveroldalom latjuk megvalosulni. Az apple es az nv erre az utra keszul, az amd inkabb egy koztesre, az intel meg probalja elnyujtani a sajat hegemoniajat.

    [ Szerkesztve ]

    facebook.com/mylittleretrocomputerworld | youtube.com/mylittleretrocomputerworld | instagram.com/mylittleretrocomputerworld

  • Abu85

    HÁZIGAZDA

    válasz Oliverda #83 üzenetére

    A Lakefield talán a legheterogénebb termék a PC-ben, hiszen már processzormagok szintjén sem homogén. Igazán jól ezt csak OpenCL-lel, vagy hasonló megoldásokkal lehet programozni, mert az figyelembe veszi, hogy a processzormagok is eltérők. Más esetben az van, amit most látsz. Fut minden a kicsi magokon, a beviteli adatokat pedig kezeli az egy szem nagy mag.

    Az Intel nem véletlenül csinálja a oneAPI-t, ami kínál DPC++-t. Ez ugye a standard ISO C++ kiegészítése a Khronos-féle SYCL-lel. Hasonló az AMD-nek a ROCm-je is, csak ők nem akarnak a Khronos megoldásaira építeni, hanem írtak maguknak technológiát a nulláról.

    Emellett mindkét opció kínál CUDA konverziót. Az Intelnek erre van egy DPC++ Compatibility Tool fejlesztőeszköze, amely segít portolni a CUDA kódokat DPC++-ra. Az AMD-nek ez a HIPify, ez egy eléggé source-2-source fordító, amely a meglévő CUDA kód alapján köp egy HIP kódot, amit nagyrészt csak fordítani kell. Az alapkoncepció az Intelnél és az AMD-nél is ugyanaz, csak más eszközökkel oldják meg. Az Intel leginkább a Khronos Group technológiáira épít, míg az AMD írt saját alternatívákat. Egyik sem rosszabb a másiknál, de szükség van rájuk. Talán nem a Lakefiledhez, de az Alder Lake asztali verziója az 8 kis mag és 8 nagy mag. Nem fogod azt tudni ISO C++-ban úgy programozni, hogy az összes mag aktív legyen. Vagy az egyik kluszter az, vagy a másik. Szerencsére a SYCL-re építő DPC++ pont erre a problémára való. Meg még másra is, de az járulékos extra.

    [ Szerkesztve ]

    Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.

  • arn

    félisten

    válasz Oliverda #88 üzenetére

    2-3x sem lesz az x86os ipc gyorsabb... a masik ut nagysagrendileg tobbet kinal. ha mas modon es hatekonyabban lehet megvalositani vmit (teljesen mindegy, hogy tensor magok, fix funkcios egysegek - itt is kezd osszemosodni a hatarvonal), mint a nehezkesen optimalizalhato cpus parhuzamositas, nem fogjak kihasznalni a cpumagokat.

    drasztikusan uj latasmod kell, ha ugrast akarnak a fejlodesben - a mostani technologiak finomitgatasaval nem lesz meg, mert az ipc mindket gyartonal kb egy szinthez konvergal, a magok szama meg egyket generacion belul eleri az eszszeruseg hatarait. de ez par x eve korvonalazodik, igazabol sok ujdonsag nincs benne.

    az amd is, ha mittomen elertek a mainstreamen a 32 magot, mit csinal utana? az intelnel is max annyi a terv, hogy ezt vegre meg tudjak valositani - de ennel tovabb a tradicionalis modon egyik gyarto sem lat - a mostani ugrasok is a magok skalazasanak koszonhetoek. ha nem lesznek, ugyanugy befagy az egesz, mint ahogy az intel befagyasztotta a negy mag kornyeken.

    facebook.com/mylittleretrocomputerworld | youtube.com/mylittleretrocomputerworld | instagram.com/mylittleretrocomputerworld

  • arn

    félisten

    válasz Oliverda #90 üzenetére

    jah ezert vannak a piacon 64 magos procik, a jatekok meg hasznalnak 4et kb... de az alkalmazasok se jobbak, egyket teruletet kiveve (render pl). tensor, opencl, gpgpu, nvenc, quicksync, etc megy, ha vki gyorsabb dolgot szeretne.

    facebook.com/mylittleretrocomputerworld | youtube.com/mylittleretrocomputerworld | instagram.com/mylittleretrocomputerworld

Új hozzászólás Aktív témák

Hirdetés