Új hozzászólás Aktív témák
-
HSM
félisten
válasz
S_x96x_S #5951 üzenetére
"Az AMD szerencséje, hogy a Desktop- AlderLake-en a Big-Little miatt ezt nagyrészt nem lehet elérni, de szerver szinten elég ütős tud lenni, hogyha a program ki tudja használni."
Nem hiszem, hogy asztali alkalmazásoknál ennek bármi jelentősége lenne. Szerveres téren sem túlzottan nagy az elterjedtsége, nem véletlen, hogy szervereken is tarolt a Zen3, hiába nincs AVX512 benne."A korai Inteles AVX-512 implementációknál - annyira átmelegedett a chip; hogy az AVX-512 -es utasításoknál vissza kellett szabályozni magát .. csak, az volt a probléma, hogy a teljes rendszert lefolytotta."
Szerintem hibás a gondolatmeneted. A probléma abból eredt, hogy Intel rendszereken minden magnak közös a szorzója, nem tudnak különböző órajeleken és feszültségeken üzemelni. Ez asztali CPU-k esetén is igaz, hogy pl. aktív AVX2 feldolgozás esetén csökken az elérhető maximális órajel (AVX offset). Ennek nincs köze a csip "átmelegedéséhez", főleg nem ennek következtében történő szabályozási folyamatokhoz. Természetesen AVX mellett nagy valószínűséggel melegebb lesz a csip, valamint a jelenlegi Intel implementációkon az AVX-mód váltásnak is van némi költsége, ezeket is írja is részletesen az optimalizálási dokumentáció. Ugyanakkor a tapasztalatom az, hogy tömény AVX feldolgozás esetén sokkal nagyobb mértékben nő a teljesítmény, mint a fogyasztás, ami kompenzálja az órajel csökkenést: [link] (AVX1 vs. AVX2, "POUT" vs Gflops.).
Probléma leginkább az általad linkelt cikkben szépen leírt esetben van, ahol nagyon sokféle a feldolgozás, és az utasítások nagyon kis része AVX-es, így a módváltás költsége és az órajelcsökkenés már nagyobb veszteség, mint amennyi tempót hoz maga az utasítás készlet abban a kevés utasításban.
Ilyen esetben pl. a jelenlegi Ryzenek máris komoly előnyben vannak, hiszen azok képesek magonként eltérő órajelen üzemelni és AVX-offset sincs legjobb tudomásom szerint.Én amúgy továbbra sem vagyok meggyőződve róla, hogy az AMD-nek valóban az AVX512-t kellene erőltetnie, én jobban örülnék egy inkább általánosabb felhasználásban erős koncepciónak (ahogy a korábbi Zen-ek), ahol pl. csak kiegészítő feture az AVX512, kb. mint az első Zen-eknél a sima AVX2, ahol az alapvetően 128bit széles architektúra két órajel alatt végezte el a 256bites műveleteket. "In the Zen/Zen+ microarchitecture the floating point physical registers, execution units, and data paths are 128 bits wide. For efficiency AVX-256 instructions which perform the same operation on the 128-bit upper and lower half of a YMM register are decoded into two macro-ops which pass through the FPU individually as execution resources become available and retire together. Accordingly the peak throughput is four SSE/AVX-128 instructions or two AVX-256 instructions per cycle." [link]
Új hozzászólás Aktív témák
- Azonnali készpénzes nVidia RTX 3000 sorozat videokártya felvásárlás személyesen / csomagküldéssel
- ÁRGARANCIA!Épített KomPhone Ryzen 5 7600X 32/64GB RAM RX 7800 XT 16GB GAMER PC termékbeszámítással
- Iphone 16E 128GB Fekete Bontatlan 24 Hónap Garancia
- BESZÁMÍTÁS!Gigabyte B650M R7 7800X3D 64GB DDR5 1TB SSD RTX 3080Ti 12GB Corsair 4000D Airflow TG 750W
- BESZÁMÍTÁS! Gigabyte H610M i5 12400F 32GB DDR4 512GB SSD Intel ARC A770 16GB Rampage SHIVA 650W
Állásajánlatok
Cég: PC Trade Systems Kft.
Város: Szeged
Cég: CAMERA-PRO Hungary Kft
Város: Budapest