- Hamarosan megkezdődik a nubia 2,8K-s táblagépének szállítása
- Barátokká váltak az eddig rivális AI-óriások
- ASUS blog: Ideális olcsó utazós gép lett az új Vivobook S14
- Az Aura Displays hordozható monitorhármasa jól felturbózhatja a produktivitást
- Dual Mode-os IPS monitorral adott magáról életjelet a Gigabyte
Új hozzászólás Aktív témák
-
#82819712
törölt tag
Na és a 96 magos CEA LETI-ről mi a véleményetek ?
-
Petykemano
veterán
válasz
Cathulhu #2793 üzenetére
Érdekes, de a simlisségek ellenére vannak méltató szavak:
Microsoft, Oracle, gigabyte, Lenovo
“We are pleased to see the launch of the Ampere Altra cloud optimized platform that helps bolster our hyperscale datacenter priorities around power efficiency, resiliency, telemetry and security. Ampere’s standards-based approach made it easy for us to bring up our software stack and we are actively evaluating their systems in our labs.”
Dr. Leendert van Doorn, Distinguished Engineer, Microsoft Azure, Microsoft CorpEz alapján lehet, hogy lesz tényleges érdeklődés
-
S_x96x_S
addikt
BBQ on AMD CPU (Meatsink)
https://www.youtube.com/watch?v=zAEXuONMJCQ -
S_x96x_S
addikt
Infinity Fabric CPU<->GPU shared memory:
-------------------------
vajon a desktop ZEN3-ban is lesz ilyen?
És vajon a Microsoft DirectX12 is fogja támogatni? Ha igen, akkor játékokban tuti kijön ennek az előnye .. és a PS5 játékokat is egyszerűbb lesz konvertálni ...https://twitter.com/addisonsnell/status/1234582848616697861?s=09
"He confirmed that future EPYC+Radeon generations will include shared memory between CPU and GPU over Infinity Fabric, as @AMD has implemented on the desktop previously in “Raven Ridge” Ryzen product. #HPC"-----------
ugyanez:AMD's CPU-to-GPU Infinity Fabric Detailed
https://www.tomshardware.com/news/amd-infinity-fabric-cpu-to-gpu -
Cathulhu
addikt
válasz
Petykemano #2792 üzenetére
"What we will note is that Ampere de-rated both the AMD EPYC 7742 and Xeon Platinum 8280 results by 16.5% and 24% respectively. This was done to adjust for using GCC versus AOCC2.0 and ICC 19.0.1.144."
Na itt van a kutya elasva. Fogtak es beszoroztak a valos erteket AMD eseteben 0.835-tel, intel eseteben 0.76-tal, hogy kompenzaljanak a fordito optimalizalatlansagan. Egyreszt ezt a vasarlot nem kellene erdekelje, a legjobb elerheto opciot kellene hasznalni (Hamiltonnak se nyomjak ki az egyik szemet es a Mercedesebol se szednek ki egy hengert, csak mert jobb az auto mint a tobbi...). Masreszt ezek a szamok se valoban igazak, a GCC nem feltetlen lassabb az AOCC-nel, ami llvm alapu, es altalaban a gcc eleve jobban optimalizal az clang/llvmnel, mostanaban kezd egyaltalan kiegyenlitodni a verseny.
-
Cathulhu
addikt
válasz
S_x96x_S #2789 üzenetére
Ha 80 magon hoz specialis esetben hasonlo teljesitmenyt es fogyasztast mint a 64 magos Epyc, az nem tul biztato. Az AMD se volt igazan versenykepes, amig magonkent nem tudta hozni az intelt, hiaba volt 2x annyi magja. Sot, lehet meg most sem szamolnak vele igazan, a szerver es HPC piac pont nem a kiserletezo kedverol hires. Na most ha x86-rol x86-ra nem hajlandok valtani, akkor ARMra meg kevesbe fognak.
-
Petykemano
veterán
-
Petykemano
veterán
válasz
S_x96x_S #2790 üzenetére
Az az érdekes, hogy - eddigi infók szerint - az AMD Milan nem hoz több magot.
Az intellel szemben persze nem is kell, de ilyen kihívókkal szemben igen. Nem gondolnám, hogy az most tényleges versenytársa lenne az intelnek vagy az Epycnek. Ugyanakkor lehetnek, akik meghosszabbítják a trendvonalat és számolnak azzal, hogy 2-3 év múlva mi lesz. Úgy ruháznak be, vagy úgy fejlesztenek. Ebben az értelemben mondom, hogy különös, hogy nem lesz több mag. Pedig a mindshare megtartásához nyilván kell, hogy aki erre felkapja a fejét, az amikor meglátja a Milant, az majd akkor legyintsen erre, ahelyett, hogy elkezdje nyomon követni. -
S_x96x_S
addikt
válasz
S_x96x_S #2789 üzenetére
A STH jobban pontosítja az Amperes vs. EPYC összehasonlítást ..
ami lényeges, hogy mit hagytak ki az összehasonlításból,
például az FP-t ..
"What is completely missing from all of the performance numbers is floating-point performance. "
------
Ampere Altra Launched with 80 Arm Cores for the Cloud
https://www.servethehome.com/ampere-altra-80-arm-cores-for-cloud/"
Let us be clear, this is a huge step forward from eMAG. It is also an important milestone for the Arm server market. This is a much more competitive part than previous iterations. If Arm is going to take sockets from Intel and AMD as primary server CPUs, this is a step in the right direction.
Looking ahead, AMD says that its next-gen “Milan” architecture is due out later this year. Since AMD has EPYC 7002 “Rome” systems already shipping and greater system diversity, and Ampere Altra is not shipping in the same quantity yet, the real competitor to Altra from AMD will be Milan." -
S_x96x_S
addikt
Az Ampere ( 80 core / socket ) már az Epyc ellen is pozicionálja magát.
nem könnyű versenytárs. Az új EPYC-nek erre is válaszolni kell.
* "41% higher performance/TCO compared to AMD EPYC 7702"
* SPEC int rate performance, the Altra was 4% faster than an AMD EPYC 7742 or 2.23x the Intel Xeon Platinum 8280.
* On a power efficiency basis with SPEC int rate they claim 1.14x the perf-per-Watt of the EPYC 7702 and 2.11x the perf-per-Watt of the Xeon Platinum 8276.---------------
- 128 PCIe Gen 4 lanes for 1P configurations and 192 PCIe lanes for dual socket servers.
- up to 80 cores, eight channel DDR4-3200 memory, a coherent mesh-based interconnect, and "leading" power per core.
- TSMC 7nm process
- The Ampere Altra can also handle up to four CCIX accelerators.
- the latest capabilities from ARMv8 features to machine learning inference additions like INT8 and FP16.
- The Altra will support up to 4TB of memory per socket.
https://www.phoronix.com/scan.php?page=article&item=ampere-altra-80core&num=1 -
S_x96x_S
addikt
Mindfactory 2020 Február.
https://imgur.com/a/HjqsuKL#IdhIpNY------
Mindfactory Week 9
Alaplapok:
https://twitter.com/TechEpiphany/status/1234230582814572544
CPU:
https://twitter.com/TechEpiphany/status/1234235424748515330 -
S_x96x_S
addikt
hivatalos ISSCC 2020 -as slide-ok.
AMD Chiplet Architecture for High-Performance Server and Desktop Products
https://www.slideshare.net/AMD/amd-chiplet-architecture-for-highperformance-server-and-desktop-productsZen 2: The AMD 7nm Energy-Efficient High-Performance x86-64 Microprocessor Core
https://www.slideshare.net/AMD/zen-2-the-amd-7nm-energyefficient-highperformance-x8664-microprocessor-core?next_slideshow=1 -
S_x96x_S
addikt
Cloudflare (March1) : "Technical Details of Why Cloudflare Chose AMD EPYC for Gen X Servers" - lényegében csak egy összefoglaló.
https://blog.cloudflare.com/technical-details-of-why-cloudflare-chose-amd-epyc-for-gen-x-servers/
+ https://news.ycombinator.com/item?id=22456702 -
S_x96x_S
addikt
válasz
Petykemano #2782 üzenetére
elnézést. túlreagáltam ..
-
S_x96x_S
addikt
válasz
Petykemano #2782 üzenetére
nincs semmi gond,
de ha ilyen magas labdát adsz, akkor miért csodálkozol ?
tessék pontosan fogalmazni> A kínaiak sosem voltak jók új dolgok fejlesztésében.
( Feb 28, 2020 )
Former Google CEO Eric Schmidt says China could supplant Silicon Valley as the world's tech powerhouse unless the US government steps in"It's pretty simple. By 2020 [China] will have caught up. By 2025 they will be better than us. And by 2030 they will dominate the industries of AI," Schmidt said in 2017, referring to a report from the Chinese government on its AI ambitions. "Trust me, these Chinese people are good. They are going to use this technology for both commercial as well as military objectives, with all sorts of implications."
https://www.businessinsider.com/former-google-ceo-eric-schmidt-on-china-tech-competition-2020-2
"Ultimately, the Chinese are competing to become the world's leading innovators, and the United States is not playing to win," he said. "For the American model to win, the American government must lead."
-
Petykemano
veterán
Úgy örülök, hogy ezen a fórumon mindig vannak, akik a mondandómban megtalálják a lényeget és rámutatnak, hogy nem tehetek egy állítást sem anélkül, hogy minden egyes körülményt, előzményt 25 oldalas esszében ne tárgyalnék ki ezzel ablakot nyitva az önelégült kiigazításnak.
Nyilván amikor azt mondom, hogy kínának a $100Mrd szerverpiacra fáj a foga, akkor valami hamis nyugati biztonságérzet szól belőlem. Mintha ez nem történt volna meg a Mobiltelefon piacon a huaweivel és a xiaomival.
Ne zavarjon, hogy egy mondattal utána mondtam hogy ez nem jelenti azt, hogy ne tudnának átállni innovatív fejlesztésre. Elnézést, hogy nem több bekezdésben fejtettem ki a szituációt. -
S_x96x_S
addikt
> Mert az ARM még mindig nem tart ott semmilyen téren,
> mint az x86/AMD64...erről győzd meg az Apple-t is.
https://www.theverge.com/2020/2/24/21151066/apple-mac-arm-chips-custom-intel-processorsAz ARM egyik előnye, hogy félig nyitott ; könnyen licenszelhető - emiatt gyorsabb ütemben tud fejlődni, hogyha van mögötte tőke és szándék.
pláne manapság ahol már gyártástechnológiát is lehet bérelni
és már ott tartuk, hogy 5nm-en előbb lesz ARM-es proci mint X86-os.persze a RISCv még nyitottabb.
-
joysefke
veterán
válasz
Petykemano #2777 üzenetére
A kínaiak sosem volt jók új dolgok fejlesztésében. Viszont remekül másoltak.
A második mondat igaz, ez első színtiszta butaság.
A másolás legfőbb oka, hogy addig amíg nem jutottál el tudásban, technikában, designban (és egy kicsit szabadalmi jogban) oda ahol az aktuális élvonal van, addig sokkal egyszerűbb, olcsóbb és hatékonyabb másolni mint eredetit tervezni/gyártani.
-
S_x96x_S
addikt
válasz
Petykemano #2777 üzenetére
> A kínaiak sosem volt jók új dolgok fejlesztésében
ez így nem igaz, (pl. puskapor, könyvnyomtatás, selyem )
és ami szerintem problémás, hogy vélt felsőbbrendűséget sugall,
és emiatt hamis biztonságérzetbe ringatja magát a nyugati elit.mert
- ott van Taiwan - ami szintén kínai kultúra .. 100% kínai emberekkel.
- Szingapúr, ami félig kínai.
és ott van az ópiumháború amikor a nyugatiak "megalázták" kínát, és emiatt a technológiai verseny stratégiai fontosságú minden nemzeti érzelmű kínai számára.A mostani Huawei-es kereskedelmi háború is az 5G miatt van,
és nem azért mert kína le van maradva, hanem azért mert az USA érzi úgy, hogy le van maradva.America Needs to Win the Battle for 5G Supremacy
https://www.nationalreview.com/2019/09/5g-technology-us-must-win-battle-to-set-standards/> Kína a nemzetközi x86 piacra akar betörni,
lehetséges,
- de az AMD-s eredeti licensz ezt nem teszi lehetővé.
- és a technológiai transzfert leállította az AMD, a ZEN2-est nem adják át. -
Petykemano
veterán
Kínának már két x86 gyártója is van mat.
- Via/Zhaoxin
- HygonA kínaiak sosem volt jók új dolgok fejlesztésében. Viszont remekül másoltak. Teszem hozzá gyorsan, hogy ez persze nem jelenti azt, hogy buták, vagy hogy ne tudnának átállni innovatív fejlesztésre.
Erre jó példa a repülőgép hordozó anyahajó. Évekig képtelenek voltak kifejleszteni. Végül valahogy birtokukba jutott egy ukrán vagy orosz ócskavasnak leselejtezett példány és azóta nem csak azt újították fel, de megfejtették a titkát és építik a sajátot.
Én valami hasonlóra számítok az x86 terén is.
Az az igazság, hogy nagyon nehéz úgy fejleszteni.valami jót, hogy arra nincs felvevőpiac. A kínai gazdaság államkapitalizmus. A Zhaoxin nem (csak) azért gyenge, mert kínai, hanem mert a kutya nem veszi, nincs bevétel, nem tudják a fejlesztés mögé tenni a tőkét.Tehát ami szerintem történni fog:
Most megszerezték a zen IP-t. Olyan, amilyen, de még ezzel is lehet, hogy a Zhaoxin procik fognak majd ugrani egyet. 2-3 évig még reverse engineeringgel másolni próbálják az amerikai konkurenciát. Taiwan kiskína...Eközben ugyebár elindult az kínai számítógépek hazai gyártásúra való cseréje az államigazgatásban.
Azt azért szögezzük le, hogy a legtöbb ország nagyvállalatának a hazai piac az alapja. Németországban Audi, Mercedes, (opel) volt az állami autó, franciaországban Renault, Citroën.
A hazai államigazgatásár egy kellően nagy piacot fog adni ahhoz, hogy a fejlesztésbe több tőke menjen.Kína célja szerintem elsődlegesen NEM a saját gyártású processzor a hazai piacon. Nem tűnt fel, hogy ma már Kína a szabadversenyes kapitalizmus, a szabad kereskedelem legnagyobb szekértolója? Kína a nemzetközi x86 piacra akar betörni, ez egy minimum $100mrd-os piac.
És ez a válasz arra is, hogy miért x86 és miért nem Arm.
-
joysefke
veterán
Azért mert a világ komoly szoftvereinek jelentős része x86-on fut.
-
#82819712
törölt tag
-
-
Ez politikai projekt. Hiába nem versenyképes a csúcs Intel és AMD szerverekkel, erre rá lehet mondani, hogy saját. Ha esetleg gazdaságilag elszigetelik Kínát (ahogy tették az Iránnal), akkor is képes lesz egy viszonylag modern processzort teljesen házilag gyártani, illetve adott esetben képes lehet az alapjain egy komplett családot fejleszteni.
Minket ez nem hat meg, csak vakarjuk a fejünket, hogy hát ez miért érte meg Kínának. De ha Kínai szemszögből nézzük, ez egy arany biztonsági tartalék. Igazából még Oroszország sem rendelkezik ilyennel. Stratégiai szempontból hozott politikai döntés...
-
-
S_x96x_S
addikt
válasz
Petykemano #2760 üzenetére
4. cikk: Gen X Performance Tuning ( February 27 ) (225W -ről -> 240W-re konfigurálták )
5. cikk: Securing Memory at EPYC Scale ( February 28 ) ( memória titkosítás )megj:
Az Intel a rendes memória titkosítást most szándékozik hozzáadni - ebben csak követi az AMD-t.
"Intel's security plans sound a lot like "we're going to catch up to AMD."
https://arstechnica.com/gadgets/2020/02/intel-promises-full-memory-encryption-in-upcoming-cpus/
" Intel's slides about their own upcoming full memory encryption are labeled "innovations," but they look a lot more like catching up to their already-established competition." -
S_x96x_S
addikt
AMD Zen 2 CPU - ISSCC 2020 slide elemzés
eredeti japán: https://pc.watch.impress.co.jp/docs/column/kaigai/1237830.html
* GoogleTranslate -> JP-> EN verzió -
Devid_81
félisten
válasz
Cathulhu #2766 üzenetére
(meg mindig kivancsi vagyok ki fogja elnyerni a brit meteorologiai szuperszamitogep ~1 mrd dollaros tenderet)
Mint 9 eve Angliaban elo megmondom neked az idojarast szuperszamitogep nelkul is, esni fog, de neha elal, majd ujra esni fog
Majustol Szeptemberig a valtozas annyi, hogy lesznek naposabb idoszakok is, de amugy esni fog -
Petykemano
veterán
válasz
Cathulhu #2766 üzenetére
Persze, szép fokozatosan építheti a mindshare-t. Ez volt benne implicit a próbavásárlásos kérdésemben. Fogalmam sincs, az a 80k mag mekkora tétel az azure összkapacitásában, de elképzelhetőnek tartom, hogy ha beválik a próbavásárlás és a következő beruházási körben az AMD még mindig jobb, akkor már nagyobb tételben nyergelnek át.
A google cloudban pl még mindig vannak haswell szerverek. Azt gondolnám, hogy egy epyc mellett azok üzemeltetése már áramfogyasztás tekintetében lényegesen rosszabb lehet, és sűríteni is lehetne, tehát helyfoglalás szempontjából sem ideális.
Oda akarok kilyukadni, hogy ha az erőviszonyok változatlanok maradnak, akkor valóban várható, hogy a Milanból még nagyobb tételeket fognak értékesíteni
-
Cathulhu
addikt
válasz
Petykemano #2765 üzenetére
Hetente 1-2x mindig bejelentenek egy-egy ujabb parszaz millios cray szuperszamitogep megbizast AMD-vel. sok kicsi sokra megy, es ez egyre inkabb mutatja az iparagi bizalmat az AMD fele. Igaz ezek jo resze kozbeszerzes es idealis esetben annak pont az a celja, hogy a legjobb ar/ertek aranyu gepre koltsek a kozpenzt, de egy egy ilyen gepet nem 2 evre epitenek, hanem mondjuk 10+-ra, ami hosszu tavon fog kihatni a mindshare-re. Es elobb utobb ez az AMD penzugyi jelentesein is meg fog latszani, mikor ezek elkezdenek realizalodni. Szoval ha szurkolunk az AMD-nek, akkor orulunk az ilyen kis 100 millioknak is
(meg mindig kivancsi vagyok ki fogja elnyerni a brit meteorologiai szuperszamitogep ~1 mrd dollaros tenderet)
-
Petykemano
veterán
Rome@Azure
12500 64 magos rome.Ez max $100m
Ezek még mindig elég kis összegeknek tűnnek...
Ezek lehetnek még csak ilyen próbavásárlások?
-
S_x96x_S
addikt
Linux 5.6 Tests On AMD EPYC 7742 vs. Intel Xeon 8280 2P With 100+ Benchmarks
https://www.phoronix.com/scan.php?page=news_item&px=Linux-5.6-Xeon-EPYC-Benchmarks -
Petykemano
veterán
-
S_x96x_S
addikt
( leegyszerűsített (~legyengített) ZEN1 )
Testing a Chinese x86 CPU: A Deep Dive into Zen-based Hygon Dhyana Processors
https://www.anandtech.com/print/15493/hygon-dhyana-reviewed-chinese-x86-cpus-amd"We discovered that these processors have been changed from the Zen 1 design in a number of ways. To say they are carbon copies of the Zen 1 SoCs, which is what a lot of people have suspected, is not true – enough has changed in the design to say that these parts are rebalanced, mostly for worse performance than their Zen 1 counterparts. The integer performance is essentially identical, however the floating point performance has been reduced – common instructions having half the throughput, and random number generation has been adjusted to be both slow and produce lower quality random numbers. The cryptography engines have also been replaced, such that common AES instructions are no longer accelerated but others more specific to the Chinese security, such as SM2, SM3, and SM4, are now included. In our testing, despite the processors showing AVX/AVX2 support when probed, it appeared to be disabled. We suspect this to be more of a firmware bug than a limitation of the Hygon CPU."
-
S_x96x_S
addikt
válasz
Petykemano #2760 üzenetére
> ez a jó marketing
igen
és ha jól értem, akkor ami most 1ccd = 2 ccx
az a ZEN3 -nál már 1ccd = 1 ccx lesz ( integrált cache-el )vagyis kimarad egy kapcsolódás , és ez valószínüleg a latency-n is meglátszik.
és a ZEN3-as L3 -cache is valószínüleg több lesz mint 32MB ;
jöhetnének már infók ...--------
A cikkből - ez a ZEN2-es 2 CCX -es c
-
S_x96x_S
addikt
válasz
Petykemano #2756 üzenetére
> Cloudflare - Rome inside
a céges blogon 2 poszt is megjelent ... ( angolul )#1.
Cloudflare’s Gen X: Servers for an Accelerated Future
February 24, 2020 2:00 PM
https://blog.cloudflare.com/cloudflares-gen-x-servers-for-an-accelerated-future/#2.
An EPYC trip to Rome: AMD is Cloudflare's 10th-generation Edge server CPU
February 25, 2020 3:00 PM
https://blog.cloudflare.com/an-epyc-trip-to-rome-amd-is-cloudflares-10th-generation-edge-server-cpu/~ 21%-os teljesítmény javulást vártak
"This gave us CPU frequencies yields for AMD at 3.03 Ghz and Intel at 2.50 Ghz on average with very little variation. With gross simplification, we expect that with the same amount of cores AMD would perform about 21% better than Intel."persze ez nem mindig jön össze,
- az OpenSSL teszt - csak 18% lett jobb
- a gzip - 29%-al lett jobb
- Go "AMD performs better in all of our Go benchmarks except for ECDSA P256 Sign losing by 38%, which is peculiar since with the test in C it does 24% better. It’s worth investigating what’s going on here. Other than that, AMD doesn’t win by as much of a margin but it still proves to be better."
.... -
Petykemano
veterán
válasz
joysefke #2757 üzenetére
Nem, vagy nem csak gúnyolódást érzek.én, hanem egyfajta berágást.
Ha a cloudflare alkalmazta az Intel sebezhetőségre kiadott patcheket, akkor állítólag elég jelentős teljesítényveszteség érhette őket.
Az Intel gyárai azért füstöltek, mert a piaci szereplők kétségbeesetten próbálták pótolni a kieső kapacitást a bevált eszközökkel. Nem kockáztattak: Inkább kelljen 2x annyi szerver, minthogy leálljon a szolgáltatás valamilyen kiforratlanság miatt (amd)
Ez nyilván költséggel jár, és ráadásul aztán a dupla költségű hardvert cserélheted le ugyanannyi elavulási idő után. (Az amazon nemrég bejelentette, hogy hosszabbít a platformok élettartamán)
Szerintem ez szülte ezt a megvető hangulatot az Intel felé.
Nyilván egyre többen döntöttek így, vagy fognak hasonlóképp dönteni. Talán emiatt az Intel meredek árcsökkentése.
-
joysefke
veterán
válasz
Petykemano #2756 üzenetére
Notably, for the first time, Intel is not inside. We are not using their hardware for any major server components such as the CPU, board, memory, storage, network interface card (or any type of accelerator). Given how critical Intel is to our industry, this would until recently have been unimaginable, and is in contrast with prior generations which made extensive use of their hardware.
Ilyet nem szoktak egy partnerről csak úgy írni: kicsit gúnyolódás szaga van a Cloudflare részéről -
Petykemano
veterán
-
S_x96x_S
addikt
2 új proci a beágyazott piacra ; NUC-okba ...
- R1305G (8-10W 2c/4t)
- R1102G (6W 2c/4t )+ pár új NUC bejelentése
-
S_x96x_S
addikt
szerintem van egy pici esély arra, hogy pár cég rögtön a PCIe 6.0-ra ugrik
és kihagyja az 5.0-át. ( de ez már vad spekuláció )még belegondolni is sok:
1 PCIe6.0 -ás csatorna megfeleltethető 8 PCIe3.0 -nak.> Tök jó, hogy az Epyc tudja a PCI-Express 4.0-át,
> de ahhoz hardverek is kellenek. Mondjuk jönnek is, lassan, de jönnek.
> Csakhogy a CCIX és a Gen-Z pont azért kezdett el formálódni,
> mert a PCI-Express lemaradt, nem kicsit, nagyon.a 3D-Xpoint memória kapcsán érdekes elemzés jelent meg:
"AMD-backed CCIX is obviously going to lose to Intel-backed CXL but there's an important takeaway: CCIX will run on PCIe4 - shipping now - while CXL won't work until we get PCIe5 - not shipping in CPUs for at least another year. From the Micron patent, it sounds like they've been working with AMD on a very high-performance, CCIX-based, 3DXP solution which could yield a huge advantage over Intel for as much as a year or more."
persze ez csak egy patent-en alapuló spekuláció ...
https://seekingalpha.com/article/4326611-next-gen-3d-xpoint-glimpse-future-of-memory
persze az egész cikk érdekes ..
"""
- The first is that Micron indicates that they have a controller which will interleave four channels each with 16 3DXP chips (64 total) for a total bandwidth of 100 gigabytes per second (!!!).
- The second is that they also indicate that each of the 3DXP chips will have a capacity of 32 gigabytes, which is double that of the current gen1 chips.
....
"""
---------------------------------------------------------------------------
más:
(#2753) Petykemano >
> Viszont ezt a kifogja a szelet kérdést nem teljesen értem
> ... de úgy már jelentős verseny lehet.igen a verseny a piaci keresletet csatornázhatja el ...
---------------------------------------------------------------------------
más : a STH elemezte az új Inteles árazást ...
eléggé versenyképes,
https://www.servethehome.com/big-2nd-gen-intel-xeon-scalable-refresh-brings-competition-anew/és igazából az érvelés lényege, hogy az Intelnek nem processzor szinten kell jól árazni, ( és lehet drágább mint az AMD ) hanem szerver/rack szinten .. és ha itt jó az ár-teljesítmény arány, akkor elfogadják, hogy a CPU drágább.
"
By implementing DCPMM support further down the stack, Intel is signaling something obvious, that it is focusing on bundling silicon products. The more SKUs that support DCPMM the more opportunities to bundle that technology along with other technologies. Intel does not need to be the lowest cost on CPUs if it can provide the best value at the server and rack levels.
With this “refresh” or “Intel Xeon Scalable Gen 2R” launch, it is now up to the rest of the industry to respond. Make no mistake, this is a fierce and formidable competitive move by Intel and other players now need to respond in turn.
"mindenesetre most az AMD lép. Vajon lesz árcsökkenés vagy sem ..
Ha a Micron-os új termék piacra lép ( sőt jobb lesz) ,
akkor ez hatástalanítja az Inteles Optane DCPMM stratégiát.persze a szoftveres integráció is számít.
és abban elég jól áll az Intel
"HMEM Device Driver Coming For Linux 5.5"
https://www.phoronix.com/scan.php?page=news_item&px=Linux-5.5-HMEM-Driver
"Intel's HMEM DAX driver is being added to Linux 5.5 for use-cases like their Optane DC Persistent Memory." -
Petykemano
veterán
válasz
S_x96x_S #2751 üzenetére
"Igazából az AMD-nek is szüksége lenne ilyen AI/ML-re tunningolt HPC-s APU-kra"
Csak emlékből, de mintha az arcturusnál.megjelenne a bfloat16, ami egy fontos és hasznos fícsör a ML cuccokhoz.
És a navi12-t is úgy emlegetik, hogy DL/ML utasításokkal bővül.Ezek szerintem alkalmasak lehetnek az AMDnek AI/ML lábaknak. Nyilván lehet lefelé skálázni apunak.
Viszont ezt a kifogja a szelet kérdést nem teljesen értem. Mármint abból foghatja ki a szelet, hogy egy komolyabb gpu-t egy komolyabb CPU mellé kelljen tokozni "BIG APU"-ként.
A közös tokozás , közös IO lapka ugye azt tenné lehetővé, hogy a compute lapka a memória sávszélességvel tudjon adatokan kinyerni a memóriából, ne pedig a pcie3 sebességével. A pcie6 ezt a gátat mondhatnók áttöri. Pcie6-on keresztül is megoldható a memória-koherens elérést (CXL) tehát egy ilyen compute lapka HBCC-vel tudna streamelni a saját memóriáját gyorsítótárnak használva. (Nyilván persze a pcie6 az egy plusz lépcső)
A vitorlából kifoghatja a szelet dolgot úgy tudom értelmezni, hogy míg összetokozásos megoldás esetleg csak AMDnek volt, addig bár a cxl és a pcie6 nem gátolja meg az amdt se, hogy úgy kínálja a portékáját, de úgy már jelentős verseny lehet.
Talán csak az az egy kérdés van, hogy vajon energiafelhasználás szempontjából számít-e, hogy csak az IO lapkán keresztül történik-e a memóriaelérés, vagy még a pcie6-on is átmegy. Ugye az epyc esetén is a huzalozáson átáramló adat rengeteg energiát emészt fel.
-
válasz
S_x96x_S #2750 üzenetére
A fő kérdés, hogy ki merre indul el és mennyire sikerül az adott technológiát elterjeszteni. Tök jó, hogy az Epyc tudja a PCI-Express 4.0-át, de ahhoz hardverek is kellenek. Mondjuk jönnek is, lassan, de jönnek. Csakhogy a CCIX és a Gen-Z pont azért kezdett el formálódni, mert a PCI-Express lemaradt, nem kicsit, nagyon. A felhő alapú számításnál pedig hátrányba került az, akinek nincs saját külső interconnectje (az nVidia itt gurított az nVLinkkel, a 2.0 már kint van két éve, 200Gb/s sebességgel, full duplex).
Az Intel kicsit elaludt, mivel a PCI-Express 3.0 vonallal tökön lőtte magát, mert ott például 8Gb/s per lane van, ami 16x csatinál = 128Gb/s. Közben meg jönnek már a 200Gb/s és készülnek a 400Gb/s hálózati csatik. Igény lenne rá, mert iszonyatos pazarlás, hogy a 16x PCI-Express csatikat hálókártyákkal tömjék meg, csak ugye az Epyc esetében is 256Gb/s az elméleti csúcs, és várják sokan a PCI-Express 5.0-át (elméleti határ: 512Gb/s). Ezért kell a CCIX (25Gb/s * 16 = 400Gb/s) és brutálisan erős opció a Gen-Z (itt még az alap 16Gb/s per lane is elégséges lehet, ha kihasználód a 256 sávot = 4096Gb/s elméleti határ, és a szkenárióban ott van az 56Gb/s per lane...). A
Miután az AMD túl kis szereplő (jelenleg), hogy maga határozza meg a "merre" vonalat, ezért kénytelen minél többet támogatni, hogy legalább a rugalmassága miatt opció legyen az asztalon.
-
S_x96x_S
addikt
AMD rivális figyelő
-------------------------------------
Glenn Henry, Centaur co-founder ( centaur: ez az új X86 rivális AVX512-re tuningolva)
előadása a Stanford-on ( ~1,5óra) .. mindenféle technikai részletekkel ( motivációval, kihivásokkal, döntésekkel )Stanford Seminar - Centaur Technology's Deep learning Coprocessor
https://www.youtube.com/watch?v=5Z7cmyYakAwők lényegében nem a GPU-val, hanem NPU-val integrálták a CPU-t - vagyis ez is egyfajta APU - tágabb értelemben.
------------------------Igazából az AMD-nek is szüksége lenne ilyen AI/ML-re tunningolt HPC-s APU-kra ;
mert lenne rá igény. ( viszont ha a CXL és az PCIe6.0 kifogja a szelet a vitorlából, akkor nem biztos, hogy üzletileg jó döntés ; viszont a chipletes technológiával így ki tudnák maxolni a 32-core os szoftvare licnce korlátot .. és az AVX512 igényt valamennyire ki tudnák elégiteni - átterelve a feldolgozást a GPU-ra. ) -
S_x96x_S
addikt
pice6.0 : igazad van, inkább 2022 .. 2023 ... a várható bevezetés.
> 2021-ben örülhetünk, ha a 2019-ben lezárt PCI-Express 5.0 megérkezik.
Elméletileg az Intel Server fronton ( LGA4677 ) azzal tervez - 2021 -re ( + DDR5 )
persze addig még sok idő.Mindenesetre az AMD-nek szintén meg kell ugyanezt célozni az Epyc -nél
( Desktop szinten már más tészta .. ott lehet, hogy a PCIe4.0 -val még elvannak a felhasználók még egy 1-2 évig. Viszont ha az Intel meglepetésszerűen a desktop szintre is lehozza, akkor az AMD-nek is lépnie kell. )A szerver fronton a CXL és a CCIX ; GEN-Z miatt lényeges a jövőbeli PCIe5.0 megjelenés.
amúgy az AMD túl nyitott lett és ezt a mérnökei szívják meg.
Mert nekik - minden szabványt be kell integrálni a chipjeikbe, ami szerintem szívás.A CXL mellett ott van a GEN-Z,CCIX,OpenCApi, ... kiváncsi leszek, hogy fogja -e mindet tudni.
persze egyesek szerint [Gen-Z + CXL] összeolvadásának és túlélésének van a legnagyobb esélye, de az is lehet, hogy minden ötletet a CXL következő verziójába integrálnak be.
egyre nagyobb a lista:
https://www.computeexpresslink.org/membersCXL erőteljes ütemű PCIe6.0 bevezetést vár
"CXL usages expected to be key driver for an aggressive timeline to PCIe 6.0"
ajajj .. hamar el fognak avulni a gépek ..lehet frissíteni.
-
válasz
S_x96x_S #2745 üzenetére
A specifikáció lezárása egy dolog, a piacra kerülés egy másik. 2021-ben örülhetünk, ha a 2019-ben lezárt PCI-Express 5.0 megérkezik. Ugyebár a lezárt specifikációkat még be kell építeni a jelenleg fejlesztés alatt lévő CPU-kba, SKU-kba...
Röviden egyébként a "szokásos" előrelépés, vagyis duplázódik a sávszélesség a PCI-Express 5.0-hoz képest és alacsonyabb válaszidő.
-
HookR
addikt
válasz
S_x96x_S #2743 üzenetére
A második linkeden van egy érdekes, látókör szélesítő komment, remélem nem gond, ha bemásolom:
olliej: "I still don’t understand what it is about avx2 that results in these kinds of issues - is it really just a matter of increased number of execution units running at once causing weird power and heat issues?"
paulmd: "Not increased number of execution units, but increased number of transistors, yeah.
A normal multiply does 1 number at a time (32 bit for simplicity). AVX2 can do up to 8 multiplications at a time. That's a huge amount more transistors firing all at once and that causes the voltage to start to droop.
AVX-512 takes that even further and now it's 16 multiplications per unit, oh and Intel moved from 1x256-bit unit per core on Haswell/Broadwell to 2x512-bit units on Skylake-X, so it's potentially 32 multiplications at a time.
Basically to prep for that much power being drawn all at once, the chip has to wind everything else down and switch to a higher-voltage mode to account for the voltage droop caused by all those transistors switching at once in one place.
At this level behavior is intensively analog and thermals/voltage both significantly affect transistor current draw and switching time, which feeds back into heat and power consumption.
This gets even more problematic on 7nm/10nm type nodes and especially in GPUs where you are doing a huge amount of vector arithmetic all the time. Essentially it is no longer possible to design processors that are 100% stable under all potential execution conditions, or even under normal operating conditions, so you have to have power watchdog circuitry that realizes when it's getting close to brownout/missing its timing conditions and slows itself down to stay stable. That's why AMD introduced clock stretching in a big way with Zen2 (despite the fact that it's nominally been around since Steamroller). NVIDIA piloted this with Pascal, AMD piloted it with Vega and brought it to CPU with Zen2. You simply cannot design the processor to be 100% stable at competitive clocks anymore. You have to have power management that's smart enough to withstand small transient power conditioning faults.
https://semiengineering.com/managing-voltage-drop-at-107nm/
https://semiengineering.com/power-delivery-affecting-performance-at-7nm/ " -
S_x96x_S
addikt
válasz
Petykemano #2744 üzenetére
> Ez csak TR vagy EPYC is érintett?
nem tudom .. korai még bármit mondani .. akár szoftver bug-is lehet.
Ha komoly, akkor gondolom pár technikai újságiró is teszteli egy héten belül.
valamint az AMD is csinál rá fixet ...A furcsa,hogy nem az eredeti helyen kommentelik. hanem a HN-on aktív ..
-
S_x96x_S
addikt
durva ... jövőre PCIe 6.0 ... mikor szivárog ez le a mezei ZEN chipekbe ?
kb ~128GB/sec lesz a x16 a sebesség. ( a PCIe4.0 x16 csak ~32GB/sec )
Ez már mintha lenyomná a dual chanel-el DDR4-et .. ( vagy valamit elszámoltam?)-----------------
"PCIe 6.0 Specification Hits Version 0.5: On Track for 2021"
https://www.anandtech.com/show/15540/pcie-60-specification-hits-version-05-on-track-for-2021 -
S_x96x_S
addikt
éppen emiatt áll a bál .. ( legalábbis a Hacker News-on )
"AMD Threadripper 3970X under heavy AVX2 load: Defective by design?"
https://forum.level1techs.com/t/amd-threadripper-3970x-under-heavy-avx2-load-defective-by-design/153883+ https://news.ycombinator.com/item?id=22382946
-------------------------------------------------------------Wikichip elemzés a már posztolt ISSSCC -előadással kapcsolatban
"7nm Boosted Zen 2 Capabilities but Doubled the Challenges"
https://fuse.wikichip.org/news/3320/7nm-boosted-zen-2-capabilities-but-doubled-the-challenges/ -
joysefke
veterán
válasz
Petykemano #2740 üzenetére
Fene se tudja, lehet az OEM gyártók előre lefoglalnak notebook és szerver chipeket a majdani termékpalettához. Ezt az AMD és TSMC már tényleges keresletként tudja elkönyvelni.
Az intel tavalyi bénázását és jelenlegi szállítási nehézségeit figyelembe véve elképzelhető, hogy néhány gyártó hosszú távra tervezhetővé akarja tenni ez ellástái láncot és nem ad hoc rendelgetni a legkritikusabb komponensből (processzor).
Aztán lehet hogy szimpla elírás és a "sima" 7nm ZEN-ről van szó...
-
S_x96x_S
addikt
válasz
Petykemano #2740 üzenetére
> 7nm EUV ...
lehet, hogy már a ZEN3-ra gondoltak
( és gyártják ? )
de az is lehet, hogy csak elírás. -
S_x96x_S
addikt
"Demand for AMD's new 7nm EUV processors remains robust, with development projects for the chips commenced by PC, motherboard and graphics card makers this year set to be 10-20% higher than the levels in 2019, according to industry sources."
https://www.digitimes.com/news/a20200221PD207.html
--------
TSMC & STMicroelectronics .. kooperáció a 10x gyorsabb chipek miatt."STMicroelectronics and TSMC are collaborating to accelerate the development of gallium nitride (GaN) process technology and the supply of both discrete and integrated GaN devices to market. Through this collaboration, ST's products will be manufactured using TSMC's GaN process technology, according to the companies."
"GaN is a wide bandgap semiconductor material which offers significant benefits over traditional silicon-based semiconductors for power applications. These benefits include greater energy efficiency at higher power, leading to a substantial reduction in parasitic power losses. GaN technology also allows the design of more compact devices for better form factors. Additionally, GaN-based devices switch at speeds as much as 10X faster than silicon-based devices while operating at higher peak temperatures. These robust and intrinsic material characteristics make GaN ideally suited for broad-based adoption in evolving automotive, industrial, telecom, and specific consumer applications across both the 100V and the 650V clusters."
Ami érdekes, hogy emlitik CEA-Leti -t , akik a 96core-os 6 chipletes procit csinálták.""This cooperation complements our existing activities on power GaN undertaken at our site in Tours, France and with CEA-Leti. GaN represents the next major innovation in power and smart power electronics, as well in process technology," said Marco Monti, president of STMicroelectronics' automotive and discrete Group."
https://www.digitimes.com/news/a20200220PR202.htmlmegj:
- A gallium nitride (GaN) -os technológiát a chipset-es architektúra jól ki tudja használni
( egy adott funkciójú lapot a neki ideálist gyártástechnológián gyártanak )
"The semiconductor material used to make each chiplet is not limited to silicon, which is another chiplet advantage. For example, specialized chiplets could be made from a variety of composite semiconductor materials including SiGe (silicon germanium), GaAs (gallium arsenide), GaN (gallium nitride), or InP (indium phosphide) to exploit the unique electronic properties of these semiconductor materials." ( link PDF )persze a probléma ott van, hogy Kínához köthető a világ gallium termelésének a 95%-a
és az 5G-s termékek is erősen fogyasztják. ( link )És meg kell még említeni, hogy az Intel is elég sok pénzt tol a szilícium alternatívájának keresésébe - vagyis a TSMC is versenykényszerben van.
Intel at IEDM: Stacking Nanoribbon Transistors and Other Bleeding Edge Research
https://www.tomshardware.com/news/intel-at-iedm-stacking-nanoribbon-transistors-and-other-bleeding-edge-research -
joysefke
veterán
válasz
Petykemano #2731 üzenetére
Elsősorban azért mert AMD. Egyébként ez a most üzembe helyezett gép Németország leggyorsabb szuperszámítógépe és 5-ik a toplistán.
Nyilván ha intel lenne az az intel hatalmas részesedését a sz.számgép piacon figyelembe véve nem lenne hír.
Egyébként most nyert egy intel alapú pályázat egy német szuperszámítógép tenderen a legnagyobb áramzabáló Xeonokra alapozva. Van némi felzúdulás, "hogy ezt hogyan"...
Erről van szó: https://insidehpc.com/2020/01/intel-powers-hlrn-iv-supercomputer-at-zib-in-germany/
Hát mégis léteznek az 56-magos Xeonok -
S_x96x_S
addikt
válasz
Petykemano #2736 üzenetére
> Kár, hogy nem mondanak.többet erről a 96 magos prototípusról.
remélem lesz folytatás ..
csak ezt találtam még:
http://www.leti-cea.com/cea-tech/leti/english/Pages/What's-On/Press%20release/CEA-Leti-Presents-High-Performance-Processor-Breakthrough-Active-Interposer-3D-Stacked.aspx-----------
ami még érdekes, hogy a konferencián 2 másik AMD-s előadás mellé tették be.
( Az egyik AMD előadáson ovelockoltak
https://twitter.com/david_schor/status/1229581188928401408 )----------
A japán oldalon találtam még pár érdekes AMD-vel kapcsolados technikai slide-ot.
pl. Ryzen Threadripper -es ..
https://pc.watch.impress.co.jp/docs/column/kaigai/1223210.html -
Petykemano
veterán
válasz
S_x96x_S #2733 üzenetére
Érdekes, hogy az ibmnél már a L3$ is eDram.
Kár, hogy nem mondanak.többet erről a 96 magos prototípusról. Persze nyilván itt nem a CPU a lényeg, hanem az aktív interposer, az összeköttetés és a skálázódás.
Ja, meg persze a 3d
Bár ez nekem magyarázatra szorul. Itt 6 lapka van. Ezek vannak 3d stackelve? Vagy arról van szó, hogy egy lapka 8 magos, ebből van 2db 3d stackelve.és ilyen 2x8-as toronyböl van 6?Mindenesetre igen, azt korábbi mérésekből tudjuk, hogy interposerrel Lehetne jelentősem csökkenteni az összeköttetés fogyasztását.
Active interposer lehet egyben IO lapka is. Adoredtv csinált videót a lehetséges topológiákról is.
És hát ez azt is bemutatta, hogy miképp Lehetne megduplázni a magok számát úgy, hogy közben az egész package kiterjedése nem nő. -
#82819712
törölt tag
Megjelent a Process Lasso 9.7 verziója - Processor Group Extender
Ez az új algoritmus lehetővé teszi a processzorcsoport számára ismeretlen alkalmazások számára a teljes CPU használatát. Ezt úgy valósítja meg, hogy megfigyeli a célfolyamatok szálait, és szükség esetén dinamikusan hozzárendeli a szálakat a kiegészítő processzorcsoportokhoz.In the case of AMD’s 3990x, for a CPU bound group unaware application with 128 threads, the performance boost would be nearly 100%.
Ez kegyetlen jól hangzik. -
S_x96x_S
addikt
3990X 128thread skálázódás ..
( ebben a tesztben a "CentOS Stream" a legjobb )
de van kivétel ; ahol meg a FreeBSD ...összesítés:
"Lastly is a look at the geometric mean for all of the benchmarks conducted for this FreeBSD vs. Linux scaling comparison on the AMD Ryzen Threadripper 3990X. In the end, both CentOS Stream and Ubuntu 20.04 (development) delivered similar performance and were basically tied for first. FreeBSD 12.1 performed well and in terms of LLVM Clang 8.0.1 (their default compiler) versus GCC 9, the GNU compiler tended to offer slightly better performance in these particular benchmarks on this AMD Zen 2 HEDT processor."link: https://www.phoronix.com/scan.php?page=article&item=3990x-freebsd-bsd&num=1
-
S_x96x_S
addikt
érdekesség; az új z15 (IBM ) maradt 14nm-en és 5.2Ghz + monolitikus design - mindenféle (Gzip?) -es gyorsítással.
és van L4-es cache is.--------------------
IBM z15 ( ISSCC konf. )
https://pc.watch.impress.co.jp/docs/news/event/1236519.html---------------
Valamit a CEA-Leti 96 core-s 6chipletes proci prototype is érdekes.
512core-ig skálázható!https://www.cdrinfo.com/d7/content/cea-leti-presents-high-performance-96-core-processor-made-chiplets
"The prototype's 96 computing cores are organized in six chiplets in 28nm FDSOI, CMOS node, which are 3D-stacked in a face-to-face configuration using 20µm pitch micro-bumps onto an active interposer embedding through-silicon vias (TSVs) in a 65nm technology node. The overall system architecture offers a fully scalable distributed cache-coherent architecture between all the chiplet computing tiles, which are interconnected through the active interposer. The cache-coherent architecture allows easy software deployment through a hierarchy of caches, for full system scalability up to 512 cores."
-
S_x96x_S
addikt
válasz
Petykemano #2729 üzenetére
> Comet Lake rajtja ... Lesz AMD oldalon áreső?
biztos kell pár helyen igazítani az árakon.
"One of the more interesting duels will likely be between the i5-10400F, which apparently costs $160-$175, and the Ryzen 5 3600 that's priced at $175. Both fighters come with six cores and 12 threads, so it'll be exciting to see which comes out as the winner."
https://www.tomshardware.com/news/intel-10th-generation-comet-lake-pricing-cpusHabár remélem ~április körül - már az új ZEN2-es desktop APU-król is lesz hír. ( 4400G? ) és igazából ezek árazása lesz érdekes ..
Vagyis egy 8c/16t -es APU-t erős Vega-val hova pozicionálnak ;
- mennyivel az Inteles árak felé lesz belőve.
- és mit jelent ez a normál ZEN2-es procik árazására. ( 3700X )Vagyis mennyi lesz az APU-s felár - ugyanannyi magszám esetén.
-
joysefke
veterán
válasz
Cathulhu #2719 üzenetére
Itt van egy másik, dupla akkora gép ugyanennek a hétnek a termése:
https://www.computerbase.de/2020-02/hpe-apollo-9000-hawk-supercomputer-24-petaflops-amd-epyc-rome-7742/ -
Petykemano
veterán
Úgy tűnik, küszöbön a Comet Lake rajtja
Lesz AMD oldalon áreső? (Már persze a jelenleg is tapasztalható 12-13%-os MSRP-hoz viszonyított kedvezményhez képest)
-
Petykemano
veterán
Geekbench 5
Google Cloud - n2d-standard
AMD EPYC 7B12
https://browser.geekbench.com/v5/cpu/1257340 -
S_x96x_S
addikt
ZEN2-es infók a ISSCC 2020 - konf.-ról. ( 27 angol slide; japán kommentek)
https://pc.watch.impress.co.jp/docs/column/semicon/1236258.html -
S_x96x_S
addikt
válasz
S_x96x_S #2725 üzenetére
Fusion Compiler ...
The Singular RTL-to-GDSII Digital Implementation Solution
https://www.synopsys.com/implementation-and-signoff/physical-implementation/fusion-compiler.html"Benefits
* Single, integrated data model architecture for unmatched capacity, scalability, and productivity
* Unified RTL-to-GDSII optimization engines unlocks new opportunities for best performance, power, and area results
* Built-in signoff timing, parasitic extraction, and power analysis eliminate design iterations
* Pervasive parallelization with multi-threaded and distributed processing technologies for maximum throughput
* Leading foundry process certified FinFET, gate-all-around, and multi-patterning aware design
"És az ARM -es új chipek tervezésénél is ezt használták.
( Fusion Compiler on Arm’s Latest Performance-Optimized CPUs ) -
S_x96x_S
addikt
Synopsys' Fusion Compiler + AMD EPYC
https://news.synopsys.com/2020-02-19-Synopsys-Fusion-Compiler-Adopted-by-AMD
"
* AMD deploys Synopsys' Fusion Compiler RTL-to-GDSII product for the development of its next-generation processor products
* Unique, single-data-model architecture and unified, full-flow optimization engines deliver superior performance, power and area metricsSynopsys, Inc. (Nasdaq: SNPS) today announced that AMD is deploying Synopsys' Fusion Compiler™ RTL-to-GDSII product for its full-flow, digital-design implementation. Based on an evaluation process, the Fusion Compiler product delivered industry-leading performance, power and area (PPA) metrics. This work has additionally resulted in an expanded collaboration between Synopsys and AMD to optimize Synopsys applications on AMD EPYC™ processors, targeted to deliver marked runtime acceleration benefits when deploying the Fusion Compiler RTL-to-GDSII product across servers powered by AMD EPYC processors. These advancements will be made available to all users in upcoming service packs.
....
"ha jól értem, akkor ez a chiptervezést gyorsítja fel - mindenféle mesterséges intelligenciás és egyéb optimalizációs okoságokkal.
eddig is partnerek voltak, csak most egy újabb szoftvert is elkezdtek használni ..
spekuláció:
- és lehet, hogy a TSMC N5 (5nm) miatt kellhet? (feltételezem, hogy a ZEN3 tervek már készek)
Synopsys and TSMC Collaborate for Certification on 5nm Process Technologies to Address Next-generation HPC, Mobile Design Requirements
https://news.synopsys.com/2019-09-26-Synopsys-and-TSMC-Collaborate-for-Certification-on-5nm-Process-Technologies-to-Address-Next-generation-HPC-Mobile-Design-Requirementspersze TSMC 7nm-re is van mindenféle segédanyag ( 7FF ; 7FF Plus )
https://www.synopsys.com/dw/emllselector.php?f=TSMC&n=7&s=r3YRJQTSMC - Synopsys Collaboration
https://www.synopsys.com/community/partners/tsmc.html -
S_x96x_S
addikt
válasz
S_x96x_S #2722 üzenetére
Az új 32c/64t -es CPU-nál (7532) kimaxolták az L3-as cachet - 256Mb-lett, mint a 64c-é. Lehet, hogy ez is valamilyen összefüggésben van a VMware-es licensz módosítással.
Update: We now have list pricing from AMD “In our standard 1Ku pricing, the 7662 is $6,150 and the 7532 is $3,350.” (Source: AMD)
AMD says that Dell and Supermicro will now offer the two new SKUs while HPE and Lenovo will follow. We requested list pricing and will update this piece when we get it.
https://www.servethehome.com/amd-epyc-7662-and-epyc-7532-launched/
-
#82819712
törölt tag
-
S_x96x_S
addikt
új EPYC :
- 7662 (64c/128t; 225W ) ~ $6650 körül
- 7532 (32c/64t; 200W) ~ $3600Expanding the AMD EPYC™ processor portfolio
https://community.amd.com/community/amd-business/blog/2020/02/19/expanding-the-amd-epyc-processor-portfolio -
Cathulhu
addikt
válasz
Petykemano #2720 üzenetére
Az AMD tul kishal a HPC piacon, hogy lehetosege legyen a CUDA ellen tenni, raadasul az sem segit, hogy par evente iranyt valt. Akkor lesz itt erdemi valtozas, ha az intel kartyai erdemi teljesitmenyt tudnak felmutatni, mert akkor hirtelen az intelnek is erdeke lesz a CUDA-t levaltani, mert tud majd egy olyan platformot nyujtani, amit az AMD is akart a HSA-val (OneAPI khm). A helyukben osszefognek es nyilt szabvany melle tennem le a voksot, mert az idovel ugyis gyozedelmeskedik/het es ha eleg nagy a nyomas, akkor az nVidianak is be kell allnia moge, lasd freesync pl. De nyilvan ez utobbinak nem erdeke, ezert tenyleg nagy nyomas kell hozza, amihez az AMD es a Frontier egyedul nagyon keves.
szerk:
"Hogy bánhatja szegény AMD, hogy ehhez nem tud még Arcturust kínálni."
Szerintem ha tudna se erdekelte volna a megrendelot. Nekem az aranyokbol az jon le, hogy viszonylag keves GPU-n futo projekt lehet, azokat meg ugyis CUDA alapon irjak, szerintem. -
Petykemano
veterán
válasz
Cathulhu #2719 üzenetére
Hogy bánhatja szegény AMD, hogy ehhez nem tud még Arcturust kínálni.
(Bár persze lehet, hogy az Arcturus olyan projekt-termék, amit pont az ilyenekbe próbálnak elsősorban eladni, aztán vagy sikerül vagy nem)Kiváncsi vagyok, hogy ha üzembe áll, vagy legalább elkezd épülni a Frontier, közben, vagy utána lesz-e elmozdulás, vagy továbbra is az nvidia CUDA lesz a nyerő minden ilyen célre.
Tegyük hozzá, hogy a 100db V100 nem egy nagy összeg (~$6000). Nem több, mint $1m.
De 290304 mag, ha 64 magos procikkal számolunk, akkor 4536 és ha a legcsúcsabbat veszik, ami kb $8k, akkor sem jön ki több, mint $35mmondjuk ha a többi alkatrészt is beleszámoljuk, nem tudom, hogy jön ki 3db $71m-ból, de mindegy.
-
Cathulhu
addikt
[link]
Újabb Epyc win. Ha nem elírás a ~100 db V100, akkor ez egy elég CPU heavy szuperszámítógép lesz.Épp melyik nap hagytak jóvá egy majd 1milliárd fontos angol szuperszámítógép beszerzést, arra is kíváncsi lennék ki nyeri
-
válasz
S_x96x_S #2716 üzenetére
Állítólag az "Unreal Engine" - kapott egy kis optimalizációt
...a kódfordító motorhoz (compiling), és nem a játékengine-hez magához.
de ezen kívül tud valaki még valamit, hogy az UE - mennyire támogatott több core -on ?
Úgy tudom 64 szálig skálázódik. *Doppergés* függően attól, milyen jellegű terhelést kap.
Ez a fő probléma a fejlesztés terén: bizonyos dolgokat tök szépen lekezel az UE, de nagy általánosságban nehéz a párhuzamos multi-thread megfelelő leprogramozása. Szóval az UE motoros játékok többsége jelenleg jobban szereti a magas IPC-t, mint a több szálat.
Nézd meg az SW: Jedi Fallen CPU teszteket, az i3-8100 (4 mag / 4 szál) kb. olyan teljesítményt nyújt, mint a Ryzen 5 3600 (6 mag / 12 szál). Az i5-8400 (6 mag / 6 szál) pedig lelépi az R9 3950X-et is...
-
S_x96x_S
addikt
UE / Játékok >= 16core felett..
Állítólag az "Unreal Engine" - kapott egy kis optimalizációt
(3990X) "AMD’s also verified 64-core scaling for compiling projects like Android OS or Unreal Engine, so there will no doubt be some demand for those tasks as well." ( link )
és mintha a Crysis is UE4 -el fut ..
valamint a Crysis -t lehet tisztán CPU-n is futtatni ( TR3990X-el )
de ezen kívül tud valaki még valamit, hogy az UE - mennyire támogatott több core -on ? melyik verziót érinti, az ezzel készülő játékok mikor jelenhetnek meg ? ( esetleg bármi technikai részletet ? ) -
S_x96x_S
addikt
AMD EPYC™ Cloud Adoption Grows with Google Cloud
"New Google Compute Engine N2D virtual machines (VMs) based on 2nd Gen AMD EPYC™ processors provide double digit savings and performance improvements over existing N-series instance"
https://www.amd.com/en/press-releases/2020-02-18-amd-epyc-cloud-adoption-grows-google-cloudGoogle-os post ( "N2D" )
https://cloud.google.com/blog/products/compute/announcing-the-n2d-vm-family-based-on-amd
"N2D VMs are now available in beta from us-central1, asia-southeast1, and europe-west4, with more regions on the way!"akit érdekel - FREE Trial $300 free credit .. -es link is van az oldalon ..
https://cloud.google.com/free/ -
S_x96x_S
addikt
> Kicsit furcsán lőtte be az AMD a CPU-k árát...
árazás ...
Az ArsTechnica csinált egy ár-thread összehasonlítást..
Ebben érdekes - hogy az Intel elég jól belőtte az új HEDT-es i9-10980XE prociját egy leheletnyivel az új threadripper 3960X alá ; éppen annyira, hogy azért én is elgondolkodjak. ... (legalábbis a 2x AVX-512 FMA Units -t azért csábító.; de ezen kívül meg minden másban meg nem ... )persze az AM4 -es 3950X ($750/32thread = $23.4 -re jön ki , ..
vagyis az Intel 10980XE - $27.78 thread ára .. éppen elég jól pozicionált.
Sóhaj/óhaj ... lehetne egy 16c/32t -es Threadripper proci is ... -
S_x96x_S
addikt
AMD EPYC 7272 Review 12 Cores of Rome
https://www.servethehome.com/amd-epyc-7272-review-12-cores-of-rome/
( A.l.z.a.n.á.l br.258eFt , avagy 203e+ÁFA)
( 12 magos, 24-szálas, 2,9 GHz, Boost technológiával akár 3,2 GHz, 64 MB L3 cache, TDP 120 W, EPYC 7002, hűtő nélkül, AMD SP3 foglalat )
Ami furcsa, hogy a 16magos 7282 10eFt -al több. -
Petykemano
veterán
"Ez megszüntetheti az említett szűk sávszél problémáját.
A közös címtér miatt meg nem kell majd mindent betölteni a cpu-n levő ramba, csak ami kell, így a gyorsítótárban elfér a fontos adat és ami később kell majd át lehet tölteni a fő ramból (már azt is gyorsabban ddr5 alapokon).
Én mindenképp a zen4 vagy zen5 időszakára várnám a következő nagyobb design ugrást emiatt. Azt nem tudom persze ez már 3D tokozás lesz-e, vagy csak esetleg 2.5D, vagy marad 2D mint a mostaniak. Hely szempontjából a 3D a legjobb, de a hűthetőségnek erősen gondot jelent. A 2D ügye sok helyet igényel, és esetlegesen nagyobb távolságokat ami késleltetésben nem jó. A 2.5D egy jó kompromisszum lehet."Igazából az AMD-nek már megvan a technológiája erre: HBCC
Az pont azt csinálja, hogy a GPU fedélzeti ramját csak gyorsítótárként használja.A cache layerekről persze általánosságban elmondható, hogy minden layer hozzáadhat egy adatkérés késleltetéséhez - amennyiben az nem található meg a cache-ben. Ezt persze szerintem okos prefetcherekkel kezelni, meg azért 2-8GB elég gigantikus ahhoz nagy legyen a haszon az esetleges veszteséghez képest.
Azt nem tudom, hogy vajon a HBCC milyen késleltetést adott hozzá a pcie-en keresztüli adateléréshez? És hogy ehhez képest ha egy ilyen megoldás a RAM előtt van L4$-ként, akkor ahhoz képest ez milyen. Valamint hogy mennyit számíthat az a ram késleltetésében, hogy a HBM2 nagyon közel (pár mm) van az IP chiphez szemben a RAM-mal, ami pár cm-re.
Teszem hozzá, a HBM2 valószínűleg nem késleltetés-bajnok, különben már rég használnák ilyen célre.
A 3D szerintem abban segíthet "csak", hogy szükséges-e interposer. Mert ha most az IOD tetejére rá lehetne pakolni HBM-et, az már most is működne.- (Más kérdés, hogy vajon a két lapka közötti szintkülönbséget mivel hidalnák át?)
Ugyanakkor meg azt is tudjuk, hogy az interposeres lapka-összeköttetés lényegesen tudná csökkenteni a fogyasztást, ami pedig az IF esetén így se kevés.
Bár az IO lapkára pakolni valamilyen cache-t egészen adná magát, hiszen azon keresztül fut minden memória felé való kérés. Én ugyanakkor lehet, hogy több potenciált látnék abban, hogy a compute lapkák 3D tokozásával alá, vagy alá-fölé akár több rétegben (nem is feltétlen HBM) cache-t tennék. Valószínűleg L4$-nek nevezném, megtartva jelenlegi L3$ méretét.
Ugyanakkor érdekes kérdés, hogy vajon mennyit érhet (hány % IPC) egy ilyen?
-
Petykemano
veterán
válasz
S_x96x_S #2695 üzenetére
"Lehet, hogy Raja re-inkarnálta a OneAPI -ba a legtöbb HSA ötletet."
Nem volna rossz, de csak hogy lássuk, hogy Abu nem habokra tépte a száját.Amúgy nyilván mindig felmerül a kérdés: mik azok a műveletek, vagy inkább úgy fogalmazok, hogy jobok, batchek, taszkok, amelyeknél egy finomszemcsés gpu gyorsítás megéri mondjuk főleg a vektoros AVX(512)-szel szemben?
Valamilyen elvont értelemben ugye ugyanarról beszélünk: van egy halom adat, amire a frontend ráenged valamilyen feldolgozó egységet. Csak egy CU nyilván lényegesen messzebb van, lassabb adat-összeköttetéssel és a vezérlés sem megoldott.
-
S_x96x_S
addikt
Április elején jönnek az új ASUS-os laptopok a 4xxxx APU-val.
-----------
AMD Ryzen 7 4800H Notebook Prices Reportedly Leaked; Launching in April
https://www.hardwaretimes.com/amd-ryzen-7-4800h-notebook-prices-reportedly-leaked-launching-in-april/ -
DraXoN
addikt
chipleten van az L3, csak CCX-hez rendelve de közös címtérrel, így minden cpu hozzáfér, de a jelenlegi cpukban 2x16MB (1chipletes cpu) vagy 4x16MB(2 chipletes cpu), ez akár ki is költözhet az IO diebe, de ha elég gyors az elérés egy HBM kiválthatja ... de lehet akár csak emiatt egy chiplet is külön (nem extrém elképzelés ha már úgy is IF-en csücsül a nagy része és azon át érhető el, esetleg L2-őt kicsit növelve ellensúlyozni a késleltetést ha magon belül lenne a használat). De HBM-el akár csökkenthető a mérete a jelenlegi felépítés mellett is.
Kérdés mi mennyi teljesítmény vesztességgel vagy nyeréssel jár, ezt a belsős szakemberek eléggé jól megtudják tippelni és abba az irányba elvinni a fejlesztést.AVX512 támogatást biztos elhúzzák addig amíg csak lehet (hogy ne legyen). AMD-nek nem érdeke, és eltudnám képzelni, hogy csak "emulálva" jön majd (futtatja, de csak ennyi, nem lesz gyorsabb) az első generáció belőle... de zen4 elé nem raknám a támogatást (a zen3-ra már mondták, hogy nem lesz benne AVX512).
Az is a gond körülötte, hogy "nincs kész", intel esetén is generációról, generációra változik, hogy mi van benne (hozzáadnak, elvesznek)... ez így maximum szívatásnak jó. -
S_x96x_S
addikt
> SMT4 esetén eleve nem növelnék szerintem a magszámot.
az lehetséges ..
-------ZEN5.
ha én tervezném, akkor az egyik prototípus olyan lenne, hogy:
- 1,5x nagyobb foglalat ( téglalap alakúra elnyújtva ) - persze a hütés nem lesz egyszerű ... , de jobban eloszlik a hő ... Ha már úgyis változik a foglalat, a ccx-es legózás miatt nem muszáj négyzet alapúnak lennie. És miért ne lehetne nagyobb ??
- én maradnék mindenképpen 8core -nál ; mert sokkal kisebb ccx-ek ( és ebből akkor több elfér a foglalatban ... és a wafer-en is .. mert ezt sokkal sokkal drágább gyártani az 5nm-en.) és akkor skálázni is könnyebb ...
- Ha kisebb ccx, és a foglalat picivel nagyobb; akkor akár már 4 ccx is beleférne .. --> és íme .. megvan a 32core -is ...És 32-core már simán elvárható is egy desktop-os gépen, ha most 16-nál járunk....
Főleg akkor, hogyha az Intel is ugyanennyit tervez.
De ekkor már kötelező is lesz az AMD részéről !És a ZEN5 idején már jönnek az ARM-es Windows-os Desktop gépek .. és ezeknél is lehet 16/32 core alapból ..
-----------
Vagyis igazából a versenytársak ( Intel, ARM , .. ) legjobb várható lépése alapján kellene az AMD-nek kialakítani a magszámot ..
És így mindenképpen a 32core-t be kell lőnie célként...
-
"Most se a cpu mag az ami sok helyet foglal chippen belül, hanem a cache, így "elfér a több mag", ha kap HBM-et a rendszer a cache növelését akkor meg el lehet halasztani."
Pont ezt mondom, hogy a cache-t nem növelve is dupláznád a chiplet tranyószámát, miközben az 5nm nem fog fele akkora effektív terület-hatékonyságot hozni. Csak az marad, hogy csökkented akkor a cache mennyiségét.
A Zen2 esetében a három cache:
L1: 32kB és 4 cikluson belül elérhető
L2: 512kB és 12 cikluson belül elérhető
L3: 16MB és 40 cikluson belül elérhetőAz L3 az I/O modulon van, és per CCX vonatkozik, tehát nem közös L3-at látnak a CCX-ek, hanem minden CCX-nek van egy 16MB-os L3 egysége az I/O modulon belül.
Na most ebből könnyen kitalálható, hogy ha kevesebb cache-t akarsz adni a magoknak, hogy elférj a CCX-en, akkor az L1 és L2 cache-t tudod csökkenteni. Ez a Zen1 óta ennyi, szóval ha csökkented, akkor esélyesen bukni fog a teljesítmény. Ugye emlékszünk, hogy a Zen is első sorban szerverbe szánt chiplet, ami amúgy a desktopokra is jó, szóval neked figyelembe kell venni, hogy mivel jár ez. A szerverekben mutatott teljesítményben pedig sokat számít a cache méret.
Szóval hiába lesz neked akár 4GB-os vagy 8GB-os L3 vagy L4 HBM alapú cache-ed, az esélyesen nem kevesebb, mint 80 cikluson belül lesz elérhető (erős tipp, de biztosan több, mint az I/O és a chiplet közötti elérés). Ezen javíthat, ha a HBM modulok az I/O chipre lesznek felstackelve, így könnyebben és gyorsabban elérné, mintha mellette lenne és interposeren keresztül csatlakozik csak. De nem tudja kiváltani a kisebb L1 és/vagy L2 okozta sebességvesztést. Egy szerverben (is) használt chipletnél ez nem fér bele, pont, hogy inkább növelni szokták a cache méretet...
Ez a logika az, ami miatt kétlem, hogy az 5nm-en a 16 magvas chiplet esélyes. Még az SMT4 esetén is húzós lesz elférni nagyjából azonos alapterületen...
-
Petykemano
veterán
Nemrég vetettem fel, hogy vajon egy ma $200-250-ért árult ryzen-t és egy $300-ért árult navi10-szerűséget 16GB HBME2-vel össze lehet-e pattintani egybe mondjuk alaplappal és hűtővel $500-ért?
De a két dolgot én szétválasztanám.
Tehát egy dolog egy méretes IGP, ami szükségtelenné teszi a dGPU-t a nagy többségnek (elvileg)
És megint egy másik egy olyan IGP, amit nem feltétlenül grafikára használsz. -
-
DraXoN
addikt
Most se a cpu mag az ami sok helyet foglal chippen belül, hanem a cache, így "elfér a több mag", ha kap HBM-et a rendszer a cache növelését akkor meg el lehet halasztani.
és azért gondoltam 16magot, mert nem számolok azzal, hogy áttervezik a ccx-et, hanem csak beledobnak 2db 8magos ccx-et.. így "kiadja".
Azt lehet tévedek.. biztosat csak azon mérnökök és vezetők tudnak még akik ezeken dolgoznak.
De azt majd meglátjuk a zen5 lényegében a zen4 egy finomítása lesz (valószínűleg), sokkal inkább körvonalazódik majd a kép ha látjuk mi meddig jut el .. de nagyon messzire jutottunk még a zen3 sincs a kanyarban.
leginkább arra akartam, utalni, hogy HBM szerintem előbb nem kerül a chippek mellé még pár évig mert a glofo (ha megtartják), csak akkortájt tud elérhető termékekkel rendelkezni majd.. onnantól meg "adja magát" a felépítés, bár közel se biztos, hogy egy ütemben lépik meg ezt mind.
De a méretnövekedése a chipletnek se ördögtől való, nem lehetetlen, most is gyárt amd nagyobb chipeket 7nm-en a cpui chipletjei méreténél.. az interposerrel meg helyet spórólhat és ha úgy is szükség van interposerre az esetleges nagyobb sávszélesség igény miatt, akkor megint "adja magát" az elv.
De igen, ezen mint csak merő spekuláció a különböző információmorzsák összelegózásából... "nem lehetetlen", de nem tudjuk még is lehetséges-e. lehet csak egy valami nem jön össze és minden borul egy ilyen komplex lépésnél (ha terveznék). Így inkább több lépcsős bevezetésre tippelnék, az első ilyen lépcső szerintem zen3ban a 8magos ccx, majd zen4 idejére talán interposer és hbm lehetőség (tippre zen4 inkább felépítésben fejlődik).. zen5 pedig annak a finomítása grafikus vezérlővel kiegészítve. a megvalósulás persze biztos lehetséges, lehet csak az időben tévedek és inkább 23vége 24eleje a céldátum (vagy amikorra ez elkészülhet).. bár szerintem az intel miatt 23eleje a legkésőbbi határidő amikorra kell valami "ütős" (ha nem is ez, de valami más mint ami most van, mert lehet az kevés lesz).
A zen magokat csak mint referencia használom, de a zen3 után szerintem utóbbiak csak finomodni fognak pár generációt és inkább a körítés fejlődésén lesz a hangsúly. -
S_x96x_S
addikt
> Én így képzelem jelenleg:
> 2022 év vége:
> zen5 cpu chiplet 1db (16mag) 5nminkább 2023 lesz abból, hogyha 12-18 hónapos váltásokat nézünk.
És szerintem maradnak 8-12 -es core méretnél, mert az
- AVX512
- SMT4
rengeteg helyet elfoglal.
habár ki tudja ...
de szerintem a következő pár évben az egy core-ra eső teljesítményt próbálják növelni.de az is lehet, hogy több különböző chiplet lesz.
Új hozzászólás Aktív témák
Hirdetés
- RTX 4080 SUPER,16GB. Ryzen 7 7800X3D, 32 RAM Fury RGB! Garancia!
- Asztali PC , i7 9700K , RX 5700 XT , 32GB DDR4 , 500GB NVME , 1TB HDD
- Dell Inspiron 5406 2-in-1i5-1135G7 16GB DDR4 3200 512GB NVME 14" FHD Érintőkijelző W11Pro
- Eladó MacBook Pro 14" M1 Pro (2021) 16/512 99% akku Makulátlan állapotban!
- Újszeru GIGABYTE G5 - 15.6" FullHD 144Hz - i7-13620H - 48GB - 1TB - RTX 4050 - Win11 - 1,5 év gari
- LG 27GR95QL - 27" OLED / Limitált LoL Edition / QHD 2K / 240Hz & 0.03ms / NVIDIA G-Sync / FreeSync
- Telefon felvásárlás!! iPhone 16/iPhone 16 Plus/iPhone 16 Pro/iPhone 16 Pro Max
- Samsung Galaxy A23 5G 128GB, Kártyafüggetlen, 1 Év Garanciával
- LG 48C2 - 48" OLED EVO - 4K 120Hz 1ms - NVIDIA G-Sync - FreeSync Premium - HDMI 2.1 - A9 Gen5 CPU
- LG 27UL500-W - 27" IPS - 3840x2160 4K - 60Hz 5ms - HDR10 - AMD FreeSync - 300 Nits - sRGB 99%
Állásajánlatok
Cég: CAMERA-PRO Hungary Kft
Város: Budapest
Cég: Liszt Ferenc Zeneművészeti Egyetem
Város: Budapest