Új hozzászólás Aktív témák
-
Petykemano
veterán
@S_x96x_S
Láttam, hogy az Nvidia találgatósban megosztottad az aggályodat, hogy az Nvidia Genoa-t és nem Genoa-X-et használt a teszteléshez.
Csak kiváncsiságból kérdezem, hogy Te tudod-e, hogy pl az OpenFoam hogy működik:
- milyen utasításokat,
- milyen feldolgozókat (FP/INT) használ
- működése közben mekkora az interdependencia és adatmegosztás a szálak között?Azért kérdezem, mert nekem elsőre az jutott eszembe, hogy nem csak a Genoa, de akár a Bergamo is jobb ellenfél lehetett volna. De nem.
A Bergamo (9754) valójában még a Genoa-nál is gyengébb eredményt ad. [link]
Hiba több a mag. Pedig nem valószínű, hogy az OpenFoam szkálázódásával lenne a gond.A Genoa, Genoa-X és Bergamo eredményei között a legszembetűnőbb különbséget talán épp a L3$ mérete adja. De a Genoa és a Genoa-X L3$ mérete közötti nagy különbség ellenére is a teljesítmény differencia csak 14%, ami hasznos (és elképzelhető, hogy per socket gyorsabb is), de nem tűnik elégségesnek a Grace hatékonyság-előnyének behozatalára.
A Grace 72 maghoz 117MB egységes L3$-t kínál. Ami egyébként összességében kevesebb, mint amit egy Genoa összesen tartalmaz (384MB) és nem sokkal több annál sem, mint amit egy Genoa-X CCD birtokol (96MB)
De az mégiscsak egységes, emitt meg hiába van 1GB L3$, egy adattárból akkor is csak 8 mag tud dolgozni.
Persze egyáltalán nem biztos, hogy ez a meghatározó tényező. De akkor mi?Memória sávszélesség? Az mondjuk a Genoa esetén feleakkora
Feldolgozók száma? A Grace-ben 4x128b SVE2 FP feldolgozó van, az nem tűnik többnek, mint a Zen4-é
CPU chipfelépítés?Van itt egy táblázat: [link]
Azért persze van különbség
Míg a Grace mag 64+64KB L1$, addig a Zen4 csak 32+32
De mindkettőben magonként 1MB L2$ van.Régen az AT-en voltak ilyen mérések, amik azt mutatták meg, hogy mennyi energia megy a magokhoz és mennyi a package veszteség. És emlékeim szerint a kép azt mutatta, hogy a Milan esetén elég nagy.
Kiváncsi lennék, a Genoa esetén ez változott-e és hogy mikor terveznek lépéseket tenni ez ellen.
Pl:
- Lecserélni a szubsztráton keresztüli távoli, magas frekvenciás, de szűk sávos kommunikációt valamilyen modern csatlakozóra
- egységes L4$ az IOD-on a memóriasávszélesség kímélésére és CCD-k közötti adatmegosztásra
- CCD-k közötti adatmegosztásra szolgáló L4$ (megosztott L3$)Vagy lehet, hogy nincs ilyen terv, hanem majd a Zen5c-vel rákötnek 16 magot egy egységes L3$-re és akkor ismét kesz valamelyest érzékelhető teljesítményjavulás itt-ott, ahol a teljesítmény függ a szálak kommunikációjától.
Mit gondolsz?
Új hozzászólás Aktív témák
- Iszonyatos mennyiségű hulladékkal járhat a Windows 10 terméktámogatásának vége
- One mobilszolgáltatások
- Kerékpársportok
- Autós topik
- Spórolós topik
- Filmvilág
- AMD Ryzen 9 / 7 / 5 / 3 5***(X) "Zen 3" (AM4)
- OLED monitor topik
- Kodi és kiegészítői magyar nyelvű online tartalmakhoz (Linux, Windows)
- Hálózati / IP kamera
- További aktív témák...
- Bivaly erőmű Lenovo P1 G3 (Core I9 8mag/16 szál 32Gb DDR4 1Tb SSD 4Gb Nvidia) MAGYAR laptop eladó!
- Samsung 860 EVO 2.5 500GB SATA3 MZ-76E500 100/90
- Samsung Galaxy Buds 3 Pro fülhallgató
- WHITE GAMER PC! i7-14900K / RTX 4080 Super / 32GB 6000MHz / 1TB 980 Pro / Z790 / 1250W! BeszámítOK!
- WD Western Digital Elements 2.5 1TB (WDBUZG0010BBK) 100/100
- ALIENWARE Area-51 R5
- Veszünk: PS5 Fat/Slim/Digital/Pro konzolt, játékokat, Portalt stb. Kérj ajánlatot!
- AKCIÓ! ASRock Z370 i5 8500 16GB DDR4 512GB SSD 2060 Super 8GB Zalman Z9 Plus Enermax 750W
- Telefon felvásárlás!! iPhone 13 Mini/iPhone 13/iPhone 13 Pro/iPhone 13 Pro Max
- ÁRGARANCIA!Épített KomPhone i5 14600KF 32/64GB DDR5 RTX 4070Ti Super GAMER PC termékbeszámítással
Állásajánlatok
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest