Hirdetés
- Összefog a YMTC és a CXMT a kínai HBM fejlődéséért?
- Megjött a Cherry legfrissebb, taktilis karakterisztikájú kapcsolója
- 8 bővítőhelyes Jonsbo "akvárium", akár kábeleket rejtő alaplapokhoz is
- 4K felbontású, 240 Hz-es OLED monitorokkal köszönti az őszt a Lenovo
- Ismét egy teljesen friss egérrel gyarapította kínálatát a Pulsar
Új hozzászólás Aktív témák
-
Raymond
titán
válasz
MasterDeeJay #11 üzenetére
Kiprobaltam a chat-et leggyengebb gepen amit itthon van, egy Intel NUC6-os egy Celeron J3455 CPU-val. Nemhogy AVX2, meg AVX sincs benne. Ubuntu 22.04 es egy docker container-ben futo ollama elindul es megy, de meg a 3B-s mini-orca vagy a 2.7B-s phi-2 mellett is tobb mint 1 percig tart amig valaszol es talan 1 masodperc per szotag sebessegel general
-
Raymond
titán
válasz
MasterDeeJay #11 üzenetére
Hat nem tudom, eleg rizikos azert az arert, akkor meg a rizikomentes 3090 is jol nez ki 700-800EUR kozott. Vagy egy uj 4060Ti 16GB is jobban nez ki 460EUR-ert.
-
Raymond
titán
válasz
MasterDeeJay #9 üzenetére
A 90HX szerintem nem igazan jo, a hasznalt kartyaknal a VRAM-ra erdemes utazni de ott is csak ugy hogy jobb uzlet legyen mint a 280EUR-os uj 3060 12GB vagy a hasznalt ugyanebbol esetleg a 200-250EUR kozotti hasznalt 2080Ti. A 170HX nem ugyanaz mint az M10? Ott is 4 GPU es 4x 8GB VRAM vagy egy kartyan, ahhoz tul draga szerintem, egy kb ugyanannyiba kerulo 3090 24GB-nak tobb ertelme van. Legalabbis ezt irtam volna par hete, de ahogy nezem azok felmentek 700-800 koze igy nem annyira jo mar.
En ezt a videot neztem [link], ez alapjan olyan 2080Ti sebessege lehet az A770-nek SDXL kepgeneralasnal.
A 100GB/s nem rossz egy CPU-nal, de a 4090 pl. meg igy is 12x gyorsabb mint az i7-13700K es DDR5-6400 nalam a Llama-2-13b szovegeneralasnal. A 2080-am is kb. annyival gyorsabb mint az abban a gepben levo i7-6700K DDR4-2133 kombo.
-
Raymond
titán
válasz
MasterDeeJay #7 üzenetére
"Chatgpt-t szeretnék localba valamit összerakni de még nem tiszta számomra melyik miben jó."
Ez most eleg nehez ugy mert mivel vadnyugati aranylaz van, naponta jonnek mindenfele hirek es hype hogy az uj XY modell a legjobb a vilagon stb. Rengeteg a zaj, de ha maradsz az alapoknal (Llama-2b, Mistral, Mixtral-8x7b) es ezek nepszerubb valtozatai (Nuos-Hermes) abban a valtozatban ami erdekel (generic, chat, instruct) akkor OK. Ha nem akarsz sok "Sorry Dave, I can not do that!" valaszt latni akkor az uncensored verziot keresd meg abbol amit hasznalni akarsz.
Az LM Studio-ban latod egyebkent ha rakeresel valamelyikre hogy melyik rep a legnepszerubb, az egy jo mutato.
Az zavar leginkább hogy a legtöbb helyen odaírják hogy cuda de nem írják hardverből mi a követelmény. (tesla P40 24gb lenne jó de az pascal és a fene se tudja mennyire támogatott)
Meg Maxwell-en is megy, a P40 (remelem a 24GB-os
) jo lesz, ott is van kozel 350GB/s savszel es az dob rajta sokat. A CPU-nal joval gyorsabb lesz az biztos es a nagyobb modellek is belefernem a VRAM-ba. A 13b modellek Q8-as verzioja siman.
Ha ilyen Skyrim szeru jatek chat-re kell akkor viszont tenyleg a modifikalt uncensored es roleplay-re optimalizalt modelleket nezd.
Lattam par hete az Intel videot a YT-on, gondoltam is rad hogy az A770-el kiprobalhatnad mert eleg jo it/s ertekeket produkalt
Aztan kiment a fejembol, de latom te is megtalaltad.
A P40-nek egyebkent adj egy power limitet mert az inference sebessegre nem lesz kihatassal, de a fogyasztas es melegedesnek jot tesz [link]
-
Raymond
titán
válasz
MasterDeeJay #5 üzenetére
A korlatozas a konkret TensortRT es model formatum/verzio kombinaciojabol akad, a 20-as sorozat nem tamogat minden formatumot, gondolom a bfloat16 amit hasznalnak. A 8GB kartyakon a Mistral-7b a 10GB+ kartyakon pedig a Llama-2-13b tudtommal mindketto a 4bit quantized valtozat.
Az LM Studio-ban a Llama-2-7b 5bit-es verzioja (Q5_K_M) egy sima RTX2080-al olyan 55 tok/s sebeseget ad.
Az NV demot eleg problemas letolteni, nalam csak 8-10Mbit-el jott es azert igy 35GB altart egy darabig. Hagytam menni, de olyan 11GB korul megszakadt. Az hogy mennyit hozna a TensorRT egy 4090-el nem tudom, de Stable Diffusion generalasnal a konvertalt modellek olyan 70-75% pluszt hoztak sebessegben a simahoz kepest.
Új hozzászólás Aktív témák
- AMD Navi Radeon™ RX 9xxx sorozat
- Counter-Strike: Global Offensive (CS:GO) / Counter-Strike 2 (CS2)
- Luck Dragon: Asszociációs játék. :)
- Hitelesítették az S26 Ultra csalódást keltő telepét
- AMD Ryzen 9 / 7 / 5 9***(X) "Zen 5" (AM5)
- World of Tanks - MMO
- Autós topik látogatók beszélgetős, offolós topikja
- Kuponkunyeráló
- Google Pixel 10 Pro XL – tíz kicsi Pixel
- OLED TV topic
- További aktív témák...
- MacBook Pro 13, 14, 15, 16, MacBook Air M1, M2 M3 M4 bill magyarosítás lézerrel / sapkacserével
- ÁRGARANCIA!Épített KomPhone i5 14400F 32/64GB DDR5 RTX 5060 Ti 8GB GAMER PC termékbeszámítással
- GYÖNYÖRŰ iPhone 13 Pro 128GB Graphite -1 ÉV GARANCIA - Kártyafüggetlen, MS2980
- Bomba ár! HP EliteBook Folio 1040 G2 - i5-G5 I 8GB I 256GB SSD I 14" HD+ I Cam I W10 I Garancia!
- Honor MagicBook 16 Ryzen 5 5600H 16GB 256GB FHD 144Hz
Állásajánlatok
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest
Cég: CAMERA-PRO Hungary Kft.
Város: Budapest