- Azonnali VGA-s kérdések órája
- Milyen pendrive-ot vegyek?
- Apple asztali gépek
- Multimédiás / PC-s hangfalszettek (2.0, 2.1, 5.1)
- Intel Core i5 / i7 / i9 "Alder Lake-Raptor Lake/Refresh" (LGA1700)
- Milyen asztali (teljes vagy fél-) gépet vegyek?
- Apple MacBook
- Váratlanul ledobta asztali csúcs-Ryzenjét az AMD
- OLED monitor topic
- Nikon Z MILC fényképezőgépcsalád
Új hozzászólás Aktív témák
-
ddekany
nagyúr
Ez a "csak statisztika" dolog nem sokat jelent. Mert ez a szokásos jelenség, hogy egyszerű alapműveletekből fel lehet építeni valami komplexet, amit már nem sok ember ért (jelen esetben senki sem), és valami olyat csinál, amire majom agyunk sosem számított volna. Ha jobban meg tudnánk nézni a saját gondolkodásunk működését, valószínűleg ugyan így járnánk azzal is.
A kicsi és nagy közötti eltérés meg a gyakorlatban nem az a pár %, amit a szintetikus tesztek mutatnak. Ha arra céloztál. Adott nehézségű feladatot a nagy modellek szinte mindig megoldanak, a kicsik meg szinte soha. Ez erősen kihat a hasznosságukra.
-
azbest
félisten
" továbbra is a legtöbb célra használhatatlan tudásszintjük"
inkább abból ered a használhatatlanság, hogy sokan azt hiszik, hogy majd mindent megold, de nem értik, hogy az llm az azt jelenti, hogy szavakat generál egymás után, aszerint, hogy mit mond a statisztika odaillőnek. A gondolkodó llm meg csak előre létrehoz egy kontextust hasonlóképpen.
A kisebb disstilled is arra jó, mint a nagy méretű, csak pár százalék pontatlanságért cserében elfut kis hardveren is.
Me az nem mindegy, hogy egy-két ember kérdéseit kell egyszerre kiszolgálni vagy sokakét, mert a kis gpu-kon egy-egy kérés is bőven elég egyszerre.
-
ddekany
nagyúr
A DeepSeek R1 nem fut el csak soktízmilliós AI-os célhardveren (pl. 6db H100). A "distilled" változatoknak meg nem sok közük van hozzá. Vagy ha azokat is nézzük, akkor a Google féle Gemma 3 is világégés, meg a kismillió másik kis model is. Ezek a pici modellek hiába verik le a pár évvel ezelőtti nagyokat tudásban, továbbra is a legtöbb célra használhatatlan tudásszintjük, és inkább előfizetsz egy nagyobbra (és aztán rájössz, hogy még az is túl sokat hallucinál).
A betanítás meg... A sajtó összevetette a GPT-4 teljes betanításával, amibe benne van a base model elkészítése, ami messze a leg hardverzabálóbb szakasz, meg az RLFH is, amihez meg embereket kell fizetni. Ellenben az R1 betanítása egy azok utáni plusz automatizált RL, mivel a korábbi szakszok már megvoltak (DeepSeek V3 és elődjei). o3-nél vagy Calude 3.7 extended thinking esetén mennyibe került csak az a szakasz? Ha egyáltalán találni érdemi megfeleltetést. Még a kérdést se tudnák feltenni persze, fogalmuk sincs miről írnak.
-
ddekany
nagyúr
"hatalmas a kereslet az NVIDIA drága AI-chipjeire, a DeepSeek előretörése ellenére is"
Meglepő, hiszen a DeepSeek-et az nem ugyanúgy nVidia H-akárhányakon futtatják, mint bármi mást nagy AI modelt. Ja, tudom, a azt mondták az Origón, hogy random gizi netbookján is fut, bocs...
Új hozzászólás Aktív témák
Hirdetés
- HIBÁTLAN ipad mini 6, 64 GB Wifi + Cellular
- Gamer PC 2020, Intel i7, 16 GB RAM, NVIDIA 1660 GTX
- Vadonatúj, bontatlan iScooter i9Max elektromos roller, 1 év gari 35 km/h
- !AKCIÓ! GAMER PC Intel Core i9-10900X/ASUS ROG Strix X299-E Gaming/NVIDIA GeForce RTX 3080/32 GB RAM
- Hankook Winter I cept evo téli 205/55 R16 91 H TL / Gyári acélfelni gumival 16x6,5 Salgótarjánban
- Hp Zbook 15 G5 15,6" FHD/ i7-8850H, 32GB, 512GB SSD, Quadro P2000- HUN / számla-garancia
- AKCIÓ! AMD Ryzen 9 7950X 16 mag 32 szál processzor garanciával hibátlan működéssel
- Kezdő Gamer PC-Számítógép! Csere-Beszámítás! I7 6700 / 16GB DDR4 / GTX 1650 Super / 500 SSD
- ÁRGARANCIA!Épített KomPhone Ryzen 7 7800X3D 32/64GB RAM RTX 5070 12GB GAMER PC termékbeszámítással
- 272 - Lenovo Legion Pro 5 (16IAX10H) - Intel Core U9 275HX, RTX 5070Ti (ELKELT)
Állásajánlatok
Cég: Laptopműhely Bt.
Város: Budapest

