- Comptex 2025: Házak, tápok és kézikonzolok az Antec standján
- Computex 2025: Profi SSD-k, hűtők és más kiegészítők az Adata standján
- Computex 2025: Monitortól a tápegységig mindent megnéztük az ASRocknál
- Elkészült a zamatos hardverbifsztek
- Vezeték nélküli, láncba kapcsolható ventilátorok jöttek a Lian Litől
- Egy nap a TCL-nél: érkeznek az új tévék!
- NVIDIA GeForce RTX 5080 / 5090 (GB203 / 202)
- Fejhallgató erősítő és DAC topik
- Gaming notebook topik
- Forrmell.enn
- Épített vízhűtés (nem kompakt) topic
- NVIDIA® driverek topikja
- SSD kibeszélő
- Huawei MatePad 11.5”S PaperMatte - papír, írószer
- Soundbar, soundplate, hangprojektor
Új hozzászólás Aktív témák
-
ddekany
veterán
Ez a "csak statisztika" dolog nem sokat jelent. Mert ez a szokásos jelenség, hogy egyszerű alapműveletekből fel lehet építeni valami komplexet, amit már nem sok ember ért (jelen esetben senki sem), és valami olyat csinál, amire majom agyunk sosem számított volna. Ha jobban meg tudnánk nézni a saját gondolkodásunk működését, valószínűleg ugyan így járnánk azzal is.
A kicsi és nagy közötti eltérés meg a gyakorlatban nem az a pár %, amit a szintetikus tesztek mutatnak. Ha arra céloztál. Adott nehézségű feladatot a nagy modellek szinte mindig megoldanak, a kicsik meg szinte soha. Ez erősen kihat a hasznosságukra.
-
ddekany
veterán
A DeepSeek R1 nem fut el csak soktízmilliós AI-os célhardveren (pl. 6db H100). A "distilled" változatoknak meg nem sok közük van hozzá. Vagy ha azokat is nézzük, akkor a Google féle Gemma 3 is világégés, meg a kismillió másik kis model is. Ezek a pici modellek hiába verik le a pár évvel ezelőtti nagyokat tudásban, továbbra is a legtöbb célra használhatatlan tudásszintjük, és inkább előfizetsz egy nagyobbra (és aztán rájössz, hogy még az is túl sokat hallucinál).
A betanítás meg... A sajtó összevetette a GPT-4 teljes betanításával, amibe benne van a base model elkészítése, ami messze a leg hardverzabálóbb szakasz, meg az RLFH is, amihez meg embereket kell fizetni. Ellenben az R1 betanítása egy azok utáni plusz automatizált RL, mivel a korábbi szakszok már megvoltak (DeepSeek V3 és elődjei). o3-nél vagy Calude 3.7 extended thinking esetén mennyibe került csak az a szakasz? Ha egyáltalán találni érdemi megfeleltetést. Még a kérdést se tudnák feltenni persze, fogalmuk sincs miről írnak.
-
ddekany
veterán
"hatalmas a kereslet az NVIDIA drága AI-chipjeire, a DeepSeek előretörése ellenére is"
Meglepő, hiszen a DeepSeek-et az nem ugyanúgy nVidia H-akárhányakon futtatják, mint bármi mást nagy AI modelt. Ja, tudom, a azt mondták az Origón, hogy random gizi netbookján is fut, bocs...
Új hozzászólás Aktív témák
- Egy nap a TCL-nél: érkeznek az új tévék!
- Samsung Galaxy S23 Ultra - non plus ultra
- NVIDIA GeForce RTX 5080 / 5090 (GB203 / 202)
- Formula-1
- D1Rect: Nagy "hülyétkapokazapróktól" topik
- Medence topik
- Luck Dragon: Asszociációs játék. :)
- Apple iPhone 16 Pro - rutinvizsga
- A fociról könnyedén, egy baráti társaságban
- Kodi és kiegészítői magyar nyelvű online tartalmakhoz (Linux, Windows)
- További aktív témák...
- billentyűzetek - kiárusítás - Logitech, Corsair, ASUS
- Samsung Galaxy A40 64GB, Kártyafüggetlen, 1 Év Garanciával
- ÁRGARANCIA!Épített KomPhone Ryzen 5 5500 16/32/64GB RAM RTX 4060 8GB GAMER PC termékbeszámítással
- RAKTÁRSÖPRÉS!!! - Videókártyák, Monitorok, Notebookok, Stb. - Szaküzletből! Számlával!
- ÁRGARANCIA!Épített KomPhone i3 10105F 8/16/32GB RAM RX 6500 XT 4GB GAMER PC termékbeszámítással
Állásajánlatok
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest
Cég: Liszt Ferenc Zeneművészeti Egyetem
Város: Budapest