DeepSeek-R1-0528-Qwen3-8B: nagy nyelvi modell teszt

Ahogy látjátok, a nagy nyelvi modellek egyre jobbak lesznek, és egyre könnyebben futtathatók helyben, a saját gépünkön. Ebben a videóban egy viszonylag új szereplőt nézünk meg közelebbről, a DeepSeek legújabb modelljét, a DeepSeek-R1-0528-Qwen3-8B-t. Miért olyan különleges ez a modell? Hogyan képes a DeepSeek elérni, hogy ez a 8 milliárd paraméteres modell ilyen jól teljesítsen, ráadásul akár egészen kevés memóriával is futtatható legyen a számítógépeteken? Tartsatok velem, és mindjárt kiderül!

A DeepSeek tesztjei szerint:
- Kiváló teljesítmény indoklási és következtetési feladatokban: Jelentősen javította az indoklási és következtetési képességeit a megnövelt számítási erőforrások és az utólagos betanítás során bevezetett algoritmikus optimalizációs mechanizmusok révén
- Megközelíti vezető modellek eredményeit: Teljesítménye megközelíti olyan vezető modellekét, mint az O3 és a Gemini 2.5 Pro
- Felülmúlja kisebb és nagyobb modellek teljesítményét bizonyos benchmarkokon: Az AIME 2024 teszten körülbelül 10%-kal jobb teljesítményt nyújt, mint a Qwen3 8B (+10.0%). Ugyanezen a teszten eléri a jóval nagyobb Qwen3-235B-thinking modell teljesítményét
Az AIME egy rangos, meghívásos amerikai középiskolai matematikai verseny. A benchmark pedig egy matematikai érvelésre fókuszáló nyelvi modell teszt, amely a modell képességét méri komplex, verseny szinten nehéz, soklépéses matekfeladatok megoldásában.
- Támogatja az eszközhasználatot és az indoklást: Képes az eszközhasználatra és a haladó szintű indoklásra már alapértelmezetten
- Alacsony erőforrásigény helyi futtatáshoz: A desztillált modell akár ~6 GB RAM-mal is futtatható, sőt, akár 4 GB RAM-mal is megelégedhet
- Helyileg futtatható: Elérhető MLX és GGUF formátumokban

*Linkek*
Hugging Face: deepseek-ai/DeepSeek-R1-0528-Qwen3-8B: https://huggingface.co/deepseek-ai/DeepSeek-R1-0528-Qwen3-8B
LM Studio model: https://lmstudio.ai/blog/deepseek-r1-0528
Ollama: https://ollama.com/library/deepseek-r1:8b
OpenRouter: https://openrouter.ai/deepseek/deepseek-r1-0528-qwen3-8b:free