Qwen3.6-35B-A3B LLM bemutató

A Qwen3.6-35B-A3B egy rendkívül hatékony, nyílt forráskódú "Mixture-of-Experts" (MoE) modell, amely 35 milliárd paraméteres tudással rendelkezik, de tokenenként csak 3 milliárdot aktivál, így egy átlagos laptopon is zökkenőmentesen futtatható. Kiemelkedő programozási, eszközkiosztási (tool calling) és vizuális képességeivel maga mögé utasítja a hasonló méretű versenytársakat, mindezt teljesen ingyenesen, Apache 2.0 licenccel.

*Mit tud ez a modell?*
- "Agentic coding" (Ágens alapú kódolás): A modell képes önállóan, több lépésben átlátni teljes kódbázisokat, hibákat keresni, teszteket generálni, sőt teljes PR-leírásokat (Pull Request) írni.
- Kétféle gondolkodási mód: Rendelkezik egy "gondolkodó" (thinking) móddal, ahol a bonyolultabb (pl. kódolási vagy matematikai) feladatok előtt lépésről lépésre levezeti a logikát, és egy gyorsabb "nem gondolkodó" (non-thinking) móddal az egyszerűbb beszélgetésekhez.
- Hatalmas kontextus: Alapértelmezetten 262 144 tokenes bemenetet bír el (ami körülbelül 393 oldalnyi szövegnek felel meg), így egy közepes projekt teljes kódját be tudja fogadni.
- Multimodális: Nemcsak szöveget ért, de natívan kezeli a képeket, képernyőfotókat és videókat is.
- Többnyelvűség: 201 nyelvet támogat, kiemelkedő például az arab és egyéb nyelvek kezelésében.

*Miért jó használni?*
- Rendkívül hatékony (alacsony hardverigény): A korábban megbeszélt "prompt feldolgozás vs. generálás" összefüggésében ez a modell zseniális: az MoE architektúrának köszönhetően a 35 milliárd paraméterből (ami a tudást adja) **egyszerre csak 3 milliárd dolgozik**. Emiatt hihetetlenül gyors (a generálási sebessége elérheti a 120-190 token/másodpercet is), ráadásul megfelelő kvantálással (tömörítéssel) már egy **13-24 GB RAM-mal rendelkező gépen (pl. egy MacBookon vagy egy RTX 4090-es kártyán) is elfut**.
- Valóban nyílt és ingyenes: Apache 2.0 licenccel adták ki, ami azt jelenti, hogy korlátozások nélkül, akár üzleti célra is használható és beépíthető saját termékekbe.

*Miben jobb, mint eddig (a korábbiakhoz vagy a konkurenciához képest)?*
- Veri a konkurenciát kódolásban: A szoftverfejlesztési képességeket mérő "SWE-bench Verified" teszten 73,4%-ot ért el, amivel jelentősen felülmúlja a hasonló kategóriájú (pl. Gemma 4-31B) modelleket, és a zárt óriások (pl. Claude) szintjét ostromolja. Eszközhasználatban (Tool calling / MCPMark) megduplázta a Gemma 4 pontszámát.
- "Preserve Thinking" (A gondolatmenet megőrzése): A korábbi modellekkel ellentétben ez a modell képes megjegyezni a saját korábbi belső logikai levezetéseit egy hosszú beszélgetés során. Így az ágensek nem felejtik el, mit miért csináltak az előző lépésben, és nem kell újra meg újra végiggondolniuk a teljes kódot.
- Fejlettebb frontend kódolás: A QwenWebBench teszten drasztikusan (több mint 40%-kal) javult a frontend kódok (UI, SVG, animációk) írásában a saját elődjéhez képest.

*Mi a baj vele? (Hátrányok és limitációk)*
- Driver-kompatibilitási hiba: A kisebb méretűre tömörített (4-bites és az alatti) változatoknál a legújabb *CUDA 13.2 driverrel "halandzsázni" kezd* (szemetet generál). Erre egyelőre a CUDA 13.1 használata a megoldás.
- Hajlamos a végtelen hurkokra: Ha a generálási paraméterek (főleg a `presence_penalty`) nincsenek jól beállítva, a modell hajlamos lehet "végtelen gondolkodási hurkokba" (thinking loops) kerülni, vagy ismételni önmagát.
- Túlbeszélés (verbosity): A modell rendkívül "bőbeszédű". A mesterséges intelligencia tesztek alapján átlagosan hatszor több tokent generál a válaszadás során, mint a versenytársak. Fizetős API használata esetén ez jelentősen megdrágíthatja a működést.
- A látási (vision) teszteredmények gyanúsak: Az Alibaba azt állítja, hogy a vizuális feladatokban a modell megveri a zárt Claude Sonnet 4.5-öt (pl. a RealWorldQA teszten). Ezt a hatalmas ugrást a független tesztelők egyelőre túlzónak tartják és további igazolásra vár.

*Linkek*
Qwen3.6-35B-A3B: https://qwen.ai/blog?id=qwen3.6-35b-a3b
HF: https://huggingface.co/Qwen/Qwen3.6-35B-A3B
Qwen3.6 - How to Run Locally: https://unsloth.ai/docs/models/qwen3.6
Unsloth: https://huggingface.co/unsloth/Qwen3.6-35B-A3B-GGUF
OpenRouter: https://openrouter.ai/qwen/qwen3.6-35b-a3b
Understanding LLM Response Latency: https://medium.com/@gezhouz/understanding-llm-response-latency-a-deep-dive-into-input-vs-output-processing-2d83025b8797
Jan.ai: https://www.jan.ai/

Ez a videó bemutatja a mesterséges intelligencia alkalmazását. Az AI (mesterséges intelligencia) rengeteg területen könnyíti és segíti az életünket.

Hirdetés