DeepSeek-V3.1-Terminus: sokat javult

A DeepSeek-V3.1-Terminus a DeepSeek-V3.1 legújabb frissítése, amely megtartja a modell eredeti képességeit, miközben orvosolja a felhasználók által jelzett problémákat, különös hangsúlyt fektetve a nyelvi konzisztenciára és az ügynök képességekre.
Ez a verzió stabilabb és megbízhatóbb kimeneteket biztosít a korábbi verzióhoz képest, optimalizálva a teljesítményt a kódolási és kereső ügynökök terén, így alkalmas kutatási, kódolási és ügynök alapú munkafolyamatokhoz.

A DeepSeek-V3.1-Terminus a DeepSeek-V3.1 erősségeire épül, miközben kezeli a kulcsfontosságú felhasználói visszajelzéseket. A frissítés megbízhatóbb kimeneteket nyújt a teljesítménytesztekben, mint az előző verzió.

*A legfontosabb fejlesztések:*
1. Nyelvi konzisztencia (Language consistency): Csökkent az angol és kínai (CN/EN) szövegek keveredése, és megszűntek az alkalmi rendellenes/véletlenszerű karakterek.
2. Ügynök képességek (Agent upgrades): Tovább optimalizálták a Code Agent és a Search Agent teljesítményét. A modell javítja az eszközhasználatot, a kódgenerálást és az érvelési hatékonyságot.
3. Stabilitás és sebesség: A modell teljesítménye összehasonlítható a DeepSeek-R1-gyel a nehéz teljesítményteszteken, miközben gyorsabban válaszol.
4. Eszközhasználat: Támogatja a strukturált eszközhívást, a kódügynököket és a keresőügynököket. Továbbá a keresőügynök sablonja és eszközkészlete frissítésre került.

*Modelljellemzők és Architektúra*
A DeepSeek-V3.1-Terminus egy nagy hibrid érvelési modell (671 milliárd paraméter, 37 milliárd aktív paraméter), amely támogatja mind a „gondolkodó” (thinking), mind a „nem-gondolkodó” (non-thinking) módokat.
*Kontextus mérete:* Kiterjeszti a DeepSeek-V3 bázist egy kétfázisú hosszú kontextusú tréninggel, elérve akár a *128K tokent*.
*Hatékonyság:* FP8-at használ a hatékony következtetés (inference) érdekében.
*Vezérlés:* A felhasználók a `reasoning enabled` logikai érték (boolean) beállításával szabályozhatják az érvelési viselkedést.
*Struktúra:* A modell struktúrája megegyezik a DeepSeek-V3-mal. A modell a szöveggenerálás kategóriájába tartozik, és Safetensors, Transformers, deepseek\_v3, conversational, custom\_code és text-generation-inference címkékkel rendelkezik a Hugging Face-en.

*Elérhetőség és Licenc*

A modell több platformon is elérhető:
*Felhasználási módok:* App, Web és API.
*Nyílt forráskód:* A modell súlyai nyílt forráskódúak, és elérhetők a Hugging Face platformon: `https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus`.
*Licenc:* Ez a tároló és a modell súlyai az *MIT Licenc* alatt vannak licencelve.
*Lokális futtatás:* Inferencia demo kód (inference demo code) áll rendelkezésre a közösség számára a helyi futtatás megkezdéséhez.

A DeepSeek-V3.1-Terminus számos tesztben javulást mutat a DeepSeek-V3.1-hez képest.
(Megjegyzendő, hogy a Codeforces és az Aider-Polyglot teszteken a Terminus verzió némileg alacsonyabb eredményt ért el a forrás szerint).

*Linkek*
Twitter bejelentés: https://x.com/deepseek_ai/status/1970117808035074215
Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus
DeepSeek chat: https://chat.deepseek.com/
API docs: https://api-docs.deepseek.com/news/news250922
OpenRouter: https://openrouter.ai/deepseek/deepseek-v3.1-terminus

Ez a videó bemutatja a mesterséges intelligencia alkalmazását. Az AI (mesterséges intelligencia) rengeteg területen könnyíti és segíti az életünket.