A ByteDance Seed-Coder egy nyílt forráskódú, 8 milliárd paraméteres nagy nyelvi modell, kifejezetten kódgenerálásra és -kiegészítésre tervezve.
Célja, hogy paraméter-hatékonyan közelítse meg a nagy, 30–70B paraméteres modellek szintjét, leküzdve a méret és pontosság közti kompromisszumot.
Modell-központú: A Seed-Coder túlnyomórészt LLM-eket használ a kézzel készített szabályok helyett a kódadatok (GitHub-repo, commitok, webes kódblokkok) szűrésére, minimalizálva a manuális erőfeszítéseket az előképzési adatok építésében.
Teljesen átláthatóság: Részletesen dokumentált, hogyan gyűjtik és tisztítják a GitHub-kódokat, commitokat és webes kódblokkokat – így bármely fejlesztő pontosan követheti a teljes adatfeldolgozást .
Kiemelkedő, paraméter-hatékony teljesítmény
Mindössze 8,2 milliárd paraméterrel ér el elméletileg olyan pontosságot kódgenerálásban és -kiegészítésben, ami korábban csak jóval nagyobb modellekre volt jellemző .
Három változat egy csomagban
– Base: az alapmodell
– Instruct: Az utasításkövető modell tovább lett finomhangolva, hogy jobban értse és kövesse a felhasználói utasításokat. Kiváló teljesítményt mutat kódgenerálási, kódszerkesztési és szoftvermérnöki feladatokban
- Reasoning: Az érvelő modell megerősítő tanulást (reinforcement learning) használ, különösen egy Long-Chain-of-Thought (LongCoT) nevű módszert, hogy javítsa a több lépésből álló kódolási problémák megoldását
Hosszú kontextus kezelése (max. 32 768 token): a “Needle in the Code” teszten 100 % pontosságot ért el ebben a hosszúságban.
A méréseik szerint a Base változat a HumanEval+ benchmarken 77,4 % pass@1, a MBPP+ esetén 82,0 % fölött teljesít, felülmúlva minden más ~8 B modellt
Az Instruct variáns a MHPP (Mostly Hard Python Problems) benchmarkon 36,2 % pass@1, a LiveCodeBench-en pedig 24,7 % pass@1 értékkel előzi meg a hasonló méretű nyílt modelleket
A Reasoning modell az IOI’2024 versenyen 1918 ELO és a Codeforces-en 1553 pontot gyűjtött, meghaladva a 32 B-s QwQ-32B-t is
Teljesen nyílt forráskódú, elérhető GitHubon és Hugging Face-en, elősegítve a közösségi fejlesztést és a kutatást
*Linkek*
ByteDance Seed Seed-Coder: https://bytedance-seed-coder.github.io/
Kutatási anyag: https://github.com/ByteDance-Seed/Seed-Coder/blob/master/Seed-Coder.pdf
Hugging Face modell: https://huggingface.co/ByteDance-Seed/Seed-Coder-8B-Instruct
GitHub: https://github.com/ByteDance-Seed/Seed-Coder
Seed-Coder: nyílt forráskódú, 8B paraméteres LLM kódgenerálásra
-
Írta:
YouTube
Hirdetés

Fotóznál vagy videóznál? Mutatjuk, melyik okostelefon mire való igazán!
PR Vásárlás előtt érdemes megnézni, mit kínálnak az aktuális telefonok, ha igazán ütős képeket vagy profi mozgóképeket szeretnénk készíteni.

Aktív témák
- Milyen asztali (teljes vagy fél-) gépet vegyek?
- OLED monitor topik
- sziku69: Fűzzük össze a szavakat :)
- sziku69: Szólánc.
- Luck Dragon: Asszociációs játék. :)
- Vicces képek
- Autós topik látogatók beszélgetős, offolós topikja
- Filmvilág
- Vegyszerek, permetezés, Élettani hatások
- D1Rect: Nagy "hülyétkapokazapróktól" topik
- További aktív témák...