Hirdetés

Komplex intelligencia a Gemini 3.1 Pro fókuszában

Nem lassít a Google: máris megérkezett és rekordokat döntöget a friss modell.

A Google 2026. február 19-én hivatalosan bemutatta a Gemini 3.1 Pro modellt, amely alig három hónappal a Gemini 3 Pro után érkezik, és komoly előrelépést hoz a mesterséges intelligencia érvelő képességeiben. A cég a core intelligence továbbfejlesztésére helyezte a hangsúlyt, így a modell elsősorban azokra a feladatokra fókuszál, ahol nem elég egy egyszerű válasz: adatok szintézise, bonyolult magyarázatok és valódi agentic munkafolyamatok.

A benchmark eredmények magukért beszélnek: az ARC-AGI-2 absztrakt logikai feladatokon a Gemini 3.1 Pro 77,1%-os eredményt ért el – ez több mint duplája az előd 31,1%-ának, és veri az Anthropic Claude Opus 4.6 68,8%-át is. A Humanity’s Last Exam akadémiai reasoning teszten 44,4%-kal vezet, a GPQA Diamond tudományos tudást mérő feladaton pedig 94,3%-ot hozott. Emellett a SWE-Bench Verified agentic kódolási teszten 80,6%, a LiveCodeBench Pro versenykódolási ranglistán pedig 2887 Elo-pontot szerzett.


[+]

Multimodális képességei továbbra is kiemelkedőek: natívan kezeli a szöveget, képet, hangot, videót, PDF-eket és akár teljes kódtárakat is, 1 millió tokenes bemeneti kontextussal. A bemutatókban a modell szöveges promptból készített weboldalra kész animált SVG-ket (tiszta kódból, így bármilyen felbontásban élesek és egyben kis méretűek), valós idejű űrkutatási telemetria adatokból épített élő műszerfalat a Nemzetközi Űrállomás pályájának vizuálizálására, valamint egy teljes 3D-s seregély madárraj-szimulációt interaktív kézmozdulat-vezérléssel és mozgásfüggő generatív zenével.

Különösen érdekes a kreatív kódolási képesség: a modell Emily Brontë Üvöltő szelek regényének hangulatát egyetlen prompt alapján fordította le egy modern, atmoszférikus portfólió-weboldalra. Ezek a példák jól mutatják, hogy a Gemini 3.1 Pro már nem csupán szöveget generál, hanem valódi, működő prototípusokat és felhasználói élményeket hoz létre.

A fejlesztők és vállalati felhasználók számára kulcsfontosságú, hogy a modell preview változatban azonnal elérhető a Gemini API-n, Vertex AI-n, a Gemini alkalmazásban, NotebookLM-ben, sőt a GitHub Copilotban is. A token-árak nem változtak jelentősen az elődhöz képest (kb. 2/12 dollár millió tokenenként input/output), a kimeneti sebesség pedig 100+ token/másodperc körül mozog, miközben a thinking_level paraméterrel (most már medium opcióval is) finomhangolható a sebesség-teljesítmény-költség egyensúly.

Technikai specifikációk tekintetében a 3.1 Pro megtartotta a 64 ezer tokenes kimeneti limitet, a bemeneti támogatást viszont bővítette (akár 900 kép vagy 900 oldalas PDF egy promptban). A Google hangsúlyozza, hogy a modell továbbra is biztonságos marad a frontier safety teszteken, és nem éri el a kritikus képességi küszöböket CBRN, cyber vagy manipulációs területeken.

Összességében a Gemini 3.1 Pro azt mutatja, hogy a Google gyors iterációkkal, folyamatos javulással akarja visszaszerezni, sőt megtartani a vezető pozíciót az egyre élesebb AI-versenyben. Aki eddig várt a Gemini 3-ra, most már bátran kipróbálhatja a preview verziót – a komplex feladatok és agentic workflowk új szintje nyílt meg a fejlesztők és vállalkozások előtt.

Előzmények