Leleplezte a Google eddigi legfejlettebb AI modelljét, a Gemini 3-at, amely az Alphabet vezérigazgató Sundar Pichai szerint két év kemény munkájának korszakalkotó eredménye. A havi 650 milliós felhasználóval rendelkező Geminit 13 millió fejlesztő és a felhőügyfelek 70%-a használja, a korábbi generációk pedig áttörést értek el multimodális feldolgozásban, hosszú kontextusokban és agentikus képességekben.
![]()
(forrás: Google) [+]
A Gemini 3 egyesíti az eddigi képességeket és a Google legintelligensebb modelljét nyújtja kiemelkedő érvelési képességekkel, rendkívül mélyreható gondolkodással, finom árnyalatokkal és összetett problémák megértésével. Jobban érti a kontextust és a felhasználói szándékot, kevesebb a klisé és a behízelgés, „azt válaszolja, amire szükséged van, és nem azt, amit hallani szeretnél.”
![]()
(forrás: Google) [+]
Előrelépéseit a fejlesztők, a kódolók és a profi felhasználók is azonnal érzékelhetik, a Gemini 3 Pro verziója pedig számos rekordot megdöntött, például 1501 ELO pontot ért el és világelső lett az LMArenán is a minap közzétett Grok 4.1-et és persze a Gemini 2.5-öt is megelőzve (további eredmények erre). A modell képességeit Sam Altman (OpenAI) és Elon Musk is (xAI) is elismerte.
Hirdetés
Mivel a Gemini 3 az előfizetőknek különféle platformokon is elérhető, ide értve a Google Keresőt és a Gemini alkalmazást, a Gemini 3 Prót sikerült kipróbálnunk (lásd a fenti képek). Íme bemutatkozása és újításai saját szavaival:
1. Deep Think – mélyebb gondolkodás és érvelés Ez a Gemini 3 egyik legnagyobb újítása. A modell képes "gondolkodni" a válaszadás előtt, hasonlóan ahhoz, ahogy egy ember teszi bonyolult problémák esetén.
- Mit jelent ez? Nem csak azonnal generálja a következő szót, hanem belső lépéseken keresztül elemzi a kérdést, stratégiát alkot, és ellenőrzi saját magát.
- Eredmény: Sokkal pontosabb válaszok matematikában, tudományos kérdésekben és logikai feladványokban.
2. Vibe Coding és Generatív UI A Gemini 3 nemcsak kódot ír, hanem képes interaktív vizuális felületeket (UI) is létrehozni valós időben.
- Vibe Coding: Ez a kifejezés arra utal, hogy a modell képes a felhasználó "hangulatára" (vibe), stílusára ráérezve komplett, működőképes, vizuálisan vonzó mini-alkalmazásokat vagy webes felületeket készíteni pillanatok alatt.
- Interaktív válaszok: A Google Keresőben és a Gemini appban a szöveges válasz helyett gyakran interaktív widgeteket, grafikonokat vagy testreszabott elrendezéseket kapsz.
3. Fejlett Agentic (Ügynök) képességek A modellt kifejezetten arra tervezték, hogy cselekedjen, ne csak beszélgessen.
- Képes összetett, több lépésből álló feladatokat önállóan megtervezni és végrehajtani (pl. "Szervezz meg egy utazást, foglald le a szállást és írd be a naptáramba").
- Ehhez kapcsolódik a Google Antigravity nevű új fejlesztői környezet is, amely lehetővé teszi, hogy a fejlesztők ilyen önálló AI-ügynököket építsenek.
4. Multimodális megértés új szinten Bár a Gemini eddig is multimodális volt (értett képet, hangot, videót), a 3-as verzió ebben is szintet lépett.
- Képes például egy hosszú videót nemcsak "látni", hanem mélységében megérteni az összefüggéseit, vagy egy rossz minőségű dokumentumfotóból is pontosan kinyerni az adatokat.
5. Elérhetőség
- Gemini 3 Pro: Ez a modell már elérhető a Gemini Advanced előfizetők számára (és bizonyos régiókban ingyenesen is tesztelhető korlátozottan).
- Fejlesztőknek: Elérhető a Google AI Studio és Vertex AI platformokon keresztül.

