Hirdetés

Többet ésszel, mint klisével: mindent felforgat a Gemini 3

Már kipróbálható a Google legfejlettebb, multimodális AI modellje.

Leleplezte a Google eddigi legfejlettebb AI modelljét, a Gemini 3-at, amely az Alphabet vezérigazgató Sundar Pichai szerint két év kemény munkájának korszakalkotó eredménye. A havi 650 milliós felhasználóval rendelkező Geminit 13 millió fejlesztő és a felhőügyfelek 70%-a használja, a korábbi generációk pedig áttörést értek el multimodális feldolgozásban, hosszú kontextusokban és agentikus képességekben.


(forrás: Google) [+]

A Gemini 3 egyesíti az eddigi képességeket és a Google legintelligensebb modelljét nyújtja kiemelkedő érvelési képességekkel, rendkívül mélyreható gondolkodással, finom árnyalatokkal és összetett problémák megértésével. Jobban érti a kontextust és a felhasználói szándékot, kevesebb a klisé és a behízelgés, „azt válaszolja, amire szükséged van, és nem azt, amit hallani szeretnél.”


(forrás: Google) [+]

Előrelépéseit a fejlesztők, a kódolók és a profi felhasználók is azonnal érzékelhetik, a Gemini 3 Pro verziója pedig számos rekordot megdöntött, például 1501 ELO pontot ért el és világelső lett az LMArenán is a minap közzétett Grok 4.1-et és persze a Gemini 2.5-öt is megelőzve (további eredmények erre). A modell képességeit Sam Altman (OpenAI) és Elon Musk is (xAI) is elismerte.

[+]

Hirdetés

Mivel a Gemini 3 az előfizetőknek különféle platformokon is elérhető, ide értve a Google Keresőt és a Gemini alkalmazást, a Gemini 3 Prót sikerült kipróbálnunk (lásd a fenti képek). Íme bemutatkozása és újításai saját szavaival:

1. Deep Think – mélyebb gondolkodás és érvelés Ez a Gemini 3 egyik legnagyobb újítása. A modell képes "gondolkodni" a válaszadás előtt, hasonlóan ahhoz, ahogy egy ember teszi bonyolult problémák esetén.

  • Mit jelent ez? Nem csak azonnal generálja a következő szót, hanem belső lépéseken keresztül elemzi a kérdést, stratégiát alkot, és ellenőrzi saját magát.
  • Eredmény: Sokkal pontosabb válaszok matematikában, tudományos kérdésekben és logikai feladványokban.

2. Vibe Coding és Generatív UI A Gemini 3 nemcsak kódot ír, hanem képes interaktív vizuális felületeket (UI) is létrehozni valós időben.

  • Vibe Coding: Ez a kifejezés arra utal, hogy a modell képes a felhasználó "hangulatára" (vibe), stílusára ráérezve komplett, működőképes, vizuálisan vonzó mini-alkalmazásokat vagy webes felületeket készíteni pillanatok alatt.
  • Interaktív válaszok: A Google Keresőben és a Gemini appban a szöveges válasz helyett gyakran interaktív widgeteket, grafikonokat vagy testreszabott elrendezéseket kapsz.

3. Fejlett Agentic (Ügynök) képességek A modellt kifejezetten arra tervezték, hogy cselekedjen, ne csak beszélgessen.

  • Képes összetett, több lépésből álló feladatokat önállóan megtervezni és végrehajtani (pl. "Szervezz meg egy utazást, foglald le a szállást és írd be a naptáramba").
  • Ehhez kapcsolódik a Google Antigravity nevű új fejlesztői környezet is, amely lehetővé teszi, hogy a fejlesztők ilyen önálló AI-ügynököket építsenek.

4. Multimodális megértés új szinten Bár a Gemini eddig is multimodális volt (értett képet, hangot, videót), a 3-as verzió ebben is szintet lépett.

  • Képes például egy hosszú videót nemcsak "látni", hanem mélységében megérteni az összefüggéseit, vagy egy rossz minőségű dokumentumfotóból is pontosan kinyerni az adatokat.

5. Elérhetőség

  • Gemini 3 Pro: Ez a modell már elérhető a Gemini Advanced előfizetők számára (és bizonyos régiókban ingyenesen is tesztelhető korlátozottan).
  • Fejlesztőknek: Elérhető a Google AI Studio és Vertex AI platformokon keresztül.

Hirdetés

Televíziók gamer szemmel: input lag, HDR és minden, ami számít

PR A modern játékélmény már messze túlmutat a képernyőn: a grafikai részletesség, a gyors reakcióidő és a látványos fényhatások mind hozzájárulnak ahhoz, hogy egy játék valóban magával ragadjon.

Azóta történt

Előzmények