Úgy tűnik, a Google nem éri be azzal, hogy a Gemini szöveget ír, képet generál vagy videót vág: a keresőóriás legújabb frissítése után a chatbot már zeneszerzőként is kipróbálhatja magát. A technológia mögött a DeepMind legfrissebb, Lyria 3 névre keresztelt modellje áll, amely képes rövid, fülbemászó dallamokat kreálni egyszerű szöveges utasítások, vagy akár feltöltött képek és videók alapján.
A használat pofonegyszerű: a Gemini felületén megjelent egy „Create Music” gomb, amelyre kattintva vagy saját leírást adhatunk meg, vagy választhatunk a felkínált stílusok – például 90-es évekbeli rap vagy latin pop – közül. A rendszer nemcsak a hangszerelést és a dallamot rakja össze, hanem a megadott hangulathoz passzoló dalszöveget is ír, sőt, énekhangot is generál hozzá, így egy komplett minislágert kapunk eredményül.
Az újdonság egyik legérdekesebb funkciója a vizuális alapú zeneszerzés. Ha feltöltünk egy fotót például egy erdei kirándulásról, a Gemini elemzi a kép hangulatát, és ahhoz illő, természetközeli audioélményt komponál. A generált zeneművek jelenleg 30 másodpercesek, ami pont ideális hosszúság egy közösségi médiás poszt alá vagy egy egyedi csengőhangnak, de arra is jó, hogy gyorsan skicceljünk fel zenei alapötleteket.
Természetesen a Google a biztonságra és a szerzői jogokra is gondolt. A generált dalok nem másolnak konkrét művészeket: ha valaki „Queen stílusú” dalt kér, a rendszer csak a hangulatot és a jellemző hangszereket veszi át, de az eredmény egyedi marad. Minden egyes hangfájlba beépítik a SynthID nevű láthatatlan digitális vízjelet is, így később bármikor beazonosítható, hogy a művet mesterséges intelligencia követte el.
Hogy a vizuális élmény se maradjon el, a zenék mellé a rendszer automatikusan albumborítót is gyárt a Google saját képgenerátorával, a Nano Bananával. A kész alkotásokat nemcsak letölthetjük, hanem közvetlen linken keresztül meg is oszthatjuk ismerőseinkkel. A funkció egyelőre béta fázisban van, de a Google ígérete szerint folyamatosan finomítják a hangzást és a zenei komplexitást.
A zenei Gemini első körben a webes felületen válik elérhetővé a 18 év feletti felhasználók számára, a mobilalkalmazásokba pedig a következő napokban szivárog be a frissítés. Bár a profi zeneszerzőknek egyelőre nem kell félteniük a munkájukat, a hétköznapi felhasználók számára egy újabb szórakoztató eszközt adott a Google, amivel bárki „kiadhatja” első saját digitális kislemezét.

