A Google bejelentette, hogy zenegenerálási funkcióval bővíti a Gemini alkalmazást az új, a Google DeepMind által fejlesztett Lyria 3 modell segítségével. A funkció egyelőre béta verzióban érhető el, és lehetővé teszi, hogy a felhasználók szöveges utasítások, illetve feltöltött képek és videók alapján akár 30 másodperces zenéket hozzanak létre.
A felhasználók megadhatnak műfajt, hangulatot vagy akár egy személyes emléket is inspirációként, a Gemini pedig ezek alapján generál dalt és dalszöveget. A rendszer lehetőséget biztosít a stílus, a tempó és az énekhang típusának beállítására is, így nagyobb kreatív kontrollt kínál az alkotók számára.
Az elkészült zeneszámokat a Google láthatatlan digitális vízjellel, úgynevezett SynthID-val látja el, amely jelzi, hogy mesterséges intelligencia által generált tartalomról van szó. A Gemini emellett képes ellenőrizni, hogy egy adott hangfájlt a Google AI-rendszere hozott-e létre.
A vállalat hangsúlyozta, hogy a Lyria 3 modellt eredeti művek készítésére szánják, nem pedig konkrét előadók stílusának utánzására. A szolgáltatás globálisan elérhető angol, német, spanyol, francia, hindi, japán, koreai és portugál nyelven, 18 év feletti felhasználók számára, az előfizetők pedig magasabb használati korlátot kapnak.