Hirdetés

Mindent a mesterséges intelligenciára fűz fel a Google, két új modell is bemutatkozott



|

A vállalat fokozatosan halad egy univerzális AI ökoszisztéma felé.

Hirdetés

A Google az I/O tavalyi eseményén még a Gemini 2.5-ös családról beszélt, azóta azonban gyors ütemben haladt előre a fejlesztés, a 3.0 és 3.1 után pedig most megérkezett a Gemini 3.5 Flash, amelyet a Google több termékében is elérhetővé tesz. A vállalat szerint az új modell nemcsak a korábbi generációknál gyorsabb és hatékonyabb, hanem már "frontier" szintű teljesítményt nyújt, miközben elég olcsó és gyors ahhoz, hogy összetett, több lépéses ügynökszerű feladatokhoz is használható legyen. A rendszer akár közel 300 tokent is képes másodpercenként generálni, miközben teljesítménye eléri a nagyobb, korábbi csúcskategóriás modellek szintjét.

A Terminal Bench, a SWE-Bench Pro és az OSWorld-Verified tesztek szerint a Gemini 3.5 Flash jelentősen felülmúlja az előző Flash modelleket, és sok esetben megközelíti vagy enyhén meghaladja a Gemini 3.1 Pro teljesítményét, miközben gyorsabb is nála. A Google szerint ez a kombináció teszi igazán alkalmassá a valós idejű, több lépéses munkafolyamatokra. Ennek részeként az Antigravity IDE is frissül, amely már párhuzamos "alügynökös" munkafolyamatokat is képes kezelni a modell segítségével.

Hirdetés

Az új modell nemcsak fejlesztői eszközökben jelenik meg, a Gemini 3.5 Flash bekerül a Android Studio felületébe, a Gemini alkalmazásba, API-kba és vállalati rendszerekbe is. Ehhez kapcsolódik a Gemini Spark nevű új ügynök is, amely folyamatosan fut a felhőben, és például e-maileket figyel a Gmail rendszerében, dokumentumokat kezel a Google Drive segítségével, vagy összefoglalókat készít találkozókról. A szolgáltatás az Ultra előfizetés részeként indul, amely havi 100 dolláros csomagban érhető el, a Google pedig később szélesebb körben is elérhetővé tenné.

A vállalat közben már a multimodális jövő felé is lép. A Gemini Omni Flash a jövőben a Veo videómodell helyét veszi át több termékben, például a Gemini alkalmazásban és a YouTube felületein. Az új modell célja, hogy egységesen kezelje a különböző bemeneti és kimeneti formátumokat - szöveget, képet, hangot és videót -, bár egyelőre főként a videógenerálásra fókuszál. A Google szerint ez még csak az első lépés egy olyan irányba, ahol a különálló modellek helyett egyre inkább egységes, univerzális AI-rendszer alakulhat ki.

Hirdetés

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://www.pcwplus.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.