Hirdetés

A Nano Banana Pro az AI-képgenerálás új korszakát nyitja meg



|

A Gemini 3 után azonnal megérkezett a Nano Banana Pro, amely részletesebb, pontosabb és többnyelvű képkészítést ígér a Google-től.

Hirdetés

A Google a Gemini 3 bemutatása után néhány nappal újabb nagy dobást tett le az asztalra: megjelent a Nano Banana Pro, amelyet hivatalosan Gemini 3 Pro Image néven emlegetnek. A cég állítása szerint jóval "hasznosabb" lett, ami a gyakorlatban azt jelenti, hogy nem csupán látványos, hanem kimondottan informatív képeket is készít: magyarázó ábrákat, receptfolyamatokat, infografikákat vagy akár részletes technikai vázlatokat is gond nélkül előállít. Ezt jól mutatja az a példakép is, amelyben a rendszer a semmiből megtervez egy kardamomos tea receptjét, lépésről lépésre összeállított képekkel és szöveges leírásokkal, amit egy letisztult folyamatábrába rendez.

A képgenerálók egyik legnagyobb mumusa évek óta az olvasható, értelmes, pontos szöveg volt. A Google most úgy érzi, megoldotta a problémát: a Nano Banana Pro nemcsak rövid feliratokat, hanem akár hosszabb bekezdéseket is képes beágyazni a képekbe, és storyboardok rajzait is elláthat apró instrukciókkal. A vállalat ugyanakkor óvatosan hozzáteszi, hogy miniatűr betűméreteknél továbbra is lehetnek hibák, így a felhasználóknak szükség esetén finomhangolással kell kiküszöbölniük a félregépeléseket.

A többnyelvűség is hangsúlyos szerepet kapott: a Nano Banana Pro akár teljes képeket is lefordít, és külön piacokra optimalizált változatokat készít. A Google azonban figyelmeztet, hogy a nyelvtani vagy kulturális bakik még mindig fel-felbukkanhatnak, ezért a tökéletes végeredményhez érdemes manuális ellenőrzéssel számolni.

Hirdetés

Az új verzióban 2K és 4K felbontások közül lehet választani, és a rendszer bármely részletet újragenerál, legyen szó színkorrekcióról, megvilágításról, kameraállásról vagy fókuszról. A vállalat külön kiemeli, hogy a pontos, aprólékos első prompt hozza a legjobb eredményt: a képaránytól a mélységélességen át egészen a fényviszonyokig minden részletet érdemes előre megadni.

A Nano Banana Pro egyik legnagyobb újítása a többképes input: egyszerre akár tizennégy képet is képes feldolgozni, és legfeljebb öt szereplő vonásait következetesen fenntartja a generálás során. Ez azt jelenti, hogy akár komplett jeleneteket vagy csapatképeket is össze lehet ollózni úgy, hogy az arcok nem torzulnak el minden új változtatásnál.

A szolgáltatás mostantól elérhető, ám ingyenes felhasználóknál kreditek lejárta után automatikusan a gyengébb Gemini Flash 2.5 lép működésbe. A Google AI Plus, Pro és Ultra előfizetők magasabb kvótával dolgozhatnak, és a funkció ott van az USA-ban a Google Search AI Mode-jában is, ha a megfelelő csomagra fizetünk. A fizetős NotebookLM felhasználók szintén hozzáférnek, illetve a Google filmkészítő AI-eszköze, a Flow is megkapja majd a Nano Banana Prót, bár ennek érkezési dátuma még nem ismert.

A Google minden jel szerint teljes erővel készül a vizuális AI-eszközök új korszakára, és a Nano Banana Pro az eddigi legkomolyabb lépésük ebben az irányban.

Hirdetés

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://www.pcwplus.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.