Az OpenAI új képgeneráló modellje, a GPT Image 1.5 végre tényleg érezhető előrelépést hozott a ChatGPT-ben, és ez most nem az a frissítés, ahol hunyorogva kell keresni a különbségeket. A generált képek részletesebbek, kevesebb a torzulás, az eredmények pedig összességében sokkal életszerűbbek, mint az előző verziónál. Ugyanakkor a Google Geminihez tartozó Nano Banana Pro továbbra is egy hajszállal minden fontos területen előtte jár. A GPT Image 1.5 jelenleg minden ChatGPT-felhasználónál aktív, legyen szó ingyenes vagy fizetős csomagról. Az OpenAI ígérete szerint javult az utasításkövetés, a szöveges elemek kezelése, a képszerkesztés pontossága és a teljesítmény is, mindezt kevesebb vizuális hibával. Ezzel párhuzamosan a ChatGPT kapott egy külön Images fület is, ahol az elkészült képek visszanézhetők, újragenerálhatók, és különböző stílusokból lehet válogatni, ami ugyan nem forradalom, de kifejezetten kényelmes.
A legszembetűnőbb fejlődés a realizmusban látszik. Egy egyszerű, otthonbelsőt kérő promptnál a régi GPT Image 1 üres, steril stockfotó-hatású képet adott, míg az 1.5 már valódi részletekkel dolgozik, bútorokkal, fényekkel, apró vizuális jelekkel, amelyek életszerűvé teszik az összképet. Itt már tényleg felveszi a versenyt a Nano Banana Próval, bár apró hibák, például furcsán összenőtt tárgyak, még mindig előfordulnak. Összetettebb feladatoknál, például képregény-generálásnál még látványosabb a különbség az előző modellhez képest. A GPT Image 1.5 már nemcsak részletesebb rajzstílust produkál, hanem képes narratív fordulatokat is következetesen megjeleníteni. Ennek ellenére a Google modellje itt is precízebb marad: pontosabban tartja a panelstruktúrát, és jobban kezeli az elrendezést, míg a ChatGPT hajlamos túllőni a kéréseken, például extra panelek hozzáadásával.
A diagramok és technikai ábrák hagyományosan az AI-k gyenge pontjai, és bár a GPT Image 1.5 ezen a téren is javult, a Nano Banana Pro továbbra is megbízhatóbb. A ChatGPT kevesebb elírást vét, szebb grafikai elemeket használ, de néha kihagy kapcsolatokat vagy eltér az eredeti struktúrától, míg a Google modellje következetesebb marad. Képszerkesztésnél vegyes a kép. A GPT Image 1.5 színei élénkebbek, kontrasztosabbak, és az élesség is jobb, viszont az eltávolított objektumok helyén nem mindig illeszkedik tökéletesen az újonnan generált részlet a környezethez. Emellett előfordul, hogy megváltozik a képarány vagy apró mintázatok jelennek meg a részletekben. A Nano Banana Pro ebben általában természetesebb eredményt ad, még ha kevésbé is látványos.
Összességében a GPT Image 1.5 egyértelműen komoly előrelépés az OpenAI korábbi képgenerálásához képest, és aki eddig is ChatGPT-t használt erre, most sokkal jobb eszközt kapott a kezébe. A Google Nano Banana Pro azonban továbbra is az etalon, főleg szerkesztésnél és összetett vizuális feladatoknál. A ChatGPT új modellje már nem kullog a mezőny végén, de az élre álláshoz még mindig hiányzik az a bizonyos utolsó lépcsőfok.