Hirdetés

Megmozdult a kép: a Midjourney belép a videók világába



|

A szolgáltató élesítette a vadonatúj V1 videómodellt.

Hirdetés

Elsők között mutatta meg a generatív algoritmusokban rejlő lehetőségeket a Midjourney, amely az állóképek létrehozása után kiterjeszti a Discordon elérhető szolgáltatását a videók készítésére is: elindította első saját videómodelljét, a V1-et. A fejlesztők víziója ambiciózus, és nem is titkolják. A végcél egy olyan rendszer, amely képes valós időben képet generálni, mozgó karakterekkel, interaktív környezettel, három dimenzióban - ahol a felhasználó szabadon barangolhat, mintha belépne egy AI által létrehozott valóságba.

Ehhez azonban lépésről lépésre kell haladniuk: előbb jöttek a képek, most érkeznek a videók, később következik a 3D, végül pedig a real-time.

Hirdetés

A V1 videómodell nem állítja fejre az iparágat, de egy okosan megtervezett belépő a mozgóképek világába. Az új workflow neve "Image-to-Video": azaz továbbra is képekkel indulunk, viszont mostantól egyetlen kattintással "Animate" módba kapcsolhatjuk őket. Az automatikus mód "magától" generál mozgást, míg a manuális verzióban szöveges promptokkal írhatjuk le, hogyan fejlődjön tovább az adott jelenet.

Két mozgási intenzitás közül lehet választani: a "low motion" finom, lassú kameramozgásra és atmoszférikus jelenetekre ideális - bár néha kissé túl statikus -, míg a "high motion" pörgősebb, dinamikusabb képsorokat kínál, igaz, némi hibalehetőséggel együtt. A videók alapesetben öt másodpercesek, de akár négyszer is meghosszabbíthatók négy-négy másodperccel - így elérhető a 21 másodperces maximum.

Fontos, hogy a rendszer nemcsak Midjourney-ben készült képekkel működik: külső képeket is feltölthetünk, majd megadhatjuk, hogyan "mozduljanak meg". A cél az, hogy ne csak látványos, de érzelmileg is megmozgató élményeket alkothassunk - legyen szó egy elfeledett családi fotóról vagy egy vadonatúj fantáziavilágról.

Ami az árakat illeti: a videók generálása nyolcszor annyiba kerül, mint egy képkérés, de egy teljes job négy különálló videót eredményez, így a képenkénti költség lényegében az upscale árának felel meg. Ez meglepően kedvező, főleg ha figyelembe vesszük, hogy a konkurencia eddig több mint huszonötször ennyit kért hasonló szolgáltatásért.

Egyelőre csak webes felületen elérhető a videómodell, és az első hetek nyilvánvalóan a finomhangolásról fognak szólni. A csapat figyeli a terhelést, az erőforrásokat, a felhasználói viselkedést, és ennek tükrében változtat majd az árazáson és az elérhetőségen. A "Relax" mód tesztje már elindult a Pro szintű felhasználóknál, így idővel a nyomás is enyhülhet.

Noha a videós modell bevezetése logikus lépés, az időzítés kissé szerencsétlen, mivel alig egy hete volt, hogy a Disney és a Universal közösen beperelte a Midjourney-t, amiért AI által generált képein felismerhető karakterek tűntek fel.

Hirdetés

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://www.pcwplus.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.