Megmozdult a kép: a Midjourney belép a videók világába

Vörös Lóránd

| 2025 június 19. 12:02

A szolgáltató élesítette a vadonatúj V1 videómodellt.

Hirdetés

Elsők között mutatta meg a generatív algoritmusokban rejlő lehetőségeket a Midjourney, amely az állóképek létrehozása után kiterjeszti a Discordon elérhető szolgáltatását a videók készítésére is: elindította első saját videómodelljét, a V1-et. A fejlesztők víziója ambiciózus, és nem is titkolják. A végcél egy olyan rendszer, amely képes valós időben képet generálni, mozgó karakterekkel, interaktív környezettel, három dimenzióban - ahol a felhasználó szabadon barangolhat, mintha belépne egy AI által létrehozott valóságba.

Ehhez azonban lépésről lépésre kell haladniuk: előbb jöttek a képek, most érkeznek a videók, később következik a 3D, végül pedig a real-time.

Hirdetés

A V1 videómodell nem állítja fejre az iparágat, de egy okosan megtervezett belépő a mozgóképek világába. Az új workflow neve "Image-to-Video": azaz továbbra is képekkel indulunk, viszont mostantól egyetlen kattintással "Animate" módba kapcsolhatjuk őket. Az automatikus mód "magától" generál mozgást, míg a manuális verzióban szöveges promptokkal írhatjuk le, hogyan fejlődjön tovább az adott jelenet.

Két mozgási intenzitás közül lehet választani: a "low motion" finom, lassú kameramozgásra és atmoszférikus jelenetekre ideális - bár néha kissé túl statikus -, míg a "high motion" pörgősebb, dinamikusabb képsorokat kínál, igaz, némi hibalehetőséggel együtt. A videók alapesetben öt másodpercesek, de akár négyszer is meghosszabbíthatók négy-négy másodperccel - így elérhető a 21 másodperces maximum.

Fontos, hogy a rendszer nemcsak Midjourney-ben készült képekkel működik: külső képeket is feltölthetünk, majd megadhatjuk, hogyan "mozduljanak meg". A cél az, hogy ne csak látványos, de érzelmileg is megmozgató élményeket alkothassunk - legyen szó egy elfeledett családi fotóról vagy egy vadonatúj fantáziavilágról.

Ami az árakat illeti: a videók generálása nyolcszor annyiba kerül, mint egy képkérés, de egy teljes job négy különálló videót eredményez, így a képenkénti költség lényegében az upscale árának felel meg. Ez meglepően kedvező, főleg ha figyelembe vesszük, hogy a konkurencia eddig több mint huszonötször ennyit kért hasonló szolgáltatásért.

Egyelőre csak webes felületen elérhető a videómodell, és az első hetek nyilvánvalóan a finomhangolásról fognak szólni. A csapat figyeli a terhelést, az erőforrásokat, a felhasználói viselkedést, és ennek tükrében változtat majd az árazáson és az elérhetőségen. A "Relax" mód tesztje már elindult a Pro szintű felhasználóknál, így idővel a nyomás is enyhülhet.

Noha a videós modell bevezetése logikus lépés, az időzítés kissé szerencsétlen, mivel alig egy hete volt, hogy a Disney és a Universal közösen beperelte a Midjourney-t, amiért AI által generált képein felismerhető karakterek tűntek fel.

Pulzusméréssel segíti a biztonságos mozgást az új balatoni kardioösvény (X)4 és egy 8 km-es egészségügyi tanösvény nyílt Balatonalmádiban.

Hirdetés

Megmozdult a kép: a Midjourney belép a videók világába

Kövess Facebookon!

Rezsicsökkentés: mennyit fogyaszt a PC-d, a konzolod és a többi elektronikai eszközöd?

A nap hőse a srác, aki épített egy biztonsági rendszert, hogy illetéktelenek ne használhassák a Steam Deckjét

Több mint ötven drónt béníthat meg egyetlen bevetésen a Lockheed új fegyvere

A Microsoft odacsap a Windows-kalózoknak, fontos változás jön az aktiválásban

Annyira megijesztette a techóriásokat a renitens OpenAI-modell, hogy összefognak

A ChatGPT megcáfolhatott egy közel 30 éves matematikai sejtést