Revoluce ve filmařině: Jak AI generátory mění tvorbu videí
Představte si, že byste mohli vytvořit hollywoodský trhák jen pomocí textu a pár kliknutí myší. Zní to jako sci-fi? Dlouho nebude. AI generátory videí mění pravidla hry ve filmovém průmyslu. Pojďme se podívat, jak tahle technologie funguje a co všechno dokáže.
Už dnes si každý může za večer vytvořit podobný videoklip:
Klip jsem vytvořil při prvním setkání s generátory videí. Chtěl jsem je rychle vyzkoušet a zjistit, co dokážou. Strávil jsem tím jen chvilku a jel vždy na první dobrou. Všechny ty „glitche“ jsem v klipu nechal schválně – ukazují, jak na tom tato technologie momentálně je. Je to takový malý dokument o současných možnostech a limitech AI generátorů videí.
Co jsou AI generátory videí?
AI generátory videí jsou nástroje, které využívají umělou inteligenci k vytváření videí na základě textových popisů nebo statických obrázků. Je to jako mít celý filmový štáb v jednom programu. Mezi populární nástroje patří Runway, Luma nebo Hailuo AI. Každý má své specifika, ať už jde o realistické vizuální efekty nebo plynulé animace.
Jak to celé funguje? Tady jsou hlavní přístupy:
- Text-to-video: Napíšete popis a AI vytvoří odpovídající video.
- Image-to-video: Nahrajete obrázek a AI ho „oživí“.
- Pokročilé metody: Ty umí vytvářet přechody mezi obrázky nebo různě vylepšovat existující videa.
Umění psaní podnětů (promptů)
Klíčem k úspěchu je komunikace. V tomto případě s AI. Tady přichází na řadu umění psaní podnětů. Dobrý podnět je jako scénář a režijní poznámky v jednom. Pojďme se podívat na klíčové aspekty:
- Buďte konkrétní. Místo „západ slunce na pláži“ zkuste „zlatý západ slunce na opuštěné písčité pláži, s jemně se vlnícím tyrkysovým mořem v pozadí“.
- Popište pohyb: Jasně definujte, jak se mají objekty nebo postavy pohybovat. Například: „Mladý pár pomalu kráčí podél břehu, jejich kroky jsou synchronizované a plynulé.“
- Nezapomeňte na kameru: Mnoho generátorů exceluje v komplexních kamerových pohybech. Buďte přesní: „Kamera začíná širokým záběrem a postupně se přibližuje k páru, udržujíc je ve středu záběru.“
- Osvětlení a atmosféra: Popište světelné podmínky a celkovou náladu. „Scéna je zalitá měkkým, zlatým světlem zapadajícího slunce, vytvářející romantickou a nostalgickou atmosféru.“
- Tempo a rytmus: Používejte slova jako „pomalu“, „plynule“ nebo „náhle“ k definování tempa akce a pohybu kamery.
Jinými slovy, prompt „Člověk jde a spadne“ neudělá přesně to, co máš v hlavě. Osvědčilo se mi generovat podněty přes Claude nebo ChatGPT. Zkopíroval jsem do nich návod, jak je psát, a asistenti pomůžou s formulací detailních a strukturovaných podnětů. A z „člověk jde a spadne“ vytvoří:
Po městském chodníku kráčí člověk sebevědomě, jeho krok je cílevědomý a uvolněný. Kamera ho sleduje ve výšce pasu a zachycuje jeho pevnou chůzi a městské prostředí. Náhle se jeho noha zachytí o neviditelnou překážku. Kamera se rychle posune nahoru a zaměří se na jeho vyděšený výraz, když začne ztrácet rovnováhu. Jeho ruce se ve zpomaleném záběru rozkmitají a prsty se snaží získat zpět stabilitu. Pozadí se mírně rozostřuje, čímž zdůrazňuje pohyb subjektu. Kamera sleduje jeho pád a naklání se směrem dolů, jak padá dopředu a jeho tělo se sklání k zemi. Scéna končí právě ve chvíli, kdy se jeho ruce natahují, aby pád přerušily, a zachycuje tak okamžik pozastavené animace před dopadem.
Tahle vypadá výsledek vygenerovaný v Hailuo:
Obraz jako odrazový můstek
Generátory videí zaostávají za svými protějšky pro statické obrázky, jako je třeba Midjourney. Proto se často volí strategie, kdy se úvodní snímek vytvoří pomocí generátoru obrázků a následně se vdechne život prostřednictvím video generátoru. Jde o techniku image-to-video. Dává nám možnost oživit vlastní fotografie, což je velmi zábavné. Tady třeba demoluji stavební památku:
Video generátor může občas nesprávně interpretovat vstupní obraz. Proto je důležité, aby prompt věrně odrážel podstatu výchozího snímku. Nemůžete třeba chtít akční scénu, pokud je vstupní obraz zjevně statický, nebo požadovat pohled z ptačí perspektivy, když originál zachycuje scénu ze země. Pokud máme například obrázek ženy sedící poklidně na lavičce, bez jakýchkoli náznaků akce, bude vhodný prompt:
Žena v červených šatech sedí na lavičce v parku a čte knihu. Je obklopena stromy s podzimním listím. Kamera se pomalu a plynule přibližuje k ženě, zachycujíc detaily její tváře a šatů. Jak se záběr zužuje, žena zvedá hlavu od knihy, kterou drží v rukou. Odkládá knihu vedle sebe, pomalu vstává z lavičky a náhle se rozbíhá směrem k rušné ulici. Kamera sleduje její pohyb, rozšiřujíc záběr tak, aby zachytila dynamiku městského prostředí – projíždějící auta a autobusy v pozadí.
Naopak příklad špatného podnětu pro stejný vstupní obraz:
Žena v červených šatech běží přes rušnou městskou ulici. Kamera ji sleduje z výšky pomocí dronu. V pozadí vidíme mrakodrapy a hustý provoz.
Tento podnět je v rozporu s vstupním obrazem a pravděpodobně by vedl k nekonzistentním nebo nerealistickým výsledkům.
Tipy pro nejlepší výsledky
- Začněte jednoduše: Pro začátek se vyhněte příliš složitým scénám nebo rychlým akcím. Většina generátorů funguje nejlépe s mírnými pohyby a plynulými přechody.
- Používejte filmovou terminologii: Pojmy jako „rack focus“, „dolly zoom“ nebo „over-the-shoulder shot“ pomohou AI lépe pochopit vaše záměry.
- Nebojte se experimentovat: Dokonalé video často nevznikne na první pokus. Experimentujte s různými formulacemi podnětů. Někdy je těch pokusů potřeba udělat desítky.
- Respektujte limity: I ty nejpokročilejší systémy mají své hranice. Například složité taneční scény nebo extrémně dynamické akční sekvence mohou být problematické.
- Kvalita vstupů: Při použití image-to-video dbejte na vysokou kvalitu vstupního obrázku. Čím lepší vstup, tím lepší výstup.
- Inspirujte se: Pro přesnější vysvětlení záměrů můžete do svých podnětů zahrnout odkazy na existující obrázky nebo krátká videa. Například: „Vytvořte scénu s podobnou atmosférou jako ve filmu ‚Blade Runner 2049‘, s neonovými světly prosvítajícími mlhou.“
Peněžka zapláče
Generování videí pomocí AI není zadarmo. Většina platforem používá kredity. Například můžete koupit 1000 kreditů, což se zdá jako hodně, ale ve skutečnosti to stačí třeba jen na 20–30 krátkých videí.
Abyste se vůbec dokázali s touto technologií seznámit, zvažte neomezený tarif, i když může stát několik tisíc za měsíc. Po celý měsíc budete naplno experimentovat a pak tarif zrušíte. Počítejte s tím, že na začátku budete potřebovat hodně pokusů k dosažení požadovaného výsledku.
A co filmaři, budou mít co žrát?
Generování videí je mnohem komplikovanější než generování statických obrázků. Nemá technologicky vůbec nic společného s tím, jak se dělají počítačové triky dosud. Jde o zcela jinou technologii, kdy neuronová síť doslova vysnívá (nechává si zdát) vaše videa. Proto v nich často špatně funguje fyzika, geometrie nebo logika, stejně jako v našich snech.
Zatím to není dokonalé, ani zdaleka. Výsledky vypadají divně a uměle. Ale vzpomeňte si, jak vypadaly první AI obrázky před pár lety. A dnes? Skoro k nerozeznání od fotek.
Stojíme na prahu éry, kdy každý bude moct přenést své nápady na obrazovku bez ohledu na rozpočet nebo technické znalosti. Představte si nezávislé filmaře tvořící epické sci-fi bez drahých efektů. Nebo školy, které oživí historii pro své studenty. Možnosti jsou nekonečné. AI generátory videí přinesou revoluci ve filmařině. Tak co, pustíte se jednou do natáčení svého AI blockbusteru?