Kling: Nove granice generisanja videa i slika
Kling Omni je novi, izuzetno moćan AI model za kreiranje video sadržaja, koji uvodi značajna unapređenja u kontroli, kvalitetu i svestranosti generisanja. Analiza, zasnovana na prezentaciji sa YouTube kanala "Fal Academy", pokazuje da se model ističe kroz pet ključnih funkcionalnosti koje zajedno pomeraju granice AI video produkcije.
- Napredna kontrola scene: Nova funkcija "Referenca na Video" omogućava korisnicima da precizno usmeravaju generisanje videa koristeći kombinaciju tekstualnih uputstava, stilskih slika i specifičnih "elemenata" (likova i objekata) koji se mogu tagovati unutar prompta.
- Precizne video izmene: Mogućnost "Video-u-Video Izmena" dozvoljava ciljane modifikacije postojećih vidDetaljna Analiza Mogućnosti
1. Referenca na video (Reference to Video): Generisanje složenih scena
Ovo je temeljna funkcija Kling Omni modela koja omogućava generisanje videa na osnovu tri vrste ulaznih podataka, pružajući izuzetan nivo kontrole nad krajnjim rezultatom.
- Ulazni podaci:
- Tekstualni prompt: Detaljan opis scene, radnje, pokreta kamere i atmosfere. Omogućava direktno referenciranje slika (@image1) i elemenata (@element1) kako bi se precizno definisala njihova uloga.
- Referentne slike (Stil): Jedna ili više slika koje modelu daju smernice o opštem vizuelnom stilu, paleti boja i atmosferi, ali ne i o specifičnim objektima.
- Elementi (Likovi/Objekti): Specifični karakteri ili predmeti koji treba da se pojave u videu. Svaki element se sastoji od:
- Frontalne slike: Glavni prikaz lika ili objekta spreda.
- Dodatnih referentnih slika: Slike iz različitih uglova (npr. s leđa) koje pomažu modelu da bolje razume trodimenzionalnost objekta.
Primer 1: Dečak u stakleniku
Ovaj primer ilustruje sposobnost modela da obradi veoma složen prompt koji kombinuje više referenci i detaljnih instrukcija za kameru.
- Prompt: Prompt je zahtevao da video počne sa satelitskim pogledom na ruševinu staklenika (image1), zatim da se kamera spusti unutra i otkrije dečaka (element1), napravi orbitalno kretanje od 180 stepeni oko njega (koristeći referentne slike dečaka s leđa), i na kraju zumira u njegov ranac kako bi otkrila svetleći kompas (element2). Takođe su specificirani stil (image2), filmsko osvetljenje i objektiv od 35 mm.
- Rezultat: Video je opisan kao "neverovatan posao", pokazujući da je model uspešno ispratio sve složene instrukcije uprkos referenciranju sedam različitih slika.
Primer 2: Video za proizvod (parfem)
Ovaj primer pokazuje primenu modela u komercijalne svrhe.
- Prompt: Jednostavniji prompt koji nalaže kameri da se približi i zumira bočicu parfema (element1), koristeći stil definisan referentnom slikom (image1).
- Rezultat: Opisan kao "prelep posao", što ukazuje na veliku moć modela za kreiranje promotivnih video snimaka za proizvode.
2. Video-u-Video izmena (Video-to-Video Edit): Precizna modifikacija
Ova funkcija omogućava modifikaciju postojećeg videa. Koristi iste ulazne podatke kao "Referenca na Video", ali sa dodatkom ulaznog video snimka koji služi kao osnova za izmenu.
- Primeri primene:
- Zamena lika: U videu konja koji trči, konj je zamenjen jednorogom (element1) uz prompt "zameni lika u videu elementom jedan, zadržavajući iste pokrete i uglove kamere". Rezultat je opisan kao "neverovatno dobro" urađen.
- Promena okruženja: Pejzaž iza konja je promenjen u vulkansko okruženje.
- Promena osvetljenja: Scena je uspešno promenjena iz dnevne u noćnu.
- Modifikacija detalja: Odraz u ogledalu je izmenjen tako da prikazuje baštu na otvorenom.
3. Video-u-Video referenca (Video-to-Video Reference): Nastavak priče
Ova funkcija služi za generisanje narednog kadra ili scene na osnovu postojećeg videa, čime se osigurava narativni i stilski kontinuitet.
- Primer: Nastavak scene u stakleniku
- Ulaz: Prvobitno generisani video dečaka u stakleniku.
- Prompt: "Na osnovu videa jedan, generiši sledeći kadar. Zadrži stil videa."
- Rezultat: Model je kreirao novu scenu u kojoj dečak vadi kutiju sa gedžetima. Rezultat pokazuje da je model zadržao konzistentan stil i da je "svestan" konteksta radnje (da se dečak i dalje nalazi u stakleniku).
4. Kling Image: Generisanje fotorealističnih slika
Ovo je potpuno nova funkcionalnost unutar Kling Omni ekosistema, namenjena generisanju statičnih slika.
- Ključne karakteristike:
- Kvalitet: Posebno je istaknuto da je model "veoma, veoma dobar u generisanju fotorealističnih slika".
- Ulazni podaci: Koristi tekstualni prompt i referentne slike.
- Primer: Uz pomoć slike čoveka (image1) i slike automobila u salonu (image2), prompt "stavi sliku jedan na sedište automobila sa slike dva" je uspešno generisao traženu kompoziciju.
- Tehničke specifikacije:
- Rezolucija se može podesiti do 2K.
- Moguće je generisati do devet slika jednim API pozivom.
5. Slika-u-Video (Image to Video): Unapređeni kvalitet animacije
Iako je ova mogućnost postojala i ranije, verzija u Kling Omni modelu donosi značajno poboljšan kvalitet ("kvalitet je otišao daleko nagore"). Funkcija može koristiti i početnu i završnu sliku za kreiranje tranzicije.
- Primer: Tranzicija godišnjih doba
- Ulaz: Početna slika drveta zimi i završna slika istog drveta u proleće.
- Prompt: Veoma detaljan prompt koji opisuje "magičnu time-lapse tranziciju", uključujući topljenje snega, cvetanje drveta, promenu svetla iz hladnog u toplo i sporo kretanje kamere. Specificiran je "Disney-style" i "cinematic 8K".
- Rezultat: Video je opisan kao "super, super kul", što potvrđuje visok kvalitet i sposobnost modela da kreira vizuelno impresivne transformacije. eo snimaka, kao što je zamena likova, promena pejzaža ili osvetljenja, uz zadržavanje originalnih pokreta kamere i kretanja.
- Narativni kontinuitet: Funkcija "Video-u-Video Referenca" omogućava generisanje sledećeg kadra na osnovu prethodnog videa, čime se održava stilski i narativni kontinuitet, što je ključno za kreiranje dužih priča.
- Fotorealistično generisanje slika: "Kling Image" je nova komponenta modela koja se ističe u kreiranju fotorealističnih slika visoke rezolucije (do 2K) i podržava generisanje do devet slika jednim API pozivom.
- Visokokvalitetna animacija: Postojeća funkcionalnost "Slika-u-Video" je značajno unapređena, omogućavajući kreiranje visokokvalitetnih i fluidnih video tranzicija između početne i završne slike.
U celini, Kling Omni se predstavlja kao sveobuhvatan alat koji nudi rešenja za složene kreativne zadatke, od produkcije promotivnih video snimaka do stvaranja narativnih sekvenci i fotorealističnih vizuala.
- Ulazni podaci:
Komentari
Nema komentara. Šta vi mislite o ovome?