Reklama

Nová AI od Google dokáže generovať realistické videá, prinesie ju na YouTube

Zdroj | Google
Stanislav Vinc
Zdroj | Google
Zdroj | Google

Google odpovedá na model Sora od spoločnosti OpenAI vlastným modelom pre generovanie videí s vysokou mierou realistickosti. Model zvaný Veo dokáže aktuálne generovať minútové videá v rôznych štýloch.

Spoločnosť priamo avizuje, že schopnosti modelu Veo bude postupne implementovať do svojich služieb, menovite aj YouTube Shorts.

Prístup k modelom schopným generovať pomerne realistické obrázky, je dnes už nielen jednoduchý, ale v niektorých prípadoch aj bezplatný. V oblasti videa sme sa však takto ďaleko ešte v oblasti umelej inteligencie nedostali, čo sa však začne ešte v priebehu tohto roka meniť.

Obsah pokračuje pod reklamou

Spoločnosť OpenAI vo februári tohto roka predstavila model Sora, ktorý dokáže generovať 60-sekundové videá na základe textových požiadaviek používateľa. Model zatiaľ nie je verejne dostupný, preto je jeho oficiálne ukážky vydané jeho autorskou spoločnosťou potrebné brať s rezervou. Do takmer identického bodu sa teraz dostávame s modelom Veo od Google.

Generovanie videí je pre umelú inteligenciu výrazne väčšou výzvou, hoci sa zdanlivo jedná o rovnaký princíp, aký je aplikovaný na generovanie obrázkov. Generatívna AI má však bez dodatočnej korekcie problém s konzistentnosťou a pokiaľ jej aj pri generovaní obrázkov. Ak jej aj poskytnete opakovane ten istý pokyn, vždy od nej dostanete mierne odlišný obrázok.

Vo videu, ktoré je zložené z minimálne 24 takýchto obrázkov zobrazených za sekundu, takéto rozdiely vidieť veľmi rýchlo a celkový dojem z kvality a uveriteľnosti takéhoto videa klesá. Dokonalým, hoci trochu extrémnym príkladom toho, je známe video Willa Smitha, ako si vychutnáva špagety.

Google pri vývoji modelu Veo preto využil rôzne techniky, vďaka ktorým dokáže AI v tomto prípade už rozpoznať obsah, s ktorým pracuje a pri generovaní obrázkov pre video dokonca simuluje aj jeho vnútornú fyziku.

Veo dokáže okrem tvorby videa na základe textového zadania pracovať aj s existujúcimi videami, ktoré dokáže upravovať. Filmári tak môžu v kratšom čase preveriť rôzne možnosti úpravy svojho reálne nakrúteného materiálu pomocou AI skôr, než sa do práce pustia skutoční experti na vizuálne efekty.

Aj samotný Google upozorňuje, že generovanie videí je stále pomerne náročnou úlohou a tak je vo výsledných záberoch potrebné počítať s istou nekonzistentnosťou, skokmi v obsahu či vizuálnymi chybami. Aj to môže byť dôvod, prečo sa Google veľmi nehrnul do ukážky toho, ako si dokáže Veo poradiť s vykreslením ľudských tvárí. Práve na nich totiž dokáže ľudské oko najjednoduchšie rozpoznať chyby a zvláštnosti.

K modelu Veo má aktuálne prístup úzka skupina tvorcov prostredníctvom platformy VideoFX od Google. Ak chcete skúsiť svoje šťastie a chcete sa medzi nich zaradiť aj vy, môžete sa zapísať na čakaciu listinu. Google však bude zjavne prístupy postupne rozširovať aj na základe regiónov.

Zdroj
Ďalšia story
Zatvoriť

Newsletter

Ďakujeme za váš záujem! Odteraz vám už neunikne žiadna novinka.
Ľutujeme, ale váš formulár sa nepodarilo odoslať.