- #Umelá inteligencia
- 4 min.
- 4.2.2025
Ako oklamať umelú inteligenciu? Trik šikovnej YouTuberky zrujnuje zlodejov videí
Umelá inteligencia dokáže už dnes hravo spracovávať texty, analyzovať ľudský hlas a generovať obrázky i zvukové nahrávky. Ako pri každej technológii, aj pri tejto niektorí ľudia okamžite našli spôsob, ako ju zneužiť.
Na platforme YouTube sa v posledných mesiacoch začali vo veľkom objavovať videá kompletne vytvorené pomocou AI, ktorých obsah je často ukradnutý z reálnych videí ľudských autorov.
Takéto videá sú ľahko rozpoznateľné už v prvých sekundách podľa toho, že ich obsahom sú zvyčajne len obrázky, ktoré vizuálne dopĺňajú rozprávanie neurálneho hlasu. V lepšom prípade tu problémy AI videí začínajú i končia, v tom horšom si ich autori po sebe ani ukradnuté texty neskontrolujú, a tak výsledné video a jeho scenár nedávajú zmysel.
Doposiaľ sa ľudskí autori videí nemali voči tomuto modernému fenoménu ako brániť. Talentovaná YouTuberka známa pod menom f4mi, ktorá sa venuje primárne technologickým témam, však na jeden spôsob predsa len prišla. Tajomstvom jej úspechu sú titulky s príponou .ass.
Formát .ass vznikol v druhej polovici 90. rokov ako titulkový formát, ktorý na rozdiel od najrozšírenejšieho formátu .srt umožňuje nastavovať, ako má text titulkov vyzerať, od výberu písma cez jeho tvar a veľkosť až po farbu a priehľadnosť. S troškou šikovnosti je tak pomocou neho možné do videa vkladať nielen pekné titulky, ale aj titulky, ktoré budú pre ľudského diváka neviditeľné.
Tvorcovia AI videí totiž kradnú obsah z reálnych videí najmä pomocou nástrojov na čítanie titulkov – či už tých, ktoré generuje YouTube automaticky prepisom hlasu, alebo tých, ktoré autori do videí vložili sami. Čo sa však stane, ak takýmto AI nástrojom podstrčíte falošný text? Umelá inteligencia ho ochotne spracuje do kôpky nezmyslov.
F4mi teda do svojich videí začala popri viditeľnom texte vkladať neviditeľné časti textov, vyextrahovaných z verejne dostupných diel, v ktorých iba pre prevenciu pred detekciou vymenila niekoľko slov.Zatiaľ čo divák na svojej obrazovke vidí správne titulky, nástroje pre súhrny videí čítajú aj podstrčené neviditeľné texty, čoho výsledkom je obsah nepoužiteľný pre tvorbu ďalších kradnutých videí.
YouTube formát .ass oficiálne nepodporuje, no na internete už existuje niekoľko nástrojov, ktoré umožňujú jeho konverziu do proprietárneho formátu .ytt, do ktorého YouTube automaticky prevádza všetky titulky na pozadí. Na strane YouTube štúdia tieto titulky síce vyzerajú ako znôžka nezmyslov, no na strane videa vidia diváci už len tie správne titulky. F4mi však narazila ešte na jeden problém – mobilná aplikácia YouTube skryté formátovanie titulkov ignoruje a neviditeľný text zobrazuje ako čierne pásy cez celú obrazovku.
Aj tu sa však autorka vynašla a pomocou Python skriptu analyzovala všetky miesta v jej videách, na ktorých dochádza k úplnému sčernaniu obrazu (typicky sú to dejové predely) a skryté texty vložila do nich. Niektorým divákom síce podľa f4mi tieto skryté texty kvôli svojmu objemu spôsobujú pád mobilnej aplikácie na menej výkonných smartfónoch a tabletoch, no tento vedľajší efekt v boji s umelou inteligenciou za to zrejme stojí.
Táto metóda je účinná proti takmer všetkým nástrojom na extrahovanie titulkov a vytváranie sumárov. Výnimkou sú niektoré pokročilé AI modely, ako je napríklad ChatGPT vo verzii o1, ktorý dokáže niekedy podstrčené nezmyselné texty odhaliť a vyfiltrovať ich. Plne imúnny je voči tejto metóde nástroj Whisper, taktiež od spoločnosti OpenAI, ktorý namiesto titulkov spracováva priamo ľudskú reč. Na spôsob, ako do videa vložiť podstrčené zvukové nahrávky bez toho, aby rušili ľudských divákov, síce zatiaľ f4mi neprišla, no použitie týchto nástrojov je oproti kradnutiu titulkov výrazne nákladnejšie. Ak teda f4mi AI zlodejov videí aj úplne nezastaví, minimálne im ich kradnutie výrazne predraží.