Keď počítačový expert z Univerzity v Toronte profesor Geoffrey E. Hinton v roku 2012 predviedol, že umelé neurónové siete môžu revolučným spôsobom zlepšiť počítačové rozpoznávanie obrazu, bola to veľká udalosť.
Netrvalo dlho a profesor aj so svojimi spolupracovníkmi skončil v Google, ktorý patrí k špičke vo výskume umelej inteligencie.
Od prekadača k počítačovému videniu
Dnes sú neurónové siete nasadené v reálnych aplikáciách a pomáhajú napríklad zlepšiť kvalitu prekladaných textov v prekladači Google Translate. Oproti časom, keď strojový preklad otrocky prekladal jednotlivé slovíčka, a frázy sa snažil vyhľadať na základe minulých analógií, sú dnešné preklady o poznanie lepšie. Ale stále sa občas stávajú spoľahlivým zdrojom zábavy.
Hinton technológiu, ktorú pomáhal priviesť k životu, hodnotí slovami: „Myslím, že spôsob, akým robíme počítačové videnie, je jednoducho nesprávny. Funguje to síce lepšie ako čokoľvek iné v súčasnosti, ale to neznamená, že to funguje správne.“
Zlepšiť technológiu strojového prekladu bol pritom tvrdý oriešok. Hintonov algoritmus funguje tak, že každému slovu priradí súbor čísel, určujúci jeho polohu v teoretickom významovom „cloude“. Z vety sa v ňom stáva namiesto skalárneho radu slov myšlienkový vektor.
Vektory podľa Hintona umožnia počítačom pochopiť zmysel textu. Napriek tomu budú mať stroje problém správne pochopiť iróniu a sarkazmus, tu však často zlyháva aj intelekt mnohých ľudí. Mohli by sa však údajne naučiť hodnoverne flirtovať.
Neurónové siete novej generácie?
Hinton nedávno odhalil svoj ďalší „starý“ nápad, ktorý by mohol zmeniť spôsob, akým počítače vidia a zmeniť tak umelú inteligenciu. Bez zdokonalenia vnímania vizuálnych obrazov sveta nebude možné vytvoriť napríklad spoľahlivé systémy pre autonómnu jazdu. Prof. Hinton minulý týždeň publikoval dve výskumné práce zastrešujúce myšlienku, nad ktorou, podľa vlastných slov, premýšľal už 40 rokov.
Nový Hintonov prístup, známy ako siete kapsúl (capsule networks), predstavuje nový typ neurónových sietí, ktorý má docieliť, aby stroje lepšie pochopili svet prostredníctvom obrazov, alebo videa. Hinton pracuje na svojej novej technike s dvoma kolegami v kancelárii Google v Toronte.
Ako to funguje? Nová architektúra využíva malé skupiny neurónov, nazývané kapsuly, ktoré sú usporiadané do vrstiev na identifikáciu objektov vo videu, alebo v obrazoch. Keď sa niekoľko kapsúl v jednej vrstve zhoduje na tom, že niečo zistí, aktivujú kapsulu na vyššej úrovni – atď., až kým sieť nedokáže urobiť úsudok o tom, čo vidí. Každá z týchto kapsúl je navrhnutá tak, aby detekovala špecifickú vlastnosť v obraze tak, že ju môže rozpoznať v rôznych scenároch, napríklad z rôznych uhlov.
V jednom z článkov uverejnených minulý týždeň, Hinton popísal, ako kapsulové siete dosiahli presnosť najlepších predchádzajúcich techník v štandardnom teste, ako sa softvér môže naučiť rozpoznať ručne písané číslice.
V druhom teste dosiahli kapsulové siete takmer o polovicu nižšiu mieru chybovosti ako tradičný softvér na rozpoznanie hračiek, ako sú nákladné a osobné autá z rôznych uhlov pohľadu.
Je hrozba umelej inteligencie fikciou?
Siete kapsúl majú za cieľ napraviť nedostatky dnešných strojových systémov, ktoré obmedzujú ich účinnosť. Softvér na rozpoznávanie obrázkov, ktorý dnes používa Google a ďalšie firmy, potrebuje veľké množstvo vzorových fotografií, aby sa naučil spoľahlivo rozpoznávať objekty vo všetkých typoch situácií.
Je to preto, že softvér nie je veľmi dobrý pri zovšeobecňovaní toho, čo sa naučí o nových scenároch. Napríklad pri pochopení toho, že aj pri pohľade z rôznych uhlov ide o ten istý objekt. Kým počítač potrebuje tisíce fotiek z rôznej perspektívy, aby sa naučil rozoznať mačku, malé dieťa s tým nemá žiadny problém.
Tu môže byť zásadné úskalie umelej inteligencie. Podľa renomovaného neurológa Prof. Martina Jana Stránského z Yale University mozog funguje natoľko odlišne a multidimenzionálne od počítačových systémov, že vytvorenie skutočne inteligentnej umelej inteligencie je nedosiahnuteľná ilúzia. Maximálnym úspechom môže byť akurát „inteligentný blbec“.
Či je to dôvod na skončenie obáv pred hegemóniou umelej inteligencie však nie je isté. Rovnako ako nie je ukľudňujúce zistenie, že sa volantu autobusu, v ktorom sa vezieme, chopil nejaký hlupák s rýchlokurzom vedenia vozidiel. Hoci nás možno umelá inteligencia v kreatívnom myslení neprekoná, jej aplikácie v technologických zariadeniach budú len narastať. Preto je v našom záujme, aby bola čo najinteligentnejšia.
Nový koncept si vyžiada ďalší výskum
Práve kapsulové siete by v tom mohli pomôcť. Hinton začal svoju myšlienku rozvíjať v roku 1979, keď sa snažil zistiť, ako ľudia používajú mentálne snímky. Prvýkrát predviedol predbežný dizajn pre siete kapsúl v roku 2011 a odvtedy experti z branže čakali na krok, ktorý prinesie do neurónových sietí revolučnú zmenu.
Aký veľký tento vývojový skok bude, je predčasné predpovedať. Kapsulové siete je stále potrebné preveriť na veľkých obrázkových súboroch a ich súčasná implementácia je v porovnaní s existujúcim softvérom na rozpoznávanie obrázkov pomalá. Hinton je však optimista a verí, že tieto nedostatky sa podarí vyriešiť.