- #Umelá inteligencia
- 5 min.
- 12.12.2024
Gemini 2.0 prináša AI agentov, ktorí budú môcť vykonávať prácu za vás
Google predstavil novú verziu svojho AI modelu Gemini. Verzia 2.0 prináša nielen efektívnejšie fungovanie modelu, ale aj natívnu podporu pre generovanie obrázkov a zvukov a takzvaných AI agentov.
Gemini 2.0 je zatiaľ dostupný v odľahčenej verzii „Flash“, ktorá už sama o sebe prekonáva v kľúčových testoch verziu 1.5 Pro hneď dvojnásobne.
Od vydania umelej inteligencie Gemini 1.0 prešiel len rok a aj tú Google nahradil verziou 1.5 už po dvoch mesiacoch. Nie je preto žiadnou nadsázkou, ak sa povie, že oblasť AI je aktuálne najrýchlejšie sa rozvíjajúcou oblasťou v rámci technológií. Nová verzia Gemini 2.0 síce zatiaľ nie je oficiálne dostupná vo svojej plnej forme, no Google jej predstavenie považuje aj tak za veľmi dôležitý míľník.
Nový model so sebou prirodzene prináša vylepšenie v oblasti efektivity výpočtov, vďaka ktorým Gemini 2.0 zvláda rovnaké úlohy ako jej predchodcovia rýchlejšie a pri nižšom vyťažení hardvéru a teda nižších nákladoch na prevádzku. Zároveň ale okrem schopnosti generovať natívne bez použitia externých súčastí obrázky a zvuky, prináša aj avizovanú revolúciu v podobe AI agentov.
AI agentov možno definovať ako pod-modely určené na špecifické úlohy a to nielen na generovanie určitého obsahu, ale napríklad aj vykonávanie reálnych úkonov vo virtuálnom alebo reálnom svete. Prvou lastovičkou Google v tomto smere bol Project Astra, vizuálny systém schopný identifikovať priestor snímaný smartfónom, opísať ho a pomôcť používateľovi lepšie sa v ňom zorientovať. Pod záštitou Gemini 2.0 má byť Project Astra ešte praktickejší a to vďaka multi-jazyčným dialógom, pamäti, rýchlejším odpovediam a schopnosti pracovať aj s Google Vyhľadávaním, Mapami a službou Lens.
Ešte zaujímavejší je Project Mariner, ktorý predstavuje rozšírenie pre prehliadač Google Chrome, v rámci ktorého dokáže Gemini 2.0 vykonávať reálne úkony na internete. Model tak možno napríklad požiadať, aby vám nielen poradil darčeky pre blízkych, ale aby ich aj rovno vyhľadal na e-shopoch a vytvoril za vás objednávku. Na obrazovke možno úkony AI sledovať, kontrolovať a v prípade potreby ich aj korigovať.
Vo virtuálnych svetoch dokáže Gemini 2.0 a jeden z jeho špeciálnych agentov radiť vo videohrách a napríklad tak odporučiť adekvátnu stratégiu pre hru, ktorú model vidí na obrazovke. Tento agent mal byť len zábavkou, na ktorej si Google vyskúšal schopnosti agentov, preto zatiaľ nemá ani žiadne špecifické meno. Agent, ktorý bude vývojárom kontrolovať ich kódy a opravovať v nich chyby priamo v GitHube, má prezývku Jules.
Google má samozrejme za cieľ integrovať časom Gemini 2.0 do všetkých jeho produktov, vrátane Vyhľadávania, kde už AI súhrny informácií môže aktuálne využívať približne 1 miliarda ľudí. V budúcom roku chce Google pokrytie touto funkciou výrazne rozšíriť a to okrem nových regiónov aj v rámci nových jazykov, medzi ktoré dúfame bude patriť aj slovenčina. Nový model sa samozrejme objaví aj v mobilnej aplikácii Gemini, ktorá postupne nahrádza Asistenta a službách balíka Google Workspace.
Gemini 2.0 Flash, teda odľahčenú verziu nového modelu, si je možné vyskúšať prostredníctvom webového rozhrania Gemini už dnes. Dostupný je spoločne s ním aj agent pre hĺbkové výskumy (Deep Research agent), ktorý má vymeniť hodiny príprav, zberu a spracovávania informácií z odborných článkov za pár minút rozhovoru s modelom. Ten dokáže z jednej otázky vytvoriť výskumný plán a ten pretvoriť do prakticky hotovej práce, ktorú už teoreticky iba stačí upraviť a odovzdať.
V reálnom svete majú napokon agenti potenciál posunúť vpred robotiku, v ktorej je okrem iného dôležitá čo najrýchlejšia a najpresnejšia interpretácia vizuálnych vstupov. Gemini 2.0 tak otvára Google dvere aj do fyzického sveta, kde sa jeho agenti môžu stať základným softvérom pre budúcich domácich a pracovných robotov.