Reklama

Po ohlásení Gemma 2 na I/O 2024 v máji Google dnes predstavuje PaliGemma 2 ako svoj najnovší model otvoreného jazyka vízie. Prvá verzia bola spustená v máji 2024 pre popisovanie obrázkov a krátkeho videa, porozumenie textu v obrázkoch, detekcia objektov, segmentácia objektov a vizuálne odpovedanie na otázky. PaliGemma 2 ponúka „dlhé titulky“ so schopnosťou generovať „detailné, kontextovo relevantné titulky pre obrázky, ktoré idú nad rámec jednoduchej identifikácie objektu a opisujú akcie, emócie a celkový príbeh scény“.

Zobraziť celú správu
Ďalšia story
Zatvoriť

Newsletter

Ďakujeme za váš záujem! Odteraz vám už neunikne žiadna novinka.
Ľutujeme, ale váš formulár sa nepodarilo odoslať.