Po ohlásení Gemma 2 na I/O 2024 v máji Google dnes predstavuje PaliGemma 2 ako svoj najnovší model otvoreného jazyka vízie. Prvá verzia bola spustená v máji 2024 pre popisovanie obrázkov a krátkeho videa, porozumenie textu v obrázkoch, detekcia objektov, segmentácia objektov a vizuálne odpovedanie na otázky. PaliGemma 2 ponúka „dlhé titulky“ so schopnosťou generovať „detailné, kontextovo relevantné titulky pre obrázky, ktoré idú nad rámec jednoduchej identifikácie objektu a opisujú akcie, emócie a celkový príbeh scény“.