- #Umelá inteligencia
- 3 min.
- 23.8.2023
Materská firma Facebooku vytvorila AI translátor schopný prekladať 100 jazykov
Americká spoločnosť Meta, ktorá má pod palcom viaceré sociálne siete vrátane Facebooku, zverejnila svoje pokroky v oblasti prekladov s využitím strojového učenia a AI.
Model Mety s názvom SeamlessM4T dokáže súčasne prekladať text, ale ho zároveň aj ponúknuť v hovorenom slove. Nový model je multijazykový a multitskingový. Aktuálne je schopný pracovať so stovkou jazykov, pričom 35 jazykmi vie momentálne aj hovoriť. Nechýba slovenčina!
A nielen to, vďaka tomu, že nimi vie hovoriť je SeamlessM4T (Massively Multilingual and Multimodal Machine Translation) schopný prijímať podklady na preklad aj v hovorenom slove. Stačí teda systému povedať vetu a on ju preloží buď do textu (do 100 jazykov), alebo rovno do hovoreného slova (do 34 ďalších jazykov). Nechýba medzi nimi ani slovenčina!
SeamlessM4T by tak mohol byť dokonalý prekladač, keby mu to toľko netrvalo. Našťastie je systém iba v plienkach a je otázkou času, kedy bude preklad takmer okamžitý. Rozdiely pri prekladoch napríklad do slovenčiny sú v tom, že náš jazyk je považovaný za malý, má relatívne málo podkladov na preklad.
Preklady hovoreného slova do hovoreného slova napríklad medzi angličtinou a nemčinou, španielčinou, francúzštinou či čínštinou sú podstatne rýchlejšie. Unikátom systému je pritom to, že všetko robí súčasne, nepotrebuje žiadne špeciálne nadstavby a tým má byť rýchlejší a efektívnejší.
Unikátom je i to, že v jednej vete môžete hovoriť rôznymi jazykmi a systém ich rozpozná a preklad ponúkne v zvolenom jazyku pre kompletnú vetu, nielen vybranú časť z konkrétnom jazyku. Detaily nového modelu SeamlessM4T si môžete pozrieť priamo na webe Mety.
Meta vytvorila SeamlessM4T zo svojej existujúcej architektúry modelu UnitY založenej na PyTorch, ktorá už natívne vykonáva rôzne modálne preklady i automatické rozpoznávanie reči. Nový systém pritom využíva BERT 2.0 na kódovanie zvuku a HiFi-GAN na generovanie hovorených odpovedí.
Model SeamlessM4T je možné si vyskúšať, na dennodenné využívanie ale stavaný zatiaľ nie je. SeamlessM4T je dostupný ako open source na GitHube, vďaka čomu z neho môžu ťažiť ďalší vývojári.