Výskumníci z MIT demonštrovali plne integrovaný fotonický procesor, ktorý dokáže opticky vykonávať všetky kľúčové výpočty hlbokej neurónovej siete na spoločnom čipe. Môže to byť základom pre rýchlejšie a energeticky efektívnejšie hlboké učenie pre výpočtovo náročné aplikácie, ako je lidar alebo vysokorýchlostné telekomunikácie.
Toto nové zariadenie využíva svetlo na vykonávanie kľúčových operácií hlbokej neurónovej siete na čipe, čím otvára dvere vysokorýchlostným procesorom, ktoré sa môžu učiť v reálnom čase. Modely hlbokých neurónových sietí (deep neural network models), ktoré poháňajú dnešné najnáročnejšie aplikácie strojového učenia, sa stali takými veľkými a zložitými, že posúvajú hranice tradičného elektronického hardvéru.
Fotonický hardvér dokáže vykonávať výpočty strojového učenia pomocou fotónov namiesto elektrónov a ponúka rýchlejšiu a energeticky efektívnejšiu alternatívu. Niektoré typy výpočtov neurónových sietí však fotonické zariadenie nedokáže vykonať, takže je potrebné do systému zaradiť externé obvody na báze klasickej mikroelektroniky, čo degraduje rýchlosť a efektívnosť.
Vedci z MIT a zahraničia po desiatich rokoch výskumu vyvinuli nový fotonický čip, ktorý tieto prekážky prekonáva. Plne integrovaný fotonický procesor dokáže opticky vykonávať všetky kľúčové výpočty hlbokej neurónovej siete na čipe. Tento optický procesor dokázal dokončiť kľúčové výpočty pre úlohu klasifikácie strojového učenia za menej ako pol nanosekundy s presnosťou viac ako 92 percent. To je výkon na úrovni tradičného hardvéru. Tým, že vedci zostali úplne v optickej doméne až do konečného výstupu, minimalizovali energetické straty a dosiahli ultra nízku latenciu.
Hlavným autorom článku o novom čipe, ktorý bol publikovaný v časopise Nature Photonics je Saumil Bandyopadhyay, hosťujúci vedec v skupine Quantum Photonics and AI Group vo Výskumnom laboratóriu elektroniky a postdoktorand v NTT Research, Inc.
Časom by fotonický procesor mohol viesť k rýchlejšiemu a energeticky efektívnejšiemu hlbokému učeniu pre výpočtovo náročné aplikácie, ako je lidar, vedecký výskum v astronómii a fyzike elementárnych častíc, alebo pre vysokorýchlostné telekomunikácie.
Hlboké neurónové siete sa skladajú z mnohých vzájomne prepojených vrstiev uzlov (neurónov), ktoré pracujú so vstupnými údajmi a vytvárajú výstup. Jednou z kľúčových operácií v hlbokej neurónovej sieti je použitie lineárnej algebry na násobenie matice, ktoré transformuje údaje pri ich prenose z vrstvy do vrstvy. Ale okrem týchto lineárnych operácií vykonávajú hlboké neurónové siete aj nelineárne operácie, ktoré pomáhajú modelu naučiť sa zložitejšie vzory. A tu je problém.
Už v roku 2017 vedci demonštrovali optickú neurónovú sieť na jednom fotonickom čipe, ktorý by mohol vykonávať násobenie matice svetlom. Zariadenie však nedokázalo vykonávať na čipe aj nelineárne operácie. Optické dáta museli byť prevedené na elektrické signály a odoslané do tradičného digitálneho procesora, aby sa mohli vykonávať nelineárne operácie.
„Nelinearita v optike je problematická, pretože fotóny navzájom veľmi ľahko neinteragujú. Vďaka tomu je spúšťanie optických nelinearít veľmi energeticky náročné a vybudovať systém, ktorý to dokáže škálovateľným spôsobom je ťažké,“ vysvetľuje S. Bandyopadhyay.
Vedci túto prekážku prekonali pomocou zariadení nazývaných nelineárne optické funkčné jednotky (nonlinear optical function unit – NOFU), ktoré kombinujú elektroniku a optiku na implementáciu nelineárnych operácií na čipe. Vybudovali optickú hlbokú neurónovú sieť na fotonickom čipe pomocou troch vrstiev zariadení, ktoré vykonávajú lineárne aj nelineárne operácie.
Systém najprv kóduje parametre hlbokej neurónovej siete na svetlo. Potom pole programovateľných rozdeľovačov lúčov vykonáva násobenie matice na týchto vstupoch. Údaje následne prechádzajú do programovateľných NOFU, ktoré realizujú nelineárne funkcie odsávaním malého množstva svetla do fotodiód, ktoré premieňajú optické signály na elektrický prúd. Tento nízkoenergetický proces eliminuje potrebu externého zosilňovača.
Fotonický čip zložený zo vzájomne prepojených modulov, ktoré tvoria optickú neurónovú sieť, sa vyrába pomocou komerčných zlievarenských procesov ako pri CMOS technológiách, čo by mohlo umožniť škálovanie technológie a jej integráciu do elektroniky.
Výskum bol čiastočne financovaný americkou Národnou vedeckou nadáciou, Úradom pre vedecký výskum amerického letectva a NTT Research.