Vo štvrtok zverejnil vedecký tím z Google Brain dokument, ktorý popisuje, ako naučili skupinu strojových algoritmov predpovedať vône molekúl na základe ich štruktúr. Prečo je to dôležité?
Na rozdiel od ďalšieho ľudského zmyslu – zraku, je schopnosť vnímať vône a zápachy oveľa komplikovanejšia a zaostáva za inými oblasťami. Vieme, že za to, ako vnímame farby, môžu rôzne vlnové dĺžky.
O tom, či nám niečo vonia rozhodujú molekuly, ktoré interagujú s receptormi, ktoré vysielajú signály do malej časti mozgu nazývanej čuchová žiarovka. Je jednou z najstarších častí ľudského mozgu a vďaka nej máme pocit pachu. Nachádza v zadnej časti nosových dutín.
Napriek technologickému pokroku je stále mimoriadne náročné zistiť vôňu molekuly z jej chemickej štruktúry. „Zmeňte alebo odstráňte jeden atóm alebo väzbu a pocítite namiesto vône ruží zhnité vajíčka,“ vysvetľuje komplikovanosť Alex Wiltschko, ktorý viedol výskumný tím Google.
Wiltschko zaujal odlišný prístup ako používali iné tímy. Využil grafickú neurónová sieť ( Graph Neural Network = GNN). Väčšina algoritmov strojového učenia potrebuje, aby dáta prichádzali vo formáte pravouhlej mriežky. No nie všetky informácie je možné takto znázorniť.
GNN môžu prezerať grafy, ako napríklad priateľov na sociálnych sieťach či siete akademických citácií z časopisov. Dokázali by predpovedať, kto sa stane našími budúcimi priatelia na sociálnych sieťach. V tomto prípade pomohla GNN spracovať štruktúru každej molekuly a pochopiť, že napríklad v jednej molekule bol atóm uhlíka a päť atómov dusíka.
Vedci použili sadu takmer 5 000 molekúl od parfuméristov a každú molekulu starostlivo priradili k označeniam, napríklad prírodná, jazmínová, sladká či tropická vôňa. Vedci použili na trénovanie zhruba dve tretiny dát, ktoré potom testovali, či umelá inteligencia dokáže predvídať vôňu zostávajúcich molekúl. A ona to naozaj dokázala!
Už pri svojej prvej iterácii GNN fungovala – a to aj s modelmi, ktoré vytvorili iné skupiny. Wiltschko napriek tomu pripomína, že jeho tím model stále vylepšuje a ich technológia bude ešte lepšia.
GNN je obmedzovaný, ako každý nástroj strojového učenia, kvalitou vstupných údajov. Už teraz je však zrejmé, že projekt pomáha pri zavádzaní tisícov nových molekúl do súborov údajov o zápachu, ktoré sú často relatívne malé. Tieto údaje by mohli tvoriť základ ďalšieho zlepšenia a pomáhať vyvíjať nové algoritmy.
Napriek tomu nie je jasné, či sa dozvieme niečo nové o ľudskom čuchu z modelu strojového učenia. Použitý návrh neurónovej siete nie je totiž rovnaký ako ľudský čuchový systém. Čuch je natoľko špecifický ľudský zmysel, že aj skúsení odborníci niekedy rozdielne cítia rovnaký pach.
GNN má okrem toho problém v jednej kľúčovej oblasti. Ide o tzv. chirálne páry, ktoré majú rovnaké atómy a väzby, ale sú usporiadané ako vzájomné zrkadlové obrazy. Ich odlišné orientácie majú za následok, že voňajú radikálne odlišne, ako príklad sa uvádza rasca a mäta. „Vieme, že v našom súbore údajov máme chirálne páry a vieme, že ich zrejme nedokážeme správne predpovedať,“ hovorí Alex Wiltschko. Práve to bude cieľom ďalšieho výskumu.