Strojno učenje predviđa koji će sljedeći virus sa životinja prijeći na ljude

Najnovija studija Nardusa Mollentzea, Simona Babayana i Daniela Streickera sa Sveučilišta u Glasgowu, objavljena u PLOS Biology, sugerira da strojno učenje pomoću virusnih genoma može predvidjeti vjerojatnost bilo kojeg virusa da će sa životinja prijeći na ljude i zaraziti ih. 

Zoonotske bolesti

Prepoznavanje zoonotskih bolesti prije pojave pandemije veliki je izazov jer je samo mali broj od procijenjenih 1,67 milijuna životinjskih virusa sposoban zaraziti ljude. 

Zoonotske bolesti prenose se s vrste na vrstu
Zoonotske bolesti prenose se s vrste na vrstu

Kako bi razvili model strojnog učenja koji koristi sekvence virusnih genoma, istraživači su prvo sastavili skup podataka od 861 vrste virusa iz 36 obitelji. Zatim su izradili modele strojnog učenja, koji su vjerojatnost zaraze ljudi izračunali na temelju taksonomije virusa i srodnosti s poznatim virusima koji inficiraju ljude. 

Samo mali broj od procijenjenih 1,67 milijuna životinjskih virusa zarazan je za ljude
Samo mali broj od procijenjenih 1,67 milijuna životinjskih virusa zarazan je za ljude

Pokazalo se kako virusni genomi mogu imati općenite značajke, neovisne o taksonomskim odnosima virusa i kako mogu unaprijed prilagoditi viruse da zaraze ljude. Istraživači su pomoću virusnih genoma uspjeli razviti modele strojnog učenja sposobne identificirati te zoonozne kandidate. 

Sposobnost zaraze

Ovi modeli dakako imaju ograničenja, budući da su računalni modeli samo preliminarni korak u identificiranju zoonotskih virusa koji mogu zaraziti ljude. Sposobnost zaraze samo je dio šireg zoonotskog rizika, na koji utječe i virulentnost virusa kod ljudi, sposobnost prijenosa između ljudi i ekološki uvjeti u vrijeme izloženosti virusu.

Daniel Streicker, Nardus Mollentze i Simon Babayan sa Sveučilišta u Glasgowu
Daniel Streicker, Nardus Mollentze i Simon Babayan sa Sveučilišta u Glasgowu

Ipak, smatraju autori, nalazi pokazuju da se zoonotski potencijal virusa može zaključiti u iznenađujuće velikoj mjeri iz njihovog slijeda genoma. 

Karakterizacija virusa

“Ovi nalazi dodaju ključni dio već iznenađujućoj količini informacija koje možemo izvući iz genetskog slijeda virusa pomoću AI tehnika”, kaže Babayan. “Genomski niz je obično prva, a često i jedina informacija koju imamo o novootkrivenim virusima i što više podataka možemo izvući iz njega, prije ćemo identificirati podrijetlo virusa i njegov zoonotski rizik.”

Istraživači su pomoću virusnih genoma razvili modele strojnog učenja sposobne identificirati zoonozne kandidate
Istraživači su pomoću virusnih genoma razvili modele strojnog učenja sposobne identificirati zoonozne kandidate

Što se više virusa okarakterizira, modeli strojnog učenja bit će učinkovitiji u identificiranju rijetkih virusa koje treba pomno pratiti i dati im prioritet kod preventivnog razvoja cjepiva, smatraju istraživači.