Maskininlärning klassificerar 191 av världens mest skadliga virus

by Albert
Två vyer av 3D PCA-datavisualiseringar av k-mer-frekvenser för mamastrovirus- och avastrovirussekvenser: astrovirussekvenser i Dataset 2 (kända genusetiketter), tillsammans med de 191 astrovirusgenom med genusetiketter som förutspåtts av 3PCM. För jämförelseändamål är HAstV och GoAstV markerade med olika färger jämfört med resten av mamastrovirusen (icke-HAstV-mamastrovirus) respektive resten av avastrovirusen (icke-GoAstV-avastrovirus). Det lavendelfärgade planet illustrerar åtskillnaden mellan två möjliga undersläkten av Mamastrovirus. Det grå planet illustrerar separationen mellan två möjliga undersläkten av Avastrovirus. Kredit: Frontiers in Molecular Biosciences (2024). DOI: 10.3389/fmolb.2023.1305506

Forskare från University of Waterloo har lyckats klassificera 191 tidigare oidentifierade astrovirus med hjälp av en ny klassificeringsprocess som bygger på maskininlärning.

Studien, ”Leveraging machine learning for taxonomic classification of emerging astroviruses”, publicerades nyligen i Frontiers in Molecular Biosciences.

Astrovirus är några av de mest skadliga och utbredda virusen i världen. Dessa virus orsakar svår diarré, som årligen dödar mer än 440.000 barn under 5 år. Inom fjäderfäindustrin har astrovirus som fågelinfluensa en infektionsfrekvens på 80% och en dödlighet på 50% bland boskapsdjur, vilket leder till ekonomisk förödelse, störningar i leveranskedjan och livsmedelsbrist.

Astrovirus muterar snabbt och kan lätt spridas mellan sina mer än 160 värdarter, vilket gör att forskare och folkhälsomyndigheter ständigt måste klassificera och förstå nya astrovirus när de dyker upp. År 2023 fanns det 322 oidentifierade astrovirus med distinkta genom. I år har det antalet stigit till 479.

”Vid varje given tidpunkt bär mellan 2% och 9% av människorna på ett av dessa virus. I vissa länder kan siffran vara så hög som 30 procent”, säger Fatemeh Alipour, doktorand i datavetenskap vid Waterloo och huvudförfattare till forskningsstudien inom datavetenskap. ”Att förstå och klassificera dessa virus på ett effektivt sätt är avgörande för att utveckla vacciner.”

I forskargruppen för astrovirus ingick forskare i datavetenskap vid Waterloo och forskare i biologi vid University of Western Ontario.

Den nya tredelade klassificeringsmetoden omfattar övervakad maskininlärning, oövervakad maskininlärning och manuell märkning av varje astrovirus värd.

”Huvudidén bakom klassificeringsmetoden är att utnyttja maskininlärning för att klassificera arter genom att lära sig av deras ’genomiska signaturer’”, säger Lila Kari, professor vid David R. Cheriton School of Computer Science. ”Klassificeringsmetoden är spännande både vad gäller dess snabbhet och dess generella tillämpbarhet.”

”Den här metoden kan hjälpa oss att förstå hur virus överförs mellan olika djur. Den kan också användas för att klassificera virus i andra virusfamiljer som HIV och Dengue.”

Ytterligare information: Fatemeh Alipour et al, Leveraging machine learning for taxonomic classification of emerging astroviruses, Frontiers in Molecular Biosciences (2024). DOI: 10.3389/fmolb.2023.1305506

Related Articles

Leave a Comment