Analysverktyg avslöjar snabbt genetisk mångfald för nästa generations växtförädling

HPC-GVCW är ett beräkningsverktyg som snabbt identifierar genetiska variationer i flera växtarter. Detta bidrar till att förbättra grödor som ris, majs, sojabönor och sorghum. Kredit: 2024 KAUST; Heno Hwang
HPC-GVCW är ett beräkningsverktyg som snabbt identifierar genetiska variationer i flera växtarter. Detta bidrar till att förbättra grödor som ris, majs, sojabönor och sorghum. Kredit: 2024 KAUST; Heno Hwang

I ett stort framsteg för jordbruksvetenskapen har forskare utvecklat ett nytt beräkningsverktyg som är utformat för att snabbt och effektivt exponera genetisk mångfald inom DNA-databaser för olika växtarter.

Den öppna källkodsplattformen är redo att påskynda upptäckten av genetiska variationer som är nyckeln till att utveckla grödor med förbättrad motståndskraft, avkastning och näringsvärde.

KAUST-teamet, som leds av växtgenomikern Rod Wing, utnyttjade avancerade algoritmer och kapaciteten hos högpresterande datorer (HPC) för att visa verktygets förmåga att upptäcka små DNA-skillnader – så kallade single nucleotide variants (SNPs) – mellan olika stammar av ris, majs, sojabönor och sorghum.

I fallet med risundersökningen, till exempel, använde teamet verktyget på en komplex genetisk dataset med DNA-sekvenser från tusentals olika accessioner – ett omfattande ”pan-genom” som forskarna tidigare hade hjälpt till att montera för asiatiskt ris (Oryza sativa).

Genom att använda detta dataset tillsammans med gruppens nya analysmetod kunde KAUST-forskarna avslöja mer än 2 miljoner genetiska varianter som tidigare förbisetts vid konventionella undersökningar av ett enda referensrisgenom.

Detta markerar ett första steg mot att låsa upp nya vägar inom grödförbättring och hållbart jordbruk, konstaterar växtgenetiker och studieförfattare Yong Zhou. ”Dessa dolda SNP:er kan nu omedelbart användas för avelsprogram och även för att identifiera nya funktionella gener för jordbruksegenskaper”, säger han.

Upptäckten av SNP:er på detta sätt kan också bidra till att avslöja genetiska och evolutionära kopplingar mellan olika rislinjer. Nyligen gick Wing och Zhou i spetsen för skapandet av ett högkvalitativt referensgenom för rött Hassawi-ris, en gröda från Saudiarabien som är känd för sin motståndskraft mot lokal torka och förhållanden med hög salthalt.

Med hjälp av verktyget kunde forskarna fastställa en genetisk koppling mellan Hassawi-ris och en undergrupp av ris som omfattar sorter med ursprung i Australien, Indien och delar av Sydostasien.

Avgörande för verktygets prestanda – som kallas HPC-GVCW (high-performance computing genome variant calling workflow) – är möjligheten att dela upp stora delar av genomet i diskreta bitar och sedan förlita sig på parallella bearbetningstekniker för att lösa komplexa beräkningsproblem på storskaliga multidimensionella genomikdata.

”Detta minskar exekveringstiden avsevärt”, säger Nagarajan Kathiresan, beräkningsforskare och medförfattare till studien, ”vilket gör det möjligt att bearbeta 3 000 genom inom 24 timmar.”

Eftersom fler genom nu sekvenseras än någonsin tidigare, tillägger Zhou, bör det nya verktyget visa sig ovärderligt för att effektivisera deras analys för att stärka nästa generations växtförädling.

Arbetet har publicerats i tidskriften BMC Biology.

Ytterligare information: Yong Zhou et al, A high-performance computational workflow to accelerate GATK SNP detection across a 25-genome dataset, BMC Biology (2024). DOI: 10.1186/s12915-024-01820-5

Bli först med att kommentera

Lämna ett svar

Din e-postadress kommer inte att publiceras.