Avkodning av nya DNA-bokstäver för att främja medicin och bioteknik

by Albert
Högkapacitets nanoporsekvensering av XNA

DNA:s universella språk, byggt av fyra baser – adenin (A), tymin (T), cytosin (C) och guanin (G) – har i årtionden varit grunden för biologisk forskning och bioteknologisk utveckling.

Men vad händer när vi lägger till nya, icke-kanoniska baser i detta genetiska alfabet? Ett forskarteam från A*STAR Genome Institute of Singapore (GIS) under ledning av Dr Mauricio Lisboa Perez och Dr Niranjan Nagarajan har tagit ett stort kliv framåt genom att utveckla en metod som med hjälp av nanoporsekvensering kombinerad med avancerad artificiell intelligens (AI) kan läsa DNA som innehåller dessa tidigare oläsliga ”nya bokstäver”. Studien, publicerad i Nature Communications, presenterar en innovativ lösning på en komplex teknisk utmaning som länge begränsat tillämpningarna inom medicin och bioteknik.

Utmaningen i att avkoda icke-kanoniska baser (NCB)

Traditionella DNA-sekvenserare är designade för att känna igen de fyra standardbaserna. De icke-kanoniska baserna, som kan förekomma naturligt i vissa virus eller syntetiseras i laboratorier, har dock varit svåra att avkoda på grund av deras ovanlighet och de begränsade träningsdataseten för sekvenseringsmaskinerna. Eftersom dessa NCB kan utöka det genetiska språket och möjliggöra designen av nya biologiska funktioner, material och programmerbara nanostrukturer, har bristen på effektiva metoder för att läsa dem varit ett betydande hinder för innovation.

AI-driven nanoporsekvensering: En ny väg för DNA-avkodning

Forskarna konstruerade ett omfattande DNA-bibliotek där både standard- och icke-kanoniska baser förekom i olika konstellationer. Genom nanoporsekvensering registrerade de unika elektriska signaler som genereras när olika baser passerade genom nanoporer, mikroskopiska filter vars signaler dock ofta präglas av brus och ofullständigheter. För att hantera detta utvecklade teamet en adaptiv AI-metod som genom iterativ inlärning successivt förbättrade sin förmåga att känna igen och särskilja signalerna för varje specifik bas, inklusive de sällsynta NCB.

En särskild utmaning låg i datamängdernas begränsning – icke-kanoniska baser är svårtillgängliga och ovanliga. För att expandera träningsdata innovativt ”omarrangerade” forskarna befintliga signaler för att simulera fler kombinationer, vilket ökade AI-modellens generalisering och träffsäkerhet. Resultatet var en sekvenserare som med hög hastighet och precision kan läsa DNA med fler än fyra baser – en första i sitt slag.

Betydelsen för biomedicin och bioteknik

Detta genombrott öppnar för flera spännande tillämpningar. Inom hälsa och terapi kan det underlätta utvecklingen av skräddarsydda DNA- och RNA-baserade behandlingar med högre specificitet och effektivitet, vilket potentiellt förbättrar diagnos och behandling av svåra sjukdomar. Inom materialvetenskap och bioteknik möjliggör NCB som byggstenar konstruerade nanostrukturer och nanorobotar, vilket kan revolutionera allt från läkemedelsleverans till hållbar tillverkning av kemikalier.

En annan potentiell applikation är datalagring. Genom att koda stor mängd information i DNA med ett utökat alfabet kan man öka lagringstätheten och minska energibehovet för datacenter, vilket är av stor betydelse för miljö och ekonomi.

Framåt och vidare utveckling

Teamet planerar att utöka sitt arbete för att identifiera fler icke-kanoniska baser i naturliga källor som virus samt att förbättra AI-modellernas detektionsförmåga och skalbarhet. Dr Wan Yue, verkställande direktör vid A*STAR GIS, lyfter fram hur denna metod inte bara skapar nya möjligheter inom grundforskning, utan också banar väg för praktiska innovationer med stor samhällsnytta.

Sammanfattningsvis markerar denna studie en ny era där DNA:s språkliga gränser flyttas fram med hjälp av AI-assisterad nanoporsekvensering. Genom att möjliggöra avkodning av ett utökat genetiskt alfabet öppnas dörrar till framtidens medicin, bioteknik och datahantering, där livets kod kan läsas med större precision och rikedom än någonsin tidigare.

Mer information: Mauricio Perez et al, Direkt högkapacitetsdekonvolution av icke-kanoniska baser via nanoporsekvensering och bootstrapped learning, Nature Communications (2025). DOI: 10.1038/s41467-025-62347-z

Related Articles

Leave a Comment