Proteiner är avgörande för livet – och för industrin. Det finns otaliga proteiner som skulle kunna modifieras för att behandla och till och med bota allvarliga sjukdomar och cellstörningar. De industriella tillämpningarna är lika lovande, där proteiner i allt högre grad används som enzymer inom livsmedelsindustrin och i hushållsrengöringsmedel.
Även om AI kan hjälpa till att föreslå förbättringar måste varje nytt protein fortfarande skapas i den verkliga världen och testas för prestanda. Det är en arbetsintensiv process som innebär att man konstruerar DNA-instruktioner för varje protein i jäst eller bakterier och odlar enskilda kloner för proteinproduktion och testning. Detta kan ta många dagar för ett enda protein av intresse och ännu längre tid om proteinet behöver testas i däggdjursceller, en process som kräver att man hämtar DNA från mikrober för överföring till däggdjurscellerna.
I en ny artikel beskriver Michael Z. Lin, professor i neurobiologi och bioteknik vid fakulteterna för ingenjörsvetenskap och medicin, tillsammans med doktoranderna Yan Wu inom bioteknik och Pengli Wang inom kemiteknik, att de har förkortat den tidskrävande processen för proteinframställning och testning till endast 24 timmar.
De kallar sin metod MIDAS, vilket står för Microbe-Independent Deep Assembly and Screening. MIDAS skulle snabbt kunna påskynda biologisk forskning inom områden som sträcker sig från onkologi till miljövetenskap. Studien som introducerar MIDAS är publicerad i tidskriften Molecular Systems Biology.
”De grundläggande frågorna inom molekylärbiologi kvarstår: hur skapar vi bättre proteiner och hur förstår vi vad som får ett protein att fungera?”, säger Lin. ”Att utföra det arbetet kräver värdefull tid och resurser, men vi har hittat ett sätt att dramatiskt minska dessa krav.”
Att gå i cirklar
Lin och hans kollegor hoppade över den traditionella mikrobiella sammansättningsprocessen genom att använda en genetisk replikationsteknik som kallas polymeraskedjereaktion (PCR). PCR kan mycket snabbt förstärka linjära DNA-segment till miljontals eller miljarder kopior. Genom att använda PCR för att bygga hela gener som används av däggdjursceller för att uttrycka ett visst protein, kringgick de behovet av mikrobiell kloning och DNA-överföring.
De PCR-producerade genvariationerna kan överföras direkt till däggdjursceller för funktionsanalys. Det enda kravet för PCR-proceduren är korta DNA-strängar, så kallade ”primers”, som kan beställas för leverans nästa dag.
”Med MIDAS kan vi ta emot PCR-primers på morgonen, sätta ihop de nödvändiga generna vid middagstid och vid sen eftermiddag överföra generna till celler för att observera hur proteinerna fungerar”, säger medförstaförfattaren Yan Wu. ”Och vi kan göra allt detta för hundratals eller tusentals proteinvarianter parallellt samtidigt.”
Inom traditionell proteinteknik måste forskare, när de identifierar en lovande variant, sätta ihop och klona genen som uttrycker proteinet till en cirkulär genetisk struktur som kallas plasmid. De måste sedan överföra de modifierade plasmiderna till DNA i bakterier eller jäst för att producera lämpliga mängder av varje unikt plasmid-DNA, som sedan måste överföras till däggdjursceller för validering.
Denna klon-och-överföringsprocess är mödosam, långsam och dyr, och den begränsar kraftigt antalet varianter som rimligen kan utvärderas. MIDAS förändrar den ekvationen. Lin och teamets viktigaste insikt var att göra sig av med de cirkulära plasmiderna, som är oförenliga med PCR. Istället behandlar de DNA som linjär information som är idealisk för PCR. Detta gör det möjligt för dem att sätta ihop hundratals genvarianter åt gången och direkt överföra dem till däggdjursceller i stora mängder för att snabbt och kostnadseffektivt identifiera de som presterar bäst.
”Vi bestämde oss för att det inte finns något magiskt med plasmidernas cirkulära struktur”, säger Lin. ”För PCR behöver man bara den genetiska informationen. Det var det ögonblicket som gav oss inspirationen.”
Ett praktiskt test av 384 varianter med MIDAS tog cirka fyra timmars praktiskt laboratoriearbete och kostade cirka 2 000 dollar i reagenser. Med befintliga metoder skulle en erfaren forskare behöva cirka 192 timmar och cirka 20 000 dollar i reagenser för att utvärdera endast 24 varianter. Forskarna beräknar att MIDAS är nästan 50 gånger snabbare och kostar en tiondel av vad kloningsbaserade metoder kostar.
Omedelbar inverkan
MIDAS kan få omedelbara praktiska konsekvenser för biologisk forskning. För det första bör det påskynda viktiga enzym- och biosensorstudier, säger forskarna. För det andra kan det förbättra den automatiska produktionen av PCR-primers som är idealiska för moderna vätskehanteringsrobotar, vilka kan utvärdera hundratals nya proteiner samtidigt. Slutligen, och kanske viktigast av allt, tror de att MIDAS kan driva fram bättre och större dataset för sekvensfitness som kan förbättra dataintensiv AI-träning, vilket leder till allt mer kraftfulla molekylära designmodeller.
”Vi använde MIDAS inte bara för att hitta den version av ett protein som presterar bäst, utan också för att förstå hur väl nära besläktade varianter fungerar, vilket är information vi kan använda för att träna AI-modeller”, säger medförstaförfattaren Pengli Wang. ”MIDAS är så enkelt att vi kan använda det för att skapa stora datamängder mycket snabbt.”
Lin tror att MIDAS i framtiden kan leda till djupare kombinatoriska sökningar, tätare integration med robotik och generering av kartor över gensekvenser och molekylär fitness som kan användas i förbättrade maskininlärningsmodeller som i sin tur kan driva på datorbaserad design och experimentell validering.
”MIDAS är minst en storleksordning snabbare vid validering i verkligheten”, säger Lin. ”Det komprimerar cykeln för konstruktion, tillverkning och testning av proteiner till bara ett par dagar, och vi tror att det kan driva på snabba framsteg inom AI-inspirerad molekylärbiologi.”
Publikationsuppgifter
Yan Wu et al, Fast analysis and engineering of protein function by microbe-independent deep assembly and screening, Molecular Systems Biology (2026). DOI: 10.1038/s44320-026-00210-z