Att förstå hur molekyler interagerar är centralt inom biologin: från att avkoda hur levande organismer fungerar till att upptäcka sjukdomsmekanismer och utveckla livräddande läkemedel. Under de senaste åren har modeller som AlphaFold förändrat vår förmåga att förutsäga proteiner 3D-struktur och gett oss viktig kunskap om molekylers form och interaktion.
Men även om AlphaFold kunde visa hur molekyler passar ihop, kunde det inte mäta hur starkt de binder – en nyckelfaktor för att förstå alla ovannämnda egenskaper. Det är den saknade pusselbiten som MIT:s nya AI-modell, Boltz-2, fyller.
Boltz-2 bryter ny mark genom att gemensamt modellera både struktur och bindningsaffinitet, en kritisk parameter i upptäckten av läkemedel med små molekyler. Boltz-2:s affinitetsmodul har tränats på miljontals verkliga laboratoriemätningar, som visar hur starkt olika molekyler binder till proteiner. Tack vare detta kan Boltz-2 nu förutsäga bindningsstyrkan med oöverträffad noggrannhet i flera benchmarktest som speglar olika stadier av läkemedelsupptäckt i verkligheten.
I etablerade riktmärken ligger Boltz-2:s förutsägelser mycket nära de som produceras av full-physics free energy perturbation (en precis datorsimulering som förutsäger hur starkt ett läkemedel fäster vid sitt mål, men som kan ta upp till en dag att köra ett test även på en GPU) – med mer än 1 000 gånger högre hastighet. Det är den första deep learning-modellen som levererar den nivån av precision.
”Denna prestandaförbättring gör Boltz-2 till mer än bara ett forskningsverktyg, det är en praktisk motor för läkemedelsutveckling i verkligheten”, säger Gabriele Corso, doktorand vid MIT CSAIL. Corso var tillsammans med sin studiekamrat Jeremy Wohlwend och forskaren Saro Passaro vid MIT Jameel Clinic huvudforskare för både Boltz-1 och Boltz-2.
”I stället för att spendera timmar på att simulera interaktionen mellan en enkel molekyl och dess mål kan forskare nu screena stora kemiska bibliotek inom samma tidsram, vilket gör det möjligt för team i ett tidigt skede att prioritera endast de mest lovande föreningarna för laboratorietester.”
Boltz-2 kommer att släppas som helt öppen källkod under MIT-licensen, inklusive modellkod, vikter och träningsdata.
Boltz-1:s början
I början av 2023 startade ett team av forskare vid MIT Computer Science and Artificial Intelligence Laboratory (CSAIL) och MIT Jameel Clinic for Machine Learning in Health (Jameel Clinic) ett ambitiöst experiment: Kan en maskininlärningsmodell inte bara förutsäga molekylstrukturer, utan också förstå hur biomolekyler beter sig – hur de interagerar och, viktigast av allt, hur sannolikt det är att de binder sig – en nyckelmekanism i läkemedelsutveckling.
Många sjukdomar har sin grund i felaktiga regleringar av biomolekylära funktioner. Detta kan dock mildras genom att man utformar molekyler som kan binda till de berörda målen. Att förutsäga detta bindningsbeteende med precision är en av de största utmaningarna när man utformar nya effektiva läkemedel.
År 2024 blev projektet känt som Boltz-1, en öppen källkodsmodell utformad som ett snabbt och tillgängligt alternativ till AlphaFold3, den senaste metoden inom området. Sedan lanseringen har Boltz-1 använts av tusentals forskare vid ledande akademiska laboratorier, bioteknikföretag och läkemedelsföretag, vilket gör den till den mest använda modellen i sitt slag inom branschen.
Nu har samma team, i samarbete med bioteknikföretaget Recursion, presenterat nästa steg: Boltz-2, ett stort framsteg inom AI-driven molekylär modellering.
Boltz-2 förbättrar Boltz-1 på flera viktiga sätt. Modellen har omskolats med hjälp av en mycket större och mer diversifierad dataset, inklusive datorsimuleringar av molekyler i rörelse och syntetiska data baserade på förutsägelser från den tidigare versionen av modellen. Den har också en ny funktion som kallas Boltz-Steering, som hjälper till att finjustera resultaten genom att använda fysikbaserade signaler för att göra de förutsagda strukturerna mer realistiska.
Förutom prestandan har Boltz-2 utformats för att vara användarvänlig. Modellen kan styras av verkliga experimentella data, exempelstrukturer eller användarpreferenser, vilket ger forskare större kontroll att anpassa resultaten till vad de redan vet eller vad de försöker testa.
”Denna release är särskilt betydelsefull för området upptäckt av småmolekylära läkemedel, där framstegen har släpat efter de snabba framstegen inom biologiska läkemedel och proteinteknik”, säger Passaro. ”Medan modeller som AlphaFold och Boltz-1 möjliggjorde ett betydande språng framåt inom datorbaserad design av antikroppar och proteinbaserade läkemedel, har vi inte sett någon motsvarande förbättring av vår förmåga att screena små molekyler, som utgör majoriteten av läkemedlen i den globala pipelinen.
”Boltz-2 åtgärdar direkt denna brist genom att tillhandahålla exakta förutsägelser av bindningsaffinitet som kan minska kostnaderna och tiden för screening i tidiga skeden avsevärt.”
Passaro och Corso arbetade med Boltz-2 tillsammans med MIT-professorerna och CSAIL:s huvudforskare Regina Barzilay och Tommi Jaakkola, Wohlwend och ett team av forskare vid MIT och Recursion.
Mer information: På GitHub: github.com/jwohlwend/boltz