En ny generativ AI-metod för att förutsäga kemiska reaktioner förbättrar noggrannheten och tillförlitligheten

by Albert
FlowER-systemet (Flow matching for Electron Redistribution) gör det möjligt för forskare att explicit hålla reda på alla elektroner i en reaktion för att säkerställa att inga elektroner läggs till eller tas bort på felaktiga grunder när resultatet av en kemisk reaktion förutsägs. Källa: Massachusetts Institute of Technology
Många försök har gjorts för att utnyttja kraften i ny artificiell intelligens och stora språkmodeller (LLM) för att försöka förutsäga resultaten av nya kemiska reaktioner. Dessa har haft begränsad framgång, delvis eftersom de hittills inte har grundats på en förståelse av grundläggande fysikaliska principer, såsom massans bevarandelagar.

Nu har ett forskarteam vid MIT kommit på ett sätt att införliva dessa fysikaliska begränsningar i en reaktionsförutsägelsesmodell, vilket avsevärt förbättrar noggrannheten och tillförlitligheten i dess resultat.

Det nya arbetet rapporteras i tidskriften Nature, i en artikel av den nyligen avlagda postdoktorn Joonyoung Joung (nu biträdande professor vid Kookmin University, Sydkorea), den tidigare mjukvaruingenjören Mun Hong Fong (nu vid Duke University), kemiingenjörsstudenten Nicholas Casetti, postdoktoranden Jordan Liles, fysikstudenten Ne Dassanayake och seniorförfattaren Connor Coley, som är professor i karriärutveckling vid MIT:s institutioner för kemiteknik och elektroteknik och datavetenskap.

”Att förutsäga reaktionsresultat är en mycket viktig uppgift”, förklarar Joung. Om man till exempel vill tillverka ett nytt läkemedel, säger han, ”måste man veta hur man tillverkar det. Det kräver att vi vet vilket produkt som sannolikt kommer att bli resultatet av en given uppsättning kemiska ingredienser i en reaktion.”

Men de flesta tidigare försök att göra sådana förutsägelser har endast tittat på en uppsättning ingångar och en uppsättning utgångar, utan att titta på mellanliggande steg eller beakta begränsningarna för att säkerställa att ingen massa varken tillförs eller försvinner i processen, vilket inte är möjligt i verkliga reaktioner.

Joung påpekar att även om stora språkmodeller som ChatGPT har varit mycket framgångsrika inom många forskningsområden, erbjuder dessa modeller inte något sätt att begränsa sina utgångar till fysiskt realistiska möjligheter, till exempel genom att kräva att de följer massbevarandets lag. Dessa modeller använder beräkningsmässiga ”tokens”, som i detta fall representerar enskilda atomer.

Men, säger han, ”om man inte bevarar tokens börjar LLM-modellen skapa nya atomer eller radera atomer i reaktionen”.

I stället för att grunda sig på verklig vetenskaplig förståelse, ”är detta något som liknar alkemi”, tillägger han. Medan många försök att förutsäga reaktioner endast tittar på slutprodukterna, ”vill vi spåra alla kemikalier och hur kemikalierna omvandlas” under hela reaktionsprocessen från början till slut, säger han.

För att lösa problemet använde teamet en metod som utvecklades på 1970-talet av kemisten Ivar Ugi, som använder en bindningselektronmatris för att representera elektronerna i en reaktion. De använde detta system som grund för sitt nya program, kallat FlowER (Flow matching for Electron Redistribution), som gör det möjligt för dem att explicit spåra alla elektroner i reaktionen för att säkerställa att inga tillförs eller tas bort på felaktiga sätt under processen.

Systemet använder en matris för att representera elektronerna i en reaktion och använder värden som inte är noll för att representera bindningar eller ensamma elektronpar och nollor för att representera avsaknaden av sådana.

”Det hjälper oss att bevara både atomer och elektroner samtidigt”, säger Fong. Denna representation, säger han, var en av de viktigaste faktorerna för att inkludera massbevarande i deras förutsägelsessystem.

Systemet de utvecklat är fortfarande i ett tidigt skede, säger Coley.

”Systemet i dess nuvarande form är en demonstration – ett bevis på att denna generativa metod för flödesmatchning är mycket väl lämpad för uppgiften att förutsäga kemiska reaktioner.”

Även om teamet är entusiastiskt över denna lovande metod, säger han, ”är vi medvetna om att den har specifika begränsningar när det gäller bredden av olika kemiska processer som den kan hantera.” Även om modellen har tränats med data om mer än en miljon kemiska reaktioner, hämtade från en databas hos det amerikanska patentverket, omfattar dessa data inte vissa metaller och vissa typer av katalytiska reaktioner, säger han.

”Vi är oerhört glada över att vi kan få så tillförlitliga förutsägelser om kemiska mekanismer” från det befintliga systemet, säger han. ”Den bevarar massa, den bevarar elektroner, men vi är medvetna om att det finns mycket mer att göra när det gäller expansion och robusthet under de kommande åren.”

Men även i sin nuvarande form, som görs fritt tillgänglig via onlineplattformen GitHub, ”tror vi att den kommer att göra korrekta förutsägelser och vara ett användbart verktyg för att bedöma reaktivitet och kartlägga reaktionsvägar”, säger Coley. ”Om vi blickar framåt mot en framtid där vi verkligen avancerar den mekanistiska förståelsen och bidrar till att uppfinna nya reaktioner, så är vi inte riktigt där ännu. Men vi hoppas att detta kommer att vara ett steg på vägen dit.”

”Allt är öppen källkod”, säger Fong. ”Modellerna, data, allt finns där”, inklusive en tidigare dataset som utvecklats av Joung och som uttömmande listar de mekanistiska stegen i kända reaktioner. ”Jag tror att vi är en av de banbrytande grupperna som skapar denna dataset, gör den tillgänglig som öppen källkod och gör den användbar för alla”, säger han.

FlowER-modellen matchar eller överträffar befintliga metoder när det gäller att hitta standardmekanistiska vägar, säger teamet, och gör det möjligt att generalisera till tidigare osedda reaktionstyper. De säger att modellen potentiellt kan vara relevant för att förutsäga reaktioner för medicinsk kemi, materialupptäckt, förbränning, atmosfärisk kemi och elektrokemiska system.

I sina jämförelser med befintliga reaktionsprediktionssystem säger Coley: ”Med hjälp av de arkitekturval vi har gjort får vi en enorm ökning i validitet och bevarande, och vi får en motsvarande eller något bättre noggrannhet när det gäller prestanda.”

Han tillägger: ”Det som är unikt med vår metod är att vi använder dessa läroboksförståelser av mekanismer för att generera denna dataset, men vi förankrar reaktanterna och produkterna från den totala reaktionen i experimentellt validerade data från patentlitteraturen.”

De drar slutsatser om de underliggande mekanismerna, säger han, snarare än att bara hitta på dem.

”Vi härleder dem från experimentella data, och det är något som inte har gjorts och delats i denna skala tidigare.”

Om nästa steg säger han: ”Vi är mycket intresserade av att utvidga modellens förståelse av metaller och katalytiska cykler. Vi har bara skrapat på ytan i denna första artikel”, och de flesta av de reaktioner som hittills ingår innehåller inte metaller eller katalysatorer, ”så det är en riktning som vi är mycket intresserade av.”

På lång sikt säger han: ”Det är mycket spännande att använda ett sådant system för att upptäcka nya komplexa reaktioner och hjälpa till att klarlägga nya mekanismer. Jag tror att den långsiktiga potentiella effekten är stor, men detta är förstås bara ett första steg.”

Mer information: Joonyoung F. Joung et al, Electron flow matching for generative reaction mechanism prediction, Nature (2025). DOI: 10.1038/s41586-025-09426-9

Denna artikel återpubliceras med tillstånd av MIT News (web.mit.edu/newsoffice/), en populär webbplats som rapporterar om nyheter om forskning, innovation och undervisning vid MIT.

Related Articles

Leave a Comment