En ny metod baserad på artificiell intelligens sorterar cancerpatienter med hög precision i grupper som har liknande egenskaper före behandling och liknande resultat efter behandling, enligt en studie ledd av forskare vid Weill Cornell Medicine. Den nya metoden har potential att möjliggöra bättre patienturval i kliniska prövningar och bättre behandlingsval för enskilda patienter.
Studien, som publicerades den 12 maj i Nature Communications, var ett samarbete med Regeneron Pharmaceuticals och tog upp ett problem som många läkemedelsföretag och läkare står inför: hur man kan förutsäga vilka patienter som kommer att svara bäst på ett läkemedel. Resultaten visade att den nya metodens förmåga att förutsäga behandlingsresultat utifrån journaluppgifter var bättre än alla andra metoder som hittills publicerats.
”Vi hoppas att denna metod i slutändan kommer att vara användbar för att testa och rikta behandlingar mot ett brett spektrum av sjukdomar”, säger seniorförfattaren Dr Fei Wang, grundande direktör för Institute of AI for Digital Health vid Department of Population Health Sciences och professor i befolkningshälsovetenskap vid Weill Cornell Medicine.
Maskininlärning har länge varit ett lovande verktyg för att hitta subtila men meningsfulla mönster i stora datamängder, inklusive medicinska datamängder. Men även om dessa system kan dela in patienter i väl definierade grupper baserat på breda likheter i deras hälsodata, motsvarar dessa grupper inte alltid patienternas framtida behandlingssvar.
Studieförfattaren Dr Ying Li, forskare vid Regeneron som arbetar med förutsägelse av behandlingssvar, kontaktade nyligen Dr Wang för att se om hans grupp kunde hjälpa till att utveckla en bättre lösning på detta problem.
”Vårt mål var att utveckla en plattform som sorterar patienter med den aktuella sjukdomen som får samma behandling i grupper med liknande utgångsvärden och behandlingsresultat”, säger Dr Li. ”Vi validerade denna metod med hjälp av en verklig databas över avancerade småcelliga lungcancerpatienter som behandlats med immuncheckpoint-hämmare.”
Studieförfattaren Dr Weishen Pan, postdoktorand vid Wang Laboratory, ledde utvecklingen av den nya plattformen för maskininlärning och ”tränade” den på avidentifierade journaluppgifter från 3 225 patienter med lungcancer i en kommersiell databas. Varje patientjournal innehöll 104 olika variabler som omfattade uppgifter såsom blodprovsresultat, recept, sjukdomshistoria och tumörstadium.
I detta initiala arbete sorterade plattformen patienterna i tre grupper. I den grupp som hade den längsta genomsnittliga överlevnadstiden från behandlingens start var de flesta patienterna (55,5 %) kvinnor, och förekomsten av andra sjukdomar som diabetes och hjärtsvikt var relativt låg.
Däremot hade gruppen med kortast överlevnad mindre än hälften av den genomsnittliga överlevnadstiden för den första gruppen, bestod främst av män (66,2 %) och hade relativt höga förekomster av tumörmetastaser samt onormala blodprovsresultat som indikerade inflammation, lever- och njurproblem.
”Med hjälp av ett mått som kallas konkordansindex visade vi att den nya metodens genomsnittliga prestanda när det gäller att förutsäga patienternas överlevnadstid var överlägsen standardmetoderna för statistisk analys och maskininlärning”, säger Dr Pan.
Teamet tillämpade sitt tränade maskininlärningssystem på en ny dataset som omfattade 1 441 patienter med icke-småcellig lungcancer och fann att det gav nästan identiska grupperingar när det gäller baslinjekarakteristika och överlevnadstider.
Dr Wang, dr Li och deras kollegor planerar nu att vidareutveckla och testa den nya metoden för patientstratifiering i kliniska tester av nya läkemedel samt för val av individuell behandling. Deras plattforms reproducerbara grupperingar av patienter och resultat tyder dessutom på att sådana verktyg också skulle kunna användas för att få grundläggande insikter om sjukdomsbiologin.
”Vi kommer troligen att behöva mer än elektroniska journaluppgifter för detta, men vi vill verkligen förstå de biologiska mekanismer som förklarar dessa distinkta patientundergrupper”, säger Dr Wang.
Mer information: Weishen Pan et al, Identification of predictive subphenotypes for clinical outcomes using real world data and machine learning, Nature Communications (2025). DOI: 10.1038/s41467-025-59092-8