Hur AI kan hjälpa till att upptäcka tidiga riskfaktorer för Alzheimers sjukdom

Översikt över deltagarurval och RF-modellens prestanda. a, Från UCSF EHR och UCSF Memory and Aging Center (MAC) databas extraherades, filtrerades och förbereddes deltagar- och klinisk information för tidpunkter före indextiden. Alla kliniska funktioner som extraherades kodades med ett hot och tränades på random forest-modeller (RF) för att förutsäga framtida risk för AD-diagnos. Modellerna utvärderades på en utvärderingsuppsättning på 30 % för att beräkna AUROC/AUPRC och tolkades baserat på funktionernas betydelse och med hjälp av ett heterogent kunskapsnätverk (SPOKE). De bästa funktionerna validerades sedan ytterligare i externa databaser. b, Filtrering av en konsekvent uppsättning individer med AD och kontroller från UCSF EHR för modellträning och testning. Filtrerade deltagarkohorter visas i tabell 1 och delas upp med 30% hållen uppsättning för testning. c, Bootstrapped prestanda för RF-modeller på den hållna utvärderingsuppsättningen (n = 300 bootstrapped iterationer av 1,000 deltagare, prevalens av AD på hållen uppsättning = 0,003). Bootstrapped AUROC-prestanda för modeller som tränats och testats på kvinnliga strata och manliga strata visas också. Rutan visar kvartiler (25:e, 50:e och 75:e percentilerna), morrhåren sträcker sig till 1,5 gånger interkvartilintervallet och de återstående punkterna är outliers. Kredit: Nature Aging (2024). DOI: 10.1038/s43587-024-00573-8
Översikt över deltagarurval och RF-modellens prestanda. a, Från UCSF EHR och UCSF Memory and Aging Center (MAC) databas extraherades, filtrerades och förbereddes deltagar- och klinisk information för tidpunkter före indextiden. Alla kliniska funktioner som extraherades kodades med ett hot och tränades på random forest-modeller (RF) för att förutsäga framtida risk för AD-diagnos. Modellerna utvärderades på en utvärderingsuppsättning på 30 % för att beräkna AUROC/AUPRC och tolkades baserat på funktionernas betydelse och med hjälp av ett heterogent kunskapsnätverk (SPOKE). De bästa funktionerna validerades sedan ytterligare i externa databaser. b, Filtrering av en konsekvent uppsättning individer med AD och kontroller från UCSF EHR för modellträning och testning. Filtrerade deltagarkohorter visas i tabell 1 och delas upp med 30% hållen uppsättning för testning. c, Bootstrapped prestanda för RF-modeller på den hållna utvärderingsuppsättningen (n = 300 bootstrapped iterationer av 1,000 deltagare, prevalens av AD på hållen uppsättning = 0,003). Bootstrapped AUROC-prestanda för modeller som tränats och testats på kvinnliga strata och manliga strata visas också. Rutan visar kvartiler (25:e, 50:e och 75:e percentilerna), morrhåren sträcker sig till 1,5 gånger interkvartilintervallet och de återstående punkterna är outliers. Kredit: Nature Aging (2024). DOI: 10.1038/s43587-024-00573-8

Forskare vid UC San Francisco har hittat ett sätt att förutsäga Alzheimers sjukdom upp till sju år innan symptomen uppträder genom att analysera patientjournaler med maskininlärning.

De tillstånd som mest påverkade förutsägelsen av Alzheimers sjukdom var högt kolesterol och, för kvinnor, den benförsvagande sjukdomen osteoporos.

Arbetet visar att det är lovande att använda artificiell intelligens (AI) för att upptäcka mönster i kliniska data som sedan kan användas för att söka igenom stora genetiska databaser för att avgöra vad som driver den risken. Forskarna hoppas att detta en dag kommer att påskynda diagnos och behandling av Alzheimers och andra komplexa sjukdomar.

”Detta är ett första steg mot att använda AI på rutinmässiga kliniska data, inte bara för att identifiera risker så tidigt som möjligt, utan också för att förstå biologin bakom dem”, säger studiens huvudförfattare, Alice Tang, en MD / PhD-student i Sirota Lab vid UCSF. ”Kraften i denna AI-metod kommer från att identifiera risk baserat på kombinationer av sjukdomar.”

Resultaten publiceras i Nature Aging.

Kliniska data och kraften i förutsägelser

Forskare har länge försökt upptäcka de biologiska drivkrafterna och tidiga prediktorer för Alzheimers sjukdom, en progressiv och i slutändan dödlig form av demens som förstör minnet. Alzheimers sjukdom drabbar omkring 6,7 miljoner amerikaner, varav nästan två tredjedelar är kvinnor. Risken att få sjukdomen ökar med åldern och kvinnor tenderar att leva längre än män, men det förklarar inte helt varför fler kvinnor än män får sjukdomen.

Forskarna använde UCSF:s kliniska databas med mer än 5 miljoner patienter för att leta efter samtidiga tillstånd hos patienter som hade fått diagnosen Alzheimers vid UCSF:s Memory and Aging Center jämfört med individer utan Alzheimers sjukdom och fann att de med 72 procents prediktiv förmåga kunde identifiera vilka som skulle utveckla sjukdomen upp till sju år tidigare.

Flera faktorer, däribland högt blodtryck, högt kolesterol och D-vitaminbrist, var prediktiva hos både män och kvinnor. Erektil dysfunktion och en förstorad prostata var också prediktiva faktorer för män. Men för kvinnor var osteoporos en särskilt viktig prediktor.

Det betyder inte att alla med bensjukdomen, som är vanlig bland äldre kvinnor, kommer att få Alzheimers.

”Det är kombinationen av sjukdomar som gör att vår modell kan förutsäga AD”, säger Tang, ”Vår upptäckt att osteoporos är en prediktiv faktor för kvinnor belyser det biologiska samspelet mellan benhälsa och demensrisk.”

En strategi för precisionsmedicin

För att förstå biologin bakom modellens prediktiva förmåga vände sig forskarna till offentliga molekylära databaser och ett specialverktyg som utvecklats vid UCSF och kallas SPOKE (Scalable Precision Medicine Oriented Knowledge Engine), som utvecklats i labbet hos Sergio Baranzini, Ph.D., professor i neurologi och medlem av UCSF Weill Institute for Neurosciences.

SPOKE är i grunden en databas av databaser som forskare kan använda för att identifiera mönster och potentiella molekylära mål för behandling. Den fångade upp det välkända sambandet mellan Alzheimers och högt kolesterol, genom en variant av apolipoprotein E-genen, APOE4. Men när den kombinerades med genetiska databaser kunde den också identifiera en koppling mellan osteoporos och Alzheimers hos kvinnor, genom en variant i en mindre känd gen, kallad MS4A6A.

I slutändan hoppas forskarna att metoden ska kunna användas för andra svårdiagnostiserade sjukdomar som lupus och endometrios.

”Det här är ett utmärkt exempel på hur vi kan utnyttja patientdata med maskininlärning för att förutsäga vilka patienter som löper större risk att utveckla Alzheimers, och även för att förstå varför det är så”, säger studiens huvudförfattare, Marina Sirota, Ph.D., biträdande professor vid Bakar Computational Health Sciences Institute vid UCSF.

Ytterligare information: Alice S. Tang et al, Leveraging electronic health records and knowledge networks for Alzheimer’s disease prediction and sex-specific biological insights, Nature Aging (2024). DOI: 10.1038/s43587-024-00573-8

Bli först med att kommentera

Lämna ett svar

Din e-postadress kommer inte att publiceras.