Studie undersöker AI:s förmåga att förbättra noggrannheten i differentialdiagnoser

by Albert
Noggrannhet och trendanalys av LLM för DDx med laboratorietestdata. Källa: npj Digital Medicine (2025). DOI: 10.1038/s41746-025-01556-8

Utvecklingen av mer tillgängliga modeller för artificiell intelligens (AI) har förändrat området för hälsodiagnoser och medicin, där AI används för diagnostisk noggrannhet, personliga behandlingsplaner, tolkning av medicinska bilder, effektivisering av operationer, stöd för fjärrövervakning av patienter och mycket mer.

Forskare från eHealth Lab vid Florida State University’s School of Information har utvärderat tillämpningen av AI som ett verktyg för att hjälpa vårdgivare att ställa mer exakta patientdiagnoser. Framstegen har potential att förbättra behandlingsmetoderna och patienternas resultat.

Seniorförfattaren och direktören för FSU:s Institute for Successful Longevity, Zhe He, och gästprofessorn Balu Bhasuran är bland medförfattarna till den multiinstitutionella forskningen.

Artikeln, som publicerades i npj Digital Medicine, bygger vidare på FSU:s LabGenie-projekt, ett verktyg för patientengagemang som syftar till att förbättra äldre personers förståelse av laboratorietestresultat.

Forskningsteamet har undersökt möjligheten att använda stora språkmodeller (LLM), en typ av AI som lär sig av stora mängder text för att svara på frågor korrekt, för att hjälpa kliniker och förbättra differentialdiagnosens noggrannhet och effektivitet. Differentialdiagnos (DDx) är ett viktigt steg i kliniska beslut och hjälper vårdgivare att skilja mellan tillstånd med liknande symtom.

”Den AI-genererade differentialdiagnosen är mycket omfattande och täcker alla möjliga diagnoser för patienter”, säger han. ”Denna studie visar hur AI potentiellt kan användas som ett verktyg för att hjälpa läkare att fatta mer välgrundade beslut för sina patienter.”

Effekt av laboratorietester på noggrannhet och mild noggrannhet i olika scenarier. Källa: npj Digital Medicine (2025). DOI: 10.1038/s41746-025-01556-8

Effekt av laboratorietester på noggrannhet och mild noggrannhet i olika scenarier. Källa: npj Digital Medicine (2025). DOI: 10.1038/s41746-025-01556-8

I studien användes LLM för att generera listor över de fem och tio bästa DDx för klinikers utvärdering. Forskarna bedömde LLM:s noggrannhet och prediktiva förmåga och undersökte hur införlivandet av laboratorietestresultat påverkade deras diagnostiska noggrannhet.

I studien testades fem LLM:er – GPT-4, GPT-3.5, Llama-2-70b, Claude-2 och Mixtral-8x7B – med hjälp av kliniska vignetter, eller narrativa patientrelaterade fall, hämtade från 50 fallrapporter. Resultaten visar att laboratorietestdata avsevärt förbättrar diagnostisk noggrannhet, där GPT-4 uppnår högst prestanda.

Specifikt uppnådde GPT-4 55 % topp 1-noggrannhet och 60 % topp 10-noggrannhet med laboratoriedata, med en total noggrannhet på 80 %. Laboratorietester, inklusive leverfunktion, metaboliska/toxikologiska paneler och serologi/immuntester, tolkades i allmänhet korrekt av LLMs.

”När vi bad modellen om den bästa differentialdiagnosen kunde de flesta av dessa modeller ställa en exakt diagnos för patienten”, säger Bhasuran. ”Det är mycket intressant eftersom det innebär att modellen kan förutsäga även sällsynta sjukdomar.”

Forskningen syftar till att bidra till att hantera välkända problemområden som ofta upplevs inom hälso- och sjukvården, både ur vårdgivarens och patientens perspektiv. En korrekt diagnos är avgörande för en effektiv patienthantering och påverkar direkt behandlingsbeslut och patientens totala resultat.

Att minska diagnostiska fel bidrar till att effektivisera patientvården, eliminerar behovet av överdrivna eller upprepade tester och sänker i slutändan vårdkostnaderna genom kortare sjukhusvistelser och onödiga ingrepp.

Mer information: Balu Bhasuran et al, Preliminary analysis of the impact of lab results on large language model generated differential diagnoses, npj Digital Medicine (2025). DOI: 10.1038/s41746-025-01556-8

Related Articles

Leave a Comment