AI-framsteg hjälper astronomer att upptäcka kosmiska händelser med bara ett fåtal exempel

by Albert
Samma transient visas i tre undersökningar, med rader som motsvarar Pan-STARRS (överst), MeerLICHT (mitten) och ATLAS (nederst). Varje rad visar, från vänster till höger, bilderna New, Reference och Difference. Röda cirklar markerar den förväntade positionen för den tillfälliga kandidaten i mitten av varje stämpel. Alla stämplar är 100×100 pixlar, men deras vinklade himmelstäckning skiljer sig åt på grund av undersökningsspecifika pixelskalor: Pan-STARRS 0,25″/pixel, MeerLICHT 0,56″/pixel och ATLAS 1,86″/pixel. Källa: Nature Astronomy (2025). DOI: 10.1038/s41550-025-02670-z

En ny studie som genomförts gemensamt av Oxfords universitet och Google Cloud har visat hur allmän AI kan klassificera verkliga förändringar på natthimlen – såsom en exploderande stjärna, ett svart hål som sliter sönder en förbipasserande stjärna, en snabbt rörlig asteroid eller en kortvarig stjärnbloss från ett kompakt stjärnsystem – och förklara sitt resonemang utan behov av komplex träning.

Studien, som publicerats i Nature Astronomy, har genomförts av forskare från Oxfords universitet, Google Cloud och Radboud University och visar att en allmän språklig modell (LLM) – Googles Gemini – kan omvandlas till en expertassistent inom astronomi med minimal vägledning.

Med hjälp av endast 15 exempelbilder och en enkel uppsättning instruktioner lärde sig Gemini att skilja verkliga kosmiska händelser från bildartefakter med cirka 93 % noggrannhet. Avgörande var att AI:n också gav en förklaring på lättförståelig engelska för varje klassificering – ett viktigt steg mot att göra AI-driven vetenskap mer transparent och pålitlig, och mot att bygga tillgängliga verktyg som inte kräver omfattande träningsdatasätt eller djup expertis inom AI-programmering.

”Det är slående att en handfull exempel och tydliga textinstruktioner kan ge en sådan noggrannhet”, säger Dr Fiorenzo Stoppa, medförfattare från Oxfords universitets fysikavdelning. ”Detta gör det möjligt för ett brett spektrum av forskare att utveckla sina egna klassificeringssystem utan djup expertis inom träning av neurala nätverk – bara viljan att skapa ett.”

”Som någon utan formell astronomisk utbildning är denna forskning otroligt spännande”, säger Turan Bulmus, medförfattare från Google Cloud. ”Den visar hur allmänna LLM kan demokratisera vetenskapliga upptäckter och ge alla som är nyfikna möjlighet att bidra på ett meningsfullt sätt till områden som de kanske inte har någon traditionell bakgrund inom. Det är ett bevis på kraften hos tillgänglig AI när det gäller att bryta ner barriärer inom vetenskaplig forskning.”

Sällsynta signaler i ett universum av brus

Moderna teleskop skannar himlen oavbrutet och genererar varje natt miljontals varningar om potentiella förändringar. Medan vissa av dessa är äkta upptäckter, som exploderande stjärnor, är de allra flesta ”falska” signaler som orsakas av satellitspår, kosmisk strålning eller andra instrumentella artefakter.

Traditionellt har astronomer förlitat sig på specialiserade maskininlärningsmodeller för att filtrera dessa data. Dessa system fungerar dock ofta som en ”svart låda” och ger en enkel ’äkta’ eller ”falsk” etikett utan att förklara sin logik. Detta tvingar forskarna att antingen blint lita på resultatet eller spendera otaliga timmar på att manuellt verifiera tusentals kandidater – en uppgift som kommer att bli omöjlig med nästa generations teleskop, såsom Vera C. Rubin Observatory, som kommer att producera cirka 20 terabyte data varje dygn.

Forskarteamet ställde en enkel fråga: Skulle en allmän, multimodal AI som Gemini, utformad för att förstå både text och bilder, inte bara kunna matcha specialiserade modellers noggrannhet, utan också förklara vad den ser?

Teamet försåg LLM med endast 15 märkta exempel för var och en av de tre stora himmelskartläggningarna (ATLAS, MeerLICHT och Pan-STARRS). Varje exempel innehöll en liten bild av en ny varning, en referensbild av samma del av himlen och en ”skillnadsbild” som markerade förändringen, tillsammans med en kort expertkommentar. Med endast dessa få exempel och kortfattade instruktioner som vägledning klassificerade modellen sedan tusentals nya varningar och tilldelade dem en etikett (verklig/falsk), en prioritetspoäng och en kort, läsbar beskrivning av sitt beslut.

Gemini använder tre bilder per kandidat – Ny (den senaste vetenskapliga bilden som visar den förmodade övergående händelsen), Referens (en tidigare eller staplad mall av samma del av himlen) och Skillnad (Ny minus Referens, vilket isolerar eventuella övergående signaler). Från varje triplett returnerar Gemini tre resultat: (1) en klassificering av äkta/falsk (astrofysisk källa vs. artefakt), (2) en kortfattad textförklaring som beskriver framträdande bildegenskaper och resonemanget bakom beslutet, och (3) en intressescore som indikerar uppföljningsprioritering för snabb flaggning till astronomer. Källa: Nature Astronomy (2025). DOI: 10.1038/s41550-025-02670-z

Gemini använder tre bilder per kandidat – Ny (den senaste vetenskapliga bilden som visar den förmodade övergående händelsen), Referens (en tidigare eller staplad mall av samma del av himlen) och Skillnad (Ny minus Referens, vilket isolerar eventuella övergående signaler). Från varje triplett returnerar Gemini tre resultat: (1) en klassificering av äkta/falsk (astrofysisk källa vs. artefakt), (2) en kortfattad textförklaring som beskriver framträdande bildegenskaper och resonemanget bakom beslutet, och (3) en intressescore som indikerar uppföljningsprioritering för snabb flaggning till astronomer. Källa: Nature Astronomy (2025). DOI: 10.1038/s41550-025-02670-z

En människa i loop: En AI som vet när den ska be om hjälp

En viktig del av studien var att verifiera kvaliteten och användbarheten av AI:ns förklaringar. Teamet samlade en panel med 12 astronomer för att granska AI:ns beskrivningar, som de bedömde som mycket sammanhängande och användbara.

I ett parallellt test lät teamet dessutom Gemini granska sina egna svar och tilldela varje svar ett sammanhangsbetyg. De upptäckte att modellens säkerhet var en stark indikator på dess noggrannhet: utdata med låg sammanhang var mycket mer benägna att vara felaktiga. Denna självbedömningsförmåga är avgörande för att bygga ett tillförlitligt arbetsflöde med ”människan i slingan”. Genom att automatiskt flagga sina egna osäkra fall för mänsklig granskning kan systemet fokusera astronomernas uppmärksamhet där den behövs mest.

Genom att använda denna självkorrigeringsloop för att förfina de initiala exemplen förbättrade teamet modellens prestanda på en dataset från ~93,4 % till ~96,7 %, vilket visar hur systemet kan lära sig och förbättras i samarbete med mänskliga experter.

Medförfattaren professor Stephen Smartt (Institutionen för fysik, Oxfords universitet) sa: ”Jag har arbetat med detta problem med att snabbt bearbeta data från himmelskartläggningar i över 10 år, och vi plågas ständigt av att sålla bort de verkliga händelserna från de falska signalerna i databehandlingen. Vi har ägnat år åt att träna maskininlärningsmodeller, neurala nätverk, för att göra bildigenkänning.

”LLM:s noggrannhet när det gäller att känna igen källor med minimal vägledning snarare än uppgiftsspecifik träning var dock anmärkningsvärd. Om vi kan skala upp detta kan det bli en total game-changer för området, ytterligare ett exempel på hur AI möjliggör vetenskapliga upptäckter.”

Vad händer härnäst?

Teamet ser denna teknik som grunden för autonoma ”agenta assistenter” inom vetenskapen. Sådana system skulle kunna göra mycket mer än att klassificera en enskild bild; de skulle kunna integrera flera datakällor (som bilder och ljusstyrkemätningar), kontrollera sin egen tillförlitlighet, självständigt begära uppföljande observationer från robotteleskop och endast vidarebefordra de mest lovande och ovanliga upptäckterna till mänskliga forskare.

Eftersom metoden endast kräver ett litet antal exempel och instruktioner i klarspråk kan den snabbt anpassas till nya vetenskapliga instrument, undersökningar och forskningsmål inom olika områden.

”Vi går in i en era där vetenskapliga upptäckter accelereras inte av black-box-algoritmer, utan av transparenta AI-partner”, säger Turan Bulmus, medförfattare från Google Cloud.

”Detta arbete visar en väg mot system som lär sig tillsammans med oss, förklarar sitt resonemang och ger forskare inom alla områden möjlighet att fokusera på det som är viktigast: att ställa nästa stora fråga.”

Mer information: Textuell tolkning av tillfälliga bildklassificeringar från stora språkmodeller, Nature Astronomy (2025). DOI: 10.1038/s41550-025-02670-z

Related Articles

Leave a Comment