Ett team av forskare vid Googles DeepMind-projekt rapporterar att dess AlphaGeometry2 AI presterade på en guldmedaljnivå när de fick i uppgift att lösa problem som gavs till gymnasieelever som deltog i International Mathematical Olympiad (IMO) under de senaste 25 åren. I sitt papper som publicerades på arXiv preprint-servern ger teamet en översikt över AlphaGeometry2 och dess poäng när man löser IMO-problem.
Tidigare forskning har föreslagit att AI som kan lösa geometriproblem kan leda till mer sofistikerade appar eftersom de kräver både en hög nivå av resonemangsförmåga och en förmåga att välja mellan möjliga steg för att arbeta mot en lösning på ett problem.
Därför har teamet på DeepMind arbetat med att utveckla alltmer sofistikerade appar för geometrilösning. Den första iterationen släpptes i januari förra året och kallades AlphaGeometry; den andra iterationen kallas AlphaGeometry2.
Teamet på DeepMind har kombinerat det med ett annat system som de utvecklade som heter Alpha Proof, som utför matematiska bevis. Teamet fann att det kunde lösa 4 av 6 problem som listades i IMO förra sommaren. I den nya studien utökade forskargruppen testerna av systemets förmåga genom att ge det flera problem som använts av IMO under de senaste 25 åren.
Forskargruppen byggde AlphaGeometry2 genom att kombinera flera kärnelement, varav ett är Googles Gemini-språkmodell. Andra element använder matematiska regler för att komma fram till lösningar på det ursprungliga problemet eller delar av det.
Teamet konstaterar att för att lösa många IMO-problem måste vissa konstruktioner läggas till innan man fortsätter, vilket innebär att deras system måste kunna skapa dem. Deras system försöker sedan förutse vilka av de konstruktioner som har lagts till i ett diagram som ska användas för att göra de nödvändiga avdrag som krävs för att lösa ett problem. AlphaGeometry2 föreslår steg som kan användas för att lösa ett givet problem och kontrollerar sedan stegen för logik innan de används.
För att testa sitt system valde forskarna 45 problem från IMO, varav några behövde översättas till en mer användbar form, vilket resulterade i totalt 50 problem. De rapporterar att AlphaGeometry2 kunde lösa 42 av dem korrekt, vilket är något högre än den genomsnittliga mänskliga guldmedaljören i tävlingen.
För mer information se: Yuri Chervonyi et al, Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2, arXiv (2025). DOI: 10.48550/arxiv.2502.03544