Historische doorbraak AI: goud op Internationale Wiskunde-Olympiade

woensdag, 23 juli 2025 om 12:10

bijgewerkt om woensdag, 23 juli 2025 om 13:44

Voor het eerst in de geschiedenis hebben AI-modellen van zowel Google DeepMind als OpenAI een gouden medaille-score behaald op de prestigieuze Internationale Wiskunde-Olympiade (IMO) in Australië. Tot nu toe konden alleen mensen zo diep nadenken en dit soort pittige rekenproblemen oplossen. Een mijlpaal die laat zien hoe sterk AI-systemen zijn gegroeid in logisch en wiskundig redeneren.

Google’s nieuwe 'Gemini Deep Think'-model loste vijf van de zes Olympiade-problemen op binnen de officiële 4,5 uur en in natuurlijke taal. Hiermee behaalde het de officiële IMO-certificering. Ook OpenAI liet van zich horen: hun model scoorde ook 35 van de 42 punten, waarmee ze de bronzen Olympiërs evenaarden, al werd hun deelname niet officieel erkend.

Gouden medaille

“We kunnen bevestigen dat Google DeepMind de felbegeerde mijlpaal van 35 uit 42 punten hebben behaald, een gouden medaille-score”, meldde de IMO-voorzitter. Daarmee staat AI nu op hetzelfde podium als de slimste tien procent van jonge wiskundigen ter wereld.

Dit succes is een flinke sprong vooruit. Vorig jaar behaalde DeepMind met AlphaProof/AlphaGeometry nog zilver, door vier problemen op te lossen in een aangepaste setting die vertaling tussen natuurlijke en formele taal vereiste. Dit jaar deed Gemini het helemaal zelf, in echte wedstrijdomstandigheden.

Wat betekent dit voor de toekomst?

AI-onderzoekers zien in deze prestatie een potentieel keerpunt. Volgens hen kunnen deze modellen binnenkort de menselijke onderzoeker serieus helpen bij de aanpak van wiskundige en natuurwetenschappelijke problemen. De shift van specialistische engines naar algemene redeneersystemen lijkt ingezet.

OpenAI-CEO Sam Altman noemt het resultaat “een droom die werkelijkheid wordt”, maar benadrukt dat het model voorlopig nog niet voor iedereen beschikbaar is.

Blijf kritisch kijken

Toch klinkt er ook nuance. Experts zoals Terence Tao waarschuwen dat AI‑oplossingen mogelijk niet volledig autonoom zijn maar deels afhangen van herformulering of menselijke bijsturing. En hoewel de IMO GPT-achtige modellen officieel heeft gecertificeerd, is benchmarking van zulke krachtige systemen complex en sterk afhankelijk van context.

Kortom: AI slaagde erin wiskundige topprestaties te leveren op hetzelfde niveau als de slimste mensen, maar echte ‘menselijke inventiviteit’ blijft voorlopig nog een brug te ver voor de pientere processoren.

Bron: Reuters

Lees ook

Vorig artikel

Veldkamp deelt zorgen om inperking anticorruptiediensten Oekraïne

Volgend artikel

RvS: afschot edelherten Oostvaardersplassen moet beter onderbouwd

POPULAIR NIEUWS

Wat zegt het over je als je je hond of kat bij je in bed laat slapen? Psychologen leggen uit

Doorwerken na uw AOW: dit levert het op, dit verliest u

Stoere namen zijn passé: dit zijn de 9 zachte jongensnamen waar Nederlandse ouders nu voor vallen

Hoe lang poep in je lijf blijft zitten, bepaalt kans op Alzheimer en Parkinson (en andere vervelende ziekten)

Nieuwe ING-truc: rustige ‘medewerker’ aan de lijn, 68-jarige Anna raakt €9.500 kwijt