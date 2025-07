Voor het eerst in de geschiedenis hebben AI-modellen van zowel Google DeepMind als OpenAI een gouden medaille-score behaald op de prestigieuze Internationale Wiskunde -Olympiade (IMO) in Australië. Tot nu toe konden alleen mensen zo diep nadenken en dit soort pittige rekenproblemen oplossen. Een mijlpaal die laat zien hoe sterk AI-systemen zijn gegroeid in logisch en wiskundig redeneren.

Google’s nieuwe 'Gemini Deep Think'-model loste vijf van de zes Olympiade-problemen op binnen de officiële 4,5 uur en in natuurlijke taal. Hiermee behaalde het de officiële IMO-certificering. Ook OpenAI liet van zich horen: hun model scoorde ook 35 van de 42 punten, waarmee ze de bronzen Olympiërs evenaarden, al werd hun deelname niet officieel erkend.

Gouden medaille

“We kunnen bevestigen dat Google DeepMind de felbegeerde mijlpaal van 35 uit 42 punten hebben behaald, een gouden medaille-score”, meldde de IMO-voorzitter. Daarmee staat AI nu op hetzelfde podium als de slimste tien procent van jonge wiskundigen ter wereld.

Dit succes is een flinke sprong vooruit. Vorig jaar behaalde DeepMind met AlphaProof/AlphaGeometry nog zilver, door vier problemen op te lossen in een aangepaste setting die vertaling tussen natuurlijke en formele taal vereiste. Dit jaar deed Gemini het helemaal zelf, in echte wedstrijdomstandigheden.

Wat betekent dit voor de toekomst?

AI-onderzoekers zien in deze prestatie een potentieel keerpunt. Volgens hen kunnen deze modellen binnenkort de menselijke onderzoeker serieus helpen bij de aanpak van wiskundige en natuurwetenschappelijke problemen. De shift van specialistische engines naar algemene redeneersystemen lijkt ingezet.

OpenAI-CEO Sam Altman noemt het resultaat “een droom die werkelijkheid wordt”, maar benadrukt dat het model voorlopig nog niet voor iedereen beschikbaar is.

Blijf kritisch kijken

Toch klinkt er ook nuance. Experts zoals Terence Tao waarschuwen dat AI‑oplossingen mogelijk niet volledig autonoom zijn maar deels afhangen van herformulering of menselijke bijsturing. En hoewel de IMO GPT-achtige modellen officieel heeft gecertificeerd, is benchmarking van zulke krachtige systemen complex en sterk afhankelijk van context.

Kortom: AI slaagde erin wiskundige topprestaties te leveren op hetzelfde niveau als de slimste mensen, maar echte ‘menselijke inventiviteit’ blijft voorlopig nog een brug te ver voor de pientere processoren.