Schokkende studie laat zien waar AI-chatbots werkelijk hun informatie vandaan halen

Tech, AI, auto
door Pieter Immerzeel
zaterdag, 30 augustus 2025 om 10:20
ANP-532343670
Waar halen chatbots als ChatGPT eigenlijk hun informatie vandaan? Veel gebruikers denken dat de antwoorden vooral leunen op betrouwbare bronnen zoals Wikipedia, maar een nieuw onderzoek van SEO-bedrijf Semrush schetst een heel ander beeld.
Uit de analyse van ruim 150.000 AI-teksten blijkt dat Reddit met afstand de belangrijkste bron is voor AI-modellen. Maar liefst 40 procent van alle verwijzingen komt van het forumplatform, waar gebruikers elkaar tips, meningen en flauwe grappen voorschotelen. Wikipedia, de nummer twee op de lijst, blijft steken op 26 procent.
Reddit domineert
Ook YouTube (23,5%), Google (23,3%), Yelp (21%) en Facebook (18,7%) staan hoog genoteerd. Maar geen van deze platforms komt in de buurt van Reddit.
Dat Reddit zo vaak wordt gebruikt, heeft volgens kenners twee oorzaken. Ten eerste zijn er miljoenen discussies waarin vrijwel ieder denkbaar onderwerp wordt behandeld – precies de rijke databank waar AI-modellen dol op zijn. Daarnaast sloot Reddit lucratieve deals met Google en OpenAI, waarbij hun content voor honderden miljoenen verkocht is voor trainingsdoeleinden.
Sarcasme als feit presenteren
Deze afhankelijkheid is problematisch, stellen de wetenschappers. De inhoud op Reddit is volledig door gebruikers gemaakt en lang niet altijd betrouwbaar. Wat de menselijke lezer vaak nog goed kan inschatten als sarcasme of een grap, neemt een chatbot doodserieus over. Zo zijn er al voorbeelden van AI die humoristische of zelfs onzinnige opmerkingen als feit presenteert.
OpenAI-baas Sam Altman zei eerder al verbaasd te zijn dat mensen ChatGPT blind vertrouwen. Het nieuwe onderzoek maakt duidelijk waarom dat riskant kan zijn: veel antwoorden blijken afkomstig uit een bron waar niet de waarheid, maar de mening of de meme regeert.
semrush-top-ai-source-domains
Bron: Semrush

