Online is een geruchtenstorm ontstaan over ChatGPT: de populaire chatbot zou een onzichtbaar watermerk toevoegen aan teksten, waarmee je in één oogopslag kunt zien of iets door AI is geschreven. Vooral scholieren reageren geschrokken.
De onrust ontstond na de lancering van de nieuwe GPT-3.o en GPT-4.o-mini van OpenAI. In lange antwoorden duiken daarin zogeheten Unicode-tekens op: onzichtbare symbolen in de tekst die alleen met technische tools zichtbaar worden. Maar is dit écht een geheim watermerk?
Geen officieel watermerk, wel digitale sporen
OpenAI ontkent dat het om een officiële watermerkfunctie gaat. Wel geven ze toe dat sommige teksten sporen kunnen bevatten als gevolg van het leerproces van de modellen, ook wel reinforcement learning genoemd. Daarbij leert een AI-systeem door beloond of gestraft te worden voor bepaalde antwoorden. Die trainingsmethode kan leiden tot onbedoelde patronen in gegenereerde tekst, zoals het opnemen van onzichtbare Unicode-symbolen (bijv. U+200B).
Met het blote oog zie je ze niet — ze lijken op gewone spaties. Maar in programmeertools worden ze zichtbaar. Dat voedt de angst dat leraren of andere controleurs ChatGPT-teksten makkelijk kunnen ontmaskeren.
Toch is er volgens OpenAI geen sprake van een opzettelijk ingebouwd herkenningsteken. De woordvoerder benadrukt dat het bedrijf juist géén herkenbare metadata in teksten wil verwerken vanwege privacyrisico’s en omdat het gebruik ervan, zoals bij vertalingen of brainstormen, dan onterecht negatief beoordeeld zou kunnen worden.
Beelden wél voorzien van metadata
Bij afbeeldingen werkt het anders. Alle beelden die via ChatGPT worden gegenereerd, bevatten wél zogeheten C2PA-metadata. Daarmee kan gecontroleerd worden of een afbeelding door AI is gemaakt. Deze transparantie is bedoeld voor uitgevers, bedrijven en andere partijen die met beeld werken.
Of er ooit een echt tekstwatermerk komt, blijft onzeker. OpenAI heeft de techniek al in huis, maar vreest dat gebruikers massaal afhaken als ze weten dat hun teksten automatisch traceerbaar zijn. Tot die tijd moeten gebruikers het doen met vage tekens, speculatie en een groeiende hoeveelheid YouTube-video’s over het onderwerp.