OpenAI zal de ChatGPT-tekst niet van een watermerk voorzien, omdat de gebruikers ervan betrapt kunnen worden

OpenAI heeft een tekstwatermerksysteem gemaakt in ChatGPT en een watermerkdetectietool die ongeveer een jaar klaar is, melden ze De Wall Street Journal. Maar het bedrijf is intern verdeeld over de vraag of het moet worden vrijgegeven. Aan de ene kant lijkt het een verantwoorde keuze; aan de andere kant zou het zijn bedrijfsresultaten kunnen schaden.

De watermerken van OpenAI worden beschreven als het aanpassen van de manier waarop het model voorspelt dat de meest waarschijnlijke woorden en zinsneden de vorige zullen volgen, waardoor een detecteerbaar patroon ontstaat. (Dat is een vereenvoudiging, maar je kunt Google’s meer gedetailleerde uitleg over het tekstwatermerk van Gemini bekijken voor meer informatie).

Het aanbieden van een manier om door AI geschreven materiaal te ontdekken is een potentiële zegen voor leraren die studenten ervan willen weerhouden schrijfopdrachten aan AI in te dienen. De logboek meldt dat het bedrijf ontdekte dat het watermerk geen invloed had op de kwaliteit van de tekstuitvoer van zijn chatbot. Uit een onderzoek in opdracht van het bedrijf blijkt dat “mensen over de hele wereld het idee van een AI-ontdekkingstool met een marge van vier tegen één steunen”, logboek het zegt

Na logboek zijn verhaal publiceerde, bevestigde OpenAI dat het aan de tekst met een watermerk werkte in een update van een blogpost die het ontdekte TechCrunch. Daarin zegt het bedrijf dat zijn methode zeer nauwkeurig is (“99,9% effectief”, aldus de documenten logboek zaag) en bestand tegen “aanraking, zoals parafraseren”. Maar technieken zoals herformulering met een ander model zouden het “triviaal maken om slechte actoren te omzeilen”. Het bedrijf zegt ook bezorgd te zijn over de stigmatisering van AI-tools die nuttig zijn voor niet-moedertaalsprekers.

Maar OpenAI lijkt zich ook zorgen te maken dat het gebruik van watermerken de ondervraagde ChatGPT-gebruikers zou kunnen afschrikken, van wie bijna 30 procent het bedrijf blijkbaar heeft verteld dat ze de software minder zouden gebruiken als er watermerken zouden worden geïmplementeerd.

Desondanks vinden sommige werknemers het watermerk naar verluidt nog steeds effectief. Echter, in het licht van de onaangename gevoelens van gebruikers logboek zegt dat sommigen methoden hebben voorgesteld die “potentieel minder controversieel zijn onder gebruikers, maar onbewezen”. In zijn bijgewerkte blogpost van vandaag zei het bedrijf dat het zich “in de beginfase” bevindt van onderzoek naar het insluiten van metadata. Hij zegt dat het nog “te vroeg” is om te weten hoe goed het zal werken, maar dat er, omdat het cryptografisch ondertekend is, geen valse positieven zullen zijn.