Meta creëerde een manier om door AI gegenereerde spraak van een watermerk te voorzien

Er zijn echter enkele grote kanttekeningen. Meta zegt dat het nog geen plannen heeft om watermerken toe te passen op door AI gegenereerde audio die met behulp van zijn tools is gemaakt. Audiowatermerken worden nog steeds niet algemeen toegepast en er bestaat geen enkele overeengekomen industriestandaard voor. Watermerken voor door AI gegenereerde inhoud zijn doorgaans eenvoudig te wijzigen, bijvoorbeeld door verwijdering of vervalsing.

Snelle detectie en de mogelijkheid om vast te stellen welke elementen van een audiobestand door AI worden gegenereerd, zullen van cruciaal belang zijn om het systeem bruikbaar te maken, zegt Elsahar. Hij zegt dat het team een nauwkeurigheid van tussen de 90% en 100% heeft bereikt bij het detecteren van watermerken, wat veel beter is dan eerdere pogingen om audiowatermerken te maken.

AudioSeal is gratis beschikbaar op GitHub. Iedereen kan het downloaden en gebruiken om watermerken toe te voegen aan door AI gegenereerde audioclips. Het zou uiteindelijk kunnen worden gelaagd op AI-modellen voor het genereren van geluid, zodat het automatisch van toepassing is op elke spraak die daarmee wordt gegenereerd. De onderzoekers die het hebben gemaakt, zullen hun werk in juli presenteren op de Internationale Conferentie over Machine Learning in Wenen, Oostenrijk.

AudioSeal wordt gemaakt met behulp van twee neurale netwerken. Eén genereert watermerksignalen die in audiotracks kunnen worden ingebed. Deze signalen zijn niet waarneembaar voor het menselijk oor, maar kunnen snel worden gedetecteerd door een ander neuraal netwerk. Als je op dit moment AI-gegenereerde audio in een langere clip wilt herkennen, moet je het geheel in stukken van een seconde doorzoeken om te zien of een van deze een watermerk bevat. Dit is een langzaam en moeizaam proces, en niet praktisch op sociale mediaplatforms met miljoenen minuten aan spraak.

AudioSeal werkt anders: door een watermerk in te sluiten in elk deel van de gehele audiotrack. Hierdoor kan het watermerk worden “gelokaliseerd”, wat betekent dat het nog steeds kan worden gedetecteerd, zelfs als de audio wordt bijgesneden of bewerkt.

Ben Zhao, hoogleraar computerwetenschappen aan de Universiteit van Chicago, zegt dat deze mogelijkheid en de bijna perfecte detectienauwkeurigheid AudioSeal beter maken dan enig ander audiowatermerksysteem dat hij ooit is tegengekomen.

“Het is zinvol om onderzoek te onderzoeken dat de stand van zaken op het gebied van watermerken verbetert, vooral in media zoals spraak die vaak moeilijker te markeren en te detecteren is dan visuele inhoud”, zegt Claire Leibowicz, hoofd van AI en media-integriteit bij de non- winst Partnerschap op het gebied van AI.

Maar er zijn enkele grote nadelen die moeten worden overwonnen voordat dit soort audiowatermerken op grote schaal kunnen worden toegepast. De onderzoekers van Meta testten verschillende aanvallen om watermerken te verwijderen en ontdekten dat hoe meer informatie over het watermerkalgoritme wordt onthuld, hoe kwetsbaarder het is. Het systeem vereist ook dat mensen vrijwillig een watermerk aan hun audiobestanden toevoegen.