OpenAI test zijn overtuigingskracht

Deze week publiceerden Sam Altman, CEO van OpenAI, en Arianna Huffington, oprichter en CEO van gezondheidszorgbedrijf Thrive Global, een artikel in Time waarin ze Thrive AI aanprezen, een startup ondersteund door Thrive en het OpenAI Startup Fund. Het werk suggereert dat kunstmatige intelligentie een enorme positieve impact op de volksgezondheid zou kunnen hebben door mensen tot gezonder gedrag te verleiden.

Altman en Huffington schrijven dat Thrive AI werkt aan “een volledig geïntegreerde persoonlijke AI-trainer die realtime aanwijzingen en aanbevelingen biedt die uniek zijn voor u, waarmee u actie kunt ondernemen op uw dagelijkse gedrag om uw gezondheid te verbeteren.”

Hun visie heeft een positieve invloed op wat een van de scherpste dubbele kanten van AI zou kunnen blijken te zijn. AI-modellen zijn al bedreven in het overtuigen van mensen, en we weten niet hoeveel krachtiger ze kunnen worden naarmate ze verder komen en toegang krijgen tot meer persoonlijke gegevens.

Alexander Madry, emeritus hoogleraar aan het Massachusetts Institute of Technology, leidt een team bij OpenAI genaamd Readiness dat aan precies die vraag werkt.

“Een van de werkstromen bij paraatheid is overreding”, vertelde Madry in mei aan WIRED. “Kortom: nadenken in hoeverre je deze modellen kunt gebruiken als een manier om mensen te overtuigen.”

Madry zegt dat hij zich aangetrokken voelde tot OpenAI vanwege het buitengewone potentieel van taalmodellen en omdat de risico’s die ze met zich meebrengen nauwelijks zijn onderzocht. “Er is letterlijk bijna geen wetenschap”, zegt hij. “Het was een impuls voor de paraatheidsinspanningen.”

Overtuigingskracht is een sleutelelement in programma’s als ChatGPT en een van de ingrediënten die dergelijke chatbots zo geloofwaardig maken. Taalmodellen zijn getraind in het menselijk schrijven en de dialoog die een groot aantal retorische en overtuigende trucs en technieken bevat. Modellen zijn doorgaans ook verfijnd om uitspraken te doen die gebruikers overtuigender vinden.

Onderzoek dat in april werd gepubliceerd door Anthropic, een concurrent opgericht door OpenAI-ballingen, suggereert dat taalmodellen steeds beter zijn geworden in het overtuigen van mensen naarmate ze groter en verfijnder zijn geworden. Dit onderzoek omvatte het geven van een verklaring aan vrijwilligers en vervolgens kijken hoe een door AI gegenereerd argument hun mening daarover veranderde.

Het werk van OpenAI strekt zich uit tot het analyseren van AI in gesprekken met gebruikers – iets dat een grotere overtuigingskracht kan onthullen. Madry zegt dat het werk wordt gedaan op instemmende vrijwilligers, en weigert de bevindingen tot nu toe bekend te maken. Maar hij zegt dat de overtuigingskracht van taalmodellen groot is. “Als mensen hebben we de ‘zwakte’ dat iets met ons communiceert in natuurlijke taal [we think of it as if] het is menselijk”, zegt hij, verwijzend naar het antropomorfisme dat ervoor kan zorgen dat chatbots levensechter en geloofwaardiger lijken.

Een artikel in Time stelt dat de potentiële gezondheidsvoordelen van overtuigende kunstmatige intelligentie sterke juridische waarborgen zullen vereisen, omdat de modellen mogelijk toegang hebben tot zoveel persoonlijke gegevens. “Beleidsmakers moeten een regelgevingsklimaat creëren dat AI-innovatie aanmoedigt en tegelijkertijd de privacy behoudt”, schrijven Altman en Huffington.

Dit is niet het enige waar beleidsmakers rekening mee moeten houden. Het kan ook van cruciaal belang zijn om in te schatten in hoeverre de steeds overtuigender wordende algoritmen mogelijk worden misbruikt. AI-algoritmen kunnen de weerklank van desinformatie versterken of bijzonder overtuigende phishing-praktijken creëren. Ze kunnen ook worden gebruikt om reclame te maken voor producten.

Madry zegt dat de belangrijkste vraag, die nog moet worden onderzocht door OpenAI en anderen, is hoe overtuigend of dwingend AI-programma’s kunnen zijn die gedurende lange perioden met gebruikers communiceren. Verschillende bedrijven bieden al chatbots aan die de rol spelen van romantische partners en andere karakters. AI-meisjes worden steeds populairder – sommige zijn zelfs ontworpen om tegen je te schreeuwen – maar hoe verslavend en overtuigend deze bots zijn is grotendeels onbekend.

De opwinding en hype die door ChatGPT werd gegenereerd na de release in november 2022 heeft OpenAI, externe onderzoekers en veel beleidsmakers ertoe gebracht zich te concentreren op de meer hypothetische vraag of AI zich ooit tegen zijn makers zou kunnen keren.

Madry zegt dat dit het risico inhoudt dat de subtielere gevaren van zilvertongalgoritmen worden genegeerd. “Ik ben bang dat ze zich op de verkeerde kwesties gaan concentreren”, zegt Madry over het trackrecord van de beleidsmakers. “Dat iedereen op de een of andere manier zegt: ‘Oh ja, we lossen het op omdat we het erover hebben’, en we hebben het niet echt over het echte werk.”