ChatGPT is geüpgraded om er menselijker uit te zien

Het nieuwste model van OpenAI biedt een meer mensachtige gesprekservaring

JIYI Afbeelding / Alamy

OpenAI heeft zijn nieuwste AI-model aangekondigd, GPT-4o genaamd, dat binnenkort enkele versies van het ChatGPT-product van het bedrijf zal aandrijven. De geüpgradede ChatGPT kan snel en in realtime reageren op tekst-, audio- en video-invoer van zijn chatpartner – en dat allemaal terwijl hij spreekt met verbuigingen en bewoordingen die een sterk gevoel van emotie en persoonlijkheid overbrengen.

Op 13 mei demonstreerde het bedrijf emotionele nabootsing van de nieuwe stemmodus tijdens een zogenaamd live OpenAI-presentatie, die zowel de mobiele ChatGPT-app als de nieuwe desktop-app omvatte. De nieuwe AI sprak met een vrouwenstem en heette ChatGPT en leek meer op de artistieke AI van Scarlett Johansson in de sciencefictionfilm ‘Her’ uit 2013 dan op de meer ingeblikte en robotachtige reacties van een typische stem. ondersteunende technologieën.

“De nieuwe GPT-4o stem-tot-stem-interactie loopt nauwer parallel met de interactie van mens tot mens”, zegt Michelle Cohn van de Universiteit van Californië, Davis. “Een groot deel hiervan zijn de korte vertragingstijden… maar een nog groter deel is het niveau van emotionele expressiviteit dat de stem genereert.”

Tijdens een gesprek met Miro Murati, de CTO van het bedrijf en twee andere medewerkers, adviseerde ChatGPT bij GPT-4o Mark Chen van OpenAI over zijn zware en snelle ademhaling door te zeggen: “Ho, doe eens rustig aan, je bent geen stofzuiger”, en suggereerde vervolgens een ademhalingsoefening. De AI inspecteerde ook visueel de tekening van Barrett Zoff van OpenAI, die woorden en een hart bevatte, en reageerde met stromende tonen: “Ah, ik zie dat je schreef dat ik van ChatGPT hou, dat is zo aardig van je.”

De nieuwe ChatGPT instrueerde zijn gesprekspartners ook mondeling over het oplossen van een eenvoudige lineaire vergelijking, legde de functie van de computercode uit en interpreteerde een grafiek met temperatuurlijnen die pieken in de zomermaanden. Desgevraagd vertelde de AI het fictieve verhaaltje voor het slapengaan zelfs verschillende keren opnieuw, terwijl hij schakelde tussen steeds dramatischer vertelling en het zingen van het einde.

De nieuwe spraakmodus zal de komende weken voor het eerst beschikbaar komen voor betalende ChatGPT Plus-abonnees, zegt Sam Altman, CEO en mede-oprichter van OpenAI, in mail op het X-platform.

ChatGPT kon zich tijdens een gesprek herstellen, zelfs van incidentele technische problemen. Toen OpenAI’s Zoph hem vroeg om gezichtsuitdrukkingen en emoties in een selfie te interpreteren, stelde de AI eerst voor om naar een houten oppervlak uit een vorig beeld te kijken voordat hem werd gevraagd om het nieuwste beeld te beoordelen.

“Ah, hier zijn we dan – je lijkt je behoorlijk gelukkig en opgewekt te voelen met een grote glimlach en een vleugje opwinding”, zei ChatGPT. ‘Wat er ook aan de hand is, je lijkt in een goed humeur te zijn. Wil je de bron van die goede vibes delen?

Toen hem werd verteld dat dit kwam omdat de live demo met ChatGPT laat zien hoe “behulpzaam en geweldig je bent”, antwoordde de AI: “Stop ermee, je laat me blozen.”

Maar Murati erkende dat de bijgewerkte versie van ChatGPT, mogelijk gemaakt door GPT-4o – waarvan het bedrijf zegt dat deze uiteindelijk zelfs beschikbaar zal zijn voor gratis ChatGPT-gebruikers – nieuwe veiligheidsrisico’s met zich meebrengt vanwege de manier waarop het realtime informatie integreert en interpreteert. Ze zei dat OpenAI werkt aan het opbouwen van ‘misbruikbeperking’.

“Het is erg moeilijk om naadloze multimodale gesprekken te voeren, dus de demonstraties zijn indrukwekkend”, zegt Peter Henderson van Princeton University in New Jersey. “Maar naarmate je meer modaliteiten toevoegt, wordt beveiliging veel moeilijker en belangrijker. Het zal waarschijnlijk enige tijd duren om mogelijke manieren van falen van de beveiliging te identificeren met het soort invoeruitbreiding dat het model gebruikt.”

Henderson omschreef zichzelf ook als “nieuwsgierig” naar de privacyvoorwaarden van OpenAI wanneer ChatGPT-gebruikers input zoals live audio en video gaan delen, en of gratis gebruikers zich kunnen afmelden voor het verzamelen van gegevens die kunnen worden gebruikt om toekomstige OpenAI-modellen te trainen.

“Aangezien het model zich buiten het apparaat lijkt te bevinden, lijkt het feit dat je je bureaubladscherm via internet met het model kunt delen of continu audio of video kunt opnemen, de uitdaging van het lanceren van dit specifieke product nog groter te maken, als het de bedoeling is om bewaar en gebruik die gegevens”, zegt Henderson.

Een meer antropomorfe AI-chatbot vormt ook een andere bedreiging: een bot die empathie kan faken door middel van stemgesprekken zou zowel persoonlijker als geloofwaardiger kunnen klinken voor mensen, zo blijkt uit onderzoeken van Cohn en haar collega’s. Dit vergroot het risico dat mensen eerder geneigd zullen zijn om potentieel onnauwkeurige informatie en vooroordelende stereotypen te geloven die zijn gecreëerd door grote taalmodellen zoals GPT-4.

“Dit heeft belangrijke implicaties voor de manier waarop mensen begeleiding zoeken en ontvangen van grote taalmodellen, vooral omdat ze niet altijd nauwkeurige informatie genereren”, zegt Cohn.

Onderwerpen: