Wil je weten hoe AI de overheid en de politiek zal beïnvloeden? Bots hebben antwoorden

Ween hoed zullen AI doet werkgelegenheid? Het is, na “zal het ons allemaal doden?”, de belangrijkste vraag over technologie, en het is uiterst moeilijk om te bepalen – zelfs als de lijn van science fiction naar de realiteit beweegt.

Aan de ene kant van het spectrum bevindt zich de enigszins Pollyanna-achtige bewering dat nieuwe technologie eenvoudigweg nieuwe banen creëert; aan de andere kant bestaat de vrees dat bedrijven hun gehele personeelsbestand zullen vervangen door AI-tools. Soms gaat het dispuut minder over de eindsituatie en meer over de snelheid van de transitie: een omwenteling die in een paar jaar voltooid is, is destructief voor degenen die er middenin zitten, op een manier dat een omwenteling die twintig jaar duurt, overleefd kan worden.

Zelfs de analogieën met het verleden zijn minder duidelijk dan we zouden willen. De verbrandingsmotor maakte uiteindelijk een einde aan de werkpaarden. Maar de stoommachine deed grotendeels het tegenovergestelde toename aantal lastdieren dat in Groot-Brittannië wordt gebruikt. Waarom? Omdat de spoorwegen zorgden voor een hausse aan goederen die door het hele land werden verscheept, maar de levering van magazijn tot deur niet konden voltooien. Er waren paarden nodig om dingen te doen die de stoommachine niet kon.

Totdat ze dat niet meer waren.

Stoomkracht en de verbrandingsmotor zijn voorbeelden van technologie voor algemeen gebruik, ontdekkingen die het hele weefsel van de samenleving opnieuw vormgeven. Het waren er niet veel, zelfs als je begint te tellen vanaf het schrift – of, daarvoor, vanaf de brand zelf. Ik geloof dat het volkomen toeval is dat de term “generatieve, vooraf getrainde transformator” dezelfde initialen heeft, dus het lijkt erop dat GPT GPT is.

Het gaat niet om banen, sukkel

Mensen zijn geen paarden en AI-hulpmiddelen zijn geen mensen.

Mensen zijn geen paarden ^{[citation needed]}. Het lijkt onwaarschijnlijk dat AI-technologie ooit in staat zal zijn om absoluut alles te doen wat een mens kan doen, omdat een deel van wat een mens kan doen wees een man, een lastige cirkelverklaring, maar wel een belangrijke. Er worden nog steeds paarden gehouden in paardenraces, want als je het paard vervangt door een auto, is het geen paardenrace ^{[citation needed]}; mensen zullen die diensten blijven verlenen die mensen, om welke reden dan ook, willen dat mensen verlenen. Wat zijn enkele van deze diensten, aangezien cultuur draait om de opkomst van AI? Zijn het zou ons kunnen verbazen. AI in de zorg wordt bijvoorbeeld ondergewaardeerd omdat voor veel mensen de ‘human touch’ slecht ding: je maakt je zorgen dat je wordt beoordeeld op basis van je drankgebruik of de therapeut tegen wie je liegt, omdat je aardig gevonden wilt worden.

Als gevolg hiervan denken veel mensen niet graag aan banen, maar aan ‘taken’. Neem een baan, definieer deze in termen van de taken die ermee gepaard gaan, en vraag of AI het kan doen. Op die manier identificeer je er een paar die het gevaar lopen volledig te worden gekannibaliseerd, een paar die volkomen veilig zijn, en een grote middenweg waar de AI op zal ‘slaan’, maar dat schudt de boel wakker.

Het is de moeite waard om op het voor de hand liggende te wijzen: deze aanpak zal er automatisch toe leiden dat een groot aantal banen wordt ‘getroffen’ en een klein aantal banen wordt ‘vernietigd’. (Zelfs de baan die het meest door AI wordt beïnvloed, heeft waarschijnlijk een aantal taken die AI moeilijk vindt.) Dat is misschien de reden waarom het een methodologie is die door OpenAI is ontwikkeld. In een paper uit 2023 schatten onderzoekers verbonden aan het laboratorium: “Dat 80 procent van de werknemers tot een beroep behoort waarbij ten minste 10 procent van hun taken is blootgesteld aan LLM, terwijl 19 procent van de werknemers een beroep uitoefent waar meer dan de helft van hun taken plaatsvindt. worden als blootgesteld bestempeld.

Het rapport beweert dat tussen de 15 en 86 beroepen “volledig blootgelegd” zijn, waaronder wiskundigen, juridische secretarissen en … journalisten.

Ik ben er nog. Maar een jaar later is het idee weer in het nieuws dankzij het werk van het Tony Blair Institute (TBI). De megadenktank was al vóór de verpletterende overwinning van Labour twee weken geleden machtig en invloedrijk; het wordt nu beschouwd als een van de architecten van het Starmerite-denken. En hij denkt dat de publieke sector rijp is voor AI-verstoring. Uit de paper van het instituut, The Potential Impact of AI on the Public Sector Workforce (pdf):

Meer dan 40 procent van de taken die door werknemers in de publieke sector worden uitgevoerd, zouden gedeeltelijk kunnen worden geautomatiseerd door een combinatie van op AI gebaseerde software, zoals machinaal leren en modellen in grote talen, en op AI gebaseerde hardware, variërend van op AI gebaseerde sensoren tot geavanceerde robotica .

De overheid zal moeten investeren in AI-technologie, haar datasystemen moeten upgraden, haar personeel moeten opleiden om nieuwe tools te gebruiken en eventuele ontslagkosten moeten dekken die verband houden met het voortijdig verlaten van personeel. In het kader van een ambitieus uitrolprogramma schatten we deze kosten op £ 4miljard per jaar gemiddeld tijdens deze zittingsperiode.

TechScape heeft de afgelopen weken gekeken naar de aanpak van de nieuwe overheid op het gebied van kunstmatige intelligentie. Morgen weten we meer, en de AI-wet wordt verwacht in de Koningstoespraak. Het TBI-rapport geeft ons één punt waar we op moeten letten: zullen de investeringen in transformatie de £4 miljard per jaar benaderen? Er kan veel gratis worden gedaan, maar er kan nog veel meer worden gedaan met veel geld. De uitgaven lonen volgens schattingen van het instituut ruim 9:1; maar een biljet van £20 miljard is moeilijk ongevraagd door het parlement te smokkelen.

AI stelt zich voor

Tony Blair spreekt op de conferentie van het Tony Blair Institute for the Future of Britain op 9 juli. Foto: Yui Mok/PA

In het weekend leidde het rapport tot een tweede golf van belangstelling, nadat critici kritiek hadden geuit op de methodologie. Van 404Media:

Het probleem met deze voorspelling, opgepikt door Politico, TechRadar, Forbes en anderen zeggen dat ChatGPT dit deed nadat de auteurs van het artikel hadden toegegeven dat voorspellingen op basis van interviews met experts te moeilijk zouden zijn. Kortom, de ontdekking dat AI mensen in hun werk zou kunnen vervangen en de manier waarop de overheid werkt radicaal zou kunnen veranderen, heeft AI voor een groot deel gebracht.

“Er zit geen validatie in deze methode dat het taalmodel goed is in het bepalen van wat in principe geautomatiseerd kan worden”, vertelde Michael Veale, universitair hoofddocent aan het University College London, mij. “Automatisering is een complex fenomeen – in de overheid omvat meerdere bestuursniveaus, gemeenschappelijke normen, veranderende wetten, zeer lage aanvaardbare kosten van falen. Deze taken bestaan niet op zichzelf, maar maken deel uit van een veel bredere reeks praktijken en routines.”

Het opsplitsen van banen in taken is al gebeurd, met een enorme database gecreëerd door het Amerikaanse ministerie van Arbeid. Maar met 20.000 van dergelijke taken is het een moeilijke taak om te beschrijven welke taken worden blootgesteld aan AI. In een soortgelijk OpenAI-document “hebben de auteurs persoonlijk aantekeningen gemaakt bij een groot aantal taken en DWA’s en ervaren menselijke annotators ingeschakeld om de GPT-3-, GPT-3.5- en GPT-4-outputs te beoordelen als onderdeel van OpenAI’s nalevingswerk”, maar ook de toen nieuwe GPT-4 om dezelfde taak uit te voeren en vond tussen de 60 en 80 procent overeenstemming tussen robots en mensen.

sla de nieuwsbriefpromotie over

Het TBI-papier sloeg de experts over en legde zijn vragen gewoon voor aan de AI om te beantwoorden. Na de vele aandacht werd de krant stilletjes bijgewerkt met een addendum van acht pagina’s waarin de keuze werd verdedigd:

Het is duidelijk dat er een wisselwerking bestaat tussen verschillende methoden. Geen enkele is perfect. Groter vertrouwen op menselijk oordeelDe analyse kan worden beperkt tot een bredere categorisering van taken met minder specificiteit, terwijl er tijd wordt bespaard. Aan de andere kant impliceert het volgen van een meer gedetailleerde categorisering doorgaans een grotere afhankelijkheid van AI om de beoordeling te ondersteunen.

Maar het afwijzen van menselijke labelers was niet het enige verschil tussen het werk van OpenAI en dat van TBI. Wonks gebruikte ook een veel gedetailleerdere vraag, waardoor het AI-systeem werd aangemoedigd om in detail na te denken over de aard van het cognitieve en fysieke werk dat bij een bepaalde taak betrokken is, alvorens te vragen of de AI de taak kan uitvoeren en vervolgens vervolgacties aan te bieden. vragen. om ervoor te zorgen dat alleen die taken praktisch worden automatisch berekend.

Dit is ‘prompt engineering’ in actie, waarbij het AI-systeem wordt aangemoedigd om stapsgewijs te denken om zijn reacties te verbeteren. Het is ook een voorbeeld van wat een ‘overhang’ wordt genoemd: de onderzoekers gebruikten in beide gevallen hetzelfde GPT-4-model, maar door er steeds beter in te worden met Het TBI-team had het beter kunnen doen van Dat.

Terwijl het stof is neergedaald, zou de nieuwe toevoeging het belangrijkste deel van het hele artikel kunnen zijn. De bevindingen op het hoogste niveau zijn waarschijnlijk voor het grootste deel correct, omdat GPT-4 erg goed is in het uitspugen van tekst die waarschijnlijk in bredere zin waar is. Als iemand de tijd had om door de duizenden pagina’s tekst te bladeren die hij produceerde bij het nakijken van die tienduizenden opdrachten, zouden er ongetwijfeld onnauwkeurigheden, clichés en regelrechte hallucinaties voorkomen. Maar binnen de reikwijdte van het onderzoek doen ze er niet toe.

En de bevindingen ook niet. “Sommige, maar niet alle, taken in de publieke sector kunnen door AI worden geautomatiseerd” is een vrij gemakkelijke bewering. Door er een getal op te zetten, wordt de investeringszaak duidelijker, maar het zou een dwaas zijn om te wedden dat ’40 procent’ nauwkeuriger is dan 50 of 30 procent.

In plaats daarvan leert werk door te doen. Wil je weten hoe AI de overheid en de politiek zal beïnvloeden? Nou, hier is het in actie. Het werk werd geproduceerd tegen een fractie van de kosten die het ooit zou hebben gekost, maar werd gepresenteerd aan een publiek waar alleen al de methode van creatie twijfel deed rijzen over de bevindingen ervan.

Spoel af en herhaal dit voor nog eens 8.000 taken, en je zult veel dichter bij het begrijpen van de impact van AI op banen komen – en beseffen dat het allesbehalve een schone transitie zal zijn.

Vouw TechScape uit

‘CIA Renée’ … door Renée DiResta. Foto: reneediresta.com