Klaar of niet, AI is aanwezig op onze scholen

Studenten over de hele wereld gebruiken generatieve AI-tools om papers te schrijven en opdrachten uit te voeren. Leraren gebruiken soortgelijke hulpmiddelen om toetsen te beoordelen. Wat is hier precies aan de hand? Waar is dit allemaal? Kan het onderwijs terugkeren naar een wereld van vóór de AI?

Hoeveel leerlingen gebruiken generatieve AI op school?

Veel middelbare scholieren en studenten omarmden populaire generatieve AI-schrijfhulpmiddelen zoals ChatGPT van OpenAI vrijwel zodra ze in 2022 internationale aandacht begonnen te krijgen. De stimulans was vrij duidelijk. Met slechts een paar simpele zoekopdrachten konden grote taalmodellen (LLM’s) destijds hun enorme databases met artikelen, boeken en archieven doorzoeken en binnen enkele seconden relatief samenhangende korte essays of antwoorden op vragen uitspugen. Het taalgebruik was niet perfect en de modellen waren geneigd feiten te verzinnen, maar ze waren goed genoeg om sommige docenten te omzeilen, die destijds niet bereid waren de tekenen van AI-manipulatie op te merken.

De trend sloeg als een lopend vuurtje aan. Ongeveer één op de vijf middelbare scholieren die van ChatGPT hebben gehoord, zegt dat ze de tools al in de klas hebben gebruikt, volgens een recent onderzoek van Pew Research. Een afzonderlijk rapport van ACT, dat een van de twee meest populaire gestandaardiseerde tests voor toelating tot de universiteit creëert, beweert dat bijna de helft (46%) van de middelbare scholieren AI heeft gebruikt om opdrachten te voltooien. Soortgelijke trends doen zich voor in het hoger onderwijs. Meer dan een derde van de Amerikaanse studenten (37%) die door het online onderwijsmagazine Intelligent.com werden ondervraagd, zegt dat ze ChatGPT hebben gebruikt om ideeën te genereren, papers te schrijven, of beide.

Deze AI-tools vinden hun weg naar beoordeelde papers. Turnitin, een vooraanstaand plagiaatdetectiebedrijf dat door docenten wordt gebruikt, zei onlangs Bedrade vond bewijs van manipulatie van kunstmatige intelligentie in 22 miljoen universiteits- en middelbare schoolpapieren die vorig jaar via zijn dienst werden ingediend. Van de 200 miljoen artikelen die in 2023 zijn ingediend, beweert Turnitin dat bij 11% meer dan 20% van de inhoud zou bestaan ​​uit door AI gegenereerd materiaal. En hoewel het generatieve gebruik van kunstmatige intelligentie in de publieke belangstelling over het algemeen is bekoeld, vertonen studenten geen tekenen van afname.

Vrijwel onmiddellijk nadat leerlingen AI-schrijfhulpmiddelen gingen gebruiken, wendden leraren zich tot andere AI-modellen om te proberen deze tegen te houden. Op het moment van schrijven beweren tientallen technologiebedrijven en startups software te hebben ontwikkeld die tekens in door AI gegenereerde tekst kan detecteren. Leraren en professoren in het hele land vertrouwen er al in verschillende mate op. Maar critici zeggen dat AI-detectietools, zelfs jaren nadat ChatGPT populair werd, nog steeds verre van perfect zijn.

Een recente analyse van 18 verschillende AI-detectietools in de Internationaal tijdschrift voor educatieve integriteit benadrukt het gebrek aan alomvattende nauwkeurigheid. Geen van de onderzochte modellen maakte nauwkeurig onderscheid tussen door AI gegenereerd materiaal en menselijk schrift. Erger nog, slechts vijf modellen bereikten een nauwkeurigheid van meer dan 70%. Detectie zou zelfs nog moeilijker kunnen worden naarmate AI-schrijfmodellen in de loop van de tijd verbeteren.

Nauwkeurigheidsproblemen zijn niet het enige probleem dat de effectiviteit van AI-detectietools beperkt. Als er te veel wordt vertrouwd op deze zich nog steeds ontwikkelende detectiesystemen, bestaat het risico dat studenten worden bestraft die anderszins nuttige AI-software zouden kunnen gebruiken die in andere contexten toelaatbaar zou zijn. Datzelfde scenario speelde zich onlangs af met Marley Stevens, een studente van de Universiteit van North Georgia, die beweert dat een AI-detectietool haar gebruik van de populaire spelling- en grammaticatool Grammarly als bedrog interpreteerde. Stevens beweert dat ze een nul kreeg voor dat essay, en daarom kon ze niet de beurs krijgen waarnaar ze op zoek was.

“Ik heb gesproken met de docent, het hoofd van de afdeling, de decaan en [they said] “Ik heb onbedoeld vals gespeeld”, zei Stevens in een TikTok-bericht. De Universiteit van Noord-Georgië reageerde niet onmiddellijk PopSci’s verzoek om commentaar.

Er zijn aanwijzingen dat de huidige AI-detectietools ten onrechte echt menselijk schrijven verwarren met AI-inhoud. Naast algemene valse positieven waarschuwen de Stanford-onderzoekers dat detectietools het schrijven van niet-moedertaalsprekers onevenredig kunnen bestraffen. Meer dan de helft (61,2%) van de essays geschreven door de in de VS geboren, niet-autochtone achtsteklassers die in het onderzoek waren opgenomen, werden geclassificeerd als door AI gegenereerd. 97% van de essays van niet-moedertaalsprekers werd gemarkeerd als AI gegenereerd door ten minste één van de zeven verschillende AI-detectietools die in het onderzoek zijn getest. Wijdverbreide ontdekkingsinstrumenten zouden meer druk kunnen uitoefenen op niet-moedertaalsprekers die al de taak hebben om taalbarrières te overwinnen.

Hoe reageren scholen op de opkomst van AI?

Leraren hebben moeite om een ​​oplossing te vinden voor de toestroom van AI-schrijven. Sommige grote schooldistricten in New York en Los Angeles hebben besloten het gebruik van ChatGPT en aanverwante tools helemaal te verbieden. Hoogleraren aan universiteiten in het hele land zijn terughoudend geworden in het gebruik van AI-detectiesoftware, ondanks het feit dat ze het bekende gebrek aan nauwkeurigheid erkennen. Een van die docenten, een hoogleraar compositie aan de Michigan Technological University, beschreef deze detectoren als “een hulpmiddel dat nuttig zou kunnen zijn, terwijl wordt erkend dat het verkeerd is en sommige studenten kan straffen”, tijdens een interview met Binnen Hogere Ed.

Anderen kiezen intussen voor de tegenovergestelde aanpak en vertrouwen in grotere mate op educatieve AI-instrumenten. In Texas, volgens Texas Tribuneheeft het staatsonderwijsagentschap deze week enkele duizenden gestandaardiseerde menselijke testscores vervangen door een ‘geautomatiseerd scoresysteem’. Het bureau beweert dat zijn nieuwe systeem, dat schriftelijke antwoorden met een open einde zal scoren die zijn opgenomen in het staatsexamen, de staat $ 15-20 miljoen per jaar zou kunnen besparen. Het zal ook ongeveer 2.000 tijdelijke nieuwkomers werkloos maken. Elders in de staat experimenteert een basisschool naar verluidt met het gebruik van leermodules voor kunstmatige intelligentie om kinderen het basiscurriculum te leren en deze vervolgens aan te vullen met menselijke leraren.

AI in het onderwijs: het nieuwe normaal

Hoewel de mogelijke AI-schrijfdetectietools kunnen worden ontwikkeld om de nauwkeurigheid te vergroten en valse positieven te verminderen, is het onwaarschijnlijk dat ze op zichzelf het onderwijs naar het pre-ChatGPT-tijdperk kunnen brengen. In plaats van het nieuwe normaal te bestrijden, beweren sommige wetenschappers dat docenten in plaats daarvan AI-tools in klaslokalen en collegezalen moeten omarmen en studenten moeten leren hoe ze deze effectief kunnen gebruiken. In een blogpost stellen de MIT Sloan-onderzoekers dat professoren en docenten nog steeds het gebruik van bepaalde tools kunnen beperken, maar merken op dat ze dit moeten doen door middel van duidelijk geschreven regels die hun redenering uitleggen. Studenten, zo schrijven ze, moeten zich op hun gemak voelen als ze leraren benaderen om te vragen wanneer AI-hulpmiddelen geschikt zijn en wanneer niet.

Anderen, zoals voormalig hoogleraar aan de Elon University, CW Howell, beweren dat het expliciet en opzettelijk blootstellen van studenten aan door AI gegenereerd schrijven in de klas ervoor kan zorgen dat ze het minder snel zullen gebruiken. Studenten vragen een essay te beoordelen dat is gegenereerd door kunstmatige intelligentie, schrijft Howell Bedrade, kan leerlingen uit de eerste hand laten ervaren hoe AI vaak bronnen verzint of citaten uit een denkbeeldige ether hallucineert. Door AI gegenereerde essays kunnen dat, wanneer ze door een nieuwe lens worden bekeken, ook daadwerkelijk doen verbeteren onderwijs.

“Door mijn studenten te laten zien hoe verkeerd ChatGPT was, kon het vertrouwen in hun eigen geest en capaciteiten worden hersteld”, schrijft Howell.

Aan de andere kant, als AI het economische landschap fundamenteel verandert, zoals sommige doemsdag-enthousiasten geloven, zouden studenten altijd hun dagen kunnen doorbrengen met het leren ontwerpen van AI-trainingsinstructies en het bijdragen aan de architectuur van hun nieuwe, door AI gedomineerde toekomst.