Deze baby met een camera op zijn hoofd heeft kunstmatige intelligentie geleerd hoe kinderen taal leren

Voor dit experiment vertrouwden de onderzoekers op 61 uur aan videobeelden van een helmcamera gedragen door een kind dat in de buurt van Adelaide, Australië woonde. Dat kind, Sam, droeg de camera anderhalf jaar lang af en toe, vanaf het moment dat hij zes maanden oud was tot vlak na zijn tweede verjaardag. De camera legde de dingen vast waar Sam naar keek en waar hij aandacht aan schonk gedurende ongeveer 1% van zijn tijd dat hij wakker was. Slechts twee katten, zijn ouders, wieg en speelgoed, huis, maaltijden en nog veel meer werden gefilmd. “Deze dataset was volkomen uniek”, zegt Lake. “Het is het beste inzicht dat we ooit hebben gehad in waartoe een kind toegang heeft.”

Om het model te trainen gebruikten Lake en zijn collega’s 600.000 videoframes gecombineerd met zinnen die Sams ouders of andere mensen in de kamer spraken toen de foto werd gemaakt – een totaal van 37.500 “uitingen”. Soms vielen woorden en voorwerpen samen. Soms niet. Op één foto kijkt Sam bijvoorbeeld naar de vormensorteerder en zegt de ouder: “Je vindt de draad leuk.” In een ander geval bedekt de hand van een volwassene enkele blokken en zegt de ouder: “Jij wilt ook blokken.”

Het team gaf het model twee tekens. Wanneer objecten en woorden samen verschijnen, is dit een teken dat ze mogelijk verband houden. Maar als een object en een woord niet samen voorkomen, is dat een teken dat ze waarschijnlijk niet bij elkaar passen. “Dus dit soort koppelingen en ontkoppelingen vindt binnen het model plaats”, zegt Wai Keen Wong, een computationeel cognitief wetenschapper aan de New York University en auteur van de studie. “Dan hopen we dat er voldoende gevallen in de gegevens voorkomen dat wanneer de ouder het woord ‘bal’ zegt, het kind de bal ziet”, zegt hij.

Het matchen van woorden met de objecten die ze vertegenwoordigen lijkt misschien een eenvoudige taak, maar dat is het niet. Om een idee te krijgen van de omvang van het probleem, stel je de woonkamer voor van een gezin met jonge kinderen. Het heeft al het normale huiskamermeubilair, maar ook de kinderrommel. De vloer ligt bezaaid met speelgoed. Kleurpotloden liggen verspreid op de tafel. Er staat een snackbeker op de vensterbank en wasgoed op de stoel. Als een kind het woord ‘bal’ hoort, kan dit verwijzen naar een bal. Maar het kan ook verwijzen naar ander speelgoed, of een bank, of een broek, of de vorm van een voorwerp, of de kleur ervan, of het tijdstip van de dag. “Er zijn voor elk woord een oneindig aantal mogelijke betekenissen”, zegt Lake.

Het probleem is zo hardnekkig dat sommige ontwikkelingspsychologen hebben betoogd dat kinderen geboren moeten worden met een aangeboren begrip van hoe taal werkt om taal zo snel te kunnen leren. Maar de studie suggereert dat sommige delen van de taal kunnen worden geleerd uit een heel klein aantal ervaringen, zelfs zonder dat aangeboren vermogen, zegt Jess Sullivan, een ontwikkelingspsycholoog aan de Skidmore University, die deel uitmaakte van het team dat Sams cameragegevens op de helm verzamelde. , maar werd niet opgenomen in de nieuwe studie. “Dat schudt voor mij echt mijn wereldbeeld op.”

Maar Sullivan wijst erop dat het vermogen om woorden te associëren met de objecten die ze vertegenwoordigen, hoewel een moeilijk leerprobleem, slechts een deel is van wat taal maakt. Er zijn ook regels die bepalen hoe woorden bij elkaar passen. Uw hond kent misschien de woorden ‘bal’ of ‘lopen’, maar dat betekent niet dat hij Engels kan begrijpen. En het zou kunnen zijn dat elk aangeboren spraakvermogen van baby’s verder gaat dan de woordenschat. Het kan van invloed zijn op de manier waarop ze door de wereld navigeren, waar ze op letten of hoe ze op taal reageren. “Ik denk niet dat het onderzoek zou hebben gewerkt als de baby’s geen dataset hadden gemaakt waar het neurale netwerk van leerde”, zegt ze.

een baby met een camera op zijn hoofd zit in een kinderstoel

De volgende stap voor Lake en zijn collega’s is proberen erachter te komen wat ze nodig hebben om ervoor te zorgen dat het leermodel het vroege taalonderwijs bij kinderen beter kan repliceren. “Er is nog werk aan de winkel om te proberen een model te krijgen met mogelijkheden die al twee jaar oud zijn”, zegt hij. Dit zou kunnen betekenen dat er meer gegevens moeten worden verstrekt. Lake’s kind, nu 18 maanden oud, maakt deel uit van de volgende groep kinderen die die informatie gaat verstrekken. Hij draagt een aantal uren per week een helmcamera. Of misschien moet het model aandacht besteden aan de blik van de ouder, of enig gevoel hebben voor de stevigheid van objecten – iets wat kinderen intuïtief begrijpen. Het creëren van modellen die meer kunnen leren zoals kinderen, zal onderzoekers helpen het menselijk leren en de menselijke ontwikkeling beter te begrijpen.

AI-modellen die bepaalde manieren kunnen detecteren waarop mensen taal leren, kunnen veel effectiever zijn in het leren; ze gedragen zich misschien meer als mensen en minder als ‘een ingewikkelde engine voor het matchen van statistische patronen’, zoals taalkundige Noam Chomsky en zijn collega’s ooit grote taalmodellen zoals ChatGPT beschreven. “AI-systemen zijn nog steeds kwetsbaar en ontberen gezond verstand”, zegt Howard Shrobe, die leiding geeft aan een programma bij het Defense Advanced Research Projects Agency van de Amerikaanse overheid dat heeft bijgedragen aan de financiering van Lake’s team. Maar een kunstmatige intelligentie die als een kind kan leren, zou in staat kunnen zijn de betekenis te begrijpen, op nieuwe situaties te reageren en van nieuwe ervaringen te leren. Het doel is om AI een stap dichter bij de menselijke intelligentie te brengen.