Deze robots weten wanneer ze om hulp moeten vragen

Een nieuw trainingsmodel, genaamd “KnowNo”, heeft tot doel dit probleem op te lossen door robots te leren om onze hulp te vragen wanneer opdrachten onduidelijk zijn. Tegelijkertijd zorgt het ervoor dat ze alleen om opheldering vragen als dat nodig is, waardoor onnodig heen en weer geminimaliseerd wordt. Het resultaat is een slimme assistent die probeert te begrijpen wat je wilt, zonder je teveel in de weg te zitten.

Andy Zeng, een onderzoeker bij Google DeepMind die heeft geholpen bij de ontwikkeling van de nieuwe techniek, zegt dat robots weliswaar krachtig kunnen zijn in veel specifieke scenario’s, maar dat ze vaak slecht zijn in algemene taken waarvoor gezond verstand vereist is.

Als de robot bijvoorbeeld wordt gevraagd om u een cola te brengen, moet hij eerst begrijpen dat hij naar de keuken moet gaan, de koelkast moet zoeken en de koelkastdeur moet openen. Normaal gesproken moesten deze kleinere deelstappen handmatig worden geprogrammeerd, omdat de robot anders niet zou weten dat mensen hun drankjes normaal gesproken in de keuken bewaren.

Dit is iets dat grote taalmodellen (LLM’s) zouden kunnen helpen oplossen, omdat er veel kennis van gezond verstand in zit ingebakken, zegt Zeng.

Wanneer de robot nu wordt gevraagd een cola te halen, kan de LLM, die een algemeen begrip van de wereld heeft, een stapsgewijze handleiding maken die de robot kan volgen.

Het probleem met LLM’s is echter dat er geen manier is om te garanderen dat hun instructies door een robot kunnen worden uitgevoerd. Misschien heeft de persoon geen koelkast in de keuken of is de hendel op de koelkastdeur kapot. In deze situaties moeten robots mensen om hulp vragen.

KnowNo maakt dit mogelijk door grote taalmodellen te combineren met statistische hulpmiddelen die de betrouwbaarheidsniveaus kwantificeren.

Wanneer KnowNo een dubbelzinnige instructie krijgt, zoals “Zet de kom in de magnetron”, genereert KnowNo eerst meerdere mogelijke volgende acties met behulp van een taalmodel. Vervolgens wordt een betrouwbaarheidsscore gecreëerd die de waarschijnlijkheid voorspelt dat elke mogelijke keuze de beste is.