Kijk hoe een AI-robot mensen verslaat in deze klassieke doolhofpuzzel

Programma’s voor kunstmatige intelligentie verslaan menselijke concurrenten gemakkelijk en consistent in cognitief intensieve spellen als schaken, poker en Go, maar robots hebben het veel moeilijker om hun biologische rivalen te verslaan in spellen die fysieke behendigheid vereisen. Die prestatiekloof lijkt kleiner te worden, te beginnen met de klassieke kinderpuzzel.

Onderzoekers van de Zwitserse ETH Zürich hebben onlangs CyberRunner onthuld, hun nieuwe robotsysteem dat gebruikmaakt van nauwkeurige fysieke controles, visueel leren en versterkende AI-training om te leren spelen Labyrint sneller dan een mens.

Labyrint en de vele varianten ervan bestaan over het algemeen uit een doos waarop een plat houten vlak zit dat door middel van externe bedieningsknoppen over de xiy-as wordt gekanteld. Bovenaan het bord bevindt zich een labyrint met talloze gaten. Het doel is om de marmeren of metalen bal van begin tot eind te verplaatsen zonder dat deze in een van die gaten valt. Het kan op zijn zachtst gezegd een frustrerend spel zijn. Maar met voldoende oefening en geduld kunnen spelers over het algemeen de besturing voldoende onder de knie krijgen om hun knikker in relatief korte tijd in veiligheid te brengen.

CyberRunner daarentegen beheerste naar verluidt de behendigheid die nodig was om het spel in amper 5 uur te voltooien. Niet alleen dat, maar onderzoekers beweren dat hij het doolhof nu in iets minder dan 14,5 seconden kan voltooien – ruim 6 procent sneller dan het bestaande menselijke record.

De sleutel tot de nieuwe doolhofexpertise van CyberRunner is een combinatie van real-time versterkingsleren en visuele input van bovengrondse camera’s. Urenlang vallen en opstaan Labyrint paden worden opgeslagen in het geheugen van CyberRunner, waardoor het stap voor stap leert hoe de knikker het beste langs zijn route kan navigeren.

[Related: This AI program could teach you to be better at chess.]

“Het is belangrijk dat de robot niet stopt met spelen om te leren; het algoritme werkt gelijktijdig met de robot die het spel speelt”, luidt de projectbeschrijving. “Het resultaat is dat de robot steeds beter wordt, run na run.”

CyberRunner leerde niet alleen de snelste manier om het spel te verslaan – hij deed het door fouten in het doolhofontwerp zelf te vinden. Tijdens het testen van mogelijke paden ontdekte het AI-programma snelkoppelingen waarmee het tijd kon afleiden van de lanceringen. Kortom, CyberRunner heeft zijn eigen versie gemaakt Labyrint cheatcodes door snelkoppelingen te vinden die de gemarkeerde paden van het doolhof omzeilen.

De ontwerpers van CyberRunner hebben een volledig open-sourceproject gemaakt, met als doel dat andere onderzoekers over de hele wereld de mogelijkheden van het programma kunnen gebruiken en verbeteren.
“Vóór CyberRunner konden alleen organisaties met grote budgetten en op maat gemaakte experimentele infrastructuur onderzoek op dit gebied doen”, zei projectmedewerker en ETH Zürich-professor Raffaello D’Andrea deze week in een verklaring. ‘Nu kan iedereen voor minder dan 200 dollar meedoen aan baanbrekend AI-onderzoek. Bovendien zal het, zodra duizenden CyberRunners in de echte wereld zijn, mogelijk zijn om deel te nemen aan grootschalige experimenten, waarbij het leren parallel plaatsvindt, op mondiale schaal.”