Kijk hoe mini-humanoïde robots pronken met hun voetbalvaardigheden

De voetbalrobots hebben een upgrade gehad. Tweevoetige robots die zijn getraind met behulp van AI-aangedreven geassisteerd deep learning kunnen sneller lopen, zich omdraaien om een bal te schoppen en opstaan na een val dan robots die aan scriptlessen werken.

Guy Lever van Google DeepMind en zijn collega’s lieten de op batterijen werkende Robotis OP3-robots, die ongeveer 50 centimeter lang zijn en 20 gewrichten hebben, 240 uur lang diepgaand leren.

Deze techniek combineert twee belangrijke principes van AI-training: bij versterkend leren verwerven agenten vaardigheden met vallen en opstaan, met als doel vaker beloond te worden voor correcte keuzes dan voor verkeerde keuzes, terwijl bij deep learning gebruik wordt gemaakt van lagen van neurale netwerken – pogingen om een mens na te bootsen. . hersenen – om patronen te analyseren binnen de gegevens die door de AI worden gepresenteerd.

De onderzoekers vergeleken hun bots met robots die werken op basis van vooraf geschreven vaardigheden. Degenen die getraind waren met diepgaand versterkend leren konden 181 procent sneller lopen, 302 procent sneller draaien, de bal 34 procent harder trappen en 63 procent sneller opstaan na een val in een één-op-één-spel dan anderen. “Dit gedrag is erg moeilijk om met de hand te ontwerpen en te schrijven”, zegt Lever.

Het onderzoek brengt vooruitgang op het gebied van robotica, zegt Jonathan Aitken van de Universiteit van Sheffield, VK. “Een van de belangrijkste problemen waar dit artikel over gaat, is het dichten van de kloof tussen de simulatie en de werkelijkheid”, zegt hij. Hierbij worden de in simulaties geleerde vaardigheden niet noodzakelijkerwijs goed overgedragen naar een echte omgeving.

De door het Google DeepMind-team voorgestelde oplossing – het gebruik van een fysica-engine om trainingscasussen te simuleren in plaats van de robot voortdurend dingen in het echte leven te laten proberen en die te gebruiken als trainingsgegevens die het neurale netwerk moet analyseren – is nuttig, zegt hij.

Maar “voetballende robots zijn niet het einddoel”, zegt teamlid Tuomas Haarnoja.

“Het doel van dit werk is niet om mensachtige robots te produceren die binnenkort in de Premier League zullen spelen”, zegt Aitken, “maar eerder om te begrijpen hoe we snel complexe robotvaardigheden kunnen opbouwen, met behulp van synthetische trainingsmethodologieën om vaardigheden op te bouwen die kunnen worden verbeterd. snel en, nog belangrijker, robuust, overgebracht naar echt werkende toepassingen.”

Onderwerpen: