De robotrace voedt de strijd om trainingsgegevens

“Veel mensen proberen erachter te komen wat de volgende big data-bron is”, zegt Pras Velagapudi, chief technology officer van Agility Robotics, dat een mensachtige robot maakt die in magazijnen werkt voor klanten, waaronder Amazon. De antwoorden op de vraag van Velagapudi zullen helpen bepalen waar de machines van morgen in zullen uitblinken en welke rol ze kunnen vervullen in onze huizen en werkplekken.

Basisinformatie over trainen

Om te begrijpen hoe robotici data kopen, moet je je een slagerij voorstellen. Er zijn premium, dure stukken klaar om te koken. Er zijn eenvoudige, alledaagse voedingsmiddelen. En dan is er nog het geval van garnituren en steaks die achterin op de loer liggen, waarvoor een creatieve chef-kok nodig is om er iets heerlijks van te maken. Ze zijn allemaal bruikbaar, maar ze zijn niet allemaal gelijk.

Als u wilt ervaren hoe primaire gegevens er voor robots uitzien, kunt u de methoden van het Toyota Research Institute (TRI) overwegen. Midden in een uitgestrekt laboratorium in Cambridge, Massachusetts, uitgerust met robotarmen, computers en een willekeurig assortiment alledaagse voorwerpen zoals vuilnisbakken en eierkloppers, leren onderzoekers robots nieuwe taken via teleoperatie, waardoor zogenaamde demonstratiegegevens worden gecreëerd. Een mens kan bijvoorbeeld een robotarm gebruiken om een ​​pannenkoek 300 keer per middag om te draaien.

Het model verwerkt die gegevens ‘s nachts, en vaak kan de robot de taak de volgende ochtend vaak zelf voltooien, zegt TRI. Omdat demonstraties veel herhalingen van dezelfde taak laten zien, creëert teleoperatie rijke, nauwkeurig gelabelde gegevens die robots helpen nieuwe taken goed uit te voeren.

Het probleem is dat het genereren van dergelijke gegevens jaren duurt en wordt beperkt door het aantal dure robots dat je je kunt veroorloven. Om goedkoper en efficiënter hoogwaardige trainingsgegevens te creëren, heeft Shuran Song, hoofd van het Robotics and Embody Artificial Intelligence Laboratory aan de Stanford University, een apparaat ontworpen dat handiger met je handen kan worden gebruikt en tegen een fractie van de kosten is gemaakt. Het is in wezen een lichtgewicht plastic grijper en kan gegevens verzamelen terwijl u hem gebruikt voor dagelijkse activiteiten zoals het kraken van een ei of het dekken van de tafel. De gegevens kunnen vervolgens worden gebruikt om robots te trainen om deze taken na te bootsen. Het gebruik van eenvoudigere apparaten als deze zou het gegevensverzamelingsproces kunnen versnellen.

Open source-inspanningen

Robotici zijn onlangs overgestapt op een andere methode om meer teleoperatiegegevens te verkrijgen: door met elkaar te delen wat ze hebben verzameld, waardoor ze het moeizame proces van het zelf creëren van de datasets kunnen besparen.

De Distributed Robot Interaction Dataset (DROID), die vorige maand werd uitgebracht, is gemaakt door onderzoekers van 13 instellingen, waaronder bedrijven als Google DeepMind en topuniversiteiten als Stanford en Carnegie Mellon. Het bevat 350 uur aan gegevens die zijn gegenereerd door mensen die taken uitvoeren variërend van het sluiten van het wafelijzer tot het schoonmaken van de tafel. Omdat de gegevens zijn verzameld met behulp van hardware die gebruikelijk is in de wereld van de robotica, kunnen onderzoekers deze gebruiken om AI-modellen te maken en die modellen vervolgens te testen op apparatuur die ze al hebben.

De inspanning bouwt voort op het succes van de Open X-Embodiment Collaboration, een soortgelijk Google DeepMind-project dat gegevens verzamelde over 527 vaardigheden, verzameld uit verschillende hardware. De dataset heeft geholpen bij het bouwen van het RT-X-model van Google DeepMind, dat tekstinstructies (bijvoorbeeld ‘Beweeg de appel links van het frisdrankblikje’) kan omzetten in fysieke bewegingen.