Grijper leert ... door vallen en opstaan

Dec 26, 2019

Geïnspireerd door de menselijke hand heeft de LearningGripper vier vingers. Met behulp van machine learning software kan deze grijper een complexe actie beheersen, zoals het oppakken en oriënteren van een artikel. De basisposities van de vingers en de feedbackfunctie van de omgeving moeten vooraf worden bepaald; de grijper leert alle andere bewegingsreeksen met vallen en opstaan.

De taak van de LearningGripper was, zoals afgebeeld, om de bal te draaien totdat het logo bovenaan staat. In het begin bewoog de grijper de bal willekeurig. Een positiesensor in de bal gaf feedback over hoe ver het logo verwijderd was van de "handpalm" van de grijper. De LearningGripper ontving een beloning op basis van een puntensysteem; punten worden verwerkt in de machine learning software. Na verloop van tijd ontwikkelde de software een bewegingsstrategie en de grijper leerde welke actie op een bepaald punt moest worden ondernomen. Het verandert zijn motieven om zoveel mogelijk positieve feedback te ontvangen en vindt eindelijk een betrouwbare oplossing voor zijn taak. Als de strategie van de ene grijper wordt overgedragen op de andere, gebruikt de tweede grijper die als kennisbasis om zijn eigen strategie efficiënter te leren.

De LearningGripper laat zien hoe systemen in de toekomst complexe taken autonoom kunnen oplossen zonder complexe programmering. Zelflerende systemen zoals de LearningGripper kunnen op een productielijn worden geïnstalleerd en vervolgens hun gedrag onafhankelijk laten optimaliseren