Gripper apprend… par essais et erreurs

Dec 26, 2019

Inspiré par la main humaine, le LearningGripper a quatre doigts. Avec l'aide d'un logiciel d'apprentissage automatique, cette pince peut maîtriser une action complexe comme ramasser et orienter un article. Les positions de base des doigts et la fonction de rétroaction de l'environnement doivent être définies à l'avance; le préhenseur apprend toutes les autres séquences de mouvement par essais et erreurs.

La tâche du LearningGripper, comme illustré, était de tourner la balle jusqu'à ce que le logo soit en haut. Au début, le préhenseur a déplacé la balle au hasard. Un capteur de position dans le ballon a fourni une rétroaction sur la distance entre le logo et la «paume» de la pince. Le LearningGripper a reçu une récompense basée sur un système de points; les points sont traités dans le logiciel d'apprentissage automatique. Au fil du temps, le logiciel a développé une stratégie de mouvement et le préhenseur a appris quelles mesures prendre à un moment donné. Il modifie ses mouvements pour recevoir autant de retours positifs que possible et trouve enfin une solution fiable à sa tâche. Si la stratégie d'un préhenseur est transférée à un autre, le deuxième préhenseur l'utilise comme base de connaissances pour apprendre plus efficacement sa propre stratégie.

Le LearningGripper montre comment les systèmes à l'avenir seront en mesure de résoudre des tâches complexes de manière autonome sans programmation complexe. Des systèmes d'auto-apprentissage tels que le LearningGripper pourraient être installés sur une ligne de production et ensuite autorisés à optimiser leur comportement de manière indépendante