Une nouvelle méthode permet aux robots d’apprendre dans la nature

par Houssen Moshinaly · 22 juillet 2022

Suivez-nous sur notre page Facebook et notre canal Telegram

Le robot regarda Shikhar Bahl ouvrir la porte du réfrigérateur. Il a enregistré ses mouvements, le balancement de la porte, l’emplacement du réfrigérateur et plus encore, analysant ces données et se préparant à imiter ce que Bahl avait fait.

Il a échoué au début, manquant complètement la poignée à certains moments, la saisissant au mauvais endroit ou la tirant de manière incorrecte. Mais après quelques heures de pratique, le robot a réussi et a ouvert la porte.

“L’imitation est un excellent moyen d’apprendre”, a déclaré Bahl, titulaire d’un doctorat. étudiant au Robotics Institute (RI) de la School of Computer Science de l’Université Carnegie Mellon. “Faire en sorte que les robots apprennent en observant directement les humains reste un problème non résolu sur le terrain, mais ce travail franchit une étape importante en permettant cette capacité.”

Bahl a travaillé avec Deepak Pathak et Abhinav Gupta, tous deux membres du corps professoral du RI, pour développer une nouvelle méthode d’apprentissage pour les robots appelée WHIRL, abréviation de In-the-Wild Human Imitating Robot Learning. WHIRL est un algorithme efficace pour l’imitation visuelle unique. Il peut apprendre directement des vidéos d’interaction humaine et généraliser ces informations à de nouvelles tâches, ce qui rend les robots bien adaptés à l’apprentissage des tâches ménagères. Les gens effectuent constamment diverses tâches chez eux. Avec WHIRL, un robot peut observer ces tâches et rassembler les données vidéo dont il a besoin pour éventuellement déterminer comment effectuer le travail lui-même.

L’équipe a ajouté une caméra et son logiciel à un robot prêt à l’emploi, et il a appris à effectuer plus de 20 tâches – de l’ouverture et de la fermeture des appareils, des portes d’armoires et des tiroirs à la mise d’un couvercle sur une casserole, en poussant un chaise et même sortir un sac poubelle de la poubelle. À chaque fois, le robot a regardé un humain terminer la tâche une fois, puis s’est entraîné et a appris à accomplir la tâche par lui-même. L’équipe a présenté ses recherches ce mois-ci lors de la conférence Robotics: Science and Systems à New York.

“Ce travail présente un moyen d’introduire des robots dans la maison”, a déclaré Pathak, professeur adjoint au RI et membre de l’équipe. “Au lieu d’attendre que les robots soient programmés ou formés pour accomplir avec succès différentes tâches avant de les déployer dans les maisons des gens, cette technologie nous permet de déployer les robots et de leur apprendre à accomplir des tâches, tout en s’adaptant à leur environnement et en améliorant uniquement en regardant.”

Les méthodes actuelles d’enseignement d’une tâche à un robot reposent généralement sur l’apprentissage par imitation ou par renforcement. Dans l’apprentissage par imitation, les humains font fonctionner manuellement un robot pour lui apprendre à accomplir une tâche. Ce processus doit être répété plusieurs fois pour une seule tâche avant que le robot n’apprenne. Dans l’apprentissage par renforcement, le robot est généralement formé sur des millions d’exemples en simulation, puis on lui demande d’adapter cette formation au monde réel.

Les deux modèles d’apprentissage fonctionnent bien lorsqu’ils enseignent à un robot une seule tâche dans un environnement structuré, mais ils sont difficiles à mettre à l’échelle et à déployer. WHIRL peut apprendre de n’importe quelle vidéo d’un humain effectuant une tâche. Il est facilement évolutif, ne se limite pas à une tâche spécifique et peut fonctionner dans des environnements domestiques réalistes. L’équipe travaille même sur une version de WHIRL formée en regardant des vidéos d’interaction humaine sur YouTube et Flickr.

Les progrès de la vision par ordinateur ont rendu le travail possible. Grâce à des modèles formés sur des données Internet, les ordinateurs peuvent désormais comprendre et modéliser le mouvement en 3D. L’équipe a utilisé ces modèles pour comprendre le mouvement humain, facilitant la formation WHIRL.

Avec WHIRL, un robot peut accomplir des tâches dans son environnement naturel. Les appareils, les portes, les tiroirs, les couvercles, les chaises et le sac poubelle n’ont pas été modifiés ou manipulés pour s’adapter au robot. Les premières tentatives du robot pour une tâche se sont soldées par un échec, mais une fois qu’il a eu quelques succès, il a rapidement compris comment l’accomplir et l’a maîtrisée. Bien que le robot puisse ne pas accomplir la tâche avec les mêmes mouvements qu’un humain, ce n’est pas le but. Les humains et les robots ont des parties différentes et ils se déplacent différemment. Ce qui compte, c’est que le résultat final soit le même. La porte est ouverte. L’interrupteur est éteint. Le robinet est ouvert.

“Pour faire évoluer la robotique dans la nature, les données doivent être fiables et stables, et les robots doivent s’améliorer dans leur environnement en s’exerçant par eux-mêmes”, a déclaré Pathak.

Source de l’histoire :

Matériaux fourni par L’université de Carnegie Mellon. Original écrit par Aaron Aupperlee. Remarque : Le contenu peut être modifié pour le style et la longueur.