La moelle épinière virtuelle est continuellement optimisée


  • FrançaisFrançais



  • Une girafe ou un poulain nouveau-né doit apprendre à marcher sur ses pattes aussi vite que possible pour éviter les prédateurs. Les animaux naissent avec des réseaux de coordination musculaire situés dans leur moelle épinière. Cependant, apprendre la coordination précise des muscles et des tendons des jambes prend un certain temps. Au départ, les bébés animaux dépendent fortement des réflexes de la moelle épinière câblés. Bien qu’un peu plus basiques, les réflexes de contrôle moteur aident l’animal à éviter de tomber et de se blesser lors de ses premières tentatives de marche. Le contrôle musculaire suivant, plus poussé et plus précis, doit être pratiqué jusqu’à ce que le système nerveux soit bien adapté aux muscles et tendons des pattes du jeune animal. Fini les trébuchements incontrôlés, le jeune animal peut maintenant suivre les adultes.

    Des chercheurs de l’Institut Max Planck pour les systèmes intelligents (MPI-IS) à Stuttgart ont mené une étude de recherche pour découvrir comment les animaux apprennent à marcher et à apprendre en trébuchant. Ils ont construit un robot à quatre pattes de la taille d’un chien, qui les a aidés à comprendre les détails.

    « En tant qu’ingénieurs et roboticiens, nous avons cherché la réponse en construisant un robot doté de réflexes comme un animal et apprenant de ses erreurs », explique Felix Ruppert, ancien doctorant du groupe de recherche Dynamic Locomotion au MPI-IS. « Si un animal trébuche, est-ce une erreur ? Pas si cela se produit une fois. Mais s’il trébuche fréquemment, cela nous donne une mesure de la façon dont le robot marche. »

    Félix Ruppert est le premier auteur de « Apprentissage de la correspondance plastique de la dynamique du robot dans les générateurs de motifs centraux en boucle fermée« , qui sera publié le 18 juillet 2022 dans la revue Nature Machine Intelligence.

    L’algorithme d’apprentissage optimise la moelle épinière virtuelle

    Après avoir appris à marcher en seulement une heure, le robot de Ruppert fait bon usage de la mécanique complexe de ses jambes. Un algorithme d’optimisation bayésien guide l’apprentissage : les informations mesurées du capteur de pied sont mises en correspondance avec les données cibles de la moelle épinière virtuelle modélisée fonctionnant comme un programme dans l’ordinateur du robot. Le robot apprend à marcher en comparant en permanence les informations de capteur envoyées et attendues, en exécutant des boucles réflexes et en adaptant ses modèles de contrôle moteur.

    L’algorithme d’apprentissage adapte les paramètres de contrôle d’un Central Pattern Generator (CPG). Chez les humains et les animaux, ces générateurs de motifs centraux sont des réseaux de neurones dans la moelle épinière qui produisent des contractions musculaires périodiques sans intervention du cerveau. Les réseaux de générateurs de motifs centraux facilitent la génération de tâches rythmiques telles que la marche, le clignement des yeux ou la digestion. De plus, les réflexes sont des actions de contrôle moteur involontaires déclenchées par des voies neuronales codées en dur qui relient les capteurs de la jambe à la moelle épinière.

    Tant que le jeune animal marche sur une surface parfaitement plane, les CPG peuvent suffire à contrôler les signaux de mouvement de la moelle épinière. Une petite bosse au sol change cependant la marche. Les réflexes se déclenchent et ajustent les schémas de mouvement pour empêcher l’animal de tomber. Ces changements momentanés dans les signaux de mouvement sont réversibles, ou « élastiques », et les modèles de mouvement reviennent à leur configuration d’origine après la perturbation. Mais si l’animal n’arrête pas de trébucher sur de nombreux cycles de mouvement – malgré des réflexes actifs – alors les schémas de mouvement doivent être réappris et rendus « plastiques », c’est-à-dire irréversibles. Chez l’animal nouveau-né, les CPG ne sont initialement pas encore assez bien ajustés et l’animal trébuche, à la fois sur un terrain plat ou accidenté. Mais l’animal apprend rapidement comment ses CPG et ses réflexes contrôlent les muscles et les tendons des jambes.

    Il en va de même pour le chien-robot de la taille d’un Labrador nommé « Morti ». De plus, le robot optimise ses schémas de déplacement plus rapidement qu’un animal, en une heure environ. Le CPG de Morti est simulé sur un petit ordinateur léger qui contrôle le mouvement des jambes du robot. Cette moelle épinière virtuelle est placée sur le dos du robot quadrupède là où se trouverait la tête. Pendant l’heure qu’il faut au robot pour marcher en douceur, les données des capteurs des pieds du robot sont continuellement comparées à l’atterrissage prévu prévu par le CPG du robot. Si le robot trébuche, l’algorithme d’apprentissage modifie la distance d’oscillation des jambes, la vitesse d’oscillation des jambes et la durée d’une jambe au sol. Le mouvement ajusté affecte également la façon dont le robot peut utiliser sa mécanique de jambe conforme. Lors de l’apprentissage, le CPG envoie des signaux moteurs adaptés pour que le robot trébuche désormais moins et optimise sa marche. Dans ce cadre, la moelle épinière virtuelle n’a aucune connaissance explicite sur la conception de la jambe du robot, ses moteurs et ses ressorts. Ne connaissant rien à la physique de la machine, il lui manque un « modèle » de robot.

    « Notre robot est pratiquement « né » sans rien savoir de l’anatomie de ses jambes ou de leur fonctionnement », explique Ruppert. « Le CPG ressemble à une intelligence de marche automatique intégrée que la nature fournit et que nous avons transférée au robot. L’ordinateur produit des signaux qui contrôlent les moteurs des jambes, et le robot marche et trébuche initialement. Les données remontent des capteurs vers le moelle épinière virtuelle où les données du capteur et du CPG sont comparées Si les données du capteur ne correspondent pas aux données attendues, l’algorithme d’apprentissage modifie le comportement de marche jusqu’à ce que le robot marche bien et sans trébucher Changer la sortie CPG tout en gardant les réflexes actifs et en surveillant le le trébuchement du robot est un élément central du processus d’apprentissage. »

    Commande de chien robot économe en énergie

    L’ordinateur de Morti ne consomme que cinq watts d’énergie lorsqu’il marche. Les robots quadrupèdes industriels de fabricants renommés, qui ont appris à fonctionner à l’aide de contrôleurs complexes, sont beaucoup plus gourmands en énergie. Leurs contrôleurs sont codés avec la connaissance de la masse exacte du robot et de la géométrie du corps – en utilisant un modèle du robot. Ils consomment généralement plusieurs dizaines, jusqu’à plusieurs centaines de watts de puissance. Les deux types de robots fonctionnent de manière dynamique et efficace, mais la consommation d’énergie de calcul est bien inférieure dans le modèle de Stuttgart. Il fournit également des informations importantes sur l’anatomie animale.

    « Nous ne pouvons pas facilement rechercher la moelle épinière d’un animal vivant. Mais nous pouvons en modéliser un dans le robot », explique Alexander Badri-Spröwitz, qui a co-écrit la publication avec Ruppert et dirige le Dynamic Locomotion Research Group. « Nous savons que ces CPG existent chez de nombreux animaux. Nous savons que les réflexes sont intégrés ; mais comment combiner les deux pour que les animaux apprennent des mouvements avec des réflexes et des CPG ? Il s’agit d’une recherche fondamentale à l’intersection entre la robotique et la biologie. Le modèle robotique donne nous répondons à des questions auxquelles la biologie seule ne peut pas répondre. »

    N'oubliez pas de voter pour cet article !
    1 étoile2 étoiles3 étoiles4 étoiles5 étoiles (No Ratings Yet)
    Loading...
    mm

    La Rédaction

    L'équipe rédactionnelle

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée.