1. Actus & Agenda
  2. FR
  3. @Presse
  4. Communiqués de presse
  5. Recherche

La Robotique neuro-évolutive : un écart entre la simulation et la réalité

Publié le 13 juillet 2021 Mis à jour le 16 juillet 2021

Publication dans Nature Communication : La robotique neuro-évolutive est une approche pour réaliser des comportements collectifs pour des essaims de robots. Une étude comparative, produite par Mauro Birattari et son équipe du centre de recherche IRIDIA - Université libre de Bruxelles-, des méthodes neuro-évolutives les plus populaires, montre que le logiciel de commande produit par la plupart des méthodes analysées donne de bons résultats en simulation. Malheureusement, dans les expériences avec des robots réels, toutes les différences ont été pratiquement effacées et tous les logiciels de commande produits par les différentes méthodes ont donné des résultats insatisfaisants. Cela indique clairement que le véritable problème que la robotique en essaim neuro-évolutive doit résoudre est le problème dit de l'écart de réalité.

La robotique neuro-évolutive est une approche attractive pour réaliser des comportements collectifs pour des essaims de robots. Malgré le grand nombre d'études qui lui ont été consacrées et bien que de nombreuses méthodes et idées aient été proposées, les évaluations empiriques et les analyses comparatives sont rares.

Une publication parue dans la revue Nature Communication, produite par Mauro Birattari et son équipe du centre de recherche IRIDIA, École polytechnique de Bruxelles, Université libre de Bruxelles, compare certaines des méthodes neuro-évolutives les plus populaires et les plus avancées pour la conception hors ligne d'essaims de robots.

« Concrètement, ces méthodes pourraient permettre le développement du comportement d'un robot humanoïde, mais la robotique neuro-évolutive n'est pas encore habituellement adoptée dans des applications du monde réel, » explique Mauro Birattari.


Toutes ces méthodes utilisent des algorithmes évolutifs pour générer un réseau de neurones qui contrôle les robots, c'est-à-dire un réseau de neurone qui prend en entrée les données des capteurs et commandes les actionneurs en sortie. Ces méthodes utilisent des simulations sur ordinateur pour générer un réseau de neurone approprié à la mission spécifique que les robots doivent accomplir. Une fois le réseau de neurone généré (en simulation), il est installé sur les robots physiques et déployé dans l’environnement cible.

En comparant les différentes méthodes, les chercheurs ont observé une sorte de « sur-ajustement » : le processus de conception se spécialise trop sur l'environnement de simulation, et le réseau de neurone produit ne parvient pas à « généraliser » au monde réel. Ce problème provient de l’écart de réalité, c’est à dire la différence entre la réalité et le simulateur utilisé dans le processus de conception. Bien que le simulateur soit assez précis, les différences sont inévitables.

« Par exemple, si les robots doivent faire des allers-retours entre deux zones, une solution que le processus évolutif pourrait trouver en simulation est de produire un réseau de neurone qui fait se déplacer le robot le long d'une trajectoire circulaire qui touche les deux zones. Cette solution est très élégante et fonctionne très efficacement en simulation. Pourtant, portée sur les robots réels, cette solution échouerait lamentablement : par exemple, il suffit que le diamètre réel des (de l'une des) roues des robots diffère légèrement de la valeur nominale pour que le rayon de la trajectoire soit différent ; la trajectoire ne passera plus par les deux zones données comme souhaité et comme prévu par la simulation, » illustre Mauro Birattari.

La solution Chocolat


Bien que contre-intuitive, la solution semble être de réduire la « puissance » de la méthode de conception : adopter une méthode qui peut produire une gamme limitée de comportements. Cela signifie clairement que l’on devra accepter d'obtenir en simulation des résultats moins bons. Cette méthode ne sera pas aussi performante en simulation qu'une méthode « puissante » car elle ne pourra pas exploiter toutes les caractéristiques du simulateur ; pourtant, le résultat sera plus général, moins spécialisé au simulateur et donc plus susceptible de bien généraliser à la réalité. Plus c'est simple, mieux c'est !

La méthode Chocolat semble une bonne illustration de cette idée. Chocolat est une méthode que les chercheurs du Centre IRIDIA ont proposée il y a quelques années et qui n'appartient pas à la robotique neuro-évolutive mais qui, de manière similaire à la neuro-évolution, génère automatiquement un logiciel de contrôle pour les robots, dans les mêmes conditions. Chocolat opère sur des modules logiciels préexistants qui sont des comportements de bas niveau (par exemple, je vais dans la direction de la lumière, je m'arrête, je m'éloigne des pairs perçus...) et des conditions pour passer d'un comportement de bas niveau à un autre (par exemple, je suis entouré de pairs, la couleur du sol sur lequel je me trouve est noire...).

Au lieu de jouer avec un réseau de neurone très puissant et capable de produire un large éventail de comportements, Chocolat joue avec des blocs de construction prédéfinis qui sont (comparativement) beaucoup plus « grossiers ». L'hypothèse de travail est qu'en procédant ainsi, les risques de « sur-ajustement » seront réduits.
 
Contact scientifique

Mauro Birattari

IRIDIA – Institut de Recherches Interdisciplinaires et de Développements en Intelligence Artificielle

Université libre de Bruxelles

mauro.birattari@ulb.be

Contact
Communication Recherche : com.recherche@ulb.be