Multi-Robot Coordination Research Papers

From Worst Case to Conditional Frontiers in Reinforcement Learning

by Computer Science & Information Technology (CS & IT) Computer Science Conference Proceedings (CSCP)

2026

We study how fundamental statistical limits in reinforcement learning change when multiple real-world challenges interact. Focusing on sample inefficiency, nonstationarity, partial observability, and high-dimensional observations, we... more

descriptionView Paper arrow_downwardDownload

A Mechanism for Dynamic Coordination of Multiple Robots

by Mario Campos

2026

In this paper, we present a mechanism for coordinating multiple robots in the execution of cooperative tasks. The basic idea in the paper is to assign to each robot in the team, a role that determines its actions during the cooperation.... more

descriptionView Paper arrow_downwardDownload

Experimental validation of a trajectory tracking controller for a two-wheeled mobile robot

by IAES Journals

2026, IAES International Journal of Robotics and Automation (IJRA)

One of the most important and challenging problems of any kind of autonomous mobile robot is the ability to accurately control its onboard actuators, enabling it to fulfill a specified task. In the case of a two-wheeled mobile robot, this... more

descriptionView Paper arrow_downwardDownload

Analysis of the Factors Affecting the Decision Making Process of Recruitment and Selection of Strategic Positions

by Felipe Rojas

2026

This paper presents the results of an exploratory study that analyzes the main factors of the decision making process of recruitment and selection of strategic positions for companies located in Santiago of Chile, in the Metropolitan... more

descriptionView Paper arrow_downwardDownload

Multi-robot Cooperative Systems for Exploration: Advances in Dealing with Constrained Communication Environments

by Pablo Monzon

2025, 2016 XIII Latin American Robotics Symposium and IV Brazilian Robotics Symposium (LARS/SBR)

In the present document, the authors introduce the Cooperative Exploration problem as well as the most relevant approaches in order to show the most common drawbacks and opportunities to improve the state of art solutions. Subsequently, a... more

descriptionView Paper arrow_downwardDownload

Efficient ADD operations for point-based algorithms

by Guy Shani

2025, International Conference on Automated Planning and Scheduling

During the past few years, point-based POMDP solvers have gradually scaled up to handle medium sized domains through better selection of the set of points and efficient backup methods. Point-based research has focused on flat, explicit... more

descriptionView Paper arrow_downwardDownload

Fair and efficient multi-agent routing for cooperative and autonomous agricultural fleets with implements

by Marin Lujak and

2025, Computers and Operations Research

The growing use of autonomous tractor fleets with detachable implements presents complex logistical challenges in agriculture. Current systems often rely on simple heuristics and avoid implement swapping, limiting efficiency. A central... more

descriptionView Paper arrow_downwardDownload

Point-based Incremental Pruning Heuristic for Solving Finite-Horizon {DEC-POMDP}s

by jilles steeve dibangoye

2025, HAL (Le Centre pour la Communication Scientifique Directe)

Recent scaling up of decentralized partially observable Markov decision process (DEC-POMDP) solvers towards realistic applications is mainly due to approximate methods. Of this family, MEMORY BOUNDED DYNAMIC PROGRAMMING (MBDP), which... more

descriptionView Paper arrow_downwardDownload

STP: Skills, tactics, and plays for multi-robot control in adversarial environments

by Manuela Veloso

2025, Proceedings of the Institution of Mechanical Engineers, Part I: Journal of Systems and Control Engineering

In an adversarial multi-robot task, such as playing robot soccer, decisions for team and single-robot behaviour must be made quickly to take advantage of short-term fortuitous events. When no such opportunities exist, the team must... more

descriptionView Paper arrow_downwardDownload

Balanced multi-robot exploration through a global optimization strategy

by Miguel Angel Garcia

2025, Journal of physical agents

This paper reviews the state of the art in coordinated multi-robot exploration and proposes a new exploration objective based on a practical scenery, reducing the difference of waiting time among different regions of a workspace, which... more

descriptionView Paper arrow_downwardDownload

Balanced multi-robot exploration through a global optimization strategy

by Miguel Angel Garcia

2025, Journal of Physical Agents (JoPha)

This paper reviews the state of the art in coordinated multi-robot exploration and proposes a new exploration objective based on a practical scenery, reducing the difference of waiting time among different regions of a workspace, which... more

descriptionView Paper arrow_downwardDownload

Quasi Deterministic POMDPs and DecPOMDPs (Extended Abstract)

by Brahim Chaib-draa

2024

In this paper, we study a particular subclass of partially observable models, called quasi-deterministic partially observable Markov decision processes (QDET-POMDPs), characterized by deterministic transitions and stochastic observations.... more

descriptionView Paper arrow_downwardDownload

Planning in Decentralized POMDPs with Predictive Policy Representations

by Brahim Chaib-draa

2024

We discuss the problem of policy representation in stochastic and partially observable systems, and address the case where the policy is a hidden parameter of the planning problem. We propose an adaptation of the Predictive State... more

descriptionView Paper arrow_downwardDownload

Searching and tracking people with cooperative mobile robots

by Anais Garrell Zulueta

2024, Autonomous Robots

Social robots should be able to search and track people in order to help them. In this paper we present two different techniques for coordinated multi-robot teams for searching and tracking people. A probability map (belief) of a target... more

descriptionView Paper arrow_downwardDownload

MinERS: team formation among heterogeneous agents

by ernesto nunes

2024

In order for multi-robot systems to efficiently assist in saving lives and infrastructures in the RoboCup Rescue Simulation, any strategy designed to allocate tasks and coordinate agents must adapt to the dynamic nature of the... more

descriptionView Paper arrow_downwardDownload

An Autonomous Exploration Strategy for Cooperative Mobile Robots

by Ayman Y Al-Rawashdeh

2024, Journal of Software Engineering and Applications

Frontier-based exploration methods are efficient for multi-robot exploration systems. In this paper, enhanced frontier-based techniques are used with team of cooperating mobile robots to explore unknown environment. The aim of the... more

Figure 2. A completed map with three robots ant trajectories. Figure 1. The map with three robots during the exploration process.

Figure 4. Time steps vs number of robots forenvironment in Figure 3. Figure 3. Sequential steps of environment exploration.

Figure 5. Time steps vs number of robots for obstacle-free environment.

Figure 6. Implementation of A* algorithm to explore the environment.

descriptionView Paper arrow_downwardDownload

A Unified Formation Control Scheme with a Single or Multiple Leaders

by Nathan Sorensen

2024, 2007 American Control Conference

In the exploration and implementation of formation control schemes, bandwidth limitations and communication breakdown form a barrier to large scale formation control applications. The limitations of current formation control strategies... more

descriptionView Paper arrow_downwardDownload

Path Planning and Collision Avoidance Regime for a Multi-Agent System in Industrial Robotics

by Mile Stankovski

2024, Machines. Technologies. Materials.

Industry 4.0 which creates "smart factories" present a recent trend in development. The area represents a merge of cyberphysical systems and Internet of Things, which aims to improve manufacturing technologies. Industry 4.0 strives to... more

Industry 4.0 which creates "smart factories" present a recent trend in development. The area represents a merge of cyberphysical systems and Internet of Things, which aims to improve manufacturing technologies. Industry 4.0 strives to boost the algorithms and technologies used in industrial processes during the production processes, process preparations, and products delivery. Our intention is to improve the robotics transport system in factory floor. There are a lot of different research approaches in this area for further improvement. Our approach is to deal with multi-agent systems control, because of the great potential it has in practical applications in industrial robotics. The strive for minimizing the work time and maximizing the efficiency can be satisfied through the usage of multiple coordinated agents to achieve the end goal. The use of Automated Guided Vehicles (AGVs), combined with concepts for task planning of multiple agents broadened during the late 20th century. In this paper, the multi-agent system consists of several mobile robots, in other words platforms, which need to transport materials in a workhouse. The goal of each mobile platform is to carry the specified object to a set position. These appointed goals are not predefined and can be changed according to the needs of the user. Working in a dynamic environment, numerous agents with different tasks to complete can be exposed to many obstacles which may be the cause of accidents. For this reason, a careful path planning is required in such environments. The suggested path planning algorithm for this system is A*. A* is a fast path finder, which can navigate quite well in a planar environment, but it is not favorable for dynamical settings. Therefore, a combination of the A* algorithm with a collision avoidance method is proposed for overcoming these difficulties. By doing this, the A* algorithm is expanded to work in dynamical situations and can assure the convergence of any agent towards their goal. This fusion of both, the path finding algorithm and the collision avoidance method, can aid the cooperation of the agents and improve the efficiency of the system as a whole.

descriptionView Paper arrow_downwardDownload

Formation control of nonholonomic mobile robots based on feedback linearization and observers

by K220008 Rukhsar Ali

2024

Most existing formation control approaches are based on the assumption that the global/relative position and/or velocity measurements of mobile robots are directly available. To extend the application domain and to improve the formation... more

Fig. 4. Simulation results for the controller (18) and (20): formation tracking errors in the image space. (a) A7ro;. (b) A731. (c) Azry3. (d) A753. Fig. 5. Simulation results for the controller (18) and (20): formation tracking errors in the configuration space. (a) Art. (b) Ar}. (c) Ar}. (d) Are.

Fig. 8. Simulation results corresponding to the controller given by (31), (35) (37), and (39): formation tracking errors in the configuration space. (a) Ar? (b) Ar?. (c) Ar}. @) Ar}. Fig. 7. Simulation results corresponding to the controller given by (31), (35), (37), and (39): formation tracking errors in the image space. (a) A7ro,. (b) Amr31. (c) Azry3. (d) Azt53.

Fig. 1. _ Leader—follower setup in the configuration space. paper. To the best of our knowledge, the proposed formation control scheme is the first one that can solve the formation tracking control problem of mobile robots with onboard per- spective cameras, without measurement or estimation of the global/relative position, and without measurement of the leader velocity.

By substituting (13) into (14) and then rearranging the terms, it is not difficult to derive that which is called the leader—follower formation kinematics in the image space for the case that the perspective camera is used as the onboard sensor of the follower robot.

Fig. 9. Simulation results corresponding to the controller given by (31), (35), (37), and (39): estimation errors of the virtual leader linear velocities 7; and 3. (a) 4/2, 71/3. (b) V3 /4, 73/5.

Fig. 12. Experimental results for the controller (18) and (20). (a) Formation tracking errors in the image space. (b) Formation tracking errors in the con- figuration space. (c) Real and estimated leader linear velocities. (d) Estimation error of the leader linear velocity. (e) Trajectories of the leader and the follower robots.

Fig. 13. Experimental results for the controller given by (31), (35), (37), and (39). (a) Formation tracking errors in the image space. (b) Formation tracking errors in the configuration space. (c) Real and estimated virtual leader linear velocity. (d) Estimation error of the virtual leader linear velocity. (e) Estimation error of the feature height. (f) Trajectories of the leader and the follower robots.

Fig. 6. Simulation results for the controller (18) and (20): estimation errors of the leader linear velocities 1; and v3. (a) 1% /2, 71/3. (b) 13/4, 03/5.

Fig. 10. Simulation results corresponding to the controller given by (31), (35), (37), and (39): estimation errors of the feature heights Z! and Z®. (a) Zr, ZA/3. (b) ZB/4, Z3/5_

Fig.3. Leader—follower relationship between the mobile robots Rj —Rs in the simulations: The mobile robot 2; is the group leader robot, the mobile robots Ry and R3 are the followers of the mobile robot R,, whereas the mobile robots R, and Rs are the followers of the mobile robot R3.

III. FORMATION KINEMATICS IN THE IMAGE SPACE To solve the formation control problem without position in- formation of the mobile robots, the first step is to develop the leader—follower kinematics in the image space. Unlike the works in [34] and [35], which use the omnidirectional camera as the onboard sensor of the follower robot, we employ the perspective camera to avoid the challenging issues in the use of omnidirec- tional cameras. For example, the omnidirectional cameras can exhibit severe nonlinear distortion and accurate calibration of them can be difficult [15]. Although there are some formation control approaches based on perspective cameras [31], [33], [36], the corresponding leader—follower kinematics in the im- age space has not been developed. In this section, we formulate such a formation kinematic model to facilitate the subsequent developments.

descriptionView Paper arrow_downwardDownload

Multiagent Task Allocation in Complementary Teams: A Hunter-and-Gatherer Approach

by Harley R Myler

2024, Complexity

Consider a dynamic task allocation problem, where tasks are unknowingly distributed over an environment. is paper considers each task comprising two sequential subtasks: detection and completion, where each subtask can only be carried out... more

descriptionView Paper arrow_downwardDownload

Architecture de contrôle distribuée pour robot mobile autonome: principes, conception et applications

by Sara Fleury

2024

Résumé/Abstract Un robot mobile autonome doit réaliser des tâches non répétitives dans un environnement imparfaitement connu et non-coopératif, voire hostile. Dans ce contexte les missions attribuées au robot ne peuvent être définies de... more

> La localisation du robot La localisation du robot se déduit directement de celle du motif et de la transformation constante Tyr qui lie les deux repéres. Si le robot, et donc le motif, évolue dans un plan horizontal, alors le plan IT est invariant et la localisation 2D suffit a caractériser la position du robot. > La localisation du robot La localisation du robot se déduit directement de celle du

wsee au moyen de Uinterface graphique GrHe. Fic. 1.17 — Localisation extéroceptive: La configuration estimée du robot et les incerti- tudes en position et en orientation sont visua- lisées sur la premiére image. Pour recaler le robot on procéde d’abord a@ une acquisition de points par coupe laser (tele3dAcqui2d). Des segments sont alors extraits de cette image de points. L’appariement de ces segments avec le modéle préexistant de l'environnement permet de recaler le robot et de réduire Uincertitude sur cette position. Le modéle sera lui-méme affiné. Cette séquence erécutée sur le robot a été visua- lisée au moyen de l’interface graphique GrHe.

Nous présentons ici rapidement ces trois nivaux. On trouvera un exemple de mission et ses différents stades d’affinement dans [Alami 95a]. Les termes d’une mission précisent les Chapitre 4. STRADA: Une application multi-robots

4.2.5 Le module MP Le module MP est un planificateur de chemins qui intégre un planificateur topologique, un planificateur géométrique et un séquenceur multi-robots. Il permet non seulement de déterminer des chemins topologiques et géométriques, mais également de marquer ces chemins par des points de synchronisation qui correspondent soit 4 l’attente d’un événement d’un autre robot (attente d’une ressource), soit 4 ’émission d’un événement vers un autre robot (libération d’une ressource). Le module MP est un planificateur de chemins qui intégre un planificateur topologique, determiner des chemins topologiques et geométriques, mais également de marquer ces chemins

> La planification de trajectoire: La planification de trajectoire a elle-méme requis l'intégration de trois fonctions de traitement distinctes correspondant A différents modes de navigation sélectionnés selon le type de terrain traversé. En effet, la planification 3D est une opération coaiteuse {en temps) qui ne se révéele pas toujours néreseaire: régions adjacentes étiquetées selon leur praticabilité (terrain plat, pentu, accidenté, obstacle, inconnu). La classification du terrain en régions s’opére selon une méthode rapide sur la base d’attributs de l'image de points 3D (densité des points, variance sur l’altitude des points, normale moyenne et sa variance) [Lacroix 95}. Une valeur de confiance dans létiquetage est attribuée 4 chaque région qui permet de lever les ambiguités lors des procédures de fusion, et de guider !a recherche de chemins dans le graphe. La figure 3.3 présente le résultat d’une classification a Vissu de trois perceptions. classification 4 issu de trois perceptions.

4.2. La couche fonctionnelle démarrer ’exécution de la trajectoire si le robot est A Parrét, ou de concaténer la nouvelle tra jectoire a la précédente dans le cas contraire, si possible sans marquer d’arrét. Ainsi, plusieur: instances de la requéte ME_ADD_PATH peuvent étre présentes simultanément, mais seule Pun Ventre elle sera dans la phase principale d’exécution exec. Les activités en instances son maintenues dans l'état start jusqu’a ce que la portion de trajectoire qui précéde se termine L’interruption (par requéte explicite ME_STOP) ou l’echec (e.g. choc arceau, asservissemen' 1éfaillant) d’une telle activité 4 pour conséquence la terminaison des activités en attente. Ce: activités d’exécution séquentialisée nécessitent, aprés une terminaison anormale, un protocol Je re-synchronisation entre le client et le serveur qui est assuré : par la requéte ME_SYNCHRO. Tw. CL LL tg te a . er) . = 7 a demarrer l execution de la trajectoire si le robot est 4 l’arrét, ou de concaténer la nouvelle tra-

2.1. Contréle des mouvements de véhicule non-holonome calcul par retour arriére le long de la trajectoire.

des trois précédents. Le module PLANIF2D est uniquement un serveur. Le module LOCEXT a la particularité de ne pas étre embarqué sur le robot.* Afin d’illustrer le développement et la description formelle d’un module, nous détaillerons plus particuligrement le module LOCO. Une mise en ceuvre d’activités composées sera décrite & l’occasion de la présentation du module PILO, client du module LOCO.

1.2.9 Autres modules Nous avons présenté les modules de base de la couche fonctionnelle d’Hilare2 (figure 1.4 page 83) qui interviennent dans la majorité des expérimentations. D’autres modules ont été développés ou sont en cours de développement. On peut citer un module d@’acquisition d’image vidéo (utilisé sur les robots Junior et Adam), un module pour effectuer des manceuvres de parking trés contraintes qui nécessitent un asservissement relatif aux obstacles segmentés par LOCA2D, des planificateurs de chemins, etc.. On abordera d’autres modules dans les chapitres 3 et 4 qui ont été développés dans le cadre des projets EDEN et STRADA. En particulier, le projet ED] accidentés, d planification EN fait intervenir des acquisitions d’images vidéo, des modélisations de terrains es planifications de chemin “3D”, et le projet STRADA utilise un module de multi-robots. Chapitre 1. Présentation de la couche fonctionnelle d’Hilare2

des données brutes ou peu affinées. Et aux niveaux supérieurs des processus lents de rai- sonnement, tel que le planificateur de taches, utilisent des données affinées essentiellement symboliques. L’architecture compléte comporte six couches qui sont elles-mémes décompo- sées horizontalement en trois parties: perception/modélisation/action ou planification. Cette structuration trés stricte a le mérite d’étre claire mais sa rigidité en fait un systéme parfois difficile 4 adapter au probléme considéré. Cette architecture, sous sa forme plus récente RSC, a été intégrée dans des applications variées [Albus 95]. sces horizontalement en trols parties: perception/modelisation/action ou planification. Cette

modiner le contenu. On accede directement aux données du poster (a la structure compléte es posters vont permettre de rendre publiques des données statiques volumineuses (le damment du tux de controle. il permet a chaque module d’exporter des données dans des

Les champs communs aux requétes de contréle ne sont. pas redécrits ici. Parmi les champs supplémentaires, seul exec_task est. obligatoire.

> La boucle d’identification/localisation A partir de deux appariements, on déduit une position possible Ty; pour le motif dans le plan II. Il est alors aisé de déterminer si d’autres points du modéle peuvent étre appariés 4 un point de la scéne en appliquant la relation Py = TuynPim (a Vincertitude ¢ prés). Au fur et A mesure que de nouveaux On procéde d’abord A une classification des percepts: chaque bi-point du modéle Mi;, composé des points m,; et m;, constitue une classe caractérisée par sa longueur J; 3 entre les deux points. Si un percept Sx, composé des points s; et s; de la scéne, a une longueur incluse dans Vintervalle {I — ¢,! + ¢], ot € est l'incertitude de mesure de distance entre deux points de la scéne, alors le percept 5, appartient A la classe Mi (Skt € Mij,). ti , Ce .

Cette interface ne s’adressant qu’a la couche fonctionnelle s’utilise indifféremment en simulation ou avec les robots. Au dela d’un outil de mise au point puissant, ce systéme montre que la couche fonctionnelle est, au moyen d’une interface conviviale, directement contrélable par un opérateur. Cette interface ne s’adressant qu’a la couche fonctionnelle s’utilise indifféremment en 11. Lalgorithme de lissage de lignes brisées a été intégré dans le graphique afin d’en visualiser le résultat avant de requérir l’exécution.

d’abscisse curviligne sur la trajectoire.

1.2.4 Le module pilotage PILO 1.2. La couche fonctionnelie d'Hilare2 En présence d’obstacles on ne peut rejoindre une configuration sous la simple impulsion de la loi d’asservissement (requéte locoGoTo). Ce chemin devra étre planifié en prenant en compte les obstacles connus et le robot devra rester sur la voie ainsi tracée ou dans des limites fixées. Afin que l’asservissement puisse effectivement suivre le chemin géomeétrique, la trajec- toire dynamique devra respecter les contraintes cinématiques (équations non-holonomes) et les contraintes dynamiques (limitations en vitesses et en accélération) du véhicule. Ces tra- jectoires sont calculées et exécutées par le module PILO (les algorithmes sont présentés au chapitre suivant). iin presence dobstacles on ne peut rejoindre une configuration sous la simple impulsion

gistrer ou de redéfinir des motifs ou de sélectionner le motif qui doit étre suivi

Chapitre 2. Développement de fonctions pour le déplacement et fa localisation Fig, 2.10 - La trajectoire de consigne et les positions du véhicule selon UVodométrie (sans utilisation du gyroscope) - en traits continus, et selon la caméra - en pointillés,

1.2.3. Le module télémétre laser TELE3D Des données sur l’environnement du robot peuvent étre acquises au moyen d’un télémétre laser et d’un dispositif de balayage & deux axes commandés par le module TELE3D qui permet d’acquérir des images de points 3D. Le rayon laser balaye environnement en site au moyen d’un miroir rotatif, l'ensemble du systéme étant disposé sur une plateforme dont la rotation engendre le balayage azimutal. Les acquisitions sont obtenues au moyen de deux requétes dexécution:

cible, ou soit encore par une activité de suivi de mur A partir de données proximétriques echos, Ces derni¢res pourront elles-mémes étre obtenues & partir de capteurs ultrasons ou d'un télémétre laser.

Lorsqu’une activité fait appel a d’autres fonctions offertes par le systéme, celles-ci pro- duisent 4 leur tour des activités. Ces nouvelles activités sont dites activités filles de Vactivité qui les a créées, elle méme nommée activité mére. Ainsi, l'ensemble des activités présentes 4 un instant donné constitue un arbre d’activités (figure 1.2) représentant l’activité (au sens générique du terme) globale du robot. Notons qu’a la racine de l’arbre nous n’avons pas & proprement parler une activité telle que celles qui sont présentées dans ce paragraphe. I] peut s’agir soit de l’exécutif d’un niveau

Sur le robot, nous souhaitions disposer d’un systéme d’exploitation qui fournisse des fonc- tions temps réel de gestion de taches, de sémaphores, de communication multi-processeurs, etc., avec des temps de réponse et des temps de commutation rapides. Le choix de léquipe RIA du LAAS s’est porté sur le systéme d’exploitation VxWorks, développé par Wind River Systems. VxWorks a été congu dans l’optique de profiter des outils de développement d’UNIX et de la connexion au réseau Ethernet pour bénéficier d’un environnement de développement et de supervision puissant & cdté d’un systéme d’exploitation temps réel performant. Afin de disposer d’un systéme physique ouvert et reconfigurable, |’électronique embarquée est une architecture multi-processeurs & plusieurs bus. Ni san cline nannies a . ‘~ +

Fic. 2.5 - Exemple de chronogramme d’activités. L’activité périodique 1 a démarré immédiatement. L’activité 2, en conflit avec la premiére, est maintenue dans l’état INIT jusqu’d la terminatson effective de l’activité 1. L’activité 2 asynchrone exécute les phases exec.0 puis exec.1 durant lequel elle a requis un service externe. Elle se suspend dans l’at- tente de la réplique qui l’ameénera dans sa phase de terminaison exec.2.

Chapitre 2. Anatomie d’un module Le graphe de controle comporte cing neeuds, correspondant & des états qui ont une durée

Le générateur, illustré par la figure 3.1, se compose de deux éléments: le squelette d’un module générique et un analyseur syntaxique qui analyse la description formelle et produit le module en instanciant le squelette. 3.2.1 Description de G*%M

3. Ces modules ont été développés par différentes personnes: H. Bullata, R. Ferraz de Camargo, M. Herrb, M. Khatib et mci-méme. Pour plus d’informatien concernant les algorithmes on trouvera des références concernant ces travaux au fur et & mesure de la présentation.

transitions prennent également le nom de l’état vers lequel elles aménent. Pour de nombreuses applications on peut dégager quatre phases dans le déroulement d’une activité: une phase d’initialisation, le corps principal de l’exécution, une phase de terminaison et éventuellement une procédure spécifique de terminaison en cas d’échec de la boucle principale. C’est pourquoi nous proposons en standard, dans le cadre de la génération automatique des modules, quatre états d’exécution auxquels nous avons attribué des noms plus explicites que exec.i qui sont respectivement: start, exec, end et fail (figure 2.4). Les transitions prennent également le nom de l’état vers lequel elles aménent. On distingue deux aspects dans le séquencement des codels d’une activité: le ssquencement logique qui définit quel est le prochain codel a exécuter, et le séquencement temporel qui précise instant d’invocation de ce codel.

Les activités sont exécutées par des taches dénommées téches d’exécution qui fournissent le contexte d’exécution des codels. Une tache d’exécution peut étre chargée de plusieurs fonc- tions de traitement et donc d’activités, en particulier si ces activités sont plusieurs instances Les activités sont exécutées par des taches dénommeées téches d’exécution qui fournissent Chapitre 2. Anatomie d'un module

fexecution). La figure 2.1 schématise les fonctions d’un module et son organisation. On distingue le systéme de contréle et les activités contrdélées. Ces deux aspects seron présentés tour 4 tour dans les sections 2.2 “Contrdle d’une activité” et 2.3 “Activité e fonctionnalité” de ce chapitre. Le module est donc structuré en deux parties: le niveat de contréle qui gére les activités en fonction de requétes, et le niveau d’exécution o7 s’exécutent ces activités. Les différents éléments interagissent par le biais de bases de donnée dont les changements d’état sont signifiés par des événements de synchronisation. Les donnée relatives au contréle des activités et & l’état du module et les données relatives aux traitement composent deux bases de données distinctes: la Structure de Données Internes de Contrél ou SDI/c, et la Structure de Données Internes Fonctionnelle ou SDI/f (parfois nommée SD d’exécution). La figure 2.1 schématise les fonctions d’un module et son organisation.

> Déclaration de la requéte d’exécution L’unique requéte d’exécution proposée par le module LOCO est le suivi de consignes: locoTrack. Le nom du poster de consignes est transmis en argument de la requéte (input). La phase d’initialisation d’exécution start vérifie lexistence du poster. La consigne est alors récupérée périodiquement (phase exec). II] ne peut y avoir qu’une instance de cette activité 4 un instant donné (incompat ible_with), une seconde requéte interromprait la premiére et poursuivrait le tracking sur un nouveau poster. Cette activité est un filtre 4 terminaison contrélée: elle se termine soit A la demande d’un client (phase INTER), soit sur une défaillance interne (phase end). Dans l’un ou l’autre cas, le méme codel smoothStopTrack stabilise le robot. Les différents possibilités de défaillance sont exprimées dans le champ fail_msg.

L’architecture proposée est organisée en trois niveaux représentant deux niveaux déci- sionnels au-dessus du niveau fonctionnel. Les deux niveaux supérieurs sont construits selon le paradigme superviseur/planificateur. Le plus haut niveau utilise un planificateur tempo- rel. Le second niveau regoit les taches et les transforme en procédures composées d’actions élémentaires, et supervise l’exécution de ces procédures tout en étant réactif aux événements asynchrones. La planification & ce niveau est un affinement qui utilise des connaissances spécifiques sur la tache ou le domaine.

> Les architectures strictement hiérarchiques. Ces architectures cherchent & concilier décision et réactivité: en partant de ’hypothése que la dynamique du monde décroit avec le niveau d’abstraction, l’architecture NASREM proposée par Albus [Albus 87} est une décom- position hiérarchique selon laquelle chaque tache peut se décomposer en sous-taches qui vont constituer le niveau immédiatement inférieur (figure 2.3 page suivante}. Ainsi, aux niveaux les plus bas se trouvent les traitements rapides tels que les asservissements qui manipulent

Fic, 1.12 — Chronogramme des activités pendant l’exécution d’une trajectoire compleze.

Accés 4 des informations concernant la tache de contréle 0.6 Les macros-commandes d’accés a la SDI/c

3.3.2 Organisation de la couche fonctionnelle Les diferentes fonctionnalités présentées ci-dessus ont été intégrées dans des modules. L: principale difficulté d’un point de vu organisationnel a été de définir les interactions en term: de contréle et de flux de données. Bien qu'ils n’aient pas été produits par G°%M, ces module ont été construits en respectant la structure et le formalisme présentés dans les chapitres _ et 2 de la partie précédente. En particulier, les interactions sont basées sur les protocoles d communication client /serveur et de transfert de données par posters. Ceci nous a permis d produire de fagon quasi automatique les fonctions d’interaction entre les modules et le niveat décisionnel constituant les prémices de G*oM. Ainsi, les services sont requis par le jeu de requétes et des répliques, ct les connexions entre les modules sont dynamiquement établies pa: le niveau décisionnel. Les traitements successivement invoqués lors d’une itération nominal dans le déroulement de la mission, sont les suivants (figure 3.5 page ci-contre): 4 Tm. . .. aan,

III Intégrations et expérimentations D Génération de trajectoires

Le niveau décisionnel doit satisfaire deux fonctions dont les temps de traitement ne sont pas compatibles: le contréle d’exécution des taches et leur planification. En effet, la plani- fication requiert généralement un temps de calcul plus long que la dynamique imposée par le systéme contrdlé. Ainsi, ce niveau est lui-méme structuré en deux parties. Un superviseur qui interagit avec le niveau inférieur, contréle le déroulement des actions et réagit aux événe- ments avec un temps de réaction borné et qui transmet les opérations de planification A un planificateur qui produit les séquences d’actions nécessaires (figure 1.2). > Le planificateur recoit une description de l'état du monde et un objectif; il produit en retour un plan composé de séquences d’actions et de modalités @’exécution. Les modalités d’exécution décrivent les contraintes A respecter durant le déroulement du plan, et les situa- tions 4 surveiller associées 4 des réactions appropriées en cas durgence. Un plan robuste doit en effet envisager les situations non-nominales, et en particulier les situations critiques, et prévoir des réactions adaptées. Les réactions sont des actions réflexes, des variantes prévues du plan ou des requétes de replanification. retour un plan compose de sequences d’actions et de modalités d’exécution. Les modalités Le niveau decisionnel doit satisfaire deux fonctions dont les temps de traitement ne sont

1.2. Les différents niveaux d‘autonomie Fic. 1.1 — L’autonomie d’un robot mobile: les niveaux de réaction et de décision.

L’exécutif intégre les procédures d’interaction avec les modules de la couche fonctionnelle. Pour cela une bibliothéque de procédures C-PRS a été générée au moyen de la version préli- minaire de G'"oM. Ces procédures, également dénommées KA-actions, établissent l’interface entre C-PRS et les fonctions d’émission et de réception des requétes et des répliques associées a chaque module.

1.1.3. Architecture informatique L’architecture informatique d’un robot expérimental doit allier des caractéristiques temps réel, un contexte d’intégration souple et des outils de développement puissants. Elle est orga- nisée en deux domaines distincts, l’un constitué par un ensemble de stations de travail UNIX, Vautre par électronique embarquée du robot. Tun slawsnctenck TIKIT wre et cl, win dk * Je i... lUm HG , oe i L’architecture informatique d’un robot expérimental doit allier des caractéristiques temps Ce principe permet également de procéder a des simulations & un trés bas niveau: la commande des capteurs et des actionneurs, intégré aux fonctions du robot logique, peut étre remplacée par des algorithmes de simulation de commande. La encore, Jes modules pourront étre utilisés tels quels et pourront étre testés intensivement avant d’étre embarqués sur le robot. Les fonctions de simulation seront présentées par la suite. Le robot logique est un ensemble d’interfaces logicielles entre le robot physique et la couche fonctionnelle, qui permet d’abstraire ses modules des aspects matériels des capteurs et des actionneurs commandés. Ce découplage permet de faire évoluer le matériel sans mo- difier les modules et surtout de rendre les modules portables sur différents robots. Ainsi, les modules d’Hilare2 et d’H2bis sont identiques. Les fonctions du robot logique sont décrites dans [Bauzil 92}. 2. Si des fonctions de vision ont été utilisées sur les robots Junior et Hitlaret, elles n’ont pas eu d’application sur le robot Hilare. On présentera par contre une application sur le robot d’extérieur Adam.

Fic. B.1 - Exemple d’organisation pour le développement d’un module. Sur VxWorks le module sera chargé (1d <loco.o) puis lancé (locoModuleInit) sur une carte CPU. La tache de test sera alors chargée (1d <locoEssay.o) et une ou plusieurs de ces taches clientes du module pourront étre lancées (sp locoEssay, 1) sur une ou plusieurs cartes CPU de la machine.

Les coordonnées du centre du cercle réduit étant:

Le module SMC s‘adresse également au module PILO dont il active le mode d’évitement par

Fig. 4.12 — La couche fonctionnelle des robots. Les modules MARTHA sont grisés. localisation s’effectue au moyen de caméras externes grace au module externe LOCEXT

Fig. 4.13 — Le plan de la salle robotique et du couloir d’accés. 4.6. Une expérimentation a trois robots

Les modules LOCO, US et TELE3D interagissent directement avec le robot logique et ne sont clients d’aucun autre module. Les modules PILO, AVOID et LOCA2D utilisent les services e8 huit modules qui font l’objet de cette présentation sont les suivants:

1.2.4 Le module ADS pourra repartir que lorsqu’il n’y aura plus de mouvement dans les environs du robot (PER_ MON_NO_MOVING_OBJECTS). Le module ADS intégre les fonctions spécifiques du robot et des stations de transbordement tels que la prise et la pose de container (par grues) ou les opérations de mise en position et de sortie du véhicule des stations. de sortie du véhicule des stations.

A partir de ce résultat on peut déterminer les valeurs des rayons des roues en exécutant de

Les fonctions générées sont groupées dans la bibliothéque xxxMsgLib. 3.0.5 Prototypes des fonctions d’accés aux posters: B.0.4 Prototypes des requétes: Les fonctions générées sont groupées dans la bibliothéque xxxPosterLib. Prototypes des fonctions d’accés aux posters d’exécution: B.4 Les fonctions des bibliothéques d'interaction

Un exemple trés général de déclaration de SDI/f est donné ci-dessous: Si le module accéde & des services ou des données exportées d’un autre module il devra alors manipuler des structures déja définies par cet autre module?. Les fichiers d’en-téte de déclaration de ces structures communes seront également inclus par la directive #include mais celle-ci devra étre intégrée dans une déclaration “import from identificateur” oi: iden- tificateur est le nom du module serveur,

La supervision et de l’affinement de taches ont été intégrés au moyen de PRS (Procedura Reasoning System) [Georgeff 87] qui fournit un contexte bien adapté pour implanter le: interactions entre la délibération et la réaction. C-PRS (la version de PRS que nous utilisons voir [Ingrand 92b]) propose des outils et des mécanismes pour représenter et exécuter de: plans sous la forme de séquences conditionnelles d’actions invoquées A l’occurrence de but; ou de situations particuliéres. Les principaux composants de PRS sont: une base de donnée: qui contient des faits représentant l’état du systéme et qui est mise & jour automatiquement ? ‘occurrence d’événements; unc bibliothéque de procédures, ou scripts (nommés KA en PRS). qui décrivent des séquences particuliéres d’actions ou de surveillances qui seront invoquées pour satisfaire des buts donnés ou pour réagir 4 certaines situations; un graphe dynamique @intentions (les taches) en cours d’exécution. Les intentions sont des structures dynamique: qui exécutent les procédures sélectionnées selon les buts postés ou les faits présents dans la base de données. Ainsi les mécanismes d’inférence utilisés dans C-PRS sont capables de réagit a de nouveaux événements tout en poursuivant l’exécution des procédures déja actives. La igure 1.4 schématise l’interpréteur de C-PRS. figure 1.4 schématise l’interpréteur de C-PRS. L’exécutif, quant a lui, constitue un niveau purement réactif sans capacité de pianification, Il contréle l’exécution des actions selon des schémas prédéfinis et sélectionnés selon le contexte. Tl est implanté au moyen du systéme A base de régles Kheops (voir [Philippe 89] et §2.1.1.1) qui permet de compiler hors-ligne un ensemble de regles produisant un programme qui consiste en une recherche en temps borné dans un arbre de décision,

Chapitre 2. Etat de I’art Les modules sont chargés d’exécuter des processus de traitement locaux tels que la perception. la planification de chemins et l’exécution. Le contréleur central gere les ressources, décide des actions et transmet les messages entre les modules. Toutes les communications transitent par le contrédleur qui les redistribue aux modules concernés. Cette hyper-centralisation limite les interactions entre les modules et done la possibilité de programmer des actions réflexes, et peut conduire 4 un goulet d’étranglement. TCA a été intégré sur différentes plateformes expérimentales: contrdle de la marche du robot d’exploration A six pattes AMBLER, contréle des robots mobiles d’intérieur HERO (chargé de ramasser des tasses au moyen d’un bras ma- nipulateur) et XAVIER qui explore l’environnement, et du prototype de robot d’exploration lunaire RATLER [Simmons 95).

Une structuration formelle est de fagon générale indispensable pour définir un systéme réactif. Cependant, le contrdle d’un robot mobile autonome ne peut se réduire au séquen- cement de sous-systémes réactifs au moyen d’un automate A états finis. L’évolution de son environnement et la variété des situations qu’il peut rencontrer en font également un sys- téme décisionnel qui doit pouvoir élaborer des comportements complexes, choisir la maniére Une structuration formelle est de fagon générale indispensable pour définir un systeéme reactil, Cependant, le controle d’un robot mobile autonome ne peut se réduire au séquen-

Afin d’illustrer cette arborescence considérons l’exemple suivant: on souhaite faire exé- cuter au robot un mouvement gardé, autrement dit exécuter une trajectoire sans heurter d’obstacles. La premiére activité concernera le calcul de la trajectoire désirée. Cette activité terminée, deux autres se dérouleront en paralléle: l’exécution de la trajectoire et la sur- veillance de présence d’obstacles (figure 1.3). Ces activités se redécomposent elles-mémes en sous-activités. Ainsi, l’exécution de la trajectoire fera appel 4 deux activités filles: le calcul de consignes et l’asservissement sur ces consignes. Le déclenchement de la surveillance d’obstacles devra immédiatement étre suivi d’une action d’évitement de l’obstacle (par contournement ou arrét du robot). Contrairement au Le déclenchement de la surveillance d’obstacies devra immédiatement étre suivi d’une

La réception d’un requéte d’exécution est associée au lancement d’une activité. La réplique

Le graphe fonctionnel représente |’ensemble des phases de traitement par lesquelles une activité peut transiter. A défaut d’information fonctionnelle préalable au niveau du contréleur, la premiére étape d’exécution invoquée sur la transition exec /- est unique et impérative. Cette phase, marquée exec.0 sur la figure, va initialiser le traitement. Par la suite, activité va transiter par un certain nombre de sous-états fonctionnels exec.i de l’état EXEC représentés par la figure 2.3. Dans cette représentation, EXEC est un macro-état qui encapsule des sous-états. Si une activité est. dans |’état EXEC alors elle réside dans un et un seul des ses sous-états exec. L’observation d’un des trois événements abort /-, -/failed ou -/ended impose la sortie de Pétat EXEC et par conséquent du sous-état actif. L’état exec.0 est le point d’entrée du graphe fonctionnel de V’activité. Tr. 7 + Rie x nr a a eae Ss tas oy Ps

Les structures de données internes sont des zones de mémoire locales & un processeur et protégées par un sémaphore. Comme nous l’avons vu, un module dispose de deux SDI distinctes: ifin de réduire les temps de changement de contexte.

3. Une régle élémentaire pour maintenir la cohérence des interactions est l'unicité de déclaration des struc- tures partagées. Les paramétres des requétes et des répliques (et donc des fonctions de traitement), les données exportées dans les posters et éventuellement les données partagées entre les activités du module doivent impérativement disposer d’une zone mémoire dans la SDI/f sous la forme d'une sous-structure. Ces sous-structures sont définies dans des fichiers de déclaration que l’on inclut directement grace A la directive #include.

Chapitre 3. Description formelle et génération automatique G''oM ne procede pas a des vérifications préalables quant 4 la viabilité du module, qu

Afin @illustrer la déclaration formelle d’un module, nous allons maintenant décrire celle du module LOCO dont la structure est présentée et les principales interactions sont illustrées par les figures 1.5 et 1.6. > Déclaration des activités permanentes Les deux activités permanentes ont la méme période et doivent s’exécuter séquentiellement (calcul position puis asservissement), il est donc naturel de leur associer la méme tache d’exécution. Dans la déclaration ci-dessous ces deux activités sont intégrées dans le codel nommé odoAndAsserv. Le codel initOdoAndAsserv in- voqué au démarrage de Ia tache initialise la SDI/f (position initiale, paramétres géométriques et cinématiques, eéc.). Cette tache d’exécution primordiale a la priorité la plus élevée du systeme. La période de 5 tics correspond A 25 ms. naturel de leur associer la méme tache d’exécution. Dans la déclaration ci-dessous ces deux .2.1.2. La déclaration du module locomotion

1.2. La couche fonctionnelle d’Hilare2 peut etre definie pour verifier la pertinence de ce changement. Dans l’exemple ci-

1.2.2 Les modules ultrasons US et US-VIR 1.2. La couche fonctionnelle d’Hilare2

1.2, La couche fonctionnelle d’Hilare2 Fic. 1.11 — Chronogramme des activités pendant l’erécution d’une trajectoire. Le second chronogramme est similaire au précédent mais & une échelle de temps différente qui permet d’apprécier les temps de traitement et les décalages entre les activités. La trajec- toire calculée étant plus complexe (requéte piloSmooth avec une ligne brisée composée d’une dizaine de points de rebroussement), l’activité est maintenue un certain temps dans l'état start. Par le jeu des priorités cela ne perturbe pas l’activité d’asservissement. Le temps de calcul et d’exportation de la consigne reste négligeable (état exec). Le second chronogramme est similaire au précédent mais & une échelle de temps différente

> Activités et requétes L’évitement consiste donc A suivre une consigne tout en évitant les obstacles grace 4 des informations proximétriques fournies par exemple par le module US. La consigne peut étre une position fixe transmise par la requéte d’exécution avoidGoTo, ou un point instationnaire transmis via un poster spécifié par la requéte d’exécution avoidTrack. On peut ainsi suivre une trajectoire calculée par le module PILO, ou encore une cible mobile loca- lisée par un module adéquat. Une troisiéme requéte d’exécution: avoidFollowWalls permet de suivre un mur modélisé 4 partir des données proximétriques. L’activité avoidFollowWalls calcule directement une consigne, exportée dans le poster avoidRef, et sur laquelle le robot va s’asservir au moyen de la requéte locoTrack. Le séquencement des activités entre les modules AVOID et LOCO est identique a celui présenté entre les modules PILO et LOCO. La requéte d’exécution avoidMonLength permet de surveiller le passage d’abscisse curviligne sur la trajectoire de consigne 9. La figure 1.14 montre la coopération entre les modules US, LOCO, AVOID et PILO lorsqu’une requete d’exécution de trajectoire a été requise auprés du module PILO en mode évitement: le module PILO produit des consignes qui sont filtrées par le module AVOID selon les données proximétriques du module US, puis transmises au module LOCO. Un résultat d’exécution est présenté sur la figure 1.15 page suivante.

La figure 1.17 présente les étapes successives d’acquisition, de segmentation et de recalage Trois requétes d’exécution sont disponibles:

Afin d’empécher le robot d’errer a la recherche de son chemin ou d’emprunter un mauvais chemin (par exemple passer 4 droite des obstacles de Ia figure 1.15 page ci-contre) on peut borner l’écart maximal a la trajectoire originale par la requéte de contrdle avoidMaxDev, ou imposer des frontiéres via les murs virtuels du module US-VIR (avoidWithVirtual). Si un obstacle ne peut étre contourné sans enfreindre ces limites, alors l’exécution s'interrompt avec le bilan S_avoidCmdTask_IMPORTANT_DRIFT ou S_avoidCmdTask_BLOCKED selon le cas. Généralement cela se traduira par une nouvelle modélisation de environnement suivie d’une nouvelle planification de chemin. 1.2.6 Le module localisation extéroceptive LOCA2D Le robot doit de temps 4 autre recaler sa position par rapport 4 son environnement et, quand cela est nécessaire, construire des modéles des obstacles avoisinants. Ces fonctions sont assurées par le module LOCA2D qui, a partir d’images de points laser acquises via le serveur TELE3D, extrait des segments. Ces segments permettent de modéliser les obstacles qui peuvent étre ajoutés au modéle de l’environnement; des appariements entre ces segments pergus et les segments du modéle permettent de localiser le robot & l'aide d’un filtre de Kalman. Le filtre de Kalman généralisé ([Moutarlier 91]) réestime également les positions des quand cela est necessaire, construire des modéles des obstacles avoisinants. Ces fonctions borner l’ecart maximal a la trajectoire originale par la requéte de contréle avoidMaxDev, serveur TELE3D, extrait des segments. Ces segments permettent de modéliser les obstacles

objets qui composent l’environnement et les incertitudes sur ces positions. On trouvera le: détails techniques dans [Bullata 96}.

Il a été démontré qu’il n’existait pas, pour des véhicules ayant la cinématique d’Hilare2, de commande par retour d’état pure continue permettant d’asservir le robot en position et en orientation (voir [Samson 90]). Différentes alternatives ont été envisagées: [Canudas de Wit 91] propose une loi de com- mande continue par morceau alors que [Samson 91] et [Kanayama 91] analysent une loi de commande continue mais instationnaire, Ces solutions permettent, de fagon exclusive, soit de stabiliser le robot autour d’une configuration quelconque (z,y,0) mais sans maitrise du mouvement, soit de le réguler sur une trajectoire matérialisée par une consigne strictement instationnaire. Les limitations de ces solutions apparaissent, d’elles-mémes. La détermination de chemins sans collision, qui a fait l’objet de nombreuses études, n’est pas abordée ici. Un planificateur sera présenté dans le chapitre 4. Le chemin géométrique peut d’ailleurs étre défini par un opérateur, par exemple au moyen de l’interface graphique GrHz. Les points 2 et 3 sont la raison d’étre des modules PILO et LOCO dont les algorithmes seront décrits dans les deux sections suivantes. seront décrits dans les deux sections suivantes.

La flexibilité offerte par G°°sM permet aisément de tester différents types d’asservissement par simple substitution du codel d’asservissement. Ainsi une loi proposée par Greg Walsh daprés [Teel 92] a été testée en simulation et d’autres lois en (x, y, @) ou permettant le controle d’une remorque sont en cours de développement et devraient étre testées prochainement. La Hexrbilite offerte par G*"oM permet aisément de tester différents types d’asservissement La détermination du vecteur d’état (position et vitesses instantanées) qui intervient dans ‘asservissement et qui est également calculé par le codel odoAndAsseryv, est. obtenu par )’in- termédiaire de codeurs optiques disposés sur les roues odométriques. En comptabilisant les incréments sur chaque roue on déduit du modéle cinématique les vitesses linéaire et angu- aire instantances du véhicule, et donc les déplacements curviligne et angulaire élémentaires ds,d@). La configuration (x,y, @) du robot est alors obtenue en projetant et en intégrant ces variations élémentaires dans un repére global. L’orientation @ peut également étre directement fournie par un gyroscope. Un calcul probabiliste de l’erreur odométrique permet d’estimer "incertitude sur la configuration. La position et son incertitude sont exportées dans le poster loecoRobot.

FIG, 2.6 — Lissage d’une ligne brisée orientée. Le calcul de la géométrie de la trajectoire lissée est indépendant du calcul de sa dyna- mique et est effectué préalablement 4 son exécution. Le temps de calcul d’un virage sans rebroussement est de 0.3ms sur un processeur 68040 4 25MHz, et celui d’un virage avec rebroussement est de 5ms (sur le chronogramme de la figure 1.11 page 93 la phase start correspond au calcul d’une ligne brisée composée d’une dizaine de points de rebroussement). Ces temps sont suffisamment courts pour envisager de paralléliser le calcul géométrique et Pexécution, lintérét étant de concaténer dynamiquement des séquences de trajectoires sans marquer d’arrét. L’activité serait alors scindée en une activité de calcul géométrique et une activité d’exécution de trajectoire (calcul et exportation des consignes) qui pourraient étre invoquées parallélement. Le temps de calcul de la consigne 4 chaque période est négligeable. L'interface graphique GrHe2 autorise la saisie de lignes brisées. Le codel de calcul de la géométrie du virage lissé a également été intégré dans GrHz permettant ainsi de pré-visualiser les trajectoires qui vont étre exécutées. La figure 2.6 qui présente une ligne brisée orientée et le résultat de son lissage a été obtenue par cette interface graphique (les annotations portées > Application au lissage de chemins de Reeds & Shepp Un planificateur de chemins sans collision qui intégre la limite du rayon de giration borné a été intégré dans un module nommé MP. Ce module a été utilisé sur les robots dans le cadre du projet STRADA qui sera présenté dans le chapitre 4. Le planificateur produit des chemins de type Reeds & Shepp qui sont des séquences particuliéres de segments de droites et d’arcs de cercles. Ces enchainements introduisent des discontinuités de courbure qui doivent étre lissées. L’algorithme de lissage qui est exposé dans l’annexe D a été intégré dans le module PILO. La requéte piloReedsShepp permet de lisser la trajectoire puis de l’exécuter selon la procédure commune (le codel de la phase exec qui produit la consigne est commun aux différentes requétes d’exécution de trajectoire).

Il s’agit donc de déterminer la transformée Tp /A qui exprime la position du robot R dan g be

L’équipement informatique embarqué se compose de deux racks VME équipés de cartes processcurs Motorola MC68030 et MC68040 sous le systéme d’exploitation VxWorks et de cartes Datacube. Le premier rack intégre les fonctions de contréle des déplacements et de Pattitude (i.e. position et orientation 3D), et le second héberge les fonctions de perception.

Chapitre 3. EDEN: Une application en robotique d’extérieur Fic. 3.2 — L’architecture de contréle et le flux de données entre les modules.

Chapitre 3. EDEN: Une application en robotique d’extérieur Fic. 3.7 — La procédure d’exécution de trajectoire 2D avec surveillance de présence d’obstacle. Si la mission se résume pour le moment A une tache (“Aller A (but)”), elle permet cependant d’expérimenter de fagon étendue la couche fonctionnelle: échange des données, pa- rallélisme d’exécution des fonctions, interactions avec lexécutif, actions réflexes programmées au niveau de l’exécutif, etc. En plus des progrés algorithmiques qu'elle a permis dans les do- maines de la perception et de la modélisation d’un environnement naturel, de la planification de trajectoires 3D, du choix de stratégies de perception et de déplacements et de la localisa- tion, cette expérience a été une étape importante dans la mise en ceuvre de l'architecture de contréle proposée au LAAS.

Chapitre 4. STRADA: Une application multi-rabots

Fic. 4.2 - Le nouveau port de Rotterdam. Le cercle indiqué par la fléche montre un véhicule de dimensions similaires a Commutor.

Fic. 4.3 - Un environnement et son modele topologique. Afin de pouvoir raisonner sur les ressources spatiales que vont se partager les robots, I: représentation de environnement est structurée en différentes entités topologiques. Le modeéle topologique est constitué d’aires, de voies et de carrefours. Les aires d’évolution hébergent les stations de chargement, de déchargement et de stationnement. Les voies, 4 sens unique connectent les aires et s’intersectent aux carrefours. Pour rendre plus efficace la gestion de: ressources, les voies et les carrefours sont eux-mémes structurés en entités plus petites: les cellules qui sont les éléments de base dans la résolution des conflits locaux. Globalement, le: robots naviguent a travers un graphe orienté de cellules qui, en mode nominal, contiennent au plus un robot. Une aire est une cellule unique dans laquelic, 4 Vexclusion des stations. plusieurs robots peuvent évoluer simultanément. La présence de plusieurs robots en une méme cellule va requérir une coopération plus fine. La figure 4.3 montre un environnement structuré et le modéle topologique qui lui est associé.

stations qu'il faut successivement rallier, les opérations a y réaliser (prise ou dépose de tel container), et éventuellement les routes (voies) privilégiées a emprunter (régulation globale du trafic).

Afin de pouvoir procéder & des tests réalistes et intensifs concernant la coopération multi- robots, une version UNIX du superviseur et des modules a été mise en place. Chaque robot simulé s’exécute sur une station de travail UNIX distincte; les communications transitent par Ethernet (figure 4.8). Les codes des modules et du superviseur des robots sont identiques & ceux qui seront embarqués sur les vrais robots et qui s’exécuteront sur VxWorks. Les mouvements du robot, la détection d’obstacles et les communications radio sont si- mulés au niveau des modules*. Nous avons ainsi pu exécuter de trés nombreuses simulations Hthernet (figure 4.8). Les codes des modules et du superviseur des robots sont identiques A simule s’execute sur une station de travail UNIX distincte; les communications transitent par

conirme par l’expérimentation réelle décrite dans la section suivante. 4.6 Une expérimentation a trois robots => > ESS: i NEE Ee SD et A On a ainsi pu procéder & des centaines d’insertions de plans et le planificateur de trajec- toire (le module MP) s’est révélé suffisamment efficace pour élaborer et fusionner des plans sans que les robots marquent d’arréts intempestifs. Pour une expérimentation & 10 robots sur l’environnement de la figure 4.3 page 130, environ 400 messages ont été échangés entre les robots dont prés de la moitié concerne la diffusion (broadcast) des ressources requises, un petit quart correspondant a des échanges de plans, un autre A des événements de synchro- nisation, et les messages restants concernant des résolutions de conflits dias A des prises de jeton simultanées pour procéder & des OFP ou a des mises A jour des graphes de détection des inter-blocages (deadlocks). Environ 40 k-octets ont été échangés en 15mn ce qui montre que ce protocole est. compatible avec des medium de communications 4 faible débit; cela sera confirmé par l’expérimentation réelle décrite dans la section suivante. Le protocole de coordination et l'ensemble des fonctions requises ont été embarqueés sur les trois robots de la famille Hilare en service et ont donné lieu & de nombreuses expérimentations que nous allons maintenant décrire. Cette intégration 4 mis en ceuvre l’ensemble des modules qui ont été présentés dans le chapitre [I.1 concernant la couche fonctionnelle d’Hilare2.

La dualité des clothoides et des anticlothoides est clairement exprimée par la tableau ci-dessous qui résume les propriétés respectives des deux courbes. D.3 Calcul des profiles de vitesses optimaux d’une trajectoire

B.5 Les prototypes des codels Les codels d’exécution retournent en fin de traitement le type d’événement interne (ACTIVITY. EVENT) qui sélectionnera la transition suivante (-/ended, -/exec.i, ...). Tous les autres codels retournent un booléen STATUS (OK ou ERROR}. Si un codel de contréle retourne ERROR alors les arguments de la requéte ne sont pas enregistrés dans la SDI/f et la réplique est retournée immédiatement. Dans le cas des codels d’initialisation ou d’exécution d’activité permanente, cela a pour effet de suspendre la tache d’exécution.

Fic. E.2 — La trajectotre selon la localisation externe (pointillés) et selon U'odométrie (tratt plein). visualise par le systeme de localisation externe dans le cas ot on a introduit artificiellement ngure &.4 produite par Gre montre la trajectoire calculée par ’odométrie et arc de cercle

> Déclaration des taches d’exécution Le module LOCO dispose de deux taches d’exécu- tion. La téche locoCmdTask de priorité importante ne s’occupe que de l’activité permanente odoAndAsserv (voir sa déclaration dans le paragraphe traitant des activités permanentes). L’activité de suivi de consigne est prise en charge par une seconde tache: lecoPumpTask. Lactivite de sulvi de consigne est prise en charge par une seconde tache: locoPumpTask. odoandasserv (voir sa declaration dans le paragraphe traitant des activités permanentes).

Les résultats donnés ci-dessus ont été obtenus a) sans appliquer la correction de la distorsion de l'image (voir annexe E), ce qui améliorerait encore la précision de la localisation et b) sans optimisation du “tracking” (au lieu d’estimer la position du motif A litération suivante on pourrait estimer directement celles des points), ce qui guiderait et accélérerait la phase d’appariement. Les performances du systéme sont résumées dans le tableau ci-dessous:

B.1 Organisation du répertoire d'un module Les fichiers générés et. les prototypes des fonctions d’interaction et des codels sont présentés 1. Pour iflnetrer noe nranne nape avane nammd.

Accés a des informations concernant les activités L’indice i est le numéro de l’acti- vité.

descriptionView Paper arrow_downwardDownload

Distributed formation control of networked mobile robots in environments with obstacles

by Jan Carlo Barca

2024, Robotica

A distributed control mechanism for ground moving nonholonomic robots is proposed. It enables a group of mobile robots to autonomously manage formation shapes while navigating through environments with obstacles. The formation can be... more

descriptionView Paper arrow_downwardDownload

Saso 2016

by Niranjan Suri

2024, ACM Transactions on Autonomous and Adaptive Systems

The IEEE International Conference on Self-Adapting and Self-Organizing Systems (SASO) is the main forum for studying and discussing the foundations of a principled approach to engineering systems, networks, and services based on... more

descriptionView Paper arrow_downwardDownload

Optimally solving Dec-POMDPs as Continuous-State MDPs: Theory and Algorithms

by François Charpillet

2024, HAL (Le Centre pour la Communication Scientifique Directe)

Decentralized partially observable Markov decision processes (Dec-POMDPs) provide a general model for decision-making under uncertainty in cooperative decentralized settings, but are difficult to solve optimally (NEXP-Complete). As a new... more

descriptionView Paper arrow_downwardDownload

Decentralizing Coordination in Open Vehicle Fleets for Scalable and Dynamic Task Allocation

by Sascha Ossowski

2024, Complexity

One of the major challenges in the coordination of large, open, collaborative, and commercial vehicle fleets is dynamic task allocation. Self-concerned individually rational vehicle drivers have both local and global objectives, which... more

descriptionView Paper arrow_downwardDownload

Scalable Distributed Decision-Making and Coordination in Large and Complex Systems: Methods, Techniques, and Models

by Sascha Ossowski

2024, Complexity

descriptionView Paper arrow_downwardDownload

A Beacon-based Docking System for an Autonomous Mobile Robot

by kaushik Kariappa

2024

We propose an autonomous docking system for a mobile robot which helps the robot to dock at a specific location with a particular orientation. This system uses active IR beacons which transmit infrared signals all through out the... more

descriptionView Paper arrow_downwardDownload

Multi Sensor-Based Obstacle Avoidance Algorithm in Visual Engineering Environment

by Abqori Aula

2024, Elkha

Obstacle avoidance is an essential problem for applications involving multiple wheeled mobile robots. This research proposes a simple obstacle avoidance rule utilizing only one type of sensor, i.e., infrared sensor. In this research,... more

descriptionView Paper arrow_downwardDownload

Large scale multi-robot coordination under network and geographical constraints

by Oussama Khatib

2023, 2009 IEEE International Symposium on Industrial Electronics

This paper addresses the problem of coordinating great numbers of vehicles in large geographical areas under network connective constraints. We leverage previous work on hierarchical potential fields to create advanced skills in... more

Fig. 5. Screenshots taken during a simulation of 50 vehicles exploring a 100 x 100 km terrain. The bright green spot is the goal of the goal pursuit fiel the brown formations are mountains, the blue ellipses are lakes, the small circles are the vehicles maintaining the optimal communication ranges, the dat trace is the trajectory followed by the group’s centroid, the dark green area is the terrain visited by the vehicles.

Fig. 6. Data recorded during the exploration behavior of Figure 5.

Fig. 3. Network connected field diagram. The nodes (labeled “Subgraph” in the figure) are attracted so that the vehicles remain in communication range and maintain a connected network.

Fig. 4. Circle formation field diagram. Each vehicle is attracted to the closest position on the perimeter of the circle.

Fig. 1. Illustration of multi-vehicle scenario. resulting generalized accelerations are then integrated to obtain trajectories that can be tracked by the individual vehicles.

Fig. 2. Conflict scenario: The goal of the group is to reach the centroid, which has been placed in an inaccessible location surrounded by mountains. Because the obstacle field does not let the group through the mountains, the goal field is rendered infeasible.

descriptionView Paper arrow_downwardDownload

A Decision-Theoretic Model of Assistance

by Sriraam Natarajan

2023, Journal of Artificial Intelligence Research

There is a growing interest in intelligent assistants for a variety of applications from sorting email to helping people with disabilities to do their daily chores. In this paper, we formulate the problem of intelligent assistance in a... more

descriptionView Paper arrow_downwardDownload

Development of homogeneous mobile robots for box-pushing problem

by Dr. Paramasivam Chelladurai

2023, IJMMS

This paper describes the development of a pair of homogeneous mobile robot using AT89C51 microcontroller with two 6V DC motors to address the box-pushing problem. In this work, two homogeneous mobile robots have been fully developed... more

descriptionView Paper arrow_downwardDownload

MAS2CAR ARCHITECTURE - Multi-agent System to Control and Coordinate teAmworking Robots

by P. Martinet

2023, Proceedings of the 8th International Conference on Informatics in Control, Automation and Robotics

This paper aims to present the Multi-Agent System to Control and Coordinate teAmworking Robots (MAS2CAR), a new architecture to control a group of coordinated autonomous robots in unstructured environments. MAS2CAR covers two main layers:... more

descriptionView Paper arrow_downwardDownload

Quasi deterministic POMDPs and DecPOMDPs

by Brahim Chaib-draa

2023

In this paper, we study a particular subclass of partially observable models, called quasi-deterministic partially observable Markov de- cision processes (QDET-POMDPs), characterized by deterministic transitions and stochastic... more

descriptionView Paper arrow_downwardDownload

Decentralized Multi-Agent Reinforcement Learning in Average-Reward Dynamic DCOPs

by Hoong Lau

2023, Proceedings of the AAAI Conference on Artificial Intelligence

Researchers have introduced the Dynamic Distributed Constraint Optimization Problem (Dynamic DCOP) formulation to model dynamically changing multi-agent coordination problems, where a dynamic DCOP is a sequence of (static canonical)... more

descriptionView Paper arrow_downwardDownload

V-Shaped Formation Control for Robotic Swarms Constrained by Field of View

by Peter H Bauer

2023, Applied Sciences

By forming a specific formation during motion, the robotic swarm is a good candidate for unknown region exploration applications. The members of this kind of system are generally low complexity, which limits the communication and... more

descriptionView Paper arrow_downwardDownload

Dynamic robot formations using directional visual perception

by François Michaud

2023, IEEE/RSJ International Conference on Intelligent Robots and System

descriptionView Paper arrow_downwardDownload

A Multirobot System for Distributed Sensing

by Juha Röning

2023, Proceedings of the Fourth International Conference on Informatics in Control, Automation and Robotics

descriptionView Paper arrow_downwardDownload

Graph-based multiagent replanning algorithm

by Xuân Chiến Nguyễn

2023, Proceedings of the 6th international joint conference on Autonomous agents and multiagent systems

The paper presents a new approach for multi-agent replanning based on Distributed Constraint Satisfaction (DisCSP) and Graph planning techniques. In this approach, a new distributed refinement strategy is proposed to construct a graph... more

descriptionView Paper arrow_downwardDownload

Two “Hot Issues” in Cooperative Robotics: Network Robot Systems, and Formal Models and Methods for Cooperation

by Pedro Lima

2023, A white paper, EURON Special Interest Group on Cooperative Robotics

Executive Summary This white paper on two currently hot areas on Cooperative Robotics research (Network Robot Systems and Formal Models and Methods) aims to:(1) survey the state of the art for the two areas,(2) list in a justified manner... more

descriptionView Paper arrow_downwardDownload

Distributed Constraint Reasoning Applied to Multi-robot Exploration

by van anh tran phu le

2023, 2009 21st IEEE International Conference on Tools with Artificial Intelligence

Exploration of an unknown environment is one of the major applications of Multi-Robot Systems. Many works have proposed multi-robot coordination algorithms to accomplish exploration missions based on multi-agent techniques. Some of these... more

descriptionView Paper arrow_downwardDownload

Anytime Planning for Decentralized POMDPs using Expectation Maximization

by Akshat Kumar

2023, arXiv (Cornell University)

Decentralized POMDPs provide an expressive framework for multi-agent sequential decision making. While finite-horizon DEC-POMDPs have enjoyed significant success, progress remains slow for the infinite-horizon case mainly due to the... more

descriptionView Paper arrow_downwardDownload

Point-Based Backup for Decentralized POMPDs: Complexity and New Algorithms

by Akshat Kumar

2023

Decentralized POMDPs provide an expressive framework for sequential multi-agent decision making. Despite their high complexity, there has been significant progress in scaling up existing algorithms, largely due to the use of pointbased... more

descriptionView Paper arrow_downwardDownload

Point-based backup for decentralized POMDPs: complexity and new algorithms

by Akshat Kumar

2023, Autonomous Agents & Multiagent Systems/Agent Theories, Architectures, and Languages

Decentralized POMDPs provide an expressive framework for sequential multi-agent decision making. Despite their high complexity, there has been significant progress in scal- ing up existing algorithms, largely due to the use of point-... more

descriptionView Paper arrow_downwardDownload

Toward a Multi-Robot Coordination Formalism

by Chris Jones

2023

Coordination is an essential characteristic of any system, either natural or artificial, that is composed of multiple interacting agents. The mechanism by which the coordination is achieved determines such properties as how robust the... more

descriptionView Paper arrow_downwardDownload

Decentralized monitoring of distributed anytime algorithms

by Alan Carlin

2023, Adaptive Agents and Multi-Agents Systems

Anytime algorithms allow a system to trade solution quality for computation time. In previous work, monitoring techniques have been developed to allow agents to stop the computation at the "right" time so as to optimize a given... more

descriptionView Paper arrow_downwardDownload

Bounded Rationality in Multiagent Systems Using Decentralized Metareasoning

by Alan Carlin

2023, Intelligent Systems Reference Library

Metareasoning has been used as a means for achieving bounded rationality by optimizing the tradeoff between the cost and value of the decision making process. Effective monitoring techniques have been developed to allow agents to stop... more

descriptionView Paper arrow_downwardDownload

Auction-Based Multi-Robot Routing

by Pinar Keskinocak

2023, Robotics: Science and Systems I

Recently, auction methods have been investigated as effective, decentralized methods for multi-robot coordination. Experimental research has shown great potential, but has not been complemented yet by theoretical analysis. In this paper... more

descriptionView Paper arrow_downwardDownload

An Autonomous Exploration Strategy for Cooperative Mobile Robots

by Dr. Ayman Al-Rawashdeh

2023, Journal of Software Engineering and Applications

Frontier-based exploration methods are efficient for multi-robot exploration systems. In this paper, enhanced frontier-based techniques are used with team of cooperating mobile robots to explore unknown environment. The aim of the... more

descriptionView Paper arrow_downwardDownload

Improved Q -Learning Method for Multirobot Formation and Path Planning with Concave Obstacles

by Kenil Patel

2023, Journal of Sensors

Aiming at the formation and path planning of multirobot systems in an unknown environment, a path planning method for multirobot formation based on improved Q -learning is proposed. Based on the leader-following approach, the leader robot... more

descriptionView Paper arrow_downwardDownload

Multi-Robot Coordination

Related Topics