Mes travaux en planification autonome :
Dans le cadre de mon travail de chercheur associé, j’ai d’abord acquis une solide culture générale sur les jeux de plateau — en particulier les wargames — ainsi que sur l’environnement et les technologies sous-marines. Cette double expertise m’a permis de concevoir le jeu Submerged Strategies, qui allie réalisme et abstraction en offrant une grande diversité, tant sur le plan environnemental que sur celui des actions et des missions proposées.
Le jeu est spécifiquement orienté vers la contre planification, c’est-à-dire la reconnaissance du but de l’adversaire, et la tromperie, pour l’autre joueur chargé d’accomplir une mission secrète. Le wargame Submerged Strategies constitue ainsi une plateforme d’expérimentation privilégiée pour nos algorithmes d’intelligence artificielle dédiés à la contre planification et à la planification entropique.
Dans ce cadre, j’ai étudié en détail la planification classique déterministe afin d’être capable de concevoir et d’implémenter une gamme étendue de planificateurs de recherche prospective. Nous avons ensuite développé une IA de planification hiérarchique et modulaire, fondée sur des principes permettant de réduire drastiquement la complexité algorithmique.
J’ai réalisé un prototype fonctionnel de cette IA, adaptée à l’un des deux rôles du jeu, en langage Python. Parallèlement, Submerged Strategies a été développé en version numérique, ce qui permet de tester et d’évaluer systématiquement les comportements générés par le planificateur implémenté.
Nous avons également développé plusieurs approches d’algorithmes de contre planification pour le second joueur. À ce jour, ces modèles ne sont toutefois pas encore implémentés sous forme de prototypes en Python.
Je travaille actuellement sur une approche stochastique de la planification trompeuse par injection d’entropie. À chaque étape de la construction du plan, l’action suivante est tirée aléatoirement selon une distribution de Boltzmann, telle qu’elle a été introduite historiquement en mécanique statistique. Cette formulation fait intervenir une température jouant le rôle de paramètre de contrôle du désordre, ainsi qu’un hamiltonien, fonction fondamentale de l’état et de l’action, permettant d’ajuster la distribution de probabilité.
Le projet consiste à étendre cette politique stochastique de type Boltzmann Gibbs au cas désordonné, dans lequel les paramètres de pondération de l’hamiltonien, ainsi que la température, sont eux-mêmes des champs aléatoires, généralement corrélés. Cette approche est actuellement en cours de développement.
Enfin, deux articles de conférence en lien direct avec ces travaux sont en préparation.