Accueil | Page Personnelle de Maxime Baczyk

Mes travaux en Planification Autonome :

Dans le cadre de mon travail de chercheur associé, j’ai d’abord acquis une solide culture générale sur les jeux de plateau — en particulier les wargames — ainsi que sur l’environnement et les technologies sous-marines. Cette double expertise m’a permis de concevoir le jeu Submerged Strategies en partenariat avec Naval Group. Ce dernier allie réalisme et abstraction en offrant une grande diversité, tant sur le plan environnemental que sur celui des actions et des missions proposées.

Le jeu est spécifiquement orienté vers la contre planification, c’est-à-dire la reconnaissance du but de l’adversaire, et la tromperie, pour l’autre joueur chargé d’accomplir une mission secrète. Le wargame Submerged Strategies constitue ainsi une plateforme d’expérimentation privilégiée pour nos algorithmes d’intelligence artificielle dédiés à la contre planification et à la planification entropique.

Dans ce cadre, j’ai étudié la planification classique déterministe afin d’être capable de concevoir et d’implémenter une gamme étendue de planificateurs de recherche prospective. Nous avons ensuite développé une IA de planification hiérarchique et modulaire, fondée sur des principes permettant de réduire drastiquement la complexité algorithmique.

J’ai réalisé un prototype fonctionnel de cette IA, adaptée à l’un des deux rôles du jeu, en langage Python. Parallèlement, Submerged Strategies a été développé en version numérique, ce qui permet de tester et d’évaluer systématiquement les comportements générés par le planificateur implémenté.

Nous avons également développé plusieurs approches d’algorithmes de contre planification pour le second joueur. À ce jour, ces modèles ne sont toutefois pas encore implémentés sous forme de prototypes en Python.

Je travaille actuellement sur une approche stochastique de la planification trompeuse par injection d’entropie. À chaque étape de la construction du plan, l’action suivante est tirée aléatoirement selon une distribution de Boltzmann, telle qu’elle a été introduite historiquement en mécanique statistique. Cette formulation fait intervenir une température jouant le rôle de paramètre de contrôle du désordre, ainsi qu’un hamiltonien, fonction fondamentale de l’état et de l’action, permettant d’ajuster la distribution de probabilité.

Le projet consiste alors à étendre cette politique stochastique de type Boltzmann Gibbs au cas désordonné, dans lequel les paramètres de pondération de l’hamiltonien, ainsi que la température, sont eux-mêmes des champs aléatoires, généralement corrélés. Cette approche est actuellement en cours de développement.

Deux articles de conférence en lien direct avec ces travaux sont en préparation.

Submerged Strategies (SbS)

SbS (CReC, Saint-Cyr, Naval Group) est un wargame tactique sous-marin conçu comme une plateforme de recherche dédiée à la planification IA dans des contextes adversariaux et partiellement observables. Le jeu intègre intrinsèquement des problématiques de contre-planification et de déception stratégique. Il met en scène une confrontation asymétrique entre deux drones sous-marins : Suspect, chargé d’accomplir une mission secrète, et Reco, dont le rôle est d’identifier cette mission et de l’empêcher d’aboutir.

Le cadre sous-marin, représenté sur une carte hexagonale statique, offre une grande diversité de terrains, de conditions environnementales et de contraintes opérationnelles (courants, interférences, faible visibilité, obstacles, etc.). Les drones disposent d’un éventail riche d’actions : déplacements, gestion de l’énergie, détection multi-capteurs (sonar actif/passif, magnétomètre, caméra intelligente) et activation de divers équipements de mission.

Le wargame se distingue par sa structure double-aveugle, simulant le brouillard de guerre : chaque joueur agit sur sa propre carte, sans accès direct aux informations de l’adversaire. Les missions assignées à Suspect couvrent plusieurs zones et se déclinent en trois identités possibles — alliée, neutre ou ennemie — ce qui permet d’explorer un large ensemble de scénarios centrés sur l’incertitude, la reconnaissance d’intention et les risques de mauvaise classification.

Initialement conçu comme un jeu de plateau physique, SbS a ensuite été transposé en environnement numérique, afin de constituer un banc d’essai rigoureux pour différentes méthodes de planification, de contre-planification et de planification entropique. Ces cadres permettent respectivement d’inférer les buts adverses et d’introduire une obfuscation volontaire dans la construction des plans.

Grâce à la combinaison de règles simples, d’une grande variété environnementale et de mécanismes explicitement orientés vers l’incertitude, SbS constitue une plateforme originale, flexible et particulièrement adaptée à l’étude, au test et à la comparaison d’algorithmes de planification, de reconnaissance de plans et de déception stratégique en intelligence artificielle.