Expire bientôt Thales

Stage - "Apprentissage par renforcement Multi-agents" (H/F)

  • Stage
  • Palaiseau (Essonne)
  • Infra / Réseaux / Télécoms

Description de l'offre

QUI SOMMES-NOUS ?

Rejoignez Thales, leader mondial des technologies de sûreté et de sécurité pour les marchés de l'Aérospatial, du Transport, de la Défense et de la Sécurité . Fort de 64 000 collaborateurs dans 56 pays , le Groupe bénéficie d'une implantation internationale qui lui permet d'agir au plus près de ses clients, partout dans le monde .

Nos équipes de l' activité Systèmes d'information critiques et cybersécurité fournissent des services et des solutions globales optimisant la performance, la résilience et la sécurité des systèmes d'information afin de faire face aux ruptures technologiques et aux cybermenaces .

L e laboratoire Adaptive Systems & Biomimetic Simulation (AS&B Sim) recherche un/une Stagiaire "Apprentissage par renforcement Multi-agents" (H/F)

Basé(e) à Palaiseau (91).

QUI ETES-VOUS ?

Vous êtes actuellement en dernière année de cycle d'ingénieur ou Master 2, vous recherchez un stage de fin d'études pour une durée de 6 mois.

Le stagiaire devra justifier de bonne connaissance en apprentissage automatique, et plus particulièrement dans le domaine de l'apprentissage par renforcement avec, idéalement, des notions sur les systèmes multi-agents.

Une bonne pratique du développement en Python est un prérequis nécessaire.

CE QUE NOUS POUVONS ACCOMPLIR ENSEMBLE :

L'équipe Adaptive Systems & Biomimetic Simulation (AS&B Sim) de Theresis, située au sein des études amont de Thales Services, développe une nouvelle expertise dans le domaine de l'apprentissage par renforcement (RL) appliqué aux systèmes multi-agents. Bien que le RL soit actuellement plus connu pour ses applications à des problématiques de jeux, il propose aussi une nouvelle manière de traiter des problèmes plus sérieux qui requièrent décision optimale et efficacité.

Des algorithmes bien fondés avec des garanties de convergence sont disponibles pour résoudre des problèmes de RL en mono-agent. Etant donné la simplicité et la généralité de cette approche, ceci en fait une piste attractive pour aborder l'apprentissage dans les systèmes RL multi-agents (MARL) qui ont des applications multiples, parmi lesquelles par exemple le contrôle distribué ou la gestion de ressources. En plus des challenges hérités du RL mon-agent, comme la malédiction de la dimensionnalité ou le compromis exploration exploitation, plusieurs challenges supplémentaires apparaissent en MARL comme la difficulté de spécifier l'objectif d'apprentissage, la non-stationnarité du problème d'apprentissage ou le besoin de coordination.

Dans ce contexte, l'objectif de ce stage est d'évaluer l'apport possible du MARL dans une méthodologie d'aide à la conception de systèmes de systèmes devant réaliser une tâche.

Après avoir pris connaissance de l'état de l'art du domaine du MARL, le stagiaire aura pour mission de sélectionner quelques approches qu'il implémentera et appliquera sur des problématiques pratiques impliquant différentes tâches en situation de coopération ou de compétition. Le livrable final devra inclure un rapport avec la revue de littérature, les expérimentations réalisées et l'analyse des résultats obtenus.

Le stagiaire sera suivi par un ingénieur de recherche de l'équipe AS&BSim. Des échanges avec des partenaires académiques de Thales pourraient également être envisagés en cours de stage.

La perspective de rejoindre un Groupe innovant vous motive ? Alors rejoignez-nous en postulant à cette offre .

Vous souhaitez en savoir plus sur les activités Systèmes d'information et de communication sécurisés ? Cliquez ici .

Faire de chaque avenir une réussite.
  • Annuaire emplois
  • Annuaire entreprises
  • Événements