Stage de M2 : Apprentissage par renforcement d'une tâche effectuée par un humain - DGDO H/F
Alternance Nantes (Loire-Atlantique) Chimie / Biologie / Agronomie
Description de l'offre
Détail de l'offre
Informations générales
Entité de rattachement
Le Commissariat à l'énergie atomique et aux énergies alternatives (CEA) est un organisme public de recherche.Acteur majeur de la recherche, du développement et de l'innovation, le CEA intervient dans le cadre de ses quatre missions :
. la défense et la sécurité
. l'énergie nucléaire (fission et fusion)
. la recherche technologique pour l'industrie
. la recherche fondamentale (sciences de la matière et sciences de la vie).
Avec ses 16000 salariés -techniciens, ingénieurs, chercheurs, et personnel en soutien à la recherche- le CEA participe à de nombreux projets de collaboration aux côtés de ses partenaires académiques et industriels.
Référence
2018-7890Description de l'unité
CEA Tech est un acteur majeur de l'innovation en France et dans le monde ayant la mission de produire et transférer des technologies innovantes vers l'industrie afin d'assurer sa compétitivité.
Au départ tourné vers les énergies nucléaires, le CEA s'est fortement diversifié pour devenir incontournable sur les
domaines des :
- Micro et nanotechnologies
- Nouvelles technologies pour l'énergie et la mobilité
- Systèmes numériques intelligents et robotiques
- Nouvelles technologies pour l'information et la communication
Délai de traitement
3 mois
Description du poste
Domaine
Systèmes d'information
Contrat
Stage
Intitulé de l'offre
Stage de M2 : Apprentissage par renforcement d'une tâche effectuée par un humain - DGDO H/F
Sujet de stage
Apprentissage par renforcement d'une tâche effectuée par un humain
Durée du contrat (en mois)
4-6 mois
Description de l'offre
Dans le cadre de ses projets de ressourcement technologique, CEA Tech Pays de la Loire (basé à Bouguenais près de Nantes) propose un stage en M2 recherche portant sur l’apprentissage par démonstration : L’apprentissage par démonstration consiste à permettre à un agent (ex. un robot) d’apprendre une tâche par l’observation d’un autre agent (ex. un humain) réalisant cette même tâche. Les méthodes d’apprentissage par renforcement sont souvent utilisées dans ce cadre afin d’améliorer la capacité du robot à réaliser une tâche dans de nouvelles situations, mais elles nécessitent de définir une fonction de récompense qui renforcera les actions permettant d’atteindre l’objectif. Au cours du stage, l'étudiant implémentera une méthode d’apprentissage par renforcement pour une tâche de « pick and place » simulée, en prenant soin de définir une fonction de récompense adaptée.
Ces travaux pourront déboucher sur une thèse portant sur la mise au point de méthode d’apprentissage par renforcement inverse permettant d’apprendre automatiquement la fonction de récompense.
Si vous êtes intéressé merci d'envoyer votre CV à l'adresse suivante:
Profil recherché
Profil du candidat
Le profil recherché est un étudiant de Master 2 en informatique ou en robotique avec une forte coloration IA