DRT/LIST - Ingénieur Traitement Automatique des Langues (TAL) H/F
Stage Palaiseau (Essonne) Développement informatique
Description de l'offre
Détail de l'offre
Informations générales
Entité de rattachement
Le Commissariat à l'énergie atomique et aux énergies alternatives (CEA) est un organisme public de recherche.Acteur majeur de la recherche, du développement et de l'innovation, le CEA intervient dans le cadre de ses quatre missions :
. la défense et la sécurité
. l'énergie nucléaire (fission et fusion)
. la recherche technologique pour l'industrie
. la recherche fondamentale (sciences de la matière et sciences de la vie).
Avec ses 16000 salariés -techniciens, ingénieurs, chercheurs, et personnel en soutien à la recherche- le CEA participe à de nombreux projets de collaboration aux côtés de ses partenaires académiques et industriels.
Référence
2020-13566Description du poste
Domaine
Mathématiques, information scientifique, logiciel
Contrat
CDD
Intitulé de l'offre
DRT/LIST - Ingénieur Traitement Automatique des Langues (TAL) H/F
Statut du poste
Cadre
Durée du contrat (en mois)
12
Description de l'offre
Dans le cadre de sa mission de transfert et de valorisation de ses technologies, le Laboratoire d'Analyse Sémantique des Textes et des Images du CEA (LASTI) recherche un(e) collaborateur/collaboratrice pour la mise en place de démonstrateurs autour de technologies TAL. Vous rejoindrez une équipe R&D dédiée à l'analyse sémantique de texte et qui a développé l'analyseur linguistique LIMA (https://github.com/aymara/lima/wiki) aujourd'hui en open source et enrichi de modules d'apprentissage profond lui permettant d'analyser 60 langues avec des performances à l'état de l'art.
Vous participerez à la mise en place des plateformes d'analyse et de recueil des données structurées et non-structurées correspondant aux besoins des utilisateurs.
Vous aurez pour missions de :
- Produire de ressources adaptées aux besoins et aux domaines sélectionnés à des fins d'extraction et de recherche d'informations. Les ressources seront élaborées à l'aide de l'un outil qui compile de la connaissance à partir des corpus annotés, des listes ou des règles constituées manuellement.
- Construire une chaîne de traitement complète d'extraction/recherche d'information pour un domaine donné défini pour le besoin du projet, à partir des logiciels et modules du CEA.
- Participer à la réflexion et au développement d'outils/fonctions pour faciliter l'adaptation de ressources à de multiples domaines et besoins. L'objectif sera d'augmenter le nombre de règles construites automatiquement et leur fiabilité en s'appuyant sur l'utilisateur.
- Evaluer les outils d'annotation/extraction comprenant une étude qualitative des annotations.
Profil recherché
Profil du candidat
De profil ingénieur ou docteur/titulaire d'un master 2 en Traitement Automatique des Langues et/ou Intelligence Artificielle, nous vous attendons. Une expérience serait appréciée mais pas obligatoire.
Sur le plan scientifique et technique, vous pouvez justifier :
• de solides connaissances dans le domaine du traitement automatique des langues: classification de texte, extraction d'information, constitution de ressources, text mining
• une expérience en développement logiciel s'appuyant idéalement sur une maîtrise de Python/ shell /perl, C++ , des connaissances des webservices REST et d'outils de développement et de partage de code tel que Git.
Vous savez travailler avec autonomie et persévérance, tout en interagissant régulièrement avec votre équipe, afin d'aboutir à la réalisation de démonstrateurs.