Les offres de “CEA”

Expire bientôt CEA

STA- Méthodes neuronales pour l'extraction d'événements dans les textes H/F

  • Stage
  • Saclay (Essonne)
  • Conception / Génie civil / Génie industriel

Description de l'offre

Détail de l'offre

Informations générales

Entité de rattachement

Le Commissariat à l'énergie atomique et aux énergies alternatives (CEA) est un organisme public de recherche.

Acteur majeur de la recherche, du développement et de l'innovation, le CEA intervient dans le cadre de ses quatre missions :
. la défense et la sécurité
. l'énergie nucléaire (fission et fusion)
. la recherche technologique pour l'industrie
. la recherche fondamentale (sciences de la matière et sciences de la vie).

Avec ses 16000 salariés -techniciens, ingénieurs, chercheurs, et personnel en soutien à la recherche- le CEA participe à de nombreux projets de collaboration aux côtés de ses partenaires académiques et industriels.

Référence

2018-7930

Description de l'unité

Acteur majeur de la recherche, du développement et de l'innovation, le Commissariat à l'Energie Atomique et aux Energies Alternatives (16 000 salariés, environ 600 brevets déposés par an) intervient dans 4 grands domaines : les énergies bas carbone, la défense et la sécurité globale, les technologies pour l'information, et les technologies pour la santé.
Vous avez du talent et souhaitez travailler dans un environnement stimulant dédié aux technologies numériques ?

Rejoignez-nous !

Au sein de CEA Tech, le pôle « recherche technologique » du CEA, l'institut List dédie ses activités aux systèmes numériques intelligents. Nous avons un savoir-faire unique issu d'une culture de l'innovation et avons pour mission de produire et de transférer les technologies utiles à nos partenaires industriels dans quatre domaines :
- Usine du futur
- Systèmes cyberphysiques
- Instrumentation innovante
- Intelligence artificielle

Au sein du LIST, le Laboratoire de Vision et d'Ingénierie des Contenus (LVIC) emploie 80 chercheurs et ingénieurs travaillant dans le domaine de l'Intelligence Artificielle pour l'analyse et l'interprétation de données multimédia (texte, image, vidéo). Le laboratoire développe des algorithmes robustes pour l'extraction, l'analyse et le traitement de grands volumes de données multimédia et participe par ailleurs à de nombreux projets collaboratifs (ANR, Europe FP7, Pôle de Compétitivité) avec des partenaires académiques, PM

Délai de traitement

3 mois

Description du poste

Domaine

Mathématiques, information scientifique, logiciel

Contrat

Stage

Intitulé de l'offre

STA- Méthodes neuronales pour l'extraction d'événements dans les textes H/F

Sujet de stage

Méthodes neuronales pour l'extraction jointe d'événements et de leurs arguments dans les textes

Durée du contrat (en mois)

6

Description de l'offre

Le sujet de stage se situe dans le domaine de l’extraction d’information, dont l’objectif est d’identifier des événements ou des faits dans des textes et de structurer les informations retenues. Le plus souvent, cet objectif prend la forme d’une tâche de remplissage de formulaires (templates) prédéfinis à partir de textes. Ainsi, pour un formulaire centré sur les événements sismiques, l’objectif est pour chaque tremblement de terre détecté dans un texte de localiser des informations telles que sa localisation, sa magnitude, sa date et son heure. Un extrait de texte tel que :

"En visite sur place, le vice-premier ministre Besir Atalay a confirmé que 25 bâtiments s’étaient effondrés à la suite du séisme d’une magnitude de 5,6. Il s’est produit à 20h23 mercredi soir, avec un épicentre localisé dans le district d’Edremit, à 17 kilomètres au sud de Van"

doit ainsi permettre à un système d’extraction d’information de remplir un formulaire typique sur les tremblements de terre qui aurait la forme suivante : FORMULAIRE « TREMBLEMENT DE TERRE » - Lieu : district d’Edremit, à 17 kilomètres au sud de Van - magnitude : 5,6 - heure : 20h23 - Date : mercredi soir


L’objectif du stage est d’étudier des approches jointes impliquant la détection des mentions d’événements et d’arguments dans un cadre de type Deep Learning. Le travail se focalisera au niveau de la phrase et commencera par examiner comment le modèle proposé par (Li et al., 2013) peut être transposé dans un cadre neuronal. Au-delà, il étudiera comment des approches jointes peuvent être définies et mises en oeuvre au travers de mécanismes plus spécifiquement liés aux réseaux de neurones comme les modèles d’attention. Pour mener ce travail, le stagiaire pourra s’appuyer sur les travaux déjà menés en extraction d’information par le laboratoire dans différents domaines (événements sismiques, finance, rapports d’inspection …) et plus particulièrement sur deux thèses portant sur l’utilisation de modèles neuronaux pour l’extraction d’événements.

Profil recherché

Profil du candidat

Vous êtes Ingénieur ou étudiant en Master 2
Vous maitrisez Linux et vous avez des connaissances en :
- langage de programmation : C++ ou python
- expérience avec une bibliothèque de type Tensorflow, PyTorch …
- notion de base en apprentissage automatique et en réseaux de neurones
- notions de base en traitement automatique des langues

Le poste est basé à Palaiseau (91) et ouvre la possibilité d'une poursuite en thèse ou sur un poste d'ingénieur au sein du laboratoire

Faire de chaque avenir une réussite.
  • Annuaire emplois
  • Annuaire entreprises
  • Événements