Il y a 28 joursCrédit Agricole

Assistant Infolinguiste H/F

  • Montrouge (Hauts-de-Seine)
  • Développement informatique

Description de l'offre

Détail de l'offre

Informations générales

Entité

Société cotée, Crédit Agricole SA est l'organe central de contrôle du Groupe Crédit Agricole.
Son organisation est au service de la stratégie et de la performance du Groupe en coordination avec les filiales et les lignes métiers.
Crédit Agricole SA regroupe et anime ses filiales spécialisées, au service des Caisses régionales et des réseaux bancaires du Groupe.

Référence

2018-35108  

Date de parution

22/12/2018

Description du poste

Type de métier

Types de métiers Crédit Agricole S.A. - Marketing et Communication

Type de contrat

Stage

Durée (en mois)

6 mois

Date prévue de prise de fonction

04/03/2019

Poste avec management

Non

Cadre / Non Cadre

Non cadre

Missions

Contexte et objectifs du stage :

 

Dans l’industrie bancaire, les corpus textuels internes ou externes sont nombreuses et exploitées par différents métiers de la banque: conformité, marketing et communication, conseil, etc.

Les experts métiers ont souvent recours à ces corpus au quotidien, pour réaliser différentes tâches d’analyse sémantique d’une façon manuelle ou semi-manuelle : extraction de l’information pertinente, reconnaissance de type de document, recherche d’information, etc. Ces tâches sont le plus souvent consommatrices en temps et effort humain. Proposer des systèmes d’analyse sémantique qui aident les experts dans ces tâches est donc d’une grande valeur d’un point de vue opérationnel.

 

L’objectif du stage consiste à concevoir et développer des briques de linguistique qui alimenteront les chaines de traitement en analyse sémantique développées en interne par le Datalab. Ces chaines reposent essentiellement sur du machine learning et analyse morpho-syntaxique des données textuelles, et manquent dans certains cas d’usage une personnalisation liée aux règles métier et/ou spécificité du langage et champs lexical utilisé.

Les briques qui seront développées seront expérimentées et validées à la fois sur un corpus interne au groupe et sur des corpus externes et donc publiques.

 

 

Organisation et livrables :

 

Le stage se déroulera en quatre étapes principales, sous l’encadrement d’un infolinguiste expérimenté :

 

·  Participation dans la mise en place du socle d’outillage sémantique/linguistique dans l’infrastructure interne;

 

·  Réalisation d’un état de l’art sur les approches symboliques en analyse sémantique pour un cas d’usage donné : extraction d’information, classification de document, moteur de recherche, etc.;

 

·  Sélection et implémentation des algorithmes les plus adaptés à la problématique et au corpus;
Réalisation d’une étude comparative pour évaluer les approches implémentées.

 

·  Intégration des développements dans la plateforme sémantique du DataLab

Des interactions avec des services métier du groupe seront organisées.

 

 

Localisation du poste

Zone géographique

Europe, France, Ile-de-France, 92 - Hauts-De-Seine

Ville

Montrouge

Profil recherché

Critères candidat

Niveau d'études minimum

Bac + 5 / M2 et plus

Formation / Spécialisation

Université ou Ecole d'ingénieur

Formation comportant une dominante NLP (traitement de langage naturel), Linguistique, Machine Learning, Intelligence artificielle, incluant de solides connaissances en développement logiciel.

Niveau d'expérience minimum

0 - 2 ans

Compétences recherchées

Compétences techniques ou spécifiques au poste:

- Traitement de langage naturel (NLP)
- Linguistique
- Développement python

Compétences générales et transverses :

- Autonomie, rigueur et communication
- Innovation/R&D et force de proposition
- Travail en équipe
- Ecoute et partage

Outils informatiques

Outils informatiques :

- Librairies de développement : Scikit-learn, NLTK, Spacy, etc.
- IDE : pycharm
- Outils : Gate, Unitex, Protege

Langues

Anglais