Assistant(e) Data Scientiste H/F
Stage Montrouge (Hauts-de-Seine) Développement informatique
Description de l'offre
Informations générales
Entité
Société cotée, Crédit Agricole SA est l'organe central de contrôle du Groupe Crédit Agricole.
Son organisation est au service de la stratégie et de la performance du Groupe en coordination avec les filiales et les lignes métiers.
Crédit Agricole SA regroupe et anime ses filiales spécialisées, au service des Caisses régionales et des réseaux bancaires du Groupe.
Référence
2017-26718
Date de parution
03/01/2018
Description du poste
Type de métier
Marketing et Communication
Types de métier complémentaires
Autres
Type de contrat
Stage
Durée (en mois)
6
Date prévue de prise de fonction
05/02/2018
Poste avec management
Non
Cadre / Non Cadre
Non cadre
Missions
Présentation du service :
Au sein du Pôle Développement Clients et Innovation, le DataLab Groupe Crédit Agricole est un centre de compétence dédié aux sciences de la donnée et à leurs applications dans le domaine bancaire.
Son rôle est de créer des approches innovantes pour la valorisation de la donnée interne et externe, qu'elle soit structurée ou non structurée.
Dans le cadre de ses missions, des thématiques scientifiques à forte valeur ajoutée sont étudiées : Apprentissage Automatique, Auto-ML, Traitement du Langage Naturel, Process Mining, Time Series Mining, Deep Learning, Géomatique, etc.
Ces activités sont menées conjointement avec des partenaires internes : les Caisses Régionales, les Entités du Groupe et les Producteurs Informatiques.
Le DLG développe également un réseau de partenaires externes lors de missions industrielles (Editeurs de logiciels, startup, SSII, etc.) ou de collaborations universitaires.
Dans le cadre de ce stage, vous rejoindrez l'équipe Data Science afin de contribuer à la valorisation de la Data et participer à la mise en place d'une approche innovante du Marketing et de la Relation Client.
Descriptif de la mission :
La donnée non-structurée, principalement du texte et des séries temporelles et séquentielles, représente un vivier majeur pour une meilleure connaissance client et pour l'optimisation des services qui lui sont proposés.
L'objectif principal du stage sera de concevoir et développer des approches à base d'algorithmes profonds pour extraire de la connaissance à partir de cette donnée non structurée.
Vous aurez pour missions principales de :
- Etablir un état de l'art des méthodes d'apprentissage profond appliquées aux données textuelles, temporelles et séquentielles ;
- Définir les approches adaptées pour améliorer l'extraction d'information et la représentativité optimale des données ;
- Développer des algorithmes d'identification d'évènements à partir des données temporelles/séquentielles ;
- Proposer une optimisation des développements à travers le calcul sur cartes graphiques (GPU) ;
- Expérimenter et analyser les expérimentations effectuées dans le cadre de POCs ou à travers des compétitions techniques (KDD, ICDM, Kaggle…) ;
Dans le cadre de ces missions, le stagiaire sera accompagné par des Data Scientistes séniors sur les aspects algorithmiques et sera également amené à échanger avec des experts métier et marketing des Caisses Régionales et autres partenaires du groupe.
Localisation du poste
Zone géographique
Europe, France, Ile-de-France, 92 - Hauts-De-Seine
Ville
Montrouge
Profil recherché
Critères candidat
Niveau d'études minimum
Bac + 5 / M2 et plus
Formation / Spécialisation
Université, Ecoles d'ingénieur.
Spécialisation :
Le stagiaire doit suivre une formation avec une composante principale en Data Science, Machine Learning, Intelligence Artificielle, Data Mining et orienté R&D/Innovation. Il doit également avoir de solides connaissances en développement logiciel.
Niveau d'expérience minimum
0 - 2 ans
Compétences recherchées
Compétences techniques ou spécifiques au poste :
- Machine learning, Intelligence Artificielle, Data Mining
- Deep Learning
- NLP, Times series Mining
- Design Pattern
Compétences générales et transverses :
- Autonomie
- Innovation/R&D et force de proposition
- Travail en équipe
- Ecoute et partage
Outils informatiques
Python, Scikit-learn, Tensorflow, CUDA, Eclispe, c++
Langues
Anglais opérationnel