Expire bientôt Dassault Systèmes

STAGE - Data Scientist & Développement Machine Learning H/F

  • Stage
  • Vélizy-Villacoublay (Yvelines)
  • Études / Statistiques / Data

Description de l'offre

Imaginez demain...



Au sein du département R&D «  Operations Execution », vous rejoindrez l’équipe «  Data & Value ». Cette équipe est en charge de la spécification et du développement d’un ensemble d’applications (détection d’anomalies, prédiction de la convergence de nos releases, etc) capables d’aider l’équipe « Managers » dans la supervision de nos releases.



L’équipe «  Data & Value » prend en charge :



- le développement : des crawlers/scrapers pour l’alimentation de nos bases de données,



- l’indexation des documents,



- l’automatisation par apprentissage des taches de contrôle,



- la description statistique de nos données multidimensionnelles,



- la présentation des résultats sous forme de Dashboard pour l’équipe Managers.



 



Votre contribution



Une Release/Programme contient plusieurs projets. Un projet comporte plusieurs fonctions (objectives) qui répondent à des besoins précis de nos clients.  Une fonction passe par une chaine de réalisation bien définie (simplifiée) : définition de l’objectif, des fonctionnalités, des architectures logicielles, des tests unitaires et des tests fonctionnels… ; Développement ; Test ; Validation et livraison.



La réalisation d’une fonction mobilise plusieurs métiers au sein de notre entreprise : Manager, Release Manager, Développeur, Architecte logiciel, Q/A, …



L’objectif du stage est d’introduire, de développer, de tester et d’évaluer des nouveaux services d’automatisation (semi-automatisation) pour assurer un suivi optimal de nos fonctions en utilisant des algorithmes de machine Learning et en exploitant les données / métadonnées générées pendant la release.



Ainsi, durant ce stage vous aurez pour missions : 



- Identifier les sources de données pertinentes : navigation, SI, BI, moteurs de recherches, etc.



- Récupérer les données.



- Prétraiter et traiter les données.



- Développer un des sujets (‘ou’ non exclusif) :



- Prédire des convergences de backlog



- Trier nos fonctions en fonction de leurs risques de divergences.



- Construire un graphe de fonctions afin d’étudier la propagation d’impact d’une fonction sur les autres fonctions.



- Etablir un lien entre livraison et test unitaire cassé pour accélérer la convergence de nos tests



- Tester & évaluer sur des données réelles de la production.



- Communiquer & présenter les résultats de façon innovante pour les autres équipes



 



Vous travaillerez en collaboration étroite avec (1) un tuteur Research Data Scientist (2) les autres équipes du département pour l’aspect collecte des données et plus particulièrement les équipes : Managers, SI, BI (Business Intelligence) et Xplore (Recherche textuelle).



Vos atouts pour réussir



Vous êtes étudiant(-e) en école d'ingénieurs ou en cursus universitaire et êtes à la recherche d'un stage de fin d'études d'une durée de 6 mois.



Spécialité(s)/ Option(s) souhaitée(s): Data Architect, Data visualization, Data Scientist, Machine Learning, Data Mining.



Vous maitrisez les fonctions suivantes : R, Python ou Java



Logiciels ETL : Talend ou autres.



Bibliothèques statistiques : Weka, NumPy, scikit-learn, Mahout, ou MLib.



Plateforme d’analyse : KNIME, Orange ou RapidMiner.



Un bon niveau d’anglais à l’écrit et à l’oral.



 



Compétences souhaitées



ELK. Elasticsearch, Logstash, Kibana



SQL, noSQL, new SQL



Javascript, Bootstrap, AngularJS, d3.js.



Git/Gitlab



 



Vous démontrez une certaine capacité d'analyse, de synthèse, de formalisation.



Vous avez la volonté  de vous impliquer, vous aimez la prise d'initiative, et faites preuve d'autonomie.



 



Plus d'informations



Type de contrat : Stage



Localisation : Vélizy Villacoublay (78)



Durée : 6 mois



Date de démarrage : Janvier 2018

Faire de chaque avenir une réussite.
  • Annuaire emplois
  • Annuaire entreprises
  • Événements