Stagiaire Data Management

Stage Par Bel
  • Système d'information / Urbanisation des SI
  • Vendôme
  • A négocier

Description

Stagiaire Data Management

Avec 5 marques universelles – La Vache qui rit®, Mini Babybel, Kiri®, Leerdammer®, Boursin® – et plus de 25 marques locales, Bel apporte du sourire à près de 400 millions de consommateurs dans plus de 130 pays. Le Groupe affiche l’ambition d’être leader sur ses différents marchés grâce à la puissance de ses marques, les plus internationales du secteur fromager.

L’engagement, l’enthousiasme et l’esprit entrepreneurial de ses 10 830 collaborateurs sont le moteur du développement du numéro 3 mondial des fromages de marque.

L’expérience Bel, c’est être audacieux, pragmatique et déterminé pour relever les défis de croissance d’un groupe agro –alimentaire international. Venez mesurer l’impact de votre talentet de votre énergie sur la réalisation d’un projet d’entreprise ambitieux.

Be you - Be ambitious - Be Bel !

Dans le cadre de sa politique sociale, le Groupe Bel est ouvert à toutes les compétences et s’engage à mener une politique handicap volontaire et durable .

Mise en place d’une plateforme de DATASCIENCE

1. Contexte

Le groupe BEL a lancé un projet de rationalisation de l’ensemble de ses activités de Datascience dédiées à la Recherche et à l’Innovation. Ces activités concernent:

· L’analyse sensorielle, sur la base de tests consommateurs,
· La microbiologie
· La physico-chimie
· Les procédés de fabrication
· L’analyse et le contrôle qualité

Pour ces différents sujets, les chercheurs des différentes équipes de Recherche et Développement sont amenés

· A collecter de grandes masses de données,
· A procéder à leurs analyses statistiques,
· A établir des modèles prédictifs et explicatifs

2. Sujet proposé

A partir d’un existant hétérogène en termes d’outils et cloisonné en termes de données, le projet de rationalisation consiste avant tout à proposer une architecture centralisée permettant:

· De décloisonner les données disponibles pour permettre à chaque équipe de bénéficier des données et résultats des autres équipes,
· D’homogénéiser les pratiques en termes d’outils pour favoriser le partage de codes et de méthodes
· De mettre en place des outils packagés permettant à des chercheurs non experts en statistiques de manipuler des modèles évolués
· De garantir à chaque équipe la persistance des données qu’elle manipule et de lui en garantir la bonne exploitation dans une logique globale de gouvernance de la donnée.

3. Méthodologie envisagée

En étroite collaboration avec son tuteur de stage, le ou la stagiaire devra procéder:

· A un recensement des pratiques en termes de statistiques
· A un recensement des données
· A la mise en place d’une base de données centralisée sur une technologie à définir mais compatible avec les solutions logicielles JMP, R et PYTHON
· A développer des scripts de mise à jour de cette base de données
· A développer les modules de calcul packagés permettant aux chercheurs d’exploiter au mieux les outils statistiques
· A la gestion de la sécurité des données - gestion des accès par utilisateurs, par source et par exploitation pour assurer une visibilité à chaque producteur des usages qui sont faits de ses données.

4. Livrables attendus

· Dictionnaire des données manipulées,
· Cartographie des méthodes statistiques exploitées par finalité métier
· Base de données structurée
· Scripts d’alimentation et d’administration de la base de données
· Outils packagés d’analyse dédiés à certaines méthodes statistiques

Compétences recherchées

- Analyses Factorielles, PLS, SVM

- Manipulation Base de données

- Architecture Big Data: MongoDB, HBase, Cassandra, HDFS

- Outils: R, Python, SQL, JSL

Si ce poste vous intéresse, nous vous invitons à cliquer dès à présent sur le bouton Postuler. L'équipe recrutement prendra alors très prochainement contact avec vous.

Découvrir la Page Entreprise

Ils ont travaillé ici