STAGE - Data Engineer : Construire un pipeline de données au service de la science des données H/F
Stage FRANCE
Description de l'offre
Pays France
Ville PAU
Lieu de travail PAU-CSTJF(FRA)
Société employeur TotalEnergies OneTech
Domaine Géoscience & Réservoir
Type de contrat Stage conventionné
Durée du contrat
6 Mois
Expérience Moins de 3 ans
Contexte et environnement
TotalEnergies est l'une des principales entreprises énergétiques au monde. Dans un contexte de changement technologique et de transformation numérique, vous travaillerez au sein du DataLab avec un groupe de collègues expérimentés et dynamiques. Le DataLab est un projet interdisciplinaire visant à faciliter la gestion des documents à l'aide de techniques de pointe en matière de science des données et d'intelligence artificielle : classification, gestion des métadonnées, traitement du langage naturel, Computer vision et large language model etc.
Activités
Vous soutiendrez l’équipe Datalab en développant et en appliquant des méthodes avancées de science des données pour répondre aux besoins des gestionnaires de données dans les domaines de l’information géographique et des géosciences.
Vous rejoindrez une équipe interdisciplinaire composée de gestionnaires de données, chefs de projet SI, experts IT, Product Owners et data scientists expérimentés.
Dans des contextes d’application concrets, vous mobiliserez des ressources de calcul puissantes (telles que le supercalculateur Pangea, le cloud computing, ou des outils low-code/no-code) pour développer et déployer des modèles et cadres de data science, favorisant l’innovation basée sur les données.
Vous participerez également à divers types de réunions : points d’avancement, comités d’arbitrage, réunions avec les partenaires, etc.
Responsabilités techniques :
- Développer et déployer des modèles de machine learning et deep learning pour résoudre des problématiques clés en géosciences et géoinformation ;
- Appliquer des techniques de traitement du langage naturel (NLP), vision par ordinateur, grands modèles de langage (LLM) et approches multimodales pour analyser des données complexes
- Collaborer avec les équipes d’ingénierie des données pour garantir la disponibilité et la qualité des données nécessaires à l’entraînement et à l’inférence des modèles
- Concevoir des expériences, évaluer les performances des modèles et optimiser continuellement les algorithmes
- Rédiger des documents techniques et des rapports de recherche pour favoriser le partage et la réutilisation des résultats au sein de l’équipe et avec les partenaires.
Vous bénéficierez de l’expérience et du soutien d’une équipe dynamique, fonctionnant selon une méthodologie agile et flexible.
Profil du candidat
Actuellement en école d'ingénieur ou université avec une spécialisation en Data / Géosciences et êtes en recherche d'un stage d’une durée de 6 mois à partir de Octobre 2025 .
Compétences Techniques :
· Maitrise de la programmation
· Connaissance des bases de données, Data lake, API architicture, Basic Machine Learning and Deep Learning knowldge. Basic NLP, Computer Vision Knowldge
· Anglais Opérationnel
Compétences Informatiques :
· Programmation, Python, Java Script and Java Environnement Linux Master Streamlit, MongoDB,neo4j
Aptitudes :
· Curiosité
· Esprit d'équipe
· Esprit innovant
· Sens critique
Vous vous reconnaissez ? N'attendez plus... postulez pour rejoindre les équipes TotalEnergies du CSTJF à Pau !
Informations supplémentaires
TotalEnergies valorise la diversité, promeut le développement individuel et offre des opportunités d'emploi égales à tous les candidats.