Les offres de “TotalEnergies”

Nouveau TotalEnergies

STAGE - Évaluation de l’utilisation des LLMs pour l’extraction de données scientifiques à partir de documents hétérogènes

  • Stage
  • FRANCE

Description de l'offre

Pays France

Ville SOLAIZE

Lieu de travail SOLAIZE-CHEMIN DU CANAL(FRA)

Société employeur TotalEnergies OneTech

Domaine Recherche Innovation&Développt, Systèmes d'Information

Type de contrat Stage conventionné

Expérience Moins de 3 ans

Contexte et environnement

Au sein de la branche   OneTech de TotalEnergies, vous rejoindrez le Centre de Recherche de Solaize , situé à 15 minutes au sud de Lyon.

Le site regroupe plus de 300 chercheurs dans un environnement verdoyant 

Il constitue l’un des principaux centres de R&D de TotalEnergies, dédié notamment :

·  Au développement de solutions ainsi que de moyens de mesure et de contrôle des émissions de gaz à effet de serre
·  À la formulation de produits à faible empreinte environnementale et décarbonés pour les mobilités thermique, électrique et pour l’industrie (carburants non fossiles d’origine renouvelable, lubrifiants, fluides caloporteurs, bitumes, etc.)

Les activités implantées sur le site évoluent constamment pour répondre aux objectifs et aux ambitions de la compagnie TotalEnergies en matière de neutralité carbone et d’accessibilité à des énergies abordables et propres pour le plus grand nombre.

Activités

TotalEnergies s’inscrit dans une ambition climat forte, visant la neutralité carbone à horizon 2050. Cette transformation s’accompagne d’une digitalisation accrue de la R&D, avec la mise en place d’approches prédictives pour accélérer le développement de nouvelles molécules et matériaux répondant aux besoins des mobilités durables. Dans ce cadre, l’exploitation efficace des données scientifiques issues de sources variées (articles, documents techniques, fichiers semi-structurés) est un levier essentiel pour innover plus rapidement et de manière responsable.

Les modèles de langage (LLMs) offrent des perspectives inédites pour automatiser cette extraction et faciliter l’accès à l’information.

Objectifs du stage :

·  Évaluer différentes solutions LLM (Copilot, ChatGPT, MistralAI) en mode interactif (chat) et via API.
·  Définir et tester des modes opératoires pour l’extraction de données scientifiques à partir, d’articles scientifiques, de documents techniques, de fichiers Excel semi-standardisés.
·  Familiariser l’équipe avec l’écosystème LLM interne (LLM Hub TotalEnergies, outils associés).
·  Proposer des recommandations pour l’intégration des LLMs dans les workflows existants.

Moyens et outils utilisés

·  Accès aux solutions LLM internes et externes (LLM Hub, Copilot, etc.).
·  Collaboration avec l’équipe R&D spécialisée en science des données

Profil du candidat

Formation Bac+5 : Ecole ingénieur / Master 

 Niveau d'anglais : B2

Date  de début souhaitée : Premier trimestre 2026

 Période de stage : 6 mois

Des compétences en informatique  et data science sont recherchées, notamment en  intelligence artificielle et apprentissage automatique, traitement automatique des langues (NLP), ainsi qu’une maîtrise des langages et outils courants (Python – pandas, NumPy, PyTorch/TensorFlow – APIs et intégration de modèles LLM).

Informations supplémentaires

TotalEnergies valorise la diversité, promeut le développement individuel et offre des opportunités d'emploi égales à tous les candidats.

Faire de chaque avenir une réussite.
  • Annuaire emplois
  • Annuaire entreprises
  • Événements