STAGE : Recherche sur les Capacités de Raisonnement des Grands Modèles de Langage Génératif F/H
Stage FRANCE
Description de l'offre
STAGE : Recherche sur les Capacités de Raisonnement des Grands Modèles de Langage Génératif F/H
Détail de l'offre
Informations générales
Entité de rattachement
Safran est un groupe international de haute technologie opérant dans les domaines de l'aéronautique (propulsion, équipements et intérieurs), de l'espace et de la défense. Sa mission : contribuer durablement à un monde plus sûr, où le transport aérien devient toujours plus respectueux de l'environnement, plus confortable et plus accessible. Implanté sur tous les continents, le Groupe emploie 100 000 collaborateurs pour un chiffre d'affaires de 27,3 milliards d'euros en 2024, et occupe, seul ou en partenariat, des positions de premier plan mondial ou européen sur ses marchés.
Safran est la 2ème entreprise du secteur aéronautique et défense du classement « World's Best Companies 2024 » du magazine TIME.
Parce que nous sommes persuadés que chaque talent compte, nous valorisons et encourageons les candidatures de personnes en situation de handicap pour nos opportunités d'emploi
Référence
2026-202191-175071
Description du poste
Intitulé du poste
STAGE : Recherche sur les Capacités de Raisonnement des Grands Modèles de Langage Génératif F/H
Type contrat
Stage
Durée du contrat
6 mois
Statut (CSP)
Etudiant
Temps de travail
Temps complet
Parlons de votre future mission
Safran est un groupe international de haute technologie, leader mondial dans les domaines de l'Aéronautique, de l'Espace, de la Défense et de la Sécurité. Au sein du centre de R&T du Groupe (Safran Tech), l'Unité de Recherche Safran Tech Artificial Intelligence Research (S.AI.R) développe des méthodes innovantes en collaboration avec des partenaires académiques dans des domaines tels que les Grands Modèles de Langage (Large Language Models, LLMs). En tant que stagiaire au sein l'unité S.AI.R, vous travaillerez en étroite collaboration avec des ingénieurs recherche pour améliorer les capacités de raisonnement des LLMs ou de systèmes agentiques sur des données internes et publiques. L'objectif principal du stage sera d'étendre les capacités de raisonnement multi-hop des LLMs. Ce type de raisonnement consiste à formuler une conclusion à travers une succession d'étapes logiques, où chaque étape s'appuie sur des informations ou des concepts intermédiaires pouvant provenir de différentes sources [1,2]. Pour atteindre cet objectif le candidat sera amené à explorer différents axes de recherche possibles tels que l'apprentissage par renforcement [3], le latent reasoning [4, 5], le causal learning [6,7], ou encore des méthodes de raisonnement fondées sur la création et l'exploitation de graphes de connaissance (représentant la mémoire de l'agent ou une base de données externes) [8]. L'étude pourra également s'appuyer sur les capacités de programmation des LLMs [9,10]. Ce stage allie à la fois des aspects informatiques (programmation) et des aspects mathématiques liés aux LLMs, et il pourra se poursuivre par une thèse CIFRE. Vos missions pendant le stage consisteront à : Conduire des recherches pour améliorer les capacités de raisonnement multi-hop des LLMs ; Réaliser une recherche bibliographique ; Implémenter et tester les différentes approches identifiées sur des cas d'usages spécifiques (publics et internes) ; Développer de nouvelles stratégies pour améliorer les capacités de raisonnement multi-hop des LLMs ; Publier les résultats de recherche dans des journaux/conférences (NeurIPS, ICLR, ICML, ACL, COLM). Bibliographie : [1] Yang, Zhilin, et al. "HotpotQA: A dataset for diverse, explainable multi-hop question answering." [2] Schnitzler, Julian, et al. "Morehopqa: More than multi-hop reasoning." [3] Sutton, Richard S., and Andrew G. Barto. Reinforcement learning: An introduction. [4] Chen, Xinghao, et al. "Reasoning beyond language: A comprehensive survey on latent chain-of-thought reasoning." [5] Yang, Sohee, et al. "Do large language models latently perform multi-hop reasoning?." [6] Schölkopf, Bernhard. "Causality for machine learning." [7] Jin, Zhijing. "Causality for natural language processing." [8] Chen, Ruirui, et al. "LLM-based multi-hop question answering with knowledge graph integration in evolving environments." [9] Zhang, et al. "Recursive language models. [10] Wang, et al. "Executable code actions elicit better llm agents.
Mais encore ? (avantages, spécificités, …)
Unité d'Accueil : Unité S.AI.R, Safran Tech, Rue des jeunes Bois, 78117 Châteaufort.
Début souhaité : semestre 2 2026
Parlons de vous
Compétences requises :
• Niveau d'étude : Master universitaire, Diplôme d'Ingénieur ou équivalent avec formations en Machine Learning, Natural Language Processing (NLP), Large Language Models (LLMs), Mathématiques ou dans un domaine technique pertinent.
• Solides compétences en programmation Python.
• Familiarité avec un ou plusieurs frameworks d'apprentissage profond (Transformers, Pytorch, Tensorflow, etc.).
• Une première expérience recherche dans le NLP et les LLMs serait un plus.
Localisation du poste
Localisation du poste
Europe, France, Ile de France, YVELINES (78)
Ville
Rue des jeunes bois 78117 Châteaufort
Critères candidat
Niveau d'études min. requis
BAC+5
Niveau d'expérience min. requis
Jeune diplômé-e/Première expérience