Data Scientist - Génération de Tests Fonctionnels avec Llms - Stage H/F
Stage FRANCE
Description de l'offre
Retour
Data Scientist - Génération de Tests Fonctionnels avec Llms - Stage H/F
· Scalian
· Occitanie
· 21 janv., 2026
79,710
Description
Vous êtes en Master 2 et cherchez un stage de Data Scientist (F/H) de 6 mois ? Nous disposons au sein de chez Scalian d'un Lab Innovation nommé Insights. Il est le catalyseur des projets de R&D du groupe et est réparti sur l'ensemble de la France. Contexte : Les recherches sur l'utilisation des Grands Modèles de Langage (ou Large Language Models, LLMs) ont montré des résultats prometteurs dans la génération de code source ainsi que dans la création de cas de tests unitaires. Dans le domaine du software testing, l'un des défis encore non résolus consiste à exploiter les LLMs pour les activités précoces du cycle de vie des tests, telles que les tests fonctionnels. Malgré leurs succès initiaux, il n'est pas encore clairement établi quelle est l'efficacité réelle de ces modèles pour générer des tests fonctionnels conformes aux exigences. SCALIAN Insights a mené plusieurs travaux visant à répondre à cette question, notamment en étudiant des facteurs tels que la stratégie de prompting (ou prompt engineering) et l'évaluation des tests générés sur des jeux de référence (benchmarks). La poursuite de ces travaux vise à explorer de nouvelles approches pour intégrer davantage de contexte - par exemple à partir de l'expression des besoins ou des spécifications fonctionnelles - en s'appuyant sur des techniques comme GraphRAG (Retrieval-Augmented Generation avec graphe de connaissances) ou encore sur la collaboration entre agents dotés de rôles spécifiques basés sur des LLMs (Mixture of Agents, MoA) et Model Contex Protocol (MCP). [1] Junjie Wang et al., « Software Testing with Large Language Models: Survey, Landscape, and Vision » (arXiv, 4 mars 2024), http://arxiv.org/abs/23. [2] Junlin Wang et al., « Mixture-of-Agents Enhances Large Language Model Capabilities » (arXiv, 7 juin 2024), http://arxiv.org/abs/24. [3] https://modelcontextprotocol.io/docs/getting-started/intro Vos missions s'articuleront autour des axes suivants : - Contribution au développement d'un pipeline pour générer des tests fonctionnels pour le framework Cypress avec des modèles LLMs - Développement d'un système de RAG pour enrichir les stratégies de prompt avec des documents fonctionnels (expression de besoins, spécifications fonctionnelles) - Développement d'un système d'agents basés sur des LLMs inspirés de l'architecture MoA appliqué à la génération de tests fonctionnels Cypress
Date de début
19 janv., 2026
Expérience
Inf_1
Profil
Elève ingénieur ou universitaire en dernière année de cursus Bac +5 en data science : - Connaissances en utilisation des modèles LLMs - Connaissances techniques : Python : Hugging Face Transformers, LangChain, AutoGen, MCP - Vous êtes curieux, méthodique, rigoureux et autonome
Répartition du temps de travail
Full time
Fonction
Informatique_syst_info
Formation
RJ/Qualif/Ingenieur_B5
Secteur
Systèmes numériques et performance des opérations