Instruction et Développement de Solution de Text-Mining pour l'Ingénierie Nucléaire H/F
Houilles (Yvelines)
Description de l'offre
Description
Les activités peuvent aller de l'extraction d'information, l'amélioration de la recherche d'information des bases documentaires, la catégorisation automatique des documents, le développement d'outil spécifique, à des tests d'outils spécialisés dans le text-mining développés par des entreprises externes. Travail attendu La mission principale du stage est d'appuyer l'équipe d'ingénieurs chercheurs travaillant dans le domaine du text-mining/NLP basée à EDF Lab Chatou. Les travaux consistent plus précisément à tester et évaluer des méthodes de text-mining sur un cas d'usage spécifique dans le domaine de la production d'énergie. Les documents techniques du producteur ont différents types de spécificités à prendre en compte : un vocabulaire technique, une variété de documents à traiter (rapport d'analyse, note d'étude, REX, constat de maintenance, documentation technique, exigences fonctionnelles etc.), des procédures de traitement différents selon les métiers, etc. Ces caractéristiques sont déterminantes pour les applications des différentes méthodes de text-mining/NLP. Le but du stage sera d'étudier les moyens d'intégration d'une ontologie pour l'amélioration de la recherche textuelle pour une plateforme de mise à disposition et de visualisation des données, conçue par la R&D. En fonction de ses compétences et de l'avancée des études R&D, le stagiaire interviendra sur les thématiques détaillées ci-dessous : 1. Prise en main de la plateforme de mise à disposition des données des producteurs 2. Développement d'un code exploitant l'ontologie pour l'amélioration de la recherche textuelle 3. Étude et analyse des résultats de la méthode 4. Restitution
Date de début
29 nov., 2025
Profil
Niveau d'études : M2 Compétences techniques : · TAL : connaissances d'au moins une des méthodes : d'IA symbolique, machine-learning, deep-learning. · Modélisation des connaissances : des bases en développement et/ou exploitation d'ontologie · Langage de programmation : Python · GitLab · Linux Langue : français ou anglais de bon niveau (écrit et parlé) Savoir-être : · Autonomie, capacité d'initiative · Rigueur · Persévérance, motivation · Esprit critique
Secteur
Energie, environnement