Stage Data Science - Détection d'anomalies avec Khiops F/H
Stage Châtillon-en-Vendelais (Ille-et-Vilaine)
Description de l'offre
votre rôle
Les algorithmes de détection d’anomalies sont une brique essentielle pour la supervision des services internes comme externes chez Orange. Ils permettent d’identifier rapidement tout comportement inhabituel susceptible d’indiquer un incident ou une défaillance, contribuant ainsi à l'excellence de notre qualité de service.
Ce stage consiste en explorer une nouvelle méthodologie pour la détection d'anomalies. Elle repose sur la combinaison de deux familles de modèles fournis par la librairie d'AutoML Khiops
(https://www.khiops.org) :
- les histogrammes régularisés non-supervisés
- les modèles predictifs : classifieurs et regresseurs
L'idée est d'exploiter le modèle génératif associé à un prédicteur et le combiner avec les histogrammes de chaque marginal pour obtenir une estimation de la densité jointe des données. Les anomalies seront définies alors par seuillage sur la densité estimée.
Un point additionnel de cette méthodologie est qui permettrait de chercher des anomalies sur des données multi-table (relationnelles).
Vos tâches seront les suivantes :
- Comprendre la théorie des modèles de Khiops
- Assimiler la théorie de la nouvelle méthodologie
- Prendre en main la librairie Python de Khiops
- Implémenter une preuve de concept (PoC) de la nouvelle méthodologie
- Mener des expériences comparatives aux méthodes de l'état de l'art (Isolation Forest, One-Class
SVM, etc)
- Étendre la méthodologie sur des données multi-table
votre profil
- En dernière année d’école d’ingénieur ou Master 2, spécialisé en informatique/mathématique/data science/IA.
- Maitrise de Python et son stack data science (numpy, scipy, scikit-learn)
- Maitrise de la théorie des probabilités basique
- Maitrise des concepts basiques de Machine Learning
- Capacité d'analyse et synthèse
- Sens de la communication et qualités rédactionnelles
entité
Composée d'une vingtaine de permanents, accueillant 4 doctorants, PROF est une équipe orientée analyse de données, machine learning et intelligence artificielle, conjuguant travaux de recherche et mise en oeuvre applicative.
Les membres de l'équipe sont basés à Lannion (majoritairement) et Paris.
contrat
Stage
Durée : 6 mois
Date souhaitée de prise de poste : 01 avr. 2026
Stage rémunéré
Seules vos compétences comptent
Quel que soit votre âge, genre, origine, religion, orientation sexuelle, neuroatypie, handicap ou apparence, nous encourageons la diversité au sein de nos équipes car c’est une force pour le collectif et un vecteur d’innovation
Orange est une entreprise handi-accueillante : n'hésitez pas à nous faire part de vos besoins spécifiques.