Expires soon Edf

Stage - - H/F

  • Stage
  • Palaiseau (Essonne)
  • Master, Titre d'ingénieur, Bac +5
  • Studies / Statistics / Data

Job description

Proposition de stage de master  2  

 

Comparaison d’algorithmes de Machine Learning pour la prévision de consommations électriques dans des conditions opérationnelles

 

Descriptif

 

Contexte et Objectifs métier  

 

La prévision de la consommation électrique joue un rôle central pour les activités d’EDF: connaître avec précision la consommation électrique de l’ensemble de ses clients permet à l’entreprise de satisfaire à tout moment la demande, de produire à moindre coût et de se positionner sur les marchés de l’énergie.

 

Le groupe « Prévisions de consommation » de la R&D d’EDF a pour mission de développer et d’implémenter des modèles de prévision avec une connaissance approfondie des mécanismes régissant le processus de consommation électrique. Ces modèles sont destinés aux branches opérationnelles qui assurent la gestion du parc de production EDF ainsi qu’à ENEDIS qui se doit de prévoir à différents horizons de temps la consommation électrique en de nombreux points du réseau.

 

Pour ces modèles nous avons exploré ces dernières années un vaste panel de méthodes:

 

Modélisation linéaires
lasso, lars2, lars, enet, foba, icr, leapBackward, leapForward, leapSeq, lm, lmStepAIC, spikeslab, glm, BstLm, glm, glmboost, glmnet, glmStepAIC

 

Generalised Additive Models
mgcv, bagEarth, bagEarthGCV, bstTree, earth, gamLoess, gamSpline, gcvEarth

 

Modélisation basée sur des projections
pcr, ppr, pls, plsRglm, simpls

 

Arbres de regressions:
gbm, blackboost, ctree, ctree2, rpart1SE, rpart2, treebag, xgbTree

 

Méthodes à noyau 
Kernelpls, svmLinear, svmPoly, svmRadial, svmRadialSigma, svmRadialCost, knn, kknn

 

Pour les outils opérationnels, nous travaillons essentiellement avec des modèles additifs à projection sur des bases de splines (modèles GAM, voir  ci-dessous Wood, S. (2006) pour une description de la méthode,   Goude, Y.; Nedellec, R. & Kong, N. (2014), Pierrot, A. & Goude Y. (2011), pour des applications à la prévision de consommation électrique ; cependant, le développement de nouvelles technologies de mesure de la consommation électrique (compteurs intelligents, mesures en différents points des réseaux) ouvre de nouvelles perspectives en termes de modélisation. Nous menons donc des travaux pour tester les forêts aléatoires, les méthodes de boosting, les réseaux de neurones ainsi que les méthodes de mélanges de prédicteurs (voir Gaillard, P. (2015)) pour prévoir la consommation électrique.

 

Le but du stage consistera à faire une comparaison de ces méthodes, sur des données de consommation électrique en simulant des contraintes métiers EDF. L’objectif sera de souligner les forces et les faiblesses de chacune de ces méthodes et de déterminer dans quelles circonstances elles sont les plus performantes (à quelle maille du réseau, sur quelles périodes de l’année….).

 

Planning envisagé 

 

S’approprier le sujet et les attendus du stage            
S’approprier des données de consommation électrique
Modéliser la consommation électrique avec plusieurs méthodes de Machine Learning et prendre en compte les contraintes métiers d’EDF
Procéder à des études de sensibilités aux paramètres
Comparer les différentes méthodes
Ecrire un rapport de stage synthétisant les résultats obtenus
 

Encadrants et contacts

 

Sandra Claudel, ingénieur-chercheur à EDF-Lab
Gilles Cabriel, ingénieur-chercheur à EDF-Lab
 

Déroulement

 

Durée proposée : 6 mois

Date de début souhaitée : 1er semestre 2019

Localisation : Sur le nouveau site d’EDF R&D à Palaiseau, vous évoluerez au sein d’une équipe dédiée à la prévision de consommation et plus généralement à l’analyse de données à EDF R&D.

Rémunération :  1250€ (ou 83,4% du SMIC) pour un stage de fin d’études. Une indemnité de logement est attribuée aux étudiants dont l'établissement de formation est en province.

 

Très courte bibliographie

The Elements of Statistical Learning   T Hastie, R Tibshirani, J Friedman Springer.

Generalized Additive Models  S Wood Chapman & Hall/CRC

Gaillard, P. (2015). Contributions à l’agrégation séquentielle robuste d’experts: Travaux sur l’erreur d’approximation et la prévision en loi. Applications à la prévision pour les marchés de l’énergie (Doctoral dissertation, Paris 11).

Goude, Y.; Nedellec, R. & Kong, N. (2014) Local Short and Middle Term Electricity Load Forecasting With Semi-Parametric Additive Models Smart Grid, IEEE Transactions on, 2014, 5, 440-446.

Pierrot, A. & Goude Y. (2011), Short-Term Electricity Load Forecasting With Generalized Additive Models Proceedings of ISAP power, pp 593-600, 2011.

Ideal candidate profile

Niveau d’étude : M2 recherche en mathématiques ou statistiques

Domaines de compétences : data science, machine learning, statistique

Informatique : R et Python

Connaissances supplémentaires : autres domaines des mathématiques appliquées, rédaction scientifique

Savoir-être : dynamique, inventif, curieux, sérieux, motivé, ouvert aux autres, humour apprécié.