Emploi

Trouvez facilement votre premier job

Découvrir

L'actualité professionnelle des 18-30 ans

Découvrir
Finance

Découvrez les aides financières auxquelles vous êtes éligible

Découvrir
Santé
🎁 1 mois gratuit

La mutuelle qui prend soin de la santé des jeunes

Découvrir
Mobilité

Révisez le code de la route à partir de 9,90€

Découvrir

Offers “Edf”

Expires soon Edf

Stage - - H/F

  • Stage
  • Palaiseau ( Essonne )
  • Master, Titre d'ingénieur, Bac +5
  • Studies / Statistics / Data

Job description

Proposition de stage de master 2



Comparaison d’algorithmes de Machine Learning pour la prévision de consommations électriques dans des conditions opérationnelles



Descriptif



Contexte et Objectifs métier



La prévision de la consommation électrique joue un rôle central pour les activités d’EDF: connaître avec précision la consommation électrique de l’ensemble de ses clients permet à l’entreprise de satisfaire à tout moment la demande, de produire à moindre coût et de se positionner sur les marchés de l’énergie.



Le groupe « Prévisions de consommation » de la R&D d’EDF a pour mission de développer et d’implémenter des modèles de prévision avec une connaissance approfondie des mécanismes régissant le processus de consommation électrique. Ces modèles sont destinés aux branches opérationnelles qui assurent la gestion du parc de production EDF ainsi qu’à ENEDIS qui se doit de prévoir à différents horizons de temps la consommation électrique en de nombreux points du réseau.



Pour ces modèles nous avons exploré ces dernières années un vaste panel de méthodes:



Modélisation linéaires
lasso, lars2, lars, enet, foba, icr, leapBackward, leapForward, leapSeq, lm, lmStepAIC, spikeslab, glm, BstLm, glm, glmboost, glmnet, glmStepAIC



Generalised Additive Models
mgcv, bagEarth, bagEarthGCV, bstTree, earth, gamLoess, gamSpline, gcvEarth



Modélisation basée sur des projections
pcr, ppr, pls, plsRglm, simpls



Arbres de regressions:
gbm, blackboost, ctree, ctree2, rpart1SE, rpart2, treebag, xgbTree



Méthodes à noyau
Kernelpls, svmLinear, svmPoly, svmRadial, svmRadialSigma, svmRadialCost, knn, kknn



Pour les outils opérationnels, nous travaillons essentiellement avec des modèles additifs à projection sur des bases de splines (modèles GAM, voir ci-dessous Wood, S. (2006) pour une description de la méthode, Goude, Y.; Nedellec, R. & Kong, N. (2014), Pierrot, A. & Goude Y. (2011), pour des applications à la prévision de consommation électrique ; cependant, le développement de nouvelles technologies de mesure de la consommation électrique (compteurs intelligents, mesures en différents points des réseaux) ouvre de nouvelles perspectives en termes de modélisation. Nous menons donc des travaux pour tester les forêts aléatoires, les méthodes de boosting, les réseaux de neurones ainsi que les méthodes de mélanges de prédicteurs (voir Gaillard, P. (2015)) pour prévoir la consommation électrique.



Le but du stage consistera à faire une comparaison de ces méthodes, sur des données de consommation électrique en simulant des contraintes métiers EDF. L’objectif sera de souligner les forces et les faiblesses de chacune de ces méthodes et de déterminer dans quelles circonstances elles sont les plus performantes (à quelle maille du réseau, sur quelles périodes de l’année….).



Planning envisagé



S’approprier le sujet et les attendus du stage
S’approprier des données de consommation électrique
Modéliser la consommation électrique avec plusieurs méthodes de Machine Learning et prendre en compte les contraintes métiers d’EDF
Procéder à des études de sensibilités aux paramètres
Comparer les différentes méthodes
Ecrire un rapport de stage synthétisant les résultats obtenus


Encadrants et contacts



Sandra Claudel, ingénieur-chercheur à EDF-Lab
Gilles Cabriel, ingénieur-chercheur à EDF-Lab


Déroulement



Durée proposée : 6 mois

Date de début souhaitée : 1er semestre 2019

Localisation : Sur le nouveau site d’EDF R&D à Palaiseau, vous évoluerez au sein d’une équipe dédiée à la prévision de consommation et plus généralement à l’analyse de données à EDF R&D.

Rémunération : 1250€ (ou 83,4% du SMIC) pour un stage de fin d’études. Une indemnité de logement est attribuée aux étudiants dont l'établissement de formation est en province.



Très courte bibliographie

The Elements of Statistical Learning T Hastie, R Tibshirani, J Friedman Springer.

Generalized Additive Models S Wood Chapman & Hall/CRC

Gaillard, P. (2015). Contributions à l’agrégation séquentielle robuste d’experts: Travaux sur l’erreur d’approximation et la prévision en loi. Applications à la prévision pour les marchés de l’énergie (Doctoral dissertation, Paris 11).

Goude, Y.; Nedellec, R. & Kong, N. (2014) Local Short and Middle Term Electricity Load Forecasting With Semi-Parametric Additive Models Smart Grid, IEEE Transactions on, 2014, 5, 440-446.

Pierrot, A. & Goude Y. (2011), Short-Term Electricity Load Forecasting With Generalized Additive Models Proceedings of ISAP power, pp 593-600, 2011.

Ideal candidate profile

Niveau d’étude : M2 recherche en mathématiques ou statistiques

Domaines de compétences : data science, machine learning, statistique

Informatique : R et Python

Connaissances supplémentaires : autres domaines des mathématiques appliquées, rédaction scientifique

Savoir-être : dynamique, inventif, curieux, sérieux, motivé, ouvert aux autres, humour apprécié.