Thèse - protection des données à caractère personnel dans les services énergétiques - H/F - Edf - Palaiseau - Wizbii

Thèse - protection des données à caractère personnel dans les services énergétiques - H/F

  • Par Edf
  • Thèse
  • Palaiseau (Essonne)
  • Master, Bac +5
2017-11-20T18:45:59+0000

Description de l'offre

Les services énergétiques ont de plus en plus recours à des algorithmes pour permettre aux clients d'échanger de l'énergie avec leurs voisins dans une architecture de microgrids, proposer de nouveaux services multi-domaines, optimiser l'énergie des foyers ou la stabilité des réseaux électriques. Ces algorithmes reposent sur le partage de données avec des voisins ou une tierce partie, par exemple le gestionnaire de réseau. Ces données peuvent être des données de consommation et de production, ou encore les données relevées par des objets déployés au sein d'un foyer.

 

Hors, ces données ont un caractère personnel (ces données sont appelées " Données à caractère personnel " ou DCP), et sont donc sensibles. Par exemple, les données de consommation énergétique peuvent donner des informations sur les activités des occupants d'une maison : elles permettent de déduire leur présence ou absence, le nombre d'occupants, leur âge, leur religion, leurs habitudes. Le développement d'algorithmes de NALM (Non-intrusive Appliance Load Monitoring), qui décomposent la consommation énergétique globale en une séquence d'allumage et d'extinction d'appareils, est un pan de recherche actif [1], [2], [3].

 

La littérature propose plusieurs types d'algorithmes d'agrégation de données énergétiques respectueux de la vie privée [4], [5], [6]. En général, les données énergétiques utilisées par ces algorithmes correspondent à des courbes de charge, c'est-à-dire des séries temporelles de la consommation énergétique, et utilisent des méthodes comme du chiffrement partiellement homomorphe, du calcul multipartite sécurisé ou de la confidentialité différentielle pour garantir la protection des données personnelles. Ces techniques apportent différentes garanties :

le chiffrement partiellement homomorphe et le calcul multipartite sécurisé garantissent que personne ne peut accéder aux données d'un client particulier ;
la confidentialité différentielle garantit qu'un résultat final tel que l'agrégat d'un ensemble de  données de différents clients, ne révèle pas d'informations individuelles sur les clients.
Ces techniques sont complémentaires dans le sens où le chiffrement partiellement homomorphe et le calcul multipartite sécurisé garantissent qu'aucune entité intervenant dans un calcul ne peut accéder aux DCP propres à chaque client, tandis que la confidentialité différentielle garantit que le résultat final obtenu (en clair) ne permet pas de faire fuiter d'autres informations que le résultat lui-même.

Les agrégations respectueuses de la vie privée sont en général des traitements spécifiques et peu évolués : moyennes et partitionnement de courbes de charge. En effet, les techniques comme le chiffrement complètement homomorphe, qui permettraient d'implémenter des traitements évolués tout en protégeant les DCP des clients, restent encore trop coûteuses à mettre en oeuvre.

 

Le cas qui nous intéresse est différent, puisque le but n'est pas simplement de faire des moyennes ou du partitionnement, mais d'aboutir à des algorithmes d'optimisation énergétique respectueux de la vie privée.

 

L'objectif des travaux de thèse est de concevoir des solutions permettant d'intégrer la protection des DCP dans les algorithmes d'optimisation énergétique existants tout en limitant les coûts associés (calculs, bande passante).

 

Les travaux de thèse pourront se dérouler en 4 étapes :

Etat de l'art sur les techniques de protection des DCP, en particulier, l'analyse de la confidentialité différentielle et de ses limites en matière de protection contre la ré-identification, mais aussi le chiffrement partiellement homomorphe, le calcul multipartite sécurisé.
Etude des algorithmes d'optimisation énergétique et choix d'un algorithme sur lequel intégrer la protection des DCP. Cette étape visera également à définir des modalités de validation précise, permettant de quantifier le coût de l'introduction de la protection des DCP en matière de perte de précision et d'impact sur les performances des algorithmes.
Conception et validation d'une première approche avec l'intervention d'un tiers. Ce tiers réalise l'optimisation énergétique, mais ne doit pas obtenir les DCP des clients. L'objectif est de protéger les DCP de chaque client vis-à-vis des autres clients et du tiers, en utilisant du calcul multipartite sécurisé ainsi que de la confidentialité différentielle.
Conception et validation d'une seconde approche avec l'intervention d'un tiers. Ce tiers n'est pas considéré de confiance, ni pour les DCP, ni pour gérer l'optimisation. Le but est donc d'arriver à un algorithme de réponse à la demande respectueux de la vie privée et vérifiable, pour garantir que le tiers ne favorise pas un foyer particulier. Une alternative est d'arriver à un algorithme décentralisé, c'est-à-dire qui ne requiert pas de tiers pour arriver au résultat.
Les résultats issus des étapes 3 et 4 seront validés sur les cas d'usages définis pendant la deuxième étape, et suivant les modalités de validation de cette étape.

                                                              

Les contributions seront valorisées dans des conférences et journaux scientifiques de haut niveau.

 

[1] G. W. Hart, "Residential Energy Monitoring and Computerized Surveillance via Utility Power Flows," IEEE Technology and Society Magazine, vol. 8, n°12, pp. 12-16, 1989.

[2] A. Prudenzi, "A neuron nets based procedure for identifying domestic appliances pattern-of-use from energy recordings at meter panel," chez Power Engineering Society Winter Meeting, 2002.

[3] M. El Guedri, "Caractérisation aveugle de la courbe de charge électrique : Détection, classification et estimation des usages dans les secteurs résidentiel et tertiaire," 2009.

[4] M. Jawurek, F. Kerschbaum et G. Danezis, "SoK: Privacy Technologies for Smart Grids - A Survey of Options," Microsoft Technical Report, 2012.

[5] G. Danezis, C. Fournet, M. Kohlweiss et S. Zanella-Béguelin, "Smart Meter Aggregation via Secret-Sharing," chez Smart Energy Grid Security Workshop, 2013.

[6] T. Allard, G. Hébrail, F. Masseglia et E. Pacitti, "Chiaroscuro: Transparency and Privacy for Massive Personal Time-Series Clustering," chez SIGMOD, 2015.

 

Les encadrants de la thèse seront Prof. Maryline Laurent (Télécom SudParis) et Paul Lajoie-Mazenc (EDF Lab Paris-Saclay).

Profil recherché

Candidat(e) sérieux(se) et motivé(e) de niveau M2, avec des connaissances approfondies à la fois théoriques et pratiques, en particulier dans les domaines suivants : protocoles de sécurité et cryptographie.

La thèse débutera à l'automne 2017
Reçois les offres qui te correspondent par email !
Des milliers de jobs sont disponibles pour toi sur Wizbii :)

À propos de Edf

EDF, électricien performant et responsable, champion de la croissance bas carbone est un des leaders sur le marché de l’énergie en Europe. EDF est présent sur l’ensemble des métiers : la production, le transport, la distribution, le négoce et la vente d’énergies. Premier producteur d’électricité en Europe, le Groupe dispose en France de moyens de production essentiellement nucléaires et hydrauliques fournissant à 87% une électricité sans émission de CO2. Le Groupe participe à la fourniture d’énergies et de services à près de 28 millions de clients en France. Par la qualité de ses équipes, ses capacités de R&D, son savoir-faire d'ingénierie et d'exploitation d'unités de production et de réseaux, par ses offres d'efficacité énergétique, il apporte des solutions compétitives pour concilier durablement développement économique et protection du climat.

 

 

707 jobs disponibles chez Edf

Trouve ton futur job sur Wizbii,
la 1ère plateforme professionnelle pour l’emploi des jeunes

Offres d'emploi

Ton job dans la poche
Télécharger