Les offres de “Orange”

Expire bientôt Orange

Post Doc Anonymisation de données spatio-temporelles en utilisant des structures de données agrégées de type Filtres de Bloom F/H

  • CDD
  • Coutures (Dordogne)
  • Infra / Réseaux / Télécoms

Description de l'offre

about the role

Votre rôle est d'effectuer un travail de post doc sur l'anonymisation de données spatio-temporelles en utilisant des structures de données agrégées de type Filtres de Bloom.

Contexte global du sujet de thèse et état de l'art

Contexte :

De par son rôle d'opérateur de télécommunication, Orange manipule des données sensibles, notamment par le biais des Comptes-Rendus d'Appel (CRA) ou des données de sonde des réseaux mobiles. Orange doit mettre en place des méthodes d'anonymisation de ces traces identifiantes, afin de pouvoir exploiter la richesse des informations qu'elles contiennent.

L'anonymisation de ces données non structurées est très difficile à réaliser car les comportements des personnes dans le temps sont considérés comme étant des signatures permettant potentiellement d'identifier ces personnes.

Différentes techniques d'anonymisation sont étudiées depuis plusieurs années au sein d'Orange. Parmi les techniques existantes, celles mettant en oeuvre les concepts de Filtres de Bloom sont parmi les plus utilisées aujourd'hui. L'objectif de ce post-doc est d'étudier comment améliorer ces structures pour les rendre parfaitement anonymes tout en restant précises sur les opérations d'intersections et d'unions qu'elles permettent ou de trouver d'autres structures ensemblistes permettant de faire les même opérations en garantissant un bon niveau d'anonymat.

Etat de l'art :

Les structures de données ensemblistes les plus utilisées pour faire du comptage spatio-temporel respectueux de la vie privée sont les Filtres de Bloom. Néanmoins si ces filtres sont stockés pour faire des opérations de comptage a postériori cela peut révéler des failles d'anonymisation dans la mesure où des intersections multiples permettraient d'isoler un individu [1]. Des travaux de bruitage des filtres de Bloom menés entre autre par l'INRIA [2] intégrant des mécanismes de corrections d'erreur sur des données de localisation WIFI permettent de se protéger de ce type d'attaques.

Se référer à la section 3 « Le plus de l'offre » pour des informations détaillés sur la mission scientifique et les principales activités associées à ce post doc.

Se référer à la section 3 « Le plus de l'offre » pour des informations détaillées sur la mission scientifique et les principales activités associées au post doc.

about you

Vous détenez un doctorat.

Vous êtes autonome dans votre travail de recherche et dans la rédaction d'articles scientifiques, vous êtes à l'aise dans la lecture et l'écriture en anglais.

Du point de vue technique, vous possédez de très bonnes compétences en techniques d'analyse de données (filtres de Bloom, machine-learning, statistiques) et/ou en anonymisation de données (k-anonymisation, privacy différentielle).

Avantageusement, vous possédez des connaissances supplémentaires dans les traitements BigData (map-reduce, Hadoop, Spark…).

Une appétence pour les mathématiques en jeu dans ces modèles d'anonymisation sera fortement appréciée.

additional information

Objectif scientifique - verrous à lever

L'objectif de la prestation de post-doc est d'effectuer un travail de recherche dans le but de déterminer et/ou de proposer les mécanismes les plus pertinents qui soient afin d'anonymiser des structures de données ensemblistes. Vous devrez qualifier au mieux le niveau d'anonymat offert par les différents modèles possibles, et comparer ces derniers au regard du compromis privacy/utilité atteint, et de la facilité de mise en oeuvre de chaque méthode. Ces travaux pourront faire l'objet d'un dépôt de brevet et/ou de publications scientifiques de recherche, en collaboration avec les chercheurs du département OLS/ARSEC.

Approche méthodologique-planning

Dans un premier temps, vous effectuerez un état de l'art afin, d'une part, d'identifier les meilleures structures de données permettant de faire des opérations ensemblistes de cardinalités d'ensembles, d'unions et d'intersections multiples sur des volumes importants de données et d'autre part de faire l'inventaire des meilleures techniques qui permettraient de rendre anonyme ces structures de données. En particulier, vous vous approprierez les techniques ensemblistes des filtres de Bloom (cardinalités d'ensembles, d'unions et d'intersections multiples) ainsi que les méthodes de bruitage telle que la privacy differentielle.

Suite à cet état de l'art, vous proposerez et évaluerez les solutions les mieux adaptées aux contraintes d'anonymisation de données spatio-temeporelles.

department

Au sein des Orange Labs, le post doc sera intégré au département Sécurité. Ces équipes sont en charge de maintenir un haut niveau d'expertise en sécurité pour Orange, notamment autour des infrastructures et des services. Ces équipes traitent tout particulièrement le cas de la sécurité du cloud computing, la détection/protection contre les intrusions, l'authentification forte, la cryptographie, la cyber-sécurité et la protection des données personnelles (anonymisation, traçabilité, …). Elles sont basées sur les sites d'Orange Labs à Chatillon ou Caen.

Qu'est ce qui fait la valeur ajoutée de cette offre ?

L'activité de recherche du post-doc sera directement liée à un projet collaboratif ADAGE dont le but est de fournir des méthodes pour anonymiser des données de mobilité.

Références :

[1] Groupe de travail «Article 29», Avis 05/2014 sur les techniques d'anonymisation.

[2] BLIP: Non-interactive Differentially-Private Similarity Computation on Bloom filters, Mohammad Alaggan, Sébastien Gambs, and Anne-Marie Kermarrec, A.W. Richa and C. Scheideler (Eds.): SSS 2012, LNCS 7596, pp. 202-216, Springer-Verlag Berlin Heidelberg

[2] Difference Bloom Filter: a Probabilistic Structure for Multi-set Membership Query, Dongsheng Yang, Deyu Tian, Junzhi Gong, Siang Gao, Tong Yangy, Xiaoming Li

[3] Practical Multi-party Private Set Intersection from Symmetric-Key Techniques, Vladimir Kolesnikovy, Naor Mataniaz, Benny Pinkasz, Mike Rosulek, Ni Trieu, August 2017

[4] EsPRESSo: Efficient Privacy-Preserving Evaluation of Sample Set Similarity, Carlo Blundo, Emiliano De Cristofaro, and Paolo Gasti, R. Di Pietro et al. (Eds.): DPM 2012 and SETOP 2012, LNCS 7731, pp. 89-103, Springer-Verlag Berlin Heidelberg 2013

[5] S. Tarkoma et al, Theory and Practice of Bloom Filters for Distributed Systems, IEEE Communications Surveys & Tutorials, Vol.14, N°1

contract

Post Doc

Faire de chaque avenir une réussite.
  • Annuaire emplois
  • Annuaire entreprises
  • Événements