Les offres de “Orange”

Expire bientôt Orange

Post-Doc : Géodistribution d'une base de données dans le réseau d'un opérateur (Fog) pour la gestion de l'internet des objets F/H

  • France
  • Infra / Réseaux / Télécoms

Description de l'offre

about the role

Effectuer un travail de recherche sur la géodistribution d'une base de données dans le réseau d'un opérateur (Fog) pour la gestion de l'internet des objets.

Vous trouverez ci-dessous la description du contexte de ce travail de recherche.

La mission et les principaux objectifs scientifiques seront précisés sous le titre "Entité".

A l'heure actuelle, 15 milliards d'objets sont connectés à Internet et les prévisions indiquent entre 30 et 75 milliards d'objets en 2020. Dans ce cadre Orange veut se positionner comme un acteur incontournable du secteur. Pour ce faire un composant important est le système d'informations référençant la description de tous les objets connectés, leurs interactions et intégrations dans le monde réel.

Orange possède un atout indéniable pour atteindre cet objectif : ses infrastructures de communication. Pour tirer parti de cet atout, le paradigme de Fog Computing[1] semble le plus adapté, le but étant de positionner les calculs et le stockage de données à l'endroit le plus approprié dans l'infrastructure depuis les centres de calcul jusqu'aux objets[2]. Dans le contexte de l'Internet des objets, du fait de la géo-distribution des objets, un tel système permettra d'avoir de meilleures QoS[3].

Dans la conception d'un « facebook » des objets l'idée est de s'appuyer sur une base de données orientée graphe pour maintenir une référence à chaque objet et caractériser les relations/interactions qui les lient. Dans ce champ d'application, plusieurs solutions existent : Neo4J, Titan, OrientDB… Ces bases permettent de parcourir aisément des très grands graphes et donc de faciliter les recherches complexes de relations entre objets. Dans notre contexte Fog Computing, nous prônons une distribution de la gestion de ce graphe au travers de toute l'infrastructure de l'opérateur, ce qui implique un partitionnement du graphe où chaque partie serait gérée indépendamment.

Dans le cadre de l'internet des objets, la taille du graphe à analyser sera grande, de l'ordre de plusieurs milliards de sommets et un ordre de grandeur de plus d'arcs et donc maintenir tout le graphe sur un seul serveur est voué à l'échec.

Certaines bases orientées graphe proposent un mode clusterisé. Elles cherchent alors à optimiser les performances du système par le biais, par exemple, de l'équilibrage de charge, en répliquant de façon cohérente le graphe sur chacune des machines du cluster (cf Neo4J). D'autres se basent sur un système de stockage distribué, mais perdent en efficacité du fait que le stockage n'a pas la connaissance du graphe et donc ne peut pas optimiser le placement des noeuds et des arcs (eg Titan/Cassandra).

La géolocalisation des objets est un besoin qui, au-delà des nécessités du Fog Computing, apparaît dans de nombreuses applications, de la réalité augmentée, aux voitures sans chauffeur en passant par les drones. Cependant les bases de données spatiales ne sont efficaces que quand les objets sont immobiles[3], par contre si les objets sont mobiles et en très grand nombre d'autres approches devront être explorées[4].

En plus des aspects spatiaux, la dimension temporelle permet de faire le suivi des états des objets, connaitre leur comportement, et aussi de retracer le séquencement et l'enchainement des actions entre objets et ainsi que de mieux comprendre leurs interactions et la causalité du système. Cela permettrait donc de faire de l'analyse à posteriori d'un événement (e.g. rejouer le « film » d'un accident) et faire des prédictions/projections d'occurrences similaires.

about you

Le ou la candidat(e) devra avoir obtenu un doctorat en informatique avec une forte composante d'algorithmique distribuée.

Une première expérience de recherche en bases de données et/ou en graphes complexes sera valorisée et grandement appréciée.

Pour l'implémentation des algorithmes conçus et leur validation par des simulations, des compétences en programmation sont absolument nécessaires.

additional information

Références :

[1] A. V. Dastjerdi, et al. Fog computing: Principals, architectures, and applications. 2016.

[2] S. Sarkar, S. Chatterjee, and S. Misra. Assessment of the suitability of fog computing in the context of internet of things. IEEE Transactions on Cloud Computing, 2015.

[3] E. van der Zee and H. Scholten. Application of geographical concepts and spatial technology to the internet of things, 2013.

[4] Fast Data: The Next Step after Big Data. http://www.infoworld.com/article/2608040, 2014.

department

Le ou la post-doctorant(e) sera pleinement intégré(e) au sein d'une équipe de recherche Orange Labs, très active au sein de l'écosystème d'innovation (IRT B-Com, pôles de compétitivité Images & Réseaux et Systematic…).

Ses travaux contribueront directement aux activités d'innovation menées pour le compte du Groupe, avec des perspectives de concrétisation rapide, à travers l'implémentation dans les infrastructures exploitées au sein de l'entreprise.

Pour cela, il ou elle aura accès aux plateformes et outils de laboratoire dimensionnés pour les services grand public et entreprises.

Ses travaux prennent place au sein d'une des plateformes d'intégration de la recherche définies par le Orange Labs Recherche. Le ou la post-doctorant(e) sera donc amené(e) à collaborer avec les équipes projets qui utiliseront cette plateforme.

Description de la mission et des principales activités associées à la thèse

L'objectif est la distribution de la gestion du graphe des objets au travers de toute l'infrastructure opérée par un opérateur de l'IoT (cf. Fog Computing). L'enjeu majeur consiste à mettre en exergue un partitionnement du graphe permettant une distribution sur une architecture de type Fog Computing (i.e. verticalement répartie depuis les centres de calcul jusqu'aux objets). Le partitionnement de données rassemble les méthodes permettant de découper une population en groupes. Les critères guidant ce processus peuvent varier, mais les objectifs sont connus.

Un premier objectif est de compresser/regrouper les données en entrée et faciliter leur traitement en considérant chaque groupe comme un sous-ensemble indépendant. Cette approche correspond au paradigme “diviser pour régner”.

Un deuxième est d'extraire de la connaissance à partir de ces groupes. Cet objectif se base naturellement sur l'analyse de graphes et se traduit par les problèmes de partitionnement de graphes ou, plus généralement, de détection de communautés.

Parmi les critères, un des plus discriminants est la position géographique qui a de plus l'avantage d'être en adéquation à la topologie réseau (cf. architecture Fog). Concrètement cela se traduirait par : le graphe des objets situés dans une région géographique est géré par le serveur le plus proche dans cette région. Ce critère de localité apportera une meilleure qualité de service dans le sens où les latences globales induites par le réseau entre les objets connectés et leurs représentations dans la base seront ainsi minimisées (nous aurons une meilleure fraicheur des données).

Le découpage choisi devra minimiser les dépendances entre régions, tout en maintenant la navigabilité dans l'intégralité du graphe. Le système devra donc garantir l'état et la cohérence des liens du graphe.

Une attention particulière sera portée aux objets mobiles qui, de fait, migreront d'une région à une autre.

Aussi l'intégration de la dimension temporelle devra être étudiée pour permettre l'analyse d'événement et la prédiction de comportement. Cela implique l'historisation des états et des relations des objets, l'étude du stockage et de l'API nécessaire.

Les résultats attendus des recherches menées dans le cadre de ce post-doctorat alimenteront principalement une des 3 plateformes d'intégration de la recherche d'Orange. Une preuve de concept devra être développée afin de valider les résultats. Cela impliquera la mise en place d'une infrastructure géo distribuée sur au moins 3 sites et la simulation d'un grand nombre d'objets mobiles dans un scénario pertinent.

Une intégration avec la solution Kiwano, développée par nos équipes, pourra permettre d'optimiser la recherche et la visualisation des objets en réalité augmentée.

contract

Post Doc

Faire de chaque avenir une réussite.
  • Annuaire emplois
  • Annuaire entreprises
  • Événements