Les offres de “Orange”

Expire bientôt Orange

Thèse - L'apprentissage Multi-tâche pour la Découverte de Contextes du Home F/H

  • CDI
  • Cesson-Sévigné (Ille-et-Vilaine)
  • Développement informatique

Description de l'offre



about the role

Les données générées quotidiennement dans l'environnement domestique, représentant les exigences et les comportements d'utilisateurs, peuvent alimenter la création de différents modèles intelligents de service principalement basés sur l'apprentissage automatique et l'apprentissage profond. Parmi ces services (p. ex., Home automation, assistant digital, gestion de l'énergie), les contextes du Home contiennent les informations implicites et contextuelles liées aux utilisateurs du Home (p. ex., la présence, les activités, les préférences personnelles, situations d'urgences, etc.), et la découverte de ces contextes est un enjeu important pour l'identification de besoins d'utilisateur, la recommandation de services ainsi que leur personnalisation.

A la suite de travaux [2] de classification de données du Home, les modèles spécifiques sont actuellement déployés pour découvrir individuellement chaque contexte. En conséquence, différents modèles existent simultanément dans l'environnement du Home, cependant ils ne sont pas forcément optimisés globalement au niveau du Home pour répondre aux contraintes de l'environnement edge (p. ex., latence, capacité offline, sécurité et vie privée) avec les ressources de calcul limitées. La technologie de l'apprentissage multi-tâche [3] permet d'extraire plusieurs informations avec un modèle unique de classification en apprenant des tâches connexes, et d'optimiser les résultats ainsi que la performance de tâches multiples. Cette technologie s'appuie principalement sur (mais n'est pas limité à) l'apprentissage profond qui découvert les relations non linéaires, temporelles et spatiales des données. Ce sujet de thèse se focalise sur l'apprentissage multi-tâche pour créer un réseau de neurones unique et découvrir des informations de contexte du Home par la modélisation, la combinaison et l'optimisation de modèles.

L'apprentissage multi-tâche a été utilisé avec succès dans la plupart des applications de l'apprentissage automatique, depuis le traitement du langage naturel et la reconnaissance vocale jusqu'à la vision par ordinateur et la découverte de contextes d'utilisateurs. Le travail dans [4] présente un algorithme simultané pour la détection du visage, la localisation, l'estimation du geste et la reconnaissance du genre dans une photo en utilisant des réseaux de neurones convolutifs, dont les résultats montrent non seulement que la précision du modèle proposé est bien plus élevée que celle des algorithmes comparables pour chacune de ces quatre tâches, mais aussi que la taille du modèle proposé est plus petite que la taille de l'ensemble de ces quatre modèles. Ce sujet de thèse s'appuie sur cette technologie de l'apprentissage multi-tâche et l'adapte aux cas d'usage et à l'environnement du Home. Sur l'aspect de l'analyse de données du Home, différents travaux de la classification et la prédiction du trafic réseau basé sur l'apprentissage automatique sont introduits dans [5-7], qui sont réalisés à la suite de l'explosion des données, le progrès de l'apprentissage profond et l'amélioration des capacités de calcul. Une autre approche d'apprentissage supervisé est présentée dans [8] pour la reconnaissance et la prédiction d'activités d'utilisateur à partir des données de capteurs ambiants installés dans la maison. Ce sont des pistes à cibler lors de la thèse pour réutiliser les données et optimiser les modèles avec l'apprentissage multi-tâche. Enfin un travail récent [1] détecte simultanément l'environnement et la mobilité de l'utilisateur en analysant les données du réseau mobile. Ce sujet envisage de s'appuyer fortement sur ce travail afin de l'étendre aux cas d'usage du Home.

about you

Vous êtes titulaire d'un master recherche ou équivalent, ou vous êtes diplômé(e) d'une école d'ingénieurs en Informatique ou Telecom ou équivalent avec, de préférence, une spécialité dans un ou plusieurs domaines de l'Intelligence Artificielle.

·   Expériences (stage ou projet) sur l'application de l'apprentissage profond et/ou sur l'analyse de données hétérogènes sont souhaitées.
·   Expériences (stage ou projet) en ingénierie des réseaux et/ou télécom incluant des aspects ayant trait à l'IA sont souhaitées.
·   Expériences de publications scientifiques ou de dépôt de brevet seraient un plus.
- Maitrise de plusieurs technologies d'apprentissage automatique et d'apprentissage profond
·   Bonnes connaissances en réseaux et protocoles
·   Savoir travailler en autonomie et être enthousiaste sur les problématiques à la pointe de la recherche
·   Curieux, Technophile et Organisé
·   Compétences en langages de développement logiciel (C/C++ ou Java, Python ou R)
·   Compétences en frameworks et bibliothèques d'apprentissage automatique (Tensorflow, Keras, PyTorch, ouscikit-learn) et de la manipulation mathématique (Numpy, Matplotlib, SciPy)
·   Des connaissances en outils de gestion et de visualisation de données (p. ex., Elasticsearch) seraient un plus.
·   Bon niveau d'Anglais (parler, lire et écrire).

additional information

L'objectif de la thèse est de proposer et d'implémenter une nouvelle solution pour découvrir plusieurs informations de contexte du Home en exploitant et en classifiant les données domestiques avec un modèle unique basé sur l'apprentissage multi-tâche.

Les données sont la clé pour amener d'autres applications d'IA dans l'environnement domestique afin de fournir des services adaptés aux utilisateurs. Lors de la thèse, le type de données ciblé principalement est la trace réseau représentant la séquence de paquets capturés sur un réseau informatique. Ces données viennent, d'une part, de la réutilisation de travaux internes et externes pour des taches individuelles, et d'une autre part de la création de nouvelles données par les outils comme WireShark [9]. En outre, les autres types de données seraient aussi étudiées comme les métriques Wifi, les données de capteurs et les données structurées d'autres projets comme Home'In [10]. Afin de pouvoir réaliser les taches multiples avec un modèle unique qui fonctionne sur les caractéristiques fusionnées, les exemples des taches représentatives sont l'identification de devices, l'identification d'applications et la localisation, qui ont une dépendance parmi elles pour partager les paramètres et les connaissances acquis à travers les liens et les couches communs dans le modèle.

En plus des publications scientifiques et du manuscrit de la thèse, différents résultats envisagés pendant la thèse sont les suivants:

·  Un prototype du réseau de neurones unique et fédéré pour plusieurs tâches du Home
·  Une méthodologie de la préparation de données, de la modélisation et de l'optimisation de modèles pour les taches multiples
·  Des démos et présentations pour salons et/ou séminaires
·  Un ou plusieurs brevets industriels sur l'architecture de réseaux de neurones, l'analyse des données du Home,

Trois verrous scientifiques sont identifiés comme suit :

1. La modélisation du réseau de neurones pour les tâches multiples. Celle-ci serait d'abord abordée par une étude des relations entre les taches et puis par la définition et l'optimisation du partage de paramètres dans le modèle.

2. L'apprentissage multi-tâche dans l'environnement embarqué et contraint. Etant donnée un réseau de neurones, la consommation de ressources lors de l'exécution de ce modèle dépend de caractéristiques du modèle. Pendant la thèse, une étude et une proposition seraient réalisées pour optimiser le modèle.

L'apprentissage profond pour traiter les données symboliques et hétérogènes. Le modèle apporte la capacité d'exploiter la corrélation non linéaire et l'aspect temporel des données du Home. Pendant la thèse, une analyse serait réalisée pour évaluer la méthode classique de transformation des données du Home et une approche mixte en deux étapes (basé sur l'apprentissage classique puis de classification par le réseau de neurones).

La thèse s'organisera en 4 grandes étapes de la manière suivante :

·  L'état de l'art (M1-M6) : étudier et synthétiser l'état de l'art sur les travaux de la découverte de contextes du Home et de l'apprentissage multi-tâche.
·  L'étude et l'amélioration Individuelle (M7-M18) : analyser indépendamment les méthodes de classification d'information de contexte du Home et les améliorer avec les derniers progrès de l'apprentissage profond. Lors de cette étape, le principe est de réutiliser au maximum les données et les modèles existants, de compléter les données si besoin, d'améliorer et d'implémenter les modèles individuels. L'étude et la proposition seraient aussi réalisées pour traiter les données symboliques et hétérogènes avec le réseau de neurones.

department

Cette thèse se déroulera dans les laboratoires d'Orange à Cesson-Sévigné et dans l'équipe Local Area Network (LAN). Cette équipe de 25 personnes développe des solutions pour connecter les équipements des clients au réseau et améliorer la qualité et la vitesse du LAN. Elle imagine les solutions de demain capables d'offrir aux clients d'Orange une expérience numérique complète à domicile. Elle pilote aussi les projets et les produits de gateway et apporte ses compétences techniques au groupe Orange, permettant des modes de travail plus intégrés avec une agilité accrue.

Au sein de cette équipe technique très expérimentée en Home services, vous travaillerez sur des nouvelles technologies à la pointe d'IA et de réseau avec des chercheurs dans le programme de recherche du domaine « Digital Personal Life ». En relation avec des partenaires académique vous aurez l'opportunité d'étudier et d'améliorer plusieurs technologies d'apprentissage pour la classification de contexte, et surtout d'innover les services du Home. Vous développerez une méthodologie scientifique et systématique pour résoudre les problématiques de recherche, et vous serez amené(e) à publier et à démontrer les résultats obtenus, et aussi à déposer des brevets d'innovation.

[1] Marie-Line Alberi-Morel, Illyyne Saffar, Kamal Singh, César Viho.: Multi-task Deep Learning basedEnvironment and Mobility Detection for User Behavior Modeling. WMLC 2019 - International Workshop on Machine Learning for Communications (2019).

[2] Bakar, U.A.B.U.A., et al.: Activity and Anomaly Detection in Smart Home: A Survey. In: Mukhopadhyay, S.C. (ed.) Next Generation Sensors and Systems. pp. 191-220. Springer International Publishing, Cham (2016).

[3] Zhang, Y., Wei, Y., Yang, Q.: Learning to Multitask. 32nd Conference on Neural Information Processing Systems (2018)

[4]Ranjan, R., Patel, V.M., Chellappa, R.: HyperFace: A Deep Multi-Task Learning Framework for Face Detection, Landmark Localization, Pose Estimation, and Gender Recognition. IEEE Trans. Pattern Anal. Mach. Intell. 41, 121-135 (2019).

[5]Boutaba, R., et al.: A comprehensive survey on machine learning for networking: evolution, applications and research opportunities. J Internet Serv Appl. 9, 16 (2018).

[6] Cherif, I.L., Kortebi, A.: On using eXtreme Gradient Boosting (XGBoost) Machine Learning algorithm for Home Network Traffic Classification. In: 2019 Wireless Days (WD). pp. 1-6. IEEE, Manchester, United Kingdom (2019).

[7] I. Alawe, A. Ksentini, Y. Hadjadj-Aoul, P. Bertin, Improving traffic forecasting for 5G core network scalability: A Machine Learning approach, IEEE Network Magazine, September 2018,p. 1-10,

[8] Julien Cumin.: Reconnaissance et prédiction d'activités dans la maison connectée | LIG - Laboratoire d'Informatique de Grenoble (2017).

[9] Wireshark · Go Deep. https://www.wireshark.org/

[10] The sensitive home is built and rebuilt with the Home'in platform. https://hellofuture.orange.com/en/sensitive-home-built-rebuilt-homein-platform/

contract

Thèse

Faire de chaque avenir une réussite.
  • Annuaire emplois
  • Annuaire entreprises
  • Événements