Les offres de “Orange”

Expire bientôt Orange

Stage - data science : détection d'outliers sur des séries temporelles multivariées appliquéé à la cybersécurité (F/H)

  • Stage
  • Saint-Jacques-de-la-Lande (Ille-et-Vilaine)
  • Développement informatique

Description de l'offre

about the role

La cybersécurité est un enjeu majeur pour Orange : pour garantir l'intégrité de ses infrastructures informatiques, pour assurer une bonne qualité de service auprès de ses clients (ex : service de VOD, Mail etc.), pour protéger les données sensibles utilisées par le groupe.

Plus particulièrement, la détection d'intrusions sur les réseaux informatiques peut être réalisée en analysant les logs de nos infrastructures. Il s'agit d'une masse de données très importante qui ne peut pas être analysée à la main. L'objectif de ce stage est de mettre au point une approche de Machine Learning pour détecter automatiquement les intrusions réseaux.

Sous la responsabilité de votre encadrant et en collaboration avec des experts métier, vous participez à un projet opérationnel visant à analyser automatiquement des données de log, et in fine, détecter de nouveaux types d'anomalies (ex: un pattern d'attaque inconnu, un dysfonctionnement matériel etc.). Votre rôle est de concevoir, de développer et de mettre en oeuvre une méthode originale de détection d'anomalies.

Vous effectuez les missions suivantes :

·  la réalisation d'une étude bibliographique sur la détection d'outlier sur des séries temporelles multivariées
·  le développement d'une méthode de détection d'anomalies, en veillant en particulier à la maintenabilité de votre code et à son efficacité sur de gros volumes de données. Le tout devra être compatible avec une future IHM associée, permettant aux experts métier d'interpréter les résultats. - l'application de la méthode développée à un cas d'usage réel interne à Orange, en interagissant avec les experts métier.
·  la rédaction d'une documentation complète pour l'usage et la maintenance de la librairie développée.

En particulier, deux pistes sont envisagées pour mettre aux point la méthode de détection :

·  modéliser le comportement normal du réseau grâce à un modèle de coclustering [1] appliqué conjointement aux différentes dimensions des séries temporelles et mesurer l'écart à ce comportement normal pour détecter les anomalies
·  entrainer un auto-encoder capable de « reconstruire » les données normales [2] et mesurer l'erreur de reconstruction de ce modèle pour détecter les anomalies.

[1] R. Guigourès, M. Boullé, F. Rossi. A Study of the Spatio-Temporal Correlations in Mobile Calls Networks. Advances in Knowledge Discovery and Management (AKDM-5), 615:3-17, 2016. [2] Längkvist, M., Karlsson, L., et Loutfi, A. (2014). A review of unsupervised feature learning and deep learning for time-series modeling. Pattern Recognition Letters, 42, 11-24.

about you

Vous préparez actuellement une dernière année d'École d'Ingénieur ou un master 2 (ou équivalent Bac+5) avec une spécialisation en Data Science.

Vous recherchez un stage de 6 mois.
Vous aimez et savez développer, et maitrisez un ou plusieurs langages objets (Java, C++, python).

Vous possédez des connaissances solides dans le domaine du Machine Learning.

Vous avez de bonnes notions en algorithmie.

La connaissance des technologies et langages Big Data (Spark, Hadoop, Scala) est un plus.

Enfin, vous aimez échanger avec des experts métier.

department

Le Big Data est un puissant levier au sein d'Orange pour améliorer le fonctionnement interne du groupe, apporter un avantage différenciant vis-à-vis de nos clients, améliorer l'expérience client et identifier de nouvelles sources de revenus. Orange développe ainsi les usages de ses capacités de traitement de données en mode Big Data, l'ambition étant d'accélérer la diffusion des savoir-faire technologiques, aussi bien sur les plates-formes que sur les algorithmes et outils d'analyse de données, avec l'ensemble des filiales et directions métier du groupe.

Au sein des Orange Labs et de la direction « Data Intelligence Enablers et Software Environment » (DIESE), le département « Data Intelligence et Algorithms» concentre l'expertise et le savoir-faire dans l'extraction de connaissances à partir des données. Il fournit des outils et des algorithmes basés sur des techniques d'analyse prédictive ou sémantique. Le département intervient à la fois en amont en explorant et développant de nouvelles techniques et de nouveaux cas d'usage nécessitant le traitement de données de tout type via ses activités de recherche mais également en support aux projets des différentes entités métiers (filiales, métiers …).

contract

Internship

Duration : 6 months

Level : Master 2

Faire de chaque avenir une réussite.
  • Annuaire emplois
  • Annuaire entreprises
  • Événements