Offers “Atos”

days ago Atos

Stage - Data Science / Industrialisation et optimisation NLP - H/F

  • CDI
  • Bezons (Val-d'Oise)
  • IT development

Job description



À propos d’Atos

Atos est un leader international de la transformation digitale avec 110 000 collaborateurs dans 73 pays et un chiffre d’affaires annuel de 12 milliards d’euros. Numéro un européen du Cloud, de la cybersécurité et des supercalculateurs, le Groupe fournit des solutions intégrées de Cloud Hybride Orchestré, Big Data, Applications Métiers et Environnement de Travail Connecté. Partenaire informatique mondial des Jeux Olympiques et Paralympiques, le Groupe exerce ses activités sous les marques Atos, Atos|Syntel, et Unify. Atos est une SE (Société Européenne) cotée sur Euronext Paris et fait partie de l’indice CAC 40.

La raison d’être d’Atos est de contribuer à façonner l’espace informationnel. Avec ses compétences et ses services, le Groupe supporte le développement de la connaissance, de l’éducation et de la recherche dans une approche pluriculturelle et contribue au développement de l’excellence scientifique et technologique. Partout dans le monde, Atos permet à ses clients et à ses collaborateurs, et plus généralement au plus grand nombre, de vivre, travailler et progresser durablement et en toute confiance dans l’espace informationnel.

 

Contexte

Ce stage s’inscrit autour de notre Practice BigData de la ligne de service Big Data et Security qui regroupe les produits et les services dédiés à la sécurité et aux offres de Big Data.

Sa mission est de répondre aux entreprises & administrations qui souhaitent transformer leurs données en avantages concurrentiels tout en sécurisant leurs actifs. Vous rejoindrez une équipe jeune et dynamique et en forte croissance réalisant des activités allant du conseil en architecture et gouvernance de la donnée aux aspects Data Science et Data Engineering, en passant par la mise en place, l’intégration, le développement et l’optimisation de solutions souples et évolutives pour les projets stratégiques de nos clients.

Notre valeur ajoutée repose sur une forte expertise technique et business de la data renforcée par de nombreux partenariats avec les éditeurs actifs dans les domaines des architectures applicatives distribuées et du Big Data & Analytics.

 

Mission

Parmi les nombreux domaines de l'intelligence artificielle, le traitement automatique du langage naturel (NLP) a l'un des plus grands potentiels pour des applications pratiques.

Compte tenu du volume important de données textuelles générées sur le Web ou dans les confinements des entreprises privées et des développements récents dans le domaine de l'apprentissage profond, les applications de traduction automatique, les agents conversationnels et l'analyse des sentiments sont de plus en plus utilisées.

La plupart des applications du NLP reposent sur des ensembles de données et des ressources linguistiques spécifiques. Bien que pour la langue anglaise, il existe de nombreuses ressources et modèles open source disponibles, pour d'autres langues, comme le français, les ressources sont moins développées. C'est pourquoi, lors de la mise en œuvre des applications NLP dans la pratique, nous constatons une baisse des performances pour la langue française. Outre les performances algorithmiques, il existe également un besoin important de mettre en œuvre efficacement ces modèles dans un scénario de production.

Nous recherchons un(e) stagiaire pour intervenir sur la construction de pipelines d'industrialisation pour les modèles de NLP et sur leur optimisation pour la langue française.

 

Le candidat travaillera en étroite collaboration avec les data scientists de l'équipe sur :

·  L’adaptabilité des ressources anglaises 
·  La transférabilité et optimisation des modèles d'apprentissage profond existants 
·  L’évaluation des modèles NLP et l’évaluation des outils de packaging pour les modèles NLP.

 

Le candidat aura l'occasion d'acquérir une expérience pratique sur divers sujets NLP, de comprendre le fonctionnement et l'utilisation de modèles d'apprentissage profond et de participer à la mise en œuvre d'applications de NLP en utilisant plusieurs des outils et bibliothèques suivants : Huggingface, Tensorflow/Keras, Pythorch, FastAPI, Flask, Docker, TensorFlow Serving, TorchServe, Kubeflow, MLFlow.

 

Profil

·  Étudiant(e) ayant un niveau Master ou 2ème ou 3ème année d’école d’ingénieur, vous avez une 1ère expérience en Data Science.
·  Vous savez travailler en équipe, rendre compte de votre avancement, et partager vos interrogations et vos connaissances.
·  Vous avez une bonne connaissance des capacités offertes par l’intelligence artificielle et connaissez certaines solutions du marché.
·  Compétences indispensables :
·  Bonne connaissance du Python
·  Bonne connaissance des modules de Machine Learning (Scikit-learn, pandas)
·  Connaissance des solutions du marché de Deep learning (Tensorflow/Keras, Pytorch)
·  Compétences appréciées :
·  ​​​​​ Connaissance des outils en data science (Jupyter) 
·  Connaissance des bibliothèques NLP Python : NLTK, Spacy, Huggingface
·  Connaissance des outils d’industrialisation des modelés : FastAPI, Flask, Docker, TensorFlow Serving

 

INFORMATIONS ADDITIONNELLES :

Chez Atos, nous voulons que nos employés se sentent valorisés, appréciés et libres d'être eux-mêmes au travail. Nos process RH sont conçus pour prévenir la discrimination envers l'identité ou l'orientation sexuelle, la religion, l’origine ethnique, l'âge, la neurodiversité, le handicap, la citoyenneté ou tout autre aspect qui rend nos collaborateurs uniques. Partout dans le monde, nous avons créé plusieurs programmes pour soutenir la culture inclusive d'Atos, et nous travaillons pour nous assurer que tous nos collaborateurs aient une chance égale de sentir qu'ils sont exactement là où ils doivent être.