Data Scientist H/F - Alternance - Niort
Alternance Niort (Deux-Sèvres) Infra / Réseaux / Télécoms
Description de l'offre
Intitulé du poste
Data Scientist H/F - Alternance - Niort
Type de contrat
Alternance
Durée du contrat (en mois)
12
Description
La MAIF recrute en alternance un Data Scientist h/f à Niort
Contrat de 12 mois
Intégré(e) au sein de notre Data Factory, votre mission s'articulera autour de l'IA. Framework de reconnaissance vocale.
L'objectif est de construire un algorithme de transcription de la voix en texte en s’appuyant sur un modèle de langage personnalisé.
Plusieurs enjeux sont liés à votre projet :
· Doter nos Data-Scientists d’un moteur Speech-To-Text (notre but est de transcrire de gros volumes vocaux :conversations téléphoniques, saisie de texte en vocal …);
· Constituer un jeu de données associant des enregistrements audios et leur texte correspondant ;
· Utiliser une souche Open Source apportant la brique ASR (reconnaissance vocale) et l’entraîner sur un dataset audios/textes en français complété d’un corpus MAIF (vocabulaire personnalisé : assurance) ;
· Faire tourner le modèle sur un jeu de conversations téléphoniques et fournir le résultat textuel aux data-scientists.
Ainsi, et selon votre profil, vous serez amené(e) à :
· Evaluer les évolutions de versions des solutions Open Source disponibles (DeepSpeech, Wav2Letter++, Kaldi …) ;
· Constituer un dataset audios-textes pour préparer l’entrainement du modèle ;
· Développer des outils de Data-Prep audio (transcodage audio, découpage locuteurs, scission fichiers, re-synchronisation audio-texte, lexique …) ;
· Entrainer un modèle de base en utilisant le dataset Mozilla Common Voice FR ;
· Entrainer un modèle de référence en utilisant les dataset audios publics (LibriVox, TCOF, Common Voice …) ;
· Entrainer un modèle MAIF en utilisant les dataset publics et MAIF (sur serveurs GPU) ;
· Optimiser le modèle ( data augmentation, hyper-paramètres, structure neuronale …) ;
· Préparer l’industrialisation du modèle (API, Kubernetes …).
Profil / Qualifications
Passionné(e) par la Data Science, vous préparez un Master 2 en Data Science / Intelligence artificielle (contrat de 12 mois uniquement).
Vous êtes curieux(se) et appréciez la nouveauté.
Vous savez vous intégrer à une équipe et appréciez le travail collaboratif.
Votre investissement pour permettra de réussir vos missions.
Localisation du poste
Localisation du poste
Nouvelle-Aquitaine, Deux Sèvres (79)
Lieu
NIORT