Data Scientist
- Études / Statistiques / Data Définition et développement des outils permettant la transcription des communications du plateau commercial (Speech-To-Text):
- Etude des papiers de recherche de l'état d'art de la reconnaissance vocale automatique basé sur les réseaux de neurones.
- Collecte et préparation les données audio accompagnées de leurs transcription pour l’apprentissage et le test du système
- Implémentation sous Tensorflow et expérimentation sur les architecture de bout-en-bout pour la reconnaissance vocal (Architecture Listen, Attend and Spell accompagnées des méthodes d’augmentations de données SpecAugment).
- Présentation des résultats (Proof-of-Concept) au responsables (taux d’erreur<20%) et la possibilité de son amélioration en collectant plus de données.