S01 - Semantic Parsing Of Maps With Deep Learning H/F
Palaiseau (Essonne)
Description de l'offre
Description
Rejoignez-nous en Stage ! CEA Tech Corporate from CEA Tech on Vimeo. En tant que stagiaire au CEA, vous aurez l'opportunité de travailler au sein d'un environnement de recherche de renommée mondiale. Nos équipes sont composées d'experts passionnés et dédiés, offrant un cadre propice à l'apprentissage et à la collaboration. Vous aurez accès à des équipements de pointe et à des ressources de recherche de premier ordre pour mener à bien vos missions. Contexte Les outils d'analyse de mise en page sont aujourd'hui performants pour les documents textuels (factures, formulaires), mais les cartes et plans posent encore de nombreux défis en raison de leur complexité graphique (symboles vectoriels, annotations textuelles, légendes, échelles, etc.). Le logiciel MapLayoutParser, développé par le CEA LIST, constitue une solution innovante pour répondre à ces problématiques et ouvre la voie à des applications variées : intelligence géospatiale, urbanisme, numérisation d'archives, robotique. Objectifs Évaluer les performances actuelles de Map-Layout-Parser sur différents types de cartes et plans (architecturaux, topographiques, techniques). Améliorer la robustesse du modèle par fine-tuning, augmentation de données et adaptation des classes cibles. Développer des modules de post-traitement pour enrichir les résultats et faciliter leur exploitation. Valider l'approche par des benchmarks et une étude de cas appliquée (ex. extraction automatique d'informations clés). Missions principales Analyse et évaluation des performances de l'outil sur divers jeux de données. Mise en place de stratégies d'amélioration : Fine-tuning sur jeux de données annotés, Augmentation et génération de données, Développement d'un module de post-traitement pour : Regroupement sémantique des éléments, Alignement texte-symbole (association étiquette-objet), Export structuré en JSON ou graphes. Validation expérimentale via benchmarks et étude de cas. Compétences développées Vision par ordinateur et deep learning appliqués aux documents complexes. Traitement et augmentation de données annotées. Développement d'algorithmes de post-traitement et structuration de données. Évaluation et validation par benchmarks et cas d'usage concrets.
Date de début
28 oct., 2025
Profil
Qu'attendons-nous de vous ? Étudiants en 5 année d'études (Master 2). Compétences en vision par ordinateur. Compétences en apprentissage automatique (deep learning, LLM, VLM, IA générative). Maîtrise de Python dans un framework de deep learning (en particulier PyTorch ou TensorFlow). Qualifications Students in their 5th year of studies (M2) Computer vision skills Machine learning skills (deep learning, LLM, VLM, generative AI) Python proficiency in a deep learning framework (especially PyTorch or TensorFlow) Rejoignez-nous, venez développer vos compétences et en acquérir de nouvelles ! Vous avez encore un doute ? Nous vous proposons : L'opportunité de travailler au sein d'une organisation de renommée mondiale dans le domaine de la recherche scientifique, Un environnement unique dédié à des projets ambitieux au profit des grands enjeux sociétaux actuels, Une expérience à la pointe de l'innovation, comportant un fort potentiel de développement industriel, Des moyens expérimentaux exceptionnels et un encadrement de qualité, De réelles opportunités de carrière à l'issue de votre stage Un poste au coeur de la métropole grenobloise, facilement accessible via la mobilité douce favorisée par le CEA, Une participation aux transports en commun à hauteur de 85%, Un équilibre vie privée - vie professionnelle reconnu, Un restaurant d'entreprise, Une politique diversité et inclusion, Conformément aux engagements pris par le CEA en faveur de l'intégration des personnes handicapées, cet emploi est ouvert à toutes et à tous. Le CEA propose des aménagements et/ou des possibilités d'organisation pour l'inclusion des travailleurs handicapés.
Durée (Mois)
5
Formation
RJ/Qualif/Ingenieur_B5
Secteur
Ind_hightech_telecom