Lead Data Architect – Unstructured Data & AI Framework :OCR/NLP, Data Governance - Freelance
Freelance Entre 7 et 12 mois Paris (Paris)
Description de l'offre
Taux journalier (TJM): 700 €
🧩 Contexte & Enjeux
Dans un environnement orienté data & intelligence artificielle, la mission vise à structurer et industrialiser la gestion des données non structurées.
L’objectif est de définir un cadre méthodologique robuste permettant :
d’assurer la fiabilité, qualité et réutilisabilité des données,
de soutenir des cas d’usage Data & AI scalables,
et d’aligner les pratiques avec les standards et stratégies data globales.
La mission implique également une dimension innovation, avec des phases de pilotage, d’expérimentation et de capitalisation des apprentissages.
🚀 Missions détaillées
🏗️ Structuration & Gouvernance Data
Concevoir un cadre méthodologique complet pour la gestion des données non structurées
Définir et formaliser : standards, règles, politiques et frameworks
Garantir la qualité, cohérence et exploitabilité des données
🤝 Coordination & Alignement stratégique
Collaborer avec les parties prenantes internes (IT, métiers, data)
Recueillir les besoins et assurer l’alignement avec les objectifs globaux
Faciliter la communication entre équipes techniques et fonctionnelles
🧪 Innovation & Expérimentation
Piloter des POC / pilotes sur des frameworks innovants
Consolider les retours d’expérience et les intégrer dans les pratiques opérationnelles
Accompagner la transformation autour des usages data & IA
🔍 Veille & Évaluation technologique
Évaluer les solutions du marché et réaliser des benchmarks
Recommander des outils et plateformes adaptés
Produire des analyses comparatives et des plans d’implémentation
📄 Expertise en traitement documentaire
Analyser et recommander des approches autour de :
OCR
NLP
VLM (Vision Language Models)
Structurer la gestion des métadonnées, ontologies et bases vectorielles
🛠️ Stack & Environnement technique
Data Governance / Data Quality / Data Architecture
Data Modeling & Metadata Management
Technologies de traitement documentaire : OCR, NLP, VLM
Gestion des ontologies & vector databases
Méthodologies d’évaluation de solutions (benchmark, vendor assessment)
Environnements data complexes orientés IA
📦 Livrables attendus
Framework méthodologique complet en Unstructured Data Management
Documentation des standards, règles et politiques data
Rapports de pilotes (retours d’expérience & best practices)
Analyses de marché et évaluations de solutions
Documentation technique sur les méthodes de transformation des données
Recommandations outils + roadmap d’implémentation
📍 Informations clés
Localisation : Paris
Télétravail : 2 jours / semaine
Démarrage : mi-mai 2026
Durée : 12 mois
Profil recherché
👤 Profil recherché
🎓 Expertise clé
Forte expérience en :
Data Governance
Data Quality
Data Architecture & Modeling
Metadata Management
Expérience concrète en déploiement de pratiques data à grande échelle
Maîtrise des enjeux liés aux données non structurées dans des projets AI
Expertise sur les technologies OCR / NLP / VLM
🧠 Compétences transverses
Capacité à structurer des frameworks data robustes
Très bon niveau d’analyse et de synthèse
Aisance à vulgariser des sujets techniques complexes
Expérience en environnement transverse (IT + métiers)
Pilotage d’initiatives innovantes
🌍 Langues
Français : courant
Anglais : courant
À propos de Collective.work
Collective.work est la plateforme de recrutement nouvelle génération pour trouver votre prochain emploi.
Fort d'une grande expertise dans l'IA, Collective.work permet de mieux cibler les offres et leurs candidats correspondants, créant ainsi un système beaucoup plus fluide que les acteurs traditionnels.
Plus de 10,000 recruteurs utilisent Collective, permettant à des dizaines de milliers de candidats de trouver leur futur emploi chaque jours