Les offres de “Collective.work”

Nouveau Collective.work

Senior AI Engineer – LLM / Agentic AI / Mistral AI / Platform Engineering - CDI

  • CDI
  • Montrouge (Hauts-de-Seine)

Description de l'offre

Dans le cadre d’un programme IA Générative stratégique à l’échelle groupe, nous recherchons un Senior AI Engineer capable d’industrialiser des solutions GenAI souveraines basées sur la plateforme Mistral AI dans un environnement bancaire critique, sécurisé et fortement réglementé.

Le contexte est particulièrement stimulant techniquement : déploiement massif de LLMs, architectures agentiques avancées, optimisation d’inférence, sécurisation des usages IA, orchestration multi-agents et industrialisation MLOps à grande échelle.

Vous rejoindrez une équipe transverse IA Gen composée d’AI Engineers, Platform Engineers, MLOps, Data Engineers, Security Engineers et Product teams afin de construire les futurs standards IA du Groupe.

Enjeux techniques du programme

  • Déploiement enterprise-scale de modèles Mistral

  • Construction de plateformes GenAI souveraines et sécurisées

  • Développement d’agents IA autonomes et multi-agents

  • Industrialisation de pipelines LLMOps / MLOps

  • Optimisation performance / latence / coût GPU

  • Gouvernance IA, sécurité et conformité AI Act

  • Détection d’hallucinations et contrôle qualité des outputs

  • Observabilité et monitoring des systèmes IA en production

  • Intégration des solutions IA dans le SI bancaire critique

    Vos responsabilités

    Engineering LLM & GenAI

    • Concevoir et développer des applications IA générative robustes exploitant Mistral et autres LLM open-source/propriétaires

    • Construire des architectures RAG avancées adaptées à des usages enterprise-scale

    • Implémenter des pipelines de prompting complexes :

      • few-shot

      • chain-of-thought

      • structured prompting

      • tool calling

      • function calling

      • context management

    • Optimiser les performances d’inférence, la qualité des réponses et la consommation des ressources

    • Évaluer les modèles selon des métriques :

      • hallucination rate

      • factuality

      • latency

      • token efficiency

      • cost efficiency

    Agentic AI & Multi-Agent Systems

    • Concevoir des agents IA autonomes capables de :

      • reasoning

      • planning

      • memory management

      • tool orchestration

      • workflow execution

    • Développer des architectures multi-agents distribuées

    • Implémenter des mécanismes de coordination, supervision et fallback agents

    • Gérer les contextes conversationnels complexes et les interactions user-agent

    • Travailler avec :

      • LangChain

      • LangGraph

      • CrewAI

      • AutoGen

      • Semantic Kernel

      • MCP servers / tool ecosystems

    AI Platform & MLOps

    • Industrialiser les déploiements IA dans des environnements Kubernetes sécurisés

    • Construire des pipelines CI/CD dédiés aux modèles et applications IA

    • Mettre en place :

      • model versioning

      • prompt versioning

      • evaluation pipelines

      • observability

      • tracing

      • monitoring LLM

    • Participer à l’optimisation GPU / inference serving

    • Collaborer étroitement avec les équipes DevOps et Platform Engineering

    AI Safety / Security / Compliance

    • Implémenter des guardrails et mécanismes de contrôle :

      • prompt injection protection

      • jailbreak detection

      • toxicity filtering

      • PII masking

      • hallucination mitigation

    • Garantir la conformité :

      • RGPD

      • AI Act

      • auditabilité

      • explicabilité

      • sécurité des données

    • Participer aux stratégies de gouvernance IA du Groupe

    Stack technique cible

    Langages & Frameworks

    • Python

    • FastAPI

    • Pydantic

    • AsyncIO

    LLM / GenAI

    • Mistral AI

    • OpenAI

    • Claude

    • Llama

    • Hugging Face

    • vLLM

    • Ollama

    • Transformers

    Agentic Frameworks

    • LangChain

    • LangGraph

    • CrewAI

    • AutoGen

    • Semantic Kernel

    RAG / Search

    • Vector DB

    • Embeddings

    • Hybrid Search

    • Reranking

    • Knowledge Retrieval

    Infra / Cloud / MLOps

    • Docker

    • Kubernetes

    • Helm

    • CI/CD

    • MLflow

    • GitLab CI

    • Observability stacks

Profil recherché

Profil recherché

  • 5+ années d’expérience en Software Engineering / AI Engineering

  • Expérience solide en GenAI et architectures LLM en production

  • Forte expertise Python et engineering backend

  • Expérience concrète sur des systèmes agentiques

  • Très bonne compréhension des problématiques d’industrialisation IA

  • Expérience en environnement critique ou réglementé fortement appréciée

  • Capacité à intervenir sur des sujets architecture, performance et sécurité

Très gros plus

  • Expérience Mistral AI

  • Déploiement self-hosted de LLMs

  • Optimisation inference serving

  • Fine-tuning / PEFT / LoRA

  • Expérience GPU workloads

  • Expérience plateforme IA enterprise

  • Banking / Finance / Cybersecurity background

À propos de Collective.work

Collective.work est la plateforme de recrutement nouvelle génération pour trouver votre prochain emploi.

Fort d'une grande expertise dans l'IA, Collective.work permet de mieux cibler les offres et leurs candidats correspondants, créant ainsi un système beaucoup plus fluide que les acteurs traditionnels.

Plus de 10,000 recruteurs utilisent Collective, permettant à des dizaines de milliers de candidats de trouver leur futur emploi chaque jours

Faire de chaque avenir une réussite.
  • Annuaire emplois
  • Annuaire entreprises
  • Événements