AXA FRANCE : DATA SCIENTIST / ML ENGINEER (F/H)

Poste
Stage
Niveau d'étude
Bac+5 (Master / Ingénieur)
Activité de l'entreprise
Informatique, web et numérique
Métier
Systèmes d'informations - Télécom : Système/Réseaux/Base de Données
Localisation
Nanterre (92, Hauts-de-Seine)

Inscrivez-vous !

En vous inscrivant sur Engagement Jeunes, recevez les offres qui vous correspondent et rendez vous visible des recruteurs.

Présentation de la société : AXA FRANCE

Présente sur l'ensemble du territoire, AXA France se distingue comme la filiale la plus importante du Groupe en termes de chiffre d'affaires et d'effectifs. Leader sur les marchés de l'assurance, de la santé et de la prévoyance, l'entreprise offre à ses équipes un cadre de travail moderne et agréable en "smartworking".
Vous hésitez encore ? Sachez que nous avons conçu un dispositif d'intégration baptisé "Welcome@AXA" pour accompagner vos premiers pas parmi nous avec attention. En lien avec nos engagements, nous célébrons chaque arrivée en agissant en faveur de la reforestation mondiale : depuis 2020, nous plantons un arbre pour chaque recrutement. Alors, prêt à postuler ?

Missions

L'équipe AI / GenAI for Opex de l'IA Factory d'AXA France conçoit et déploie des solutions d'intelligence artificielle à fort impact opérationnel pour l'ensemble des directions métiers (Assurance, Sinistres, Finance, Juridique, Opérations, etc.) . Elle intervient sur des projets de Document Understanding à grande échelle, avec un objectif clair : automatiser, fiabiliser et accélérer le traitement des documents métiers, tout en garantissant robustesse, sécurité et passage à l'échelle industrielle. Vous intégrerez une équipe de 12 personnes, composée de : Machine Learning Engineers, Data Scientists, Leads Data Scientist & Lead ML Engineer (encadrement technique) . En tant que stagiaire Data Scientist / Machine Learning Engineer, vous contribuerez à l'ensemble du cycle de vie d'applications IA, depuis les données jusqu'au déploiement en production. Les missions pourront être ajustées selon votre dominante (Data Science ou ML Engineering) , tout en conservant une vision end-to-end.
Vos missions seront les suivantes :
1. Acquisition & prétraitement des données
  • Collecte et nettoyage de documents scannés (PDF, images)
  • Extraction du texte et de la structure via des modèles OCR
  • Enrichissement sémantique via NER
  • Constitution de corpus annotés de haute qualité
  • Technos : LayoutLMv3, TrOCR, Tesseract OCR 5, VLMs, spaCy
2. Modélisation & fine-tuning
  • Fine-tuning de LLMs via LoRA / QLoRA
  • Adaptation de SLMs / TLMs pour des tâches NLP ciblées
  • Évaluation des performances (BLEU, ROUGE, F1, OCR accuracy)
  • Spécialisation de modèles sur des cas métiers AXA
  • Technos : Hugging Face Transformers, PEFT, LoRA
3. Pipelines & orchestration
  • Construction de pipelines ETL & Feature Engineering
  • Intégration des modèles dans des APIs REST
  • Garantie de la reproductibilité et de la traçabilité
  • Technos : Kedro, FastAPI, Docker
4. Entraînement & optimisation
  • Entraînement des modèles sur Azure ML / OpenShift AI
  • Hyperparameter tuning (Optuna, Ray Tune)
  • Arbitrage performance / coûts
5. Déploiement & MLOps
  • Containerisation des modèles
  • Déploiement sur Kubernetes via Helm / Kustomize
  • Mise en place de pipelines CI/CD
  • Sécurisation, scalabilité et robustesse des services
  • Technos : Docker, Kubernetes, Azure DevOps
6. Monitoring & maintenance
  • Suivi de la performance en production
  • Détection de dérives (concept drift, latence, erreurs)
  • Automatisation du retraining
  • Technos : OpenTelemetry, Dynatrace, Azure ML Pipelines
7. Collaboration & documentation
  • Code reviews, pair programming
  • Documentation technique et MLOps
  • Outils : Markdown, MkDocs, Confluence

Profil recherché

Vous êtes étudiant en Master 2 ou dernière année de cycle d'ingénieur spécialisé en Data Science, Statistiques, Mathématiques appliquées, Informatique, IA. Vous recherchez un stage de fin d'études (PFE) de 6 mois à partir de février / avril 2026.

Compétences techniques :

Programmation

  • Python (pandas, numpy, PyTorch)

Machine Learning & NLP

  • Classification, régression, clustering
  • Transformers & LLMs (BERT, GPT, LLaMA, T5)
  • OCR & Document AI (spaCy, Tesseract, LayoutLM, TrOCR)

MLOps & Cloud

  • Git & bonnes pratiques de code
  • Pipelines ML
  • Microservices
  • Docker, Kubernetes, Helm, Kustomize
  • Expérience Cloud (Azure apprécié)

Soft skills :

  • Autonomie et curiosité intellectuelle
  • Esprit d'équipe et collaboration
  • Capacité de vulgarisation technique
  • Communication claire (écrit / oral)

La motivation, la capacité d'apprentissage et la rigueur sont essentielles.

Rejoignez-nous et contribuez à améliorer les processus de demain grâce à l'intelligence artificielle !