COLLECTIVE.WORK : EXPERT OBSERVABILITÉ SI - DATADOG (H/F)

Poste
CDI - Non Cadre
Niveau d'étude
Sans diplôme
Activité de l'entreprise
Audit et Conseil
Localisation
Paris (75, Paris)

Inscrivez-vous !

En vous inscrivant sur Engagement Jeunes, recevez les offres qui vous correspondent et rendez vous visible des recruteurs.

Présentation de la société : COLLECTIVE.WORK

Collective.work est la plateforme de recrutement nouvelle génération pour trouver votre prochain emploi.

Fort d'une grande expertise dans l'IA, Collective.work permet de mieux cibler les offres et leurs candidats correspondants, créant ainsi un système beaucoup plus fluide que les acteurs traditionnels.

Plus de 10, 000 recruteurs utilisent Collective, permettant à des dizaines de milliers de candidats de trouver leur futur emploi chaque jours

Missions

  1. Définition du modèle d’observabilité (Blueprints & Standards)
  • Concevoir et maintenir les blueprints d’observabilité (logs, métriques, traces, RUM, synthetics)
  • Définir les standards d’instrumentation (OpenTelemetry, tagging, naming, SLO/SLI)
  • Structurer une approche “Observability by Design” intégrée aux cycles de développement
  • Formaliser des patterns d’intégration Datadog pour différents types d’applications et architectures
  1. Plateforme Datadog & Enablement des équipes
  • Piloter et optimiser la plateforme Datadog (APM, Logs, Infrastructure, RUM, Synthetic Monitoring)
  • Mettre en place des mécanismes self-service pour les équipes (templates, dashboards prêts à l’emploi, librairies)
  • Intégrer l’observabilité dans les chaînes CI/CD
  • Conjointement avec les experts de l'infrastructure Cloud, automatiser les déploiements et configurations (Terraform, API Datadog)
  1. Supervision de la supervision & FinOps
  • Définir et mettre en œuvre les pratiques de “monitoring de la plateforme d’observabilité” :

    • Qualité des données

    • Taux de couverture
    • Pertinence des alertes
  • Piloter la maîtrise des coûts Datadog :

    • Optimisation du volume de logs et traces

    • Politique de rétention
    • Gouvernance des usages
  • Mettre en place des indicateurs FinOps et tableaux de bord de pilotage
  1. Approche SRE & fiabilité des systèmes
  • Déployer les pratiques SRE (SLO/SLI, error budgets, toil reduction)
  • Accompagner les équipes dans la gestion proactive des performances et incidents
  • Contribuer à l’amélioration continue de la résilience des systèmes
  • Promouvoir l’usage de l’observabilité pour la prise de décision opérationnelle (gestion des événements)
  1. Animation de la communauté & conduite du changement
  • Animer une communauté SRE / Observabilité transverse
  • Organiser des ateliers, formations et retours d’expérience
  • Produire de la documentation, guidelines et bonnes pratiques
  • Acculturer les équipes aux enjeux d’observabilité moderne et de fiabilité

Compétences techniques

  • Maîtrise de Datadog (APM, Logs, RUM, Synthetic Monitoring, Infrastructure Monitoring)
  • Excellente connaissance des concepts d’observabilité (logs, métriques, traces, OpenTelemetry)
  • Expérience dans la définition de modèles / standards d’observabilité à l’échelle
  • Connaissance des pratiques SRE (SLO, SLI, error budgets)
  • Expérience en FinOps appliqué aux outils de monitoring
  • Compétences en automatisation (Terraform, scripting Python/Bash)
  • Bonne compréhension des environnements cloud et architectures distribuées
  • Connaissance des apports de l’IA appliquée à l’observabilité (AIOps)

Compétences comportementales

  • Vision produit et approche plateforme
  • Forte capacité d’influence et de leadership transverse
  • Esprit analytique et orientation résultats
  • Pédagogie et capacité à embarquer des communautés techniques
  • Autonomie et proactivité

Outils & Environnement

  • AWS (niveau avancé, 5 à 8 ans d’expérience)
  • Datadog
  • Bonnes pratiques de développement logiciel

Profil recherché

  1. Minimum 5 ans d’expérience dans les domaines de l’observabilité, de la supervision ou du SRE, avec une forte orientation plateforme et transformation des pratiques
  2. Maîtrise de Datadog (APM, Logs, RUM, Synthetic Monitoring, Infrastructure Monitoring)
  3. Excellente connaissance des concepts d’observabilité (logs, métriques, traces, OpenTelemetry)
  4. Expérience dans la définition de modèles / standards d’observabilité à l’échelle
  5. Connaissance des pratiques SRE (SLO, SLI, error budgets)
  6. Expérience en FinOps appliqué aux outils de monitoring
  7. Compétences en automatisation (Terraform, scripting Python/Bash)
  8. Bonne compréhension des environnements cloud et architectures distribuées
  9. Connaissance des apports de l’IA appliquée à l’observabilité (AIOps)
  10. Vision produit et approche plateforme
  11. Forte capacité d’influence et de leadership transverse
  12. Esprit analytique et orientation résultats
  13. Pédagogie et capacité à embarquer des communautés techniques
  14. Autonomie et proactivité