Présentation de la société : COLLECTIVE.WORK

Collective.work est la plateforme de recrutement nouvelle génération pour trouver votre prochain emploi.

Fort d'une grande expertise dans l'IA, Collective.work permet de mieux cibler les offres et leurs candidats correspondants, créant ainsi un système beaucoup plus fluide que les acteurs traditionnels.

Plus de 10, 000 recruteurs utilisent Collective, permettant à des dizaines de milliers de candidats de trouver leur futur emploi chaque jours

Missions

Définition du modèle d’observabilité (Blueprints & Standards)

Concevoir et maintenir les blueprints d’observabilité (logs, métriques, traces, RUM, synthetics)
Définir les standards d’instrumentation (OpenTelemetry, tagging, naming, SLO/SLI)
Structurer une approche “Observability by Design” intégrée aux cycles de développement
Formaliser des patterns d’intégration Datadog pour différents types d’applications et architectures

Plateforme Datadog & Enablement des équipes

Piloter et optimiser la plateforme Datadog (APM, Logs, Infrastructure, RUM, Synthetic Monitoring)
Mettre en place des mécanismes self-service pour les équipes (templates, dashboards prêts à l’emploi, librairies)
Intégrer l’observabilité dans les chaînes CI/CD
Conjointement avec les experts de l'infrastructure Cloud, automatiser les déploiements et configurations (Terraform, API Datadog)

Supervision de la supervision & FinOps

Définir et mettre en œuvre les pratiques de “monitoring de la plateforme d’observabilité” :
- Qualité des données
- Taux de couverture
- Pertinence des alertes
Piloter la maîtrise des coûts Datadog :
- Optimisation du volume de logs et traces
- Politique de rétention
- Gouvernance des usages
Mettre en place des indicateurs FinOps et tableaux de bord de pilotage

Approche SRE & fiabilité des systèmes

Déployer les pratiques SRE (SLO/SLI, error budgets, toil reduction)
Accompagner les équipes dans la gestion proactive des performances et incidents
Contribuer à l’amélioration continue de la résilience des systèmes
Promouvoir l’usage de l’observabilité pour la prise de décision opérationnelle (gestion des événements)

Animation de la communauté & conduite du changement

Animer une communauté SRE / Observabilité transverse
Organiser des ateliers, formations et retours d’expérience
Produire de la documentation, guidelines et bonnes pratiques
Acculturer les équipes aux enjeux d’observabilité moderne et de fiabilité

Compétences techniques

Maîtrise de Datadog (APM, Logs, RUM, Synthetic Monitoring, Infrastructure Monitoring)
Excellente connaissance des concepts d’observabilité (logs, métriques, traces, OpenTelemetry)
Expérience dans la définition de modèles / standards d’observabilité à l’échelle
Connaissance des pratiques SRE (SLO, SLI, error budgets)
Expérience en FinOps appliqué aux outils de monitoring
Compétences en automatisation (Terraform, scripting Python/Bash)
Bonne compréhension des environnements cloud et architectures distribuées
Connaissance des apports de l’IA appliquée à l’observabilité (AIOps)

Compétences comportementales

Vision produit et approche plateforme
Forte capacité d’influence et de leadership transverse
Esprit analytique et orientation résultats
Pédagogie et capacité à embarquer des communautés techniques
Autonomie et proactivité

Outils & Environnement

AWS (niveau avancé, 5 à 8 ans d’expérience)
Datadog
Bonnes pratiques de développement logiciel

Profil recherché

Minimum 5 ans d’expérience dans les domaines de l’observabilité, de la supervision ou du SRE, avec une forte orientation plateforme et transformation des pratiques
Maîtrise de Datadog (APM, Logs, RUM, Synthetic Monitoring, Infrastructure Monitoring)
Excellente connaissance des concepts d’observabilité (logs, métriques, traces, OpenTelemetry)
Expérience dans la définition de modèles / standards d’observabilité à l’échelle
Connaissance des pratiques SRE (SLO, SLI, error budgets)
Expérience en FinOps appliqué aux outils de monitoring
Compétences en automatisation (Terraform, scripting Python/Bash)
Bonne compréhension des environnements cloud et architectures distribuées
Connaissance des apports de l’IA appliquée à l’observabilité (AIOps)
Vision produit et approche plateforme
Forte capacité d’influence et de leadership transverse
Esprit analytique et orientation résultats
Pédagogie et capacité à embarquer des communautés techniques
Autonomie et proactivité

COLLECTIVE.WORK : EXPERT OBSERVABILITÉ SI - DATADOG (H/F)