Présentation de la société : COLLECTIVE.WORK
Collective.work est la plateforme de recrutement nouvelle génération pour trouver votre prochain emploi.Fort d'une grande expertise dans l'IA, Collective.work permet de mieux cibler les offres et leurs candidats correspondants, créant ainsi un système beaucoup plus fluide que les acteurs traditionnels.
Plus de 10, 000 recruteurs utilisent Collective, permettant à des dizaines de milliers de candidats de trouver leur futur emploi chaque jours
Missions
- Définition du modèle d’observabilité (Blueprints & Standards)
- Concevoir et maintenir les blueprints d’observabilité (logs, métriques, traces, RUM, synthetics)
- Définir les standards d’instrumentation (OpenTelemetry, tagging, naming, SLO/SLI)
- Structurer une approche “Observability by Design” intégrée aux cycles de développement
- Formaliser des patterns d’intégration Datadog pour différents types d’applications et architectures
- Plateforme Datadog & Enablement des équipes
- Piloter et optimiser la plateforme Datadog (APM, Logs, Infrastructure, RUM, Synthetic Monitoring)
- Mettre en place des mécanismes self-service pour les équipes (templates, dashboards prêts à l’emploi, librairies)
- Intégrer l’observabilité dans les chaînes CI/CD
- Conjointement avec les experts de l'infrastructure Cloud, automatiser les déploiements et configurations (Terraform, API Datadog)
- Supervision de la supervision & FinOps
- Définir et mettre en œuvre les pratiques de “monitoring de la plateforme d’observabilité” :
Qualité des données
- Taux de couverture
- Pertinence des alertes
- Piloter la maîtrise des coûts Datadog :
Optimisation du volume de logs et traces
- Politique de rétention
- Gouvernance des usages
- Mettre en place des indicateurs FinOps et tableaux de bord de pilotage
- Approche SRE & fiabilité des systèmes
- Déployer les pratiques SRE (SLO/SLI, error budgets, toil reduction)
- Accompagner les équipes dans la gestion proactive des performances et incidents
- Contribuer à l’amélioration continue de la résilience des systèmes
- Promouvoir l’usage de l’observabilité pour la prise de décision opérationnelle (gestion des événements)
- Animation de la communauté & conduite du changement
- Animer une communauté SRE / Observabilité transverse
- Organiser des ateliers, formations et retours d’expérience
- Produire de la documentation, guidelines et bonnes pratiques
- Acculturer les équipes aux enjeux d’observabilité moderne et de fiabilité
Compétences techniques
- Maîtrise de Datadog (APM, Logs, RUM, Synthetic Monitoring, Infrastructure Monitoring)
- Excellente connaissance des concepts d’observabilité (logs, métriques, traces, OpenTelemetry)
- Expérience dans la définition de modèles / standards d’observabilité à l’échelle
- Connaissance des pratiques SRE (SLO, SLI, error budgets)
- Expérience en FinOps appliqué aux outils de monitoring
- Compétences en automatisation (Terraform, scripting Python/Bash)
- Bonne compréhension des environnements cloud et architectures distribuées
- Connaissance des apports de l’IA appliquée à l’observabilité (AIOps)
Compétences comportementales
- Vision produit et approche plateforme
- Forte capacité d’influence et de leadership transverse
- Esprit analytique et orientation résultats
- Pédagogie et capacité à embarquer des communautés techniques
- Autonomie et proactivité
Outils & Environnement
- AWS (niveau avancé, 5 à 8 ans d’expérience)
- Datadog
- Bonnes pratiques de développement logiciel
Profil recherché
- Minimum 5 ans d’expérience dans les domaines de l’observabilité, de la supervision ou du SRE, avec une forte orientation plateforme et transformation des pratiques
- Maîtrise de Datadog (APM, Logs, RUM, Synthetic Monitoring, Infrastructure Monitoring)
- Excellente connaissance des concepts d’observabilité (logs, métriques, traces, OpenTelemetry)
- Expérience dans la définition de modèles / standards d’observabilité à l’échelle
- Connaissance des pratiques SRE (SLO, SLI, error budgets)
- Expérience en FinOps appliqué aux outils de monitoring
- Compétences en automatisation (Terraform, scripting Python/Bash)
- Bonne compréhension des environnements cloud et architectures distribuées
- Connaissance des apports de l’IA appliquée à l’observabilité (AIOps)
- Vision produit et approche plateforme
- Forte capacité d’influence et de leadership transverse
- Esprit analytique et orientation résultats
- Pédagogie et capacité à embarquer des communautés techniques
- Autonomie et proactivité
