Postée il y a 13 jours
Vos missions principales :
1. Déploiement et optimisation de la plateforme d'observabilité SplunkConfigurer et maintenir une plateforme cloud-based de monitoring.
Concevoir et améliorer des tableaux de bord, alertes, et rapports analytiques pour une vision en temps réel des performances IT.
Intégrer et traiter des données complexes (logs, métriques, traces) issues de technologies variées (Java, Python, Node.js, PHP...).
2. Mise en place d?une observabilité avancéeImplémenter des solutions d'APM avancées.
Intégrer OpenTelemetry pour collecter les logs et traces applicatifs.
Superviser les environnements ECS, EC2 et Kubernetes avec des outils comme Fluentd.
Déployer des tests de Synthetic Monitoring pour vérifier la disponibilité des services et prévenir les dégradations de performance.
3. Surveillance et optimisation des services ITImplémenter un système de gestion des incidents avancé.
Construire des indicateurs de performance (KPIs, SLOs) pour assurer une disponibilité optimale des applications critiques.
Mettre en place des modèles de corrélation d'événements pour anticiper et résoudre les incidents plus rapidement.
4. Intégration et automatisationConnecter la plateforme avec des outils tiers (AWS CloudWatch, Datadog, Prometheus).
Automatiser les déploiements et la supervision avec Terraform.
Intégrer l'observabilité dans les pipelines CI/CD pour une détection précoce des problèmes.
5. Formation et accompagnement des équipesFormer et accompagner les équipes internes à l'utilisation des outils d'observabilité.
Fournir un support technique avancé et proposer des bonnes pratiques d'optimisation.
Profil candidat:
Vos compétences techniques :Solide expérience (5 ans min.) en supervision IT et observabilité.
Maîtrise d?une plateforme d'observabilité avancée.
Bonne connaissance des environnements Cloud AWS.
Expérience en développement.
Bonne approche FinOps, automatisation, industrialisation.