Postée il y a 13 jours
Au sein de l?équipe Opération garante de la qualité de service de la plateforme Tech & Data (150 produits/ 500 personnes qui maintiennent les fondations techniques de l?ensemble du groupe)
La mission comprend :
40% d?animation et de suivi de l?ensemble des équipes produits sur des problématiques Ops
Animation des niveau de service (SLO) des produits
Bonnes pratiques ITSM (Incidentologie, change management)
Animation mensuelle d?un comité avec le domaine dont le consultant sera en responsabilité et suivi des sujets au quotidien (obsolescence, suivi de conformité, suivi des indicateurs selon nos objectifs...)
30 % de RUN / accompagnement plus technique des équipes produits
Accompagnement sur l?Observabilité (chaîne de monitoring/alerting : configuration datadog, pagerduty, servicenow, SLO?). Utilisation d?infra as code (terraform)
Accompagnement des produits sur nos produits Ops (définition de SLO, création d?automatisation Ansible)
30% de BUILD sur les produits de l?équipe
Outil de calcul et centralisation de nos indicateurs de disponibilité (stack gcp + python)
Outil d?automatisation basé sur AWX qui automatise notamment la remédiation d?une grande partie de nos incidents (30k automatisations/mois)
Construction de dashboard (+ requêtes SQL) pour pouvoir animer les différents sujets Ops à partir des données de l?entreprise
Profil candidat:
Je recherche quelqu?un d?expérimenté, comprenant les enjeux de la prod à grande échelle; autant à l?aise sur de la technique que sur de l?animation.
Ops/SRE - Confirmé - Impératif
GCP - Confirmé - Impératif
Scripting - Confirmé - Impératif
Datadog - Confirmé - Important
Anglais Professionnel (Impératif)