Postée il y a 24 heures
Explorons ensemble. Visons l'impossible Leader européen du cloud computing, OVHcloud est présent dans une
quinzaine de pays et fournit des solutions d'hébergement et de cloud sécurisées, fiables et accessibles.
Au sein de votre équipe #OneTeam
- Intégrez l'équipe en charge du déploiement et du maintien en conditions opérationnelles des infrastructures critiques utilisées par nos clients internes et externes (infrastructures anti-ddos, Load balancers, etc.) ainsi que des couches applicatives associées.
Vos principales responsabilités
- Assurer la maintenance opérationnelle de l'infrastructure et des applications.
- Gérer les alertes et les incidents à l'aide d'Opsgenie, JIRA et ServiceNow.
- Effectuer la maintenance régulière et suivre les changements.
- Documenter les processus opérationnels.
- Développer et maintenir des scripts d'automatisation (Ansible, Python, GO, Perl).
- Automatiser les tâches répétitives pour optimiser l'efficacité.
- Contribuer activement aux pipelines CI/CD.
- Mettre en oeuvre des solutions d'Infrastructure as Code (IaC).
- Créer et configurer des tableaux de bord avec Grafana.
- Optimiser les alertes Prometheus pour une détection proactive des problèmes.
- Améliorer l'observabilité des systèmes pour une meilleure compréhension et résolution des incidents.
- Surveiller régulièrement les tendances DEVOPS, y compris celles liées aux microservices, aux technologies cloud et à l'observabilité.
- Proposer des améliorations techniques pour l'optimisation et l'innovation.
Votre futur impact
Dans 6 mois
- Vous aurez une bonne connaissance de nos infrastructures et de notre système d'information.
- Vous contribuerez activement à la gestion des incidents et des déploiements matériels et logiciels.
- Vous participerez à des évolutions de celui-ci (Automatisation, Supervision, Industrialisation, Changements d'archi, correctifs techniques long terme)
- Vous participerez aux cycles d'astreintes de notre équipe SRE
Et dans 1 an
- Vous participerez aux évolutions majeures du Système d'information
- Vous prendrez le lead sur la gestion de sujets complexes avec différentes parties prenantes
Compétences requises :
- Vous avez des compétences en administration de systèmes et réseaux
- Vous justifiez d'expérience CI/CD
- Vous avez connaissance des outils de déploiements : Ansible, Terraform, Puppet
- Vous avez déjà travaillé en monitoring, plateformes et processus associés : Icinga, etc
- Vous avez une expérience significative avec Prometheus et Grafana
- Avec un grand sens du service, vous souhaitez avoir un impact positif sur vos contacts internes et / ou externes
- Vous êtes ouvert sur le monde et travailler dans un contexte international est un aspect important pour vous.
- Vous êtes autonome et capable de travailler dans un environnement en évolution rapide
C'est un +
- Vous développez sur Python ou GO
SRE - Network Operations / Appliances H/F/N
Compétences requises :
- Vous avez des compétences en administration de systèmes et réseaux
- Vous justifiez d'expérience CI/CD
- Vous avez connaissance des outils de déploiements : Ansible, Terraform, Puppet
- Vous avez déjà travaillé en monitoring, plateformes et processus associés : Icinga, etc
- Vous avez une expérience significative avec Prometheus et Grafana
- Avec un grand sens du service, vous souhaitez avoir un impact positif sur vos contacts internes et / ou externes
- Vous êtes ouvert sur le monde et travailler dans un contexte international est un aspect important pour vous.
- Vous êtes autonome et capable de travailler dans un environnement en évolution rapide
C'est un +
- Vous développez sur Python ou GO
SRE - Network Operations / Appliances H/F/N