Postée il y a 5 jours
La prestation va porter sur l?ensemble des assets IT susceptibles d?être sujet à dysfonctionnement dégradant le niveau de service de la DSI.
Il est attendu du prestataire de piloter les enquêtes préliminaires et suivre les actions identifiées suite à la caractérisation permettant de traiter tout le cycle de vie de ces incidents ou perturbations : de la détection à l?amélioration continue.
Ci-dessous, quelques exemples de sources d?incidents :
?Des défaillances matérielles (problème réseau, pannes de serveurs, défaillance de disque dur?etc
?Des problèmes logiciels (conflits de version lors d?un upgrade d?OS ou applicatif, failles de sécurité?)
?Des problèmes environnementaux dans le datacenter (coupures d?électricité?etc)
?Des surcharges en termes de consommations dépassant la capacité des solutions en place (pic de charge, trafic réseau excessif, sollicitation excessive des ressources informatiques?etc)
?Une défaillance des procédures de sauvegarde et de restauration après une crise pouvant causer une perte de données
?Des évolutions majeures (upgrades, modifications de configurations, déploiement de nouveaux équipements réseau ou infra?) mal évaluées ou pas complètement testées
?Des problèmes sur les postes de travail (OS, surcharge en termes de stockage?)
?Des problèmes de performance (surcharge des espaces de stockage, sous-dimensionnement des bandes passantes pour les flux volumineux?)
Le prestataire devra donc se reposer sur une expérience pluridisciplinaire afin de prendre en compte l?ensemble de ces dimensions pour mettre en place une équipe mutualisée permettant d?adresser ces points de défaillance de manière efficiente et suivre des plans de remédiation le plus rapidement possible.
Profil candidat:
Excellentes compétences en communication pour coordonner les activités de l'équipe, communiquer avec les parties prenantes internes et externes
Capacité à analyser rapidement les situations et à prendre des décisions éclairées
Connaissance des technologies et des systèmes impliqués dans l'infrastructure informatique de l'organisation
Expertise dans la mise en oeuvre et la gestion des processus de gestion des incidents.
Collaboration et travail d'équipe
Compétences techniques :
Systèmes et Infrastructure : Connaissance des environnements Windows et Linux, virtualisation et stockage.
Bases de données : Connaissances des SGBD.
Réseaux et Sécurité : Compétences en administration réseau et cybersécurité.
Supervision et Diagnostic : Expérience avec les outils de monitoring et d?analyse des incidents.
Gestion des incidents IT : Connaissance des processus ITIL et des outils ITSM.
Compétences analytiques et méthodologiques :
Diagnostic & Troubleshooting : Capacité à analyser rapidement les causes profondes des incidents et à proposer des solutions efficaces en coordination avec les équipes techniques.
Gestion de crise et post-mortem : Savoir organiser des rétrospectives pour éviter la récurrence des incidents critiques. Expertise en supervision et observabilité
Compétences en coordination et communication :
collaboration interdisciplinaire : Capacité à interagir avec les équipes métiers, infrastructure, développement et sécurité.
Pédagogie & vulgarisation : Aptitude à expliquer des problèmes techniques complexes aux non-techniciens.
Reporting & suivi : Rédaction de rapports d?incidents, mise en place de tableaux de bord et indicateurs de performance (KPI).
D?autres compétences pourraient être identifiées dans le cadre de ce cadrage sur recommandation du prestataire sélectionnés