Postée il y a 4 jours
Au sein du département IT, la DSI a pour vocation de fournir aux services Technologies & Opérations (pôles Global Business Management and Transformation (GBMT), WorkPlace, CIO Office Groupe) et Banque de Proximité et Assurance (BPA), l?ensemble des applications nécessaires à leur fonctionnement.
Le département CIO Office Groupe a lancé un programme stratégique qui comporte plusieurs projets d'harmonisation des processus et outils. L'un de ces streams a pour vocation de constituer un datalake sur une stack Hadoop, afin de servir les besoins en data et reporting. Ce datalake CIO Office a également pour vocation de devenir la brique centrale de l'architecture du SI CIO Office.
Profil candidat:
Nous recherchons un profil Hadoop / PySpark qui sera en charge, en lien avec l'équipe de production applicative / devops, de mettre en ?uvre techniquement les évolutions du datalake CIO Office. Passionné par les données, capable de s?adapter à un environnement dynamique et en constante évolution, le prestataire doit faire preuve d'autonomie, d'initiative et d'une forte capacité d'analyse pour résoudre des problèmes complexes.
Les tâches suivantes seront confiés au consultant :
? Mettre en ?uvre de nouvelles ingestions de données, data prep/transformation
? Maintenir et faire évoluer nos outils de gestion des pipeline de données (Pyspark + shell scripting)
? Adresser à l'équipe devops les demandes relatives aux évolutions de la plateforme
? Eventuellement mettre en ?uvre une couche d'APIs afin d'exposer nos données