Data engineer - Hadoop/Pyspark impératif (IT)

Les missions du poste

Au sein du département IT, la DSI a pour vocation de fournir aux services Technologies & Opérations (pôles Global Business Management and Transformation (GBMT), WorkPlace, CIO Office Groupe) et Banque de Proximité et Assurance (BPA), l?ensemble des applications nécessaires à leur fonctionnement.

Le département CIO Office Groupe a lancé un programme stratégique qui comporte plusieurs projets d'harmonisation des processus et outils. L'un de ces streams a pour vocation de constituer un datalake sur une stack Hadoop, afin de servir les besoins en data et reporting. Ce datalake CIO Office a également pour vocation de devenir la brique centrale de l'architecture du SI CIO Office.



Profil candidat:
Nous recherchons un profil Hadoop / PySpark qui sera en charge, en lien avec l'équipe de production applicative / devops, de mettre en ?uvre techniquement les évolutions du datalake CIO Office. Passionné par les données, capable de s?adapter à un environnement dynamique et en constante évolution, le prestataire doit faire preuve d'autonomie, d'initiative et d'une forte capacité d'analyse pour résoudre des problèmes complexes.

Les tâches suivantes seront confiés au consultant :

? Mettre en ?uvre de nouvelles ingestions de données, data prep/transformation

? Maintenir et faire évoluer nos outils de gestion des pipeline de données (Pyspark + shell scripting)

? Adresser à l'équipe devops les demandes relatives aux évolutions de la plateforme

? Eventuellement mettre en ?uvre une couche d'APIs afin d'exposer nos données

Lieu : Charenton-le-Pont
Contrat : CDI
Accueil / Emploi / Emploi Charenton-le-Pont / Emploi