Postée il y a 15 heures
Présentation de la direction générale et du service
La Direction Générale du Système d'Information (DGSI) a pour rôle de concevoir et mettre en oeuvre la stratégie informatique de la Banque de France. Elle veille à la mise à niveau de l'architecture informatique, à l'intégration de l'innovation, à la sécurité numérique de la Banque de France mais aussi à la bonne gestion de son patrimoine de données. La DGSI regroupe plus de 2 000 personnes (internes et externes) réparties sur différents sites, à Paris, Vincennes, Marne-la-Vallée, Paris La Courneuve et Poitiers.
La Direction des Données et des Services Analytiques (DDSA) élabore et met en oeuvre, en collaboration avec les métiers, les principes de gouvernance des données définis dans la stratégie Data de la Banque de France et assure le partage et la diffusion de ces données.
La Cellule IA (C-IA) fait partie de la DDSA et contribue à intégrer les solutions data science et d'intelligence artificielle (IA) dans le système d'Information de l'entreprise et l'environnement de travail métier. C-IA est le centre de compétence en IA de la Banque de France. Il a en charge la conception et la mise en oeuvre de solutions nouvelles à fort risque technique, et la mise à disposition de solutions prêtes à l'emploi pour les métiers.
Descriptif de mission
Vous serez intégré(e) au sein de la Cellule IA dont les missions principales sont les suivantes :
-
Mettre en place de façon continue les Proofs of Concept (POC) fonctionnels et techniques issus des analyses d'opportunité ;
-
Benchmarker de façon régulière les outils d'Intelligence Artificielle, Data Science et Bigdata ;
-
Réaliser et préparer l'industrialisation des POC identifiés comme pertinents.
Au sein de cette équipe composée de spécialistes (data scientists, ML engineers et data engineers), vous participerez au développement de projets d'IA générative avec pour objectif d'adapter les grands modèles de langage (LLM) aux métiers de la Banque de France.
Le développement des LLM spécifiques aux activités d'une banque centrale est nécessaire pour assurer la précision, la pertinence et le respect des principes de l'IA dite de confiance dans un secteur avec de grands enjeux.
Nous développons actuellement système RAG qui repose sur un modèle d'embedding qui vectorise les textes de la base documentaire pour permettre une recherche sémantique. Cette étape, essentielle pour la pertinence des résultats, pourrait être renforcée en adaptant davantage le modèle au lexique spécifique de la Banque de France.
L'entraînement d'un modèle d'embedding suit généralement deux grandes phases : le pretraining, qui est coûteux en ressources, et le finetuning, qui affine les performances sur une tâche spécifique. Dans ce contexte, une stratégie prometteuse consiste à prolonger la phase de finetuning (further finetuning) afin de spécialiser le modèle de manière plus approfondie pour la récupération de textes.
Lors de ce stage, vous contribuerez aux activités du pôle en tant que Stagiaire ML Engineer et aurez les missions suivantes :
-
Réaliser un benchmark des modèles d'embedding open source.
-
Collecter et préparer des données adaptées.
-
Automatiser la génération du dataset pour l'entraînement.
-
Effectuer un further finetuning du modèle.
-
Évaluer les performances avec :
-
Les données spécifiques de la Banque de France.
-
Le benchmark MTEB pour une évaluation standardisée.
Intégré(e) à la Cellule IA, vous participerez pleinement à la vie de l'équipe : restitutions régulières du travail effectué, participation à la veille technologique générale, aux séminaires internes, aux séances de brainstorming...
Profil recherché
Formation recherchée :
-
Formation supérieure en informatique ou métier de la donnée (ingénieur ou équivalent) à la recherche d'un stage de fin d'études dans ce domaine.
-
Votre cursus scolaire vous a permis de maîtriser les fondements mathématiques et statistiques des techniques de data science/machine learning et IA et vous avez mis en pratique vos connaissances au travers de projets étudiants et/ou de stages.
Compétences :
-
Prérequis : connaissance en Deep Learning et NLP avec une première expérience dans l'utilisation de modèles de type LLM
-
Maitrise de la programmation avancée en Python (paradigme de programmation orientée objets) et des bonnes pratiques de développement logiciel en Python (tests unitaires, Git)
-
Aptitude à vulgariser une information complexe aussi bien à l'écrit qu'à l'oral, bonnes capacités rédactionnelles et de communication (pour documenter les travaux et restituer les résultats)
Qualités :
-
Esprit méthodique et rigueur d'analyse
-
Force de proposition, agilité, autonomie
-
Curiosité et créativité
-
Goût du travail en équipe
Contactez nos ambassadeurs
La Banque de France est une institution socialement responsable, attachée au respect de la diversité sous toutes ses formes, à la lutte contre les discriminations, à favoriser la parité Femme/Homme et à garantir un environnement de travail de qualité.
Des aménagements de poste peuvent être organisés pour tenir compte des handicaps des personnes recrutées.