Nous recrutons un·e Architecte Système afin de renforcer notre équipe Infrastructure.
OUTSCALE, marque de Dassault Systèmes, est un opérateur souverain et durable de l’Expérience en tant que Service qui offre à ses clients des environnements technologiques de confiance.
Nous offrons des expériences uniques grâce au savoir-faire de nos équipes passionnées, qui se reflète notamment par la création de solutions de Business Expériences, le développement de notre propre orchestrateur Cloud, TINA OS, ou encore l’obtention de la qualification SecNumCloud.
Vos missions
L'équipe Infrastructure Engineering au sein du département Infrastructure & Data Centers de 3DS Outscale est responsable du développement et de l'amélioration des solutions matérielles et réseau.
Vous travaillez en étroite collaboration avec les équipes d'infrastructure et d'exploitation du département pour concevoir de nouvelles solutions autour du calcul par le GPU:
- Vous gérez les applications GPU, de calcul et de réseau sur des plateformes convergentes x86/arm64, et vous soutenez les opérations de production
- Vous avez des connaissances en matière d'entraînement à l'IA à moyenne et grande échelle et vous comprenez les principales bibliothèques utilisées pour l'entraînement NLP/LLM/VLA (NeMo Framework, DeepSpeed, etc.).
- Vous êtes familier avec les serveurs multi-GPU (NVLink).
- Vous collaborez avec les équipes internes pour comprendre les besoins spécifiques d'Outscale.
- Vous optimisez l'environnement GPU et assurez la résilience de l'infrastructure.
- Vous travaillez avec les équipes d'ingénierie et de produits pour répondre aux besoins de production d'Outscale.
- Vous résolvez les problèmes complexes de GPU et de calcul à l'aide d'outils spécialisés.
Stack technique
- GPU, CUDA, ROCm,DGX, serveurs multi-GPU
- VMWare, KVM, Hyper-V
- AWS, Azure, GCP...
- Slurm, PBS
- C
- Python/Bash
- HPC
Votre profil
- Diplômé·e d'un master en informatique, science des données, génie électrique ou équivalent, vous possédez au minimum 8 ans d'expérience professionnelle post-diplôme dans les fondamentaux des réseaux, la pile TCP/IP et l'architecture des centres de données.
- Vous bénéficiez d'une solide expérience dans la configuration, le test, la validation et la résolution de problèmes liés aux GPU (NVIDIA, AMD), y compris l'utilisation d'outils de validation pour surveiller les performances d'environnements AI/HPC de taille moyenne à grande.
- Vous êtes capable de résoudre des problèmes complexes et de collaborer dans des environnements dynamiques et en évolution rapide.
- Vous possédez une expertise en administration de système Linux/DevOps : gestion des processus, gestion des paquets, optimisation des performances, gestion des journaux et optimisation du réseau.
Nous rejoindre c'est aussi
Intégrer une entreprise scientifique au cœur de l’innovation technologique, portée par une forte croissance depuis plus de 40 ans
Principaux avantages et bénéfices :
- Environnement multiculturel
- Cadre de travail convivial axé sur le bien-être et la santé
- Engagement en faveur de la diversité et de l’inclusion
- Politique dynamique de développement de carrière : plan de formation, mobilités internes, etc.