جديد
وصف الوظيفة
Nebius, acteur incontournable de la nouvelle ère du cloud computing dédié à l’intelligence artificielle, recherche un Ingénieur Support Senior L3 pour piloter la création et l’exploitation d’une ligne de support hautement spécialisée sur ses serveurs, firmware (BIOS/BMC) et diagnostics Linux avancés, au sein de ses datacenters européens et américains.
**Missions principales**
- Prendre en charge les incidents de haute sévérité (P1/P2) liés aux serveurs, aux cartes GPU, au firmware et aux interactions hardware/software, en assurant une résolution rapide et fiable.
- Conduire des investigations techniques approfondies : analyse des causes racines, identification de patterns récurrents, élaboration de rapports d’incidents détaillés.
- Collaborer étroitement avec les fournisseurs ODM, les équipes R&D et les équipes L1/L2 afin de garantir la continuité du service et l’amélioration continue des processus.
- Valider, tester et déployer les mises à jour firmware sur les plateformes serveur et GPU, en veillant à la conformité avec les exigences de sécurité et de performance.
- Rédiger et maintenir des run‑books, guides de dépannage, catalogues d’erreurs et procédures d’escalade destinés aux équipes de support de niveau 1 et 2.
- Automatiser les tâches de diagnostic et de collecte d’informations via des scripts Bash/Python et des outils tels que ipmitool, Redfish, nvidia‑smi, dcgmi.
- Assurer une communication claire et structurée avec les clients et les parties prenantes internes, même sous forte pression, en anglais comme en français.
**Profil recherché**
- Minimum 5 ans d’expérience pratique sur des serveurs de datacenter (x86, ARM) et sur le troubleshooting Linux (CentOS, RHEL, Ubuntu, SLES).
- Maîtrise du diagnostic matériel, du BIOS/BMC, du firmware et des interfaces de gestion (IPMI, Redfish, iLO, iDRAC).
- Connaissance approfondie des plateformes GPU (NVIDIA, AMD) et des outils de monitoring (nvidia‑smi, dcgmi).
- Solides compétences en scripting Bash et Python pour automatiser la collecte de logs, le déploiement de correctifs et la génération de rapports.
- Expérience avérée dans la gestion d’incidents critiques, la rédaction de post‑mortems et la mise en place de processus d’amélioration continue.
- Excellente capacité de communication écrite et orale en français et en anglais.
- Esprit d’équipe, sens du service client et capacité à travailler en environnement multiculturel et multi‑site.
**Ce que nous offrons**
- Un poste en CDI basé à Paris ou Béthune, avec des possibilités de déplacements ponctuels dans nos datacenters aux États‑Unis et en Europe.
- Un environnement technologique de pointe, au cœur de projets IA et cloud de grande envergure.
- Un package de rémunération attractif, complété par des avantages sociaux (mutuelle, tickets restaurant, plan d’épargne entreprise) et des opportunités de formation continue.
- Une culture d’entreprise qui valorise l’innovation, la prise d’initiative et le développement de carrière.
Rejoignez Nebius et participez à la construction de l’infrastructure qui soutient les futures applications d’intelligence artificielle à l’échelle mondiale.