Remote
Job description
Rejoignez Tether, start‑up innovante au cœur de l’écosystème IA français, en tant qu’Ingénieur Recherche IA spécialisé dans le pré‑entraînement de modèles de grande envergure. Vous intégrerez l’équipe « Modèles IA », une petite équipe d’experts passionnés qui conçoit, entraîne et optimise des architectures de modèles de langage (LLM) et multimodaux, de la taille de quelques millions de paramètres jusqu’à plusieurs dizaines de milliards.
**Missions principales**
- Concevoir et implémenter des architectures de modèles novatrices (transformers, architectures hybrides, modèles multimodaux) en s’appuyant sur les dernières avancées scientifiques.
- Piloter le cycle complet de pré‑entraînement : définition du protocole, sélection et curation de jeux de données massifs, mise en place de pipelines de data‑augmentation et de filtrage de qualité.
- Optimiser les performances d’entraînement sur des clusters distribués de plusieurs milliers de GPU NVIDIA (A100, H100) : parallélisme de données et de modèles, gestion de la mémoire, utilisation de techniques de mixed‑precision et de ZeRO.
- Identifier, analyser et résoudre les goulets d’étranglement (IO, bande passante, scalabilité) afin de réduire les temps de formation de 30 % en moyenne.
- Mettre en place des métriques de suivi de la qualité du modèle (perplexité, loss, benchmarks spécifiques) et automatiser les rapports d’évaluation.
- Collaborer étroitement avec les équipes Data Engineering, Produit et Recherche pour transformer les modèles entraînés en API robustes et déployables.
- Publier des articles scientifiques ou des rapports techniques, participer à des conférences (NeurIPS, ICML, ACL) et contribuer à la communauté open‑source.
**Profil recherché**
- Diplôme d’ingénieur, Master ou PhD en informatique, IA, mathématiques appliquées ou domaine équivalent.
- Minimum 5 ans d’expérience professionnelle en recherche appliquée ou ingénierie IA, avec un historique de projets de pré‑entraînement de LLM ou de modèles multimodaux.
- Maîtrise avancée des frameworks Deep Learning (PyTorch, TensorFlow) et des bibliothèques de parallélisme (DeepSpeed, Megatron‑LM, FairScale).
- Solide expérience en programmation Python et C++, ainsi qu’en administration de systèmes Linux et gestion de clusters GPU.
- Connaissance approfondie des algorithmes d’optimisation, du training distribué, du mixed‑precision et des techniques de réduction de la consommation énergétique.
- Capacité à travailler de façon autonome en environnement 100 % remote, à organiser son temps, à communiquer clairement les avancées et les obstacles.
- Anglais professionnel (lecture et rédaction de publications scientifiques) ; le français est un plus.
**Ce que nous offrons**
- CDI à temps plein, 100 % télétravail avec un budget annuel dédié à l’équipement (PC, écrans, accessoires).
- Accès à une infrastructure de pointe (clusters GPU, stockage haute‑performance) et à des licences logicielles premium.
- Rémunération attractive avec bonus annuel lié aux performances du modèle et aux livrables scientifiques.
- Programme de formation continue (conférences, cours en ligne, certifications) et temps dédié à la recherche personnelle.
- Environnement de travail stimulant, culture d’innovation, équipe internationale et opportunités de visibilité dans la communauté IA.
- Congés payés, mutuelle santé, tickets restaurant et participation aux frais de transport (pour les visites ponctuelles au siège de Paris).
Vous êtes prêt à repousser les limites du pré‑entraînement IA et à contribuer à la prochaine génération de modèles intelligents ? Postulez dès maintenant et rejoignez Tether pour façonner l’avenir de l’intelligence artificielle.