Remote
وصف الوظيفة
Rejoignez Tether, une start‑up ambitieuse qui se positionne à la pointe de l’intelligence artificielle générative. En tant qu’Ingénieur Recherche IA spécialisé dans le pré‑entraînement, vous intégrerez l’équipe Modèles IA, une petite équipe d’experts passionnés qui conçoit, entraîne et optimise des modèles de très grande taille (LLM) et des architectures multimodales. Vous travaillerez depuis votre domicile, avec la flexibilité totale du télétravail, tout en collaborant étroitement avec des chercheurs, des data scientists et des ingénieurs systèmes basés à Bucarest et dans nos data‑centers mondiaux.
**Missions principales**
- Concevoir, implémenter et itérer sur des architectures de modèles de grande envergure (transformers, vision‑language, diffusion, etc.) en suivant une approche recherche‑pratique.
- Piloter le pipeline complet de pré‑entraînement : collecte, nettoyage et curation de jeux de données massifs (texte, images, audio), création de jeux de données de référence, mise en place de stratégies de filtrage et de déduplication.
- Optimiser l’utilisation de clusters GPU NVIDIA (A100, H100) composés de plusieurs milliers de cartes, en développant des solutions de parallélisme de données, de modèle et de pipeline (ZeRO, DeepSpeed, Megatron‑LM).
- Identifier, diagnostiquer et résoudre les goulets d’étranglement du pré‑entraînement (IO, bande passante, saturation de la mémoire, instabilité numérique) afin d’améliorer le throughput et la qualité des modèles.
- Mettre en place des métriques de suivi de la performance (perplexité, loss, benchmarks multimodaux) et automatiser les cycles de validation et de fine‑tuning.
- Collaborer avec les équipes produit pour transformer les prototypes de recherche en services IA exploitables (API, SDK, inference optimisée).
- Contribuer à la rédaction d’articles scientifiques, de rapports techniques et à la diffusion des résultats lors de conférences internationales.
**Profil recherché**
- Diplôme d’ingénieur ou master (ou équivalent) en informatique, IA, mathématiques appliquées ou domaine connexe ; un doctorat est un plus.
- Minimum 5 ans d’expérience professionnelle sur des projets de recherche et développement en deep learning, idéalement sur des modèles de langage de grande taille.
- Maîtrise avancée de Python et des frameworks PyTorch/TensorFlow, ainsi que des bibliothèques de parallélisme (DeepSpeed, Megatron‑LM, FairScale).
- Solide expérience avec les environnements Linux, les outils de conteneurisation (Docker, Kubernetes) et les pipelines CI/CD pour le ML (MLflow, DVC).
- Connaissance approfondie des architectures de GPU NVIDIA, du CUDA et des optimisations bas‑niveau (kernel tuning, NCCL).
- Capacité à travailler de façon autonome, à gérer des projets complexes et à communiquer clairement les résultats à des interlocuteurs techniques et non‑techniques.
- Esprit d’innovation, curiosité scientifique et volonté de publier et de partager les connaissances.
**Ce que nous offrons**
- Un poste 100 % remote avec une politique de travail flexible et un budget annuel dédié à l’équipement de bureau à domicile.
- Accès à des infrastructures de calcul de pointe (clusters GPU multi‑site, stockage haute performance).
- Un environnement de travail stimulant où chaque idée compte, avec des revues de code, des séminaires internes et des hackathons réguliers.
- Un package de rémunération compétitif, incluant des actions de la société et des bonus liés aux performances des modèles.
- Des opportunités de formation continue (conférences, cours en ligne, certifications) et de participation à des projets open‑source.
- Une culture d’entreprise inclusive, orientée vers la collaboration, la transparence et le bien‑être des équipes.
Si vous êtes passionné(e) par les défis du pré‑entraînement à grande échelle et que vous souhaitez contribuer à façonner l’avenir de l’IA générative, rejoignez Tether et participez à la création de la prochaine génération de modèles intelligents.