Prosus zoekt een Senior MLOps Engineer die de infrastructuur bouwt en beheert achter hun LLM-operaties in Amsterdam. Als eigenaar van de kritieke ML-infrastructuur werk je direct samen met het ML-team in het AI House, waar meer dan 200 AI-specialisten aan eigen taalmodellen bouwen.
Wat ga je doen
Je bouwt end-to-end ML-pipelines voor data-ingestie, modeltraining en deployment. Je beheert Kubernetes- en Slurm-clusters voor GPU-workloads, optimaliseert resource-gebruik en implementeert kostencontroles. Een groot deel van de rol draait om het deployen en fine-tunen van vLLM-infrastructuur voor productie, inclusief inference-optimalisatie met technieken als quantization, continuous batching en PagedAttention.
Wat ze zoeken
- 5+ jaar ervaring in MLOps, DevOps of platform engineering gericht op ML-systemen
- Expert-level ervaring met het deployen en optimaliseren van LLM serving in productie
- Sterke Python-kennis en API-ontwikkeling met FastAPI
- Kubernetes en Docker voor GPU-workloads, plus job orchestration (Slurm, Ray, Argo, Kubeflow)
- Ervaring met GPU-kostenoptimalisatie: budgettering, tracking en alerting
Wat ze bieden
- Eigenaarschap over kritieke AI-infrastructuur met directe zichtbaarheid bij C-level
- Toegang tot een H200 GPU-fleet en vLLM serving-infrastructuur
- Competitief salaris, MacBook Pro en hybride werkmodel in Amsterdam
- Veel autonomie in het ontwerpen van MLOps-oplossingen en toolkeuze