Prosus zoekt een Senior MLOps Engineer die de infrastructuur bouwt en beheert achter hun LLM-operaties in Amsterdam. Als eigenaar van de kritieke ML-infrastructuur werk je direct samen met het ML-team in het AI House, waar meer dan 200 AI-specialisten aan eigen taalmodellen bouwen.

Wat ga je doen

Je bouwt end-to-end ML-pipelines voor data-ingestie, modeltraining en deployment. Je beheert Kubernetes- en Slurm-clusters voor GPU-workloads, optimaliseert resource-gebruik en implementeert kostencontroles. Een groot deel van de rol draait om het deployen en fine-tunen van vLLM-infrastructuur voor productie, inclusief inference-optimalisatie met technieken als quantization, continuous batching en PagedAttention.

Wat ze zoeken

  • 5+ jaar ervaring in MLOps, DevOps of platform engineering gericht op ML-systemen
  • Expert-level ervaring met het deployen en optimaliseren van LLM serving in productie
  • Sterke Python-kennis en API-ontwikkeling met FastAPI
  • Kubernetes en Docker voor GPU-workloads, plus job orchestration (Slurm, Ray, Argo, Kubeflow)
  • Ervaring met GPU-kostenoptimalisatie: budgettering, tracking en alerting

Wat ze bieden

  • Eigenaarschap over kritieke AI-infrastructuur met directe zichtbaarheid bij C-level
  • Toegang tot een H200 GPU-fleet en vLLM serving-infrastructuur
  • Competitief salaris, MacBook Pro en hybride werkmodel in Amsterdam
  • Veel autonomie in het ontwerpen van MLOps-oplossingen en toolkeuze