Elsevier, de wetenschappelijke uitgeverij die onderdeel is van RELX, zoekt een Senior Data Scientist voor hun Amsterdam Tech Hub. Het team van NLP- en machine learning-experts werkt aan het ontsluiten van Elsevier's enorme collectie wetenschappelijke publicaties. Denk aan miljoenen artikelen over geneeskunde, techniek en exacte wetenschappen die met AI doorzoekbaar en analyseerbaar worden gemaakt.

Wat ga je doen

Je ontwikkelt en onderhoudt Generative AI-, RAG- en NLP-oplossingen die wetenschappelijke content verrijken en toegankelijker maken. Je bouwt aan data-pipelines op Spark-clusters, werkt met de kerndata van Elsevier en levert algoritmen op die in productie draaien. Je werkt samen met teams door de hele organisatie om text mining en concept mining te integreren in Elsevier's producten.

Wat ze zoeken

  • 7+ jaar toegepaste ervaring in data science, met focus op Generative AI, NLP en machine learning
  • MSc of bij voorkeur PhD in NLP, Computational Linguistics, Computer Science of verwant
  • Python voor data science (PySpark, Pandas, Jupyter, NumPy)
  • Ervaring met big data-technologieen (Hadoop, Spark, ETL-pipelines)
  • Kennis van SQL en datavisualisatie
  • Ervaring met het deployen van algoritme-gedreven producten in productie

Wat ze bieden

  • Werken aan een van de grootste wetenschappelijke datasets ter wereld
  • Kantoor in Amsterdam met hybride werkopties
  • Impact maken op de wetenschappelijke community wereldwijd
  • Werken in een team van NLP-specialisten en ML-experts