Large Language Models

AI-prijzen week 19, DeepSeek's cache zet de toon

DeepSeek verlaagde vorige week zijn cache-prijs naar een tiende, en zette daarmee de toon voor week 19. Bij het frontier-veld bewoog niks. Anthropic, Google, OpenAI en xAI hielden hun tarieven precies waar ze stonden in week 18. De marktdynamiek schoof wél, want naast de DeepSeek-stap kwam Xiaomi met MiMo en publiceerden we een uitgewerkte case van een NL-bedrijf dat alles draaiend houdt voor €180 per maand. We rekenen door wat dat betekent voor wie deze week zijn AI-budget moet vaststellen.

Prijzen per miljoen tokens

Alle bedragen in USD per 1 miljoen tokens, met EUR-conversie op peilkoers 1 USD = 0,92 EUR (4 mei 2026). De EUR-kolommen tonen het bedrag inclusief 21 procent btw, zodat een ZZP'er of consument direct kan rekenen. Een NL-bedrijf dat btw aftrekt rekent met USD × 0,92.

ModelProviderInput $/MOutput $/MCache-read $/MInput € incl btwOutput € incl btw
Claude Opus 4.7Anthropic5,0025,000,505,5727,83
Claude Sonnet 4.6Anthropic3,0015,000,303,3416,70
Claude Haiku 4.5Anthropic1,005,000,101,115,57
GPT-5.4 proOpenAI30,00180,00-33,40200,38
GPT-5.4 miniOpenAI0,754,500,0750,835,01
GPT-5.4 nanoOpenAI0,201,250,020,221,39
GPT-5.3 CodexOpenAI1,7514,000,1751,9515,58
GPT-5.2OpenAI1,7514,000,1751,9515,58
GPT-5.1OpenAI1,2510,000,1251,3911,13
GPT-5OpenAI1,2510,000,1251,3911,13
GPT-5 miniOpenAI0,252,000,0250,282,23
GPT-5 nanoOpenAI0,050,400,0050,060,45
o3OpenAI2,008,000,502,238,91
o4-miniOpenAI1,104,400,2751,224,90
Gemini 2.5 ProGoogle1,2510,000,1251,3911,13
Gemini 2.5 FlashGoogle0,302,500,030,332,78
Gemini 3.1 Pro (preview)Google2,0012,00-2,2313,36
Gemini 3 Flash (preview)Google0,503,00-0,563,34
Grok 4xAI3,0015,00-3,3416,70
Grok 4 FastxAI0,200,50-0,220,56
DeepSeek V3.2DeepSeek0,270,42-0,300,47

De cache-kolom voor DeepSeek staat op een streepje, omdat de tariefverlaging van 26 april nog niet als losse waarde in onze tabel zit. In de praktijk is het cachetarief inmiddels rond 0,028 USD per miljoen, ofwel ongeveer drie eurocent inclusief btw. We werken die kolom in een latere update bij; voor wie nu een RAG- of agent-pipeline op DeepSeek draait, is dat de scherpste cijferreeks van het hele veld.

De vijf goedkoopste modellen deze week

Gerangschikt op output-tarief, want dat is de zwaarst wegende kostenpost in een chat- of agent-workload. Alle bedragen in EUR per 1 miljoen output-tokens, inclusief btw.

  1. GPT-5 nano, €0,45 per miljoen, het absolute minimum binnen het frontier-veld.
  2. DeepSeek V3.2, €0,47 per miljoen, sinds vorige week ook met cache-tarief van een tiende. We schreven hoe DeepSeek's cache zakt naar een tiende, je RAG wordt spotgoedkoop.
  3. Grok 4 Fast, €0,56 per miljoen, xAI's budgetvariant met een 2M-context.
  4. GPT-5.4 nano, €1,39 per miljoen, nieuwste generatie aan de onderkant.
  5. GPT-5 mini, €2,23 per miljoen, een dependable workhorse voor classificatie en simpele extractie.

Aan de andere kant van de tabel staat GPT-5.4 pro op €200,38 per miljoen output-tokens en blijft daarmee veruit de duurste model-call die je publiek kunt aanroepen. Daarna komen Claude Opus 4.7 op €27,83 en het trio premium-modellen Claude Sonnet 4.6, Grok 4 en GPT-5.3 Codex op respectievelijk €16,70, €16,70 en €15,58 per miljoen.

Wat veranderde sinds vorige week

In onze hoofdtabel niets, in de markt drie dingen. Eén, DeepSeek verlaagde zijn cache hit-tarief met een factor tien over de hele API, niet alleen bij het nieuwste V4-Pro maar ook bij de varianten daaronder. Voor agent- en RAG-workloads die elke turn dezelfde fundering aan context herkauwen, is dat de scherpste tariefshift van 2026 tot nu toe. Twee, Xiaomi bracht MiMo uit, een open-weights model dat Claude evenaart op publieke benchmarks voor dertien procent van de prijs. Drie, en hieruit volgt geen tariefshift maar wel een perceptiekanteling, we publiceerden een case waarin een NL-MKB'er zijn hele bedrijfsautomatisering rond Claude bouwt voor onder de tweehonderd euro per maand. Anthropic, Google, OpenAI en xAI hielden hun frontier-prijzen op slot.

Prijs versus effectieve kosten

Benchmarkscores per model staan voor het frontier-veld nog niet volledig in onze database, dus een echte prijs-per-intelligentie-ranking laten we wederom achterwege. Wat wel in beweging blijft, is het effectieve tarief per taak. Een coding-prompt die begin dit jaar bij Claude Sonnet 4.5 acht- tot tienduizend tokens kostte, kost bij Claude Opus 4.7 al gauw twintigduizend tokens of meer, omdat het model meer redeneert per turn. Het tarief daalt niet, het verbruik per taak stijgt. Reken die factor mee bij het bepalen van je maandbudget en kies bewust voor een lichter model wanneer de extra redeneerstappen geen verschil maken.

Aangekondigd maar nog zonder publieke prijs

  • GPT-5.5 (OpenAI, release 23 april 2026), wel beschikbaar in Plus en Pro, geen publieke per-token-pricing.
  • Gemini 3 Pro (Google, release 15 maart 2026), preview-only, geen publieke pricing.
  • Llama 4 Maverick (Meta, 15 januari 2026), open-weights, geen hosted-API-tarief. Zelf hosten kost GPU-tijd, geen per-token-fee.

Wat dit kost voor een NL-developer

Een realistisch scenario, een SaaS-tool met 1.000 AI-requests per dag, gemiddeld 2k input- en 2k output-tokens per request. Dat is 60 miljoen input- en 60 miljoen output-tokens per maand.

  • Claude Sonnet 4.6 → (60 × $3) + (60 × $15) = $1.080 per maand, circa €1.202 incl btw.
  • Claude Haiku 4.5 → (60 × $1) + (60 × $5) = $360 per maand, circa €401 incl btw.
  • GPT-5 mini → (60 × $0,25) + (60 × $2) = $135 per maand, circa €150 incl btw.
  • Gemini 2.5 Flash → (60 × $0,30) + (60 × $2,50) = $168 per maand, circa €187 incl btw.
  • DeepSeek V3.2 → (60 × $0,27) + (60 × $0,42) = $41 per maand, circa €46 incl btw.

Voor een ZZP'er zonder btw-aftrek zijn dit de werkelijke uitgaven. Een BV trekt de btw eraf en zit dus 17,4 procent lager. Het verschil tikt aan zodra je richting Sonnet of Opus opschaalt. Wie audio-output meeneemt, vindt nog scherper tarief in Gemini Flash TTS, dat Nederlandstalige speech genereert voor drie cent per minuut.

Wat we volgende week in de gaten houden

Drie dingen. Of OpenAI alsnog een per-token-tarief publiceert voor GPT-5.5 in de standaard-API, want het model staat nu bijna twee weken zonder API-pricing online. Of Anthropic op zijn voorjaarsbijeenkomst van begin mei iets aankondigt op cache-tarieven, het enige tariefonderdeel waar het frontier-veld de afgelopen kwartalen nauwelijks beweging in liet zien. En of Google de publieke pricing voor Gemini 3 Pro vrijgeeft, want het preview-traject duurt inmiddels zeven weken.

Michael Groeneweg
Geschreven door Michael Groeneweg AI-consultant bij Digital Impact en oprichter van UnicornAI.nl

Michael is AI-consultant bij Digital Impact in Rotterdam en oprichter van UnicornAI.nl, waar hij AI-oplossingen en SaaS-integraties bouwt voor bedrijven. Al tien jaar ondernemer, en sinds een paar jaar weigert hij iets te doen waar geen AI in verweven zit, zakelijk noch privé, tot mild ongenoegen van zijn omgeving. Zijn reizen door de wereld zijn inmiddels een serie experimenten in wat AI wel en niet kan vanaf een terrasje in Lissabon of een treinstation in Tokio. Hij test obsessief nieuwe tools, bouwt oplossingen voor klanten, en vindt dat niemand de hype moet geloven, maar ook niemand meer kan doen alsof AI niet alles verandert. Houdt van goede koffie, lange vluchten en mensen die met AI bouwen in plaats van er alleen over praten.

Gemaakt door een mens, met AI als assistent bij research en redactie. Meer over onze werkwijze in de AI-disclosure en het redactiestatuut.