DeepSeek verlaagde vorige week zijn cache-prijs naar een tiende, en zette daarmee de toon voor week 19. Bij het frontier-veld bewoog niks. Anthropic, Google, OpenAI en xAI hielden hun tarieven precies waar ze stonden in week 18. De marktdynamiek schoof wél, want naast de DeepSeek-stap kwam Xiaomi met MiMo en publiceerden we een uitgewerkte case van een NL-bedrijf dat alles draaiend houdt voor €180 per maand. We rekenen door wat dat betekent voor wie deze week zijn AI-budget moet vaststellen.
Prijzen per miljoen tokens
Alle bedragen in USD per 1 miljoen tokens, met EUR-conversie op peilkoers 1 USD = 0,92 EUR (4 mei 2026). De EUR-kolommen tonen het bedrag inclusief 21 procent btw, zodat een ZZP'er of consument direct kan rekenen. Een NL-bedrijf dat btw aftrekt rekent met USD × 0,92.
| Model | Provider | Input $/M | Output $/M | Cache-read $/M | Input € incl btw | Output € incl btw |
|---|---|---|---|---|---|---|
| Claude Opus 4.7 | Anthropic | 5,00 | 25,00 | 0,50 | 5,57 | 27,83 |
| Claude Sonnet 4.6 | Anthropic | 3,00 | 15,00 | 0,30 | 3,34 | 16,70 |
| Claude Haiku 4.5 | Anthropic | 1,00 | 5,00 | 0,10 | 1,11 | 5,57 |
| GPT-5.4 pro | OpenAI | 30,00 | 180,00 | - | 33,40 | 200,38 |
| GPT-5.4 mini | OpenAI | 0,75 | 4,50 | 0,075 | 0,83 | 5,01 |
| GPT-5.4 nano | OpenAI | 0,20 | 1,25 | 0,02 | 0,22 | 1,39 |
| GPT-5.3 Codex | OpenAI | 1,75 | 14,00 | 0,175 | 1,95 | 15,58 |
| GPT-5.2 | OpenAI | 1,75 | 14,00 | 0,175 | 1,95 | 15,58 |
| GPT-5.1 | OpenAI | 1,25 | 10,00 | 0,125 | 1,39 | 11,13 |
| GPT-5 | OpenAI | 1,25 | 10,00 | 0,125 | 1,39 | 11,13 |
| GPT-5 mini | OpenAI | 0,25 | 2,00 | 0,025 | 0,28 | 2,23 |
| GPT-5 nano | OpenAI | 0,05 | 0,40 | 0,005 | 0,06 | 0,45 |
| o3 | OpenAI | 2,00 | 8,00 | 0,50 | 2,23 | 8,91 |
| o4-mini | OpenAI | 1,10 | 4,40 | 0,275 | 1,22 | 4,90 |
| Gemini 2.5 Pro | 1,25 | 10,00 | 0,125 | 1,39 | 11,13 | |
| Gemini 2.5 Flash | 0,30 | 2,50 | 0,03 | 0,33 | 2,78 | |
| Gemini 3.1 Pro (preview) | 2,00 | 12,00 | - | 2,23 | 13,36 | |
| Gemini 3 Flash (preview) | 0,50 | 3,00 | - | 0,56 | 3,34 | |
| Grok 4 | xAI | 3,00 | 15,00 | - | 3,34 | 16,70 |
| Grok 4 Fast | xAI | 0,20 | 0,50 | - | 0,22 | 0,56 |
| DeepSeek V3.2 | DeepSeek | 0,27 | 0,42 | - | 0,30 | 0,47 |
De cache-kolom voor DeepSeek staat op een streepje, omdat de tariefverlaging van 26 april nog niet als losse waarde in onze tabel zit. In de praktijk is het cachetarief inmiddels rond 0,028 USD per miljoen, ofwel ongeveer drie eurocent inclusief btw. We werken die kolom in een latere update bij; voor wie nu een RAG- of agent-pipeline op DeepSeek draait, is dat de scherpste cijferreeks van het hele veld.
De vijf goedkoopste modellen deze week
Gerangschikt op output-tarief, want dat is de zwaarst wegende kostenpost in een chat- of agent-workload. Alle bedragen in EUR per 1 miljoen output-tokens, inclusief btw.
- GPT-5 nano, €0,45 per miljoen, het absolute minimum binnen het frontier-veld.
- DeepSeek V3.2, €0,47 per miljoen, sinds vorige week ook met cache-tarief van een tiende. We schreven hoe DeepSeek's cache zakt naar een tiende, je RAG wordt spotgoedkoop.
- Grok 4 Fast, €0,56 per miljoen, xAI's budgetvariant met een 2M-context.
- GPT-5.4 nano, €1,39 per miljoen, nieuwste generatie aan de onderkant.
- GPT-5 mini, €2,23 per miljoen, een dependable workhorse voor classificatie en simpele extractie.
Aan de andere kant van de tabel staat GPT-5.4 pro op €200,38 per miljoen output-tokens en blijft daarmee veruit de duurste model-call die je publiek kunt aanroepen. Daarna komen Claude Opus 4.7 op €27,83 en het trio premium-modellen Claude Sonnet 4.6, Grok 4 en GPT-5.3 Codex op respectievelijk €16,70, €16,70 en €15,58 per miljoen.
Wat veranderde sinds vorige week
In onze hoofdtabel niets, in de markt drie dingen. Eén, DeepSeek verlaagde zijn cache hit-tarief met een factor tien over de hele API, niet alleen bij het nieuwste V4-Pro maar ook bij de varianten daaronder. Voor agent- en RAG-workloads die elke turn dezelfde fundering aan context herkauwen, is dat de scherpste tariefshift van 2026 tot nu toe. Twee, Xiaomi bracht MiMo uit, een open-weights model dat Claude evenaart op publieke benchmarks voor dertien procent van de prijs. Drie, en hieruit volgt geen tariefshift maar wel een perceptiekanteling, we publiceerden een case waarin een NL-MKB'er zijn hele bedrijfsautomatisering rond Claude bouwt voor onder de tweehonderd euro per maand. Anthropic, Google, OpenAI en xAI hielden hun frontier-prijzen op slot.
Prijs versus effectieve kosten
Benchmarkscores per model staan voor het frontier-veld nog niet volledig in onze database, dus een echte prijs-per-intelligentie-ranking laten we wederom achterwege. Wat wel in beweging blijft, is het effectieve tarief per taak. Een coding-prompt die begin dit jaar bij Claude Sonnet 4.5 acht- tot tienduizend tokens kostte, kost bij Claude Opus 4.7 al gauw twintigduizend tokens of meer, omdat het model meer redeneert per turn. Het tarief daalt niet, het verbruik per taak stijgt. Reken die factor mee bij het bepalen van je maandbudget en kies bewust voor een lichter model wanneer de extra redeneerstappen geen verschil maken.
Aangekondigd maar nog zonder publieke prijs
- GPT-5.5 (OpenAI, release 23 april 2026), wel beschikbaar in Plus en Pro, geen publieke per-token-pricing.
- Gemini 3 Pro (Google, release 15 maart 2026), preview-only, geen publieke pricing.
- Llama 4 Maverick (Meta, 15 januari 2026), open-weights, geen hosted-API-tarief. Zelf hosten kost GPU-tijd, geen per-token-fee.
Wat dit kost voor een NL-developer
Een realistisch scenario, een SaaS-tool met 1.000 AI-requests per dag, gemiddeld 2k input- en 2k output-tokens per request. Dat is 60 miljoen input- en 60 miljoen output-tokens per maand.
- Claude Sonnet 4.6 → (60 × $3) + (60 × $15) = $1.080 per maand, circa €1.202 incl btw.
- Claude Haiku 4.5 → (60 × $1) + (60 × $5) = $360 per maand, circa €401 incl btw.
- GPT-5 mini → (60 × $0,25) + (60 × $2) = $135 per maand, circa €150 incl btw.
- Gemini 2.5 Flash → (60 × $0,30) + (60 × $2,50) = $168 per maand, circa €187 incl btw.
- DeepSeek V3.2 → (60 × $0,27) + (60 × $0,42) = $41 per maand, circa €46 incl btw.
Voor een ZZP'er zonder btw-aftrek zijn dit de werkelijke uitgaven. Een BV trekt de btw eraf en zit dus 17,4 procent lager. Het verschil tikt aan zodra je richting Sonnet of Opus opschaalt. Wie audio-output meeneemt, vindt nog scherper tarief in Gemini Flash TTS, dat Nederlandstalige speech genereert voor drie cent per minuut.
Wat we volgende week in de gaten houden
Drie dingen. Of OpenAI alsnog een per-token-tarief publiceert voor GPT-5.5 in de standaard-API, want het model staat nu bijna twee weken zonder API-pricing online. Of Anthropic op zijn voorjaarsbijeenkomst van begin mei iets aankondigt op cache-tarieven, het enige tariefonderdeel waar het frontier-veld de afgelopen kwartalen nauwelijks beweging in liet zien. En of Google de publieke pricing voor Gemini 3 Pro vrijgeeft, want het preview-traject duurt inmiddels zeven weken.