Large Language Models

AI-prijzen week 20, tokens stabiel en abonnementen schuiven

· 5 min leestijd

De API-tarieven voor Claude, GPT-5 en Gemini stonden week 20 stil. Wie vorige week zijn calculatie maakte op basis van $5 per miljoen input-tokens voor Opus 4.7 of $0,40 voor GPT-5 nano, hoeft hem niet bij te werken. De beweging zat aan de andere kant van het prijslandschap. Anthropic kondigde Claude Cowork aan, OpenAI schoof de ChatGPT-abonnementen om, en op de developer-tools-flank streden Claude Code en Codex om dezelfde euro per maand. We zetten de tokens op een rij, rekenen de Nederlandse btw erbij en kijken wie de meeste tokens per euro levert voor een NL-developer met een doorsnee werklast.

Prijzen per miljoen tokens

Alle bedragen in USD per 1 miljoen tokens, met EUR-conversie op peilkoers 1 USD = 0,92 EUR (11 mei 2026). De EUR-kolommen tonen het bedrag inclusief 21 procent btw, zodat een ZZP'er of consument direct kan rekenen. Een NL-bedrijf dat btw aftrekt rekent met USD × 0,92.

ModelProviderInput $/MOutput $/MCache-read $/MInput € incl btwOutput € incl btw
Claude Opus 4.7Anthropic5,0025,000,505,5727,83
Claude Sonnet 4.6Anthropic3,0015,000,303,3416,70
Claude Haiku 4.5Anthropic1,005,000,101,115,57
GPT-5.4 proOpenAI30,00180,00-33,40200,38
GPT-5.4 miniOpenAI0,754,500,0750,835,01
GPT-5.4 nanoOpenAI0,201,250,020,221,39
GPT-5.3 CodexOpenAI1,7514,000,1751,9515,58
GPT-5.2OpenAI1,7514,000,1751,9515,58
GPT-5.1OpenAI1,2510,000,1251,3911,13
GPT-5OpenAI1,2510,000,1251,3911,13
GPT-5 miniOpenAI0,252,000,0250,282,23
GPT-5 nanoOpenAI0,050,400,0050,060,45
o3OpenAI2,008,000,502,238,91
o4-miniOpenAI1,104,400,2751,224,90
Gemini 2.5 ProGoogle1,2510,000,1251,3911,13
Gemini 2.5 FlashGoogle0,302,500,030,332,78
Gemini 3.1 Pro (preview)Google2,0012,00-2,2313,36
Gemini 3 Flash (preview)Google0,503,00-0,563,34
DeepSeek V3.2DeepSeek0,270,42-0,300,47
Grok 4xAI3,0015,00-3,3416,70
Grok 4 FastxAI0,200,50-0,220,56

Top vijf goedkoopste output-tokens

Output is doorgaans de duurste kant van de calculatie omdat modellen meer compute kwijt zijn aan generatie dan aan ingestie. Gerankschikt op output-prijs komen we voor week 20 hier uit.

  1. GPT-5 nano, $0,40 / €0,45 per miljoen output-tokens
  2. DeepSeek V3.2, $0,42 / €0,47
  3. Grok 4 Fast, $0,50 / €0,56
  4. GPT-5.4 nano, $1,25 / €1,39
  5. GPT-5 mini, $2,00 / €2,23

Aan de bovenkant van het spectrum staat GPT-5.4 pro op €200,38 per miljoen output-tokens incl btw, daarna Claude Opus 4.7 op €27,83, en op een gedeelde derde plaats Claude Sonnet 4.6 en Grok 4 op €16,70. Een ranking puur op prijs zegt overigens weinig over welk model bij je use case past. GPT-5 nano kost de helft van het tarief van DeepSeek, maar haalt geen Sonnet-redenering. Voor een echte prijs-per-intelligentie-ranking moet je publieke benchmarks erbij pakken, en zelfs daar geldt dat geen enkel leaderboard alle 21 modellen uit deze tabel cover. Deze week beperken we ons daarom tot de pure tarieven.

Aangekondigd maar nog zonder publieke prijs

Drie modellen zijn live geannonceerd maar publiceren nog geen tokentarief.

  • GPT-5.5 (OpenAI, 23 april 2026). Staat in de lijn van GPT-5.4 maar zonder input- of output-prijs. In ons eerdere stuk over GPT-5.5 stond het al stil bij de pricing-vraag.
  • Gemini 3 Pro (Google, preview, 15 maart 2026). Pro-tier zonder tarief, terwijl Gemini 3 Flash al wel een prijs heeft ($0,50 input, $3 output).
  • Llama 4 Maverick (Meta, 15 januari 2026). Geen directe API-prijs, gebruik loopt via clouds als Bedrock, Together of Groq met eigen marges.

Wat veranderde sinds vorige week

In de snapshot van week 19 noteerden we al dat de frontier-prijzen stil stonden en dat DeepSeek's cache-cut van vorige maand de toon zette. Die situatie houdt aan. Wie de tabel van vorige week ernaast legt, ziet identieke getallen.

De beweging zit dus volledig aan de productkant. Anthropic voegde collaboration-features toe aan Claude Cowork zonder de API-prijs aan te raken. OpenAI herzag de tier-structuur van ChatGPT-abonnementen, zonder aanpassing aan de API-tarieven van GPT-5 of zijn varianten. En de strijd tussen Claude Code en Codex speelt zich af in IDE-integraties die in een bestaand abonnement zitten, waardoor de prijs per output-token gelijk blijft.

Wat dit kost voor een Nederlandse developer

We rekenen met een realistisch volume voor een Nederlandse developer of klein team: 200 requests per dag, 4.000 input-tokens en 1.000 output-tokens per request. Dat komt neer op 24 miljoen input-tokens en 6 miljoen output-tokens per maand. Met de huidige tarieven, alles in euro inclusief btw.

  • GPT-5 nano, circa €4 per maand
  • DeepSeek V3.2, circa €10 per maand
  • GPT-5 mini, circa €20 per maand
  • Gemini 2.5 Flash, circa €25 per maand
  • Claude Haiku 4.5, circa €60 per maand
  • Claude Sonnet 4.6, circa €180 per maand
  • Claude Opus 4.7, circa €300 per maand

De spreiding van ruwweg factor 75 tussen GPT-5 nano en Claude Opus 4.7 is de echte beslissing die elke NL-ondernemer deze week maakt. Wie een chatbot op een webshop laat draaien voor klantvragen heeft aan Haiku of GPT-5 mini ruim voldoende, Opus zou overdimensionering zijn. Wie code laat genereren voor een productie-deploy of contracten laat reviewen, betaalt die €300 graag voor de hogere kwaliteit. Het tussenscenario, een €60-Haiku of een €180-Sonnet, is waar de meeste MKB-implementaties uitkomen.

Voor wie compliance een rol speelt blijft Azure OpenAI in de Netherlands-region een serieuze optie, met dezelfde tarieven als OpenAI direct en EU-data-residency erbij. AWS Bedrock host onder andere Llama 4 Maverick zonder publieke per-token-prijs maar met on-demand inference vanaf enkele euro's per uur op een p5-instance, wat alleen rendeert bij hoge throughput. Voor de bovenstaande werklast blijven directe API-calls naar Anthropic, OpenAI of Google nog steeds het goedkoopst.

Wat we volgende week in de gaten houden

Twee dingen voor week 21. Een, Google I/O staat op de agenda. Als Gemini 3 Pro daar zijn officiele prijs krijgt, dan wordt dat de eerste echte beweging in de hoofdtabel sinds de cache-cut van DeepSeek. Twee, de silent launch van OpenAI's GPT-5.5 zonder gepubliceerde prijs houdt deze week stand of breekt. Een nieuwe tier rond $1,50 input zou Claude Sonnet 4.6 onder druk zetten en de balans in onze top-vijf goedkoopste output-tokens kantelen.

Michael Groeneweg
Geschreven door Michael Groeneweg AI-consultant bij Digital Impact en oprichter van UnicornAI.nl

Michael is AI-consultant bij Digital Impact in Rotterdam en oprichter van UnicornAI.nl, waar hij AI-oplossingen en SaaS-integraties bouwt voor bedrijven. Al tien jaar ondernemer, en sinds een paar jaar weigert hij iets te doen waar geen AI in verweven zit, zakelijk noch privé, tot mild ongenoegen van zijn omgeving. Zijn reizen door de wereld zijn inmiddels een serie experimenten in wat AI wel en niet kan vanaf een terrasje in Lissabon of een treinstation in Tokio. Hij test obsessief nieuwe tools, bouwt oplossingen voor klanten, en vindt dat niemand de hype moet geloven, maar ook niemand meer kan doen alsof AI niet alles verandert. Houdt van goede koffie, lange vluchten en mensen die met AI bouwen in plaats van er alleen over praten.

Gemaakt door een mens, met AI als assistent bij research en redactie. Meer over onze werkwijze in de AI-disclosure en het redactiestatuut.