Large Language Models

AI-prijzen week 22, Gemini 3.5 Flash verstoort middenmarkt

· 7 min leestijd

Vorige week ontbrak Gemini 3.5 Flash nog in ons overzicht. Google lanceerde het model op 19 mei, een dag na publicatie van de prijs-snapshot van week 21, en daarmee is het de enige echte nieuwkomer in dit weekoverzicht. Het tarief positioneert Gemini 3.5 Flash stevig in de middenklasse: $1,50 per miljoen input-tokens en $9 per miljoen output-tokens. Voor de rest geldt: geen grote prijswijzigingen van de andere providers. In dit overzicht zetten we alle actuele AI-modelprijzen op een rij, omgerekend naar euro's. Peilkoers: 1 USD = 0,92 EUR (25 mei 2026). Bedrijven die btw kunnen aftrekken, houden het excl.-btw-bedrag aan; consumenten en zzp-ers zonder btw-aftrek rekenen met incl.-btw.

Prijzen per miljoen tokens

Gesorteerd op output-prijs (laag naar hoog). Modellen met * zijn preview-status. Alle EUR-bedragen incl. 21% btw.

ModelProviderInput USDOutput USDOutput EUR incl. btwCache read USD
GPT-5 nanoOpenAI$0,05$0,40€0,45$0,005
DeepSeek V3.2DeepSeek$0,27$0,42€0,47n.v.t.
Grok 4 FastxAI$0,20$0,50€0,56n.v.t.
GPT-5.4 nanoOpenAI$0,20$1,25€1,39$0,02
GPT-5 miniOpenAI$0,25$2,00€2,23$0,025
Gemini 2.5 FlashGoogle$0,30$2,50€2,78$0,03
Gemini 3 Flash *Google$0,50$3,00€3,34n.v.t.
o4-miniOpenAI$1,10$4,40€4,90$0,275
GPT-5.4 miniOpenAI$0,75$4,50€5,01$0,075
Claude Haiku 4.5Anthropic$1,00$5,00€5,57$0,10
o3OpenAI$2,00$8,00€8,91$0,50
Gemini 3.5 Flash (nieuw)Google$1,50$9,00€10,02$0,15
GPT-5OpenAI$1,25$10,00€11,13$0,125
GPT-5.1OpenAI$1,25$10,00€11,13$0,125
Gemini 2.5 ProGoogle$1,25$10,00€11,13$0,125
Gemini 3.1 Pro *Google$2,00$12,00€13,36n.v.t.
GPT-5.2OpenAI$1,75$14,00€15,58$0,175
GPT-5.3 CodexOpenAI$1,75$14,00€15,58$0,175
Claude Sonnet 4.6Anthropic$3,00$15,00€16,70$0,30
Grok 4xAI$3,00$15,00€16,70n.v.t.
Claude Opus 4.7Anthropic$5,00$25,00€27,83$0,50
GPT-5.4 proOpenAI$30,00$180,00€200,38n.v.t.

Goedkoopste en duurste modellen

Op basis van output-prijs per miljoen tokens, het meest representatieve tariefgetal voor de meeste workloads.

Top-5 goedkoopste (output, EUR incl. btw)

  1. GPT-5 nano - €0,45 per miljoen output-tokens
  2. DeepSeek V3.2 - €0,47
  3. Grok 4 Fast - €0,56
  4. GPT-5 mini - €2,23
  5. Gemini 2.5 Flash - €2,78

Top-3 duurste (output, EUR incl. btw)

  1. GPT-5.4 pro - €200,38 per miljoen output-tokens
  2. Claude Opus 4.7 - €27,83
  3. Claude Sonnet 4.6 / Grok 4 - €16,70

Prijs per GPQA-punt

Voor modellen met een bekend GPQA Diamond-benchmarkscore berekenen we de output-prijs gedeeld door de score als ruwe prijs-kwaliteitverhouding. GPQA meet wetenschappelijke domeinkennis en is een van de meest consistent gemeten benchmarks. Let op: dit is een simplificering - geen model scoort op alle taken hetzelfde als op GPQA.

Beste prijs-kwaliteitverhouding (laagste USD per GPQA-punt):

  1. DeepSeek V3.2: GPQA 82,4 - $0,42 output - $0,0051 per punt
  2. Grok 4 Fast: GPQA 85,7 - $0,50 output - $0,0058 per punt
  3. GPT-5 nano: GPQA 67,6 - $0,40 output - $0,0059 per punt
  4. GPT-5 mini: GPQA 82,3 - $2,00 output - $0,024 per punt
  5. Gemini 2.5 Flash: GPQA 82,8 - $2,50 output - $0,030 per punt

Slechtste prijs-kwaliteitverhouding:

  1. GPT-5.4 pro: GPQA 92,0 - $180 output - $1,957 per punt (383 keer duurder dan DeepSeek V3.2)
  2. GPT-5.3 Codex: GPQA 73,8 - $14 output - $0,190 per punt
  3. Grok 4: GPQA 87,5 - $15 output - $0,171 per punt

Aangekondigd maar nog zonder publieke prijs

Drie modellen staan in ons systeem maar hebben vooralsnog geen officieel API-tarief:

  • GPT-5.5 (OpenAI) - beschikbaar maar geen publiek tarief gepubliceerd
  • Llama 4 Maverick (Meta, jan 2026) - open source; via zelfhosting beschikbaar, API-prijs per aanbieder verschillend
  • Gemini 3 Pro (Google, preview, mrt 2026) - nog in preview zonder stabiel tarief

Wat veranderde ten opzichte van week 21

Ten opzichte van de editie van 18 mei is er precies een nieuw model bijgekomen: Gemini 3.5 Flash, gelanceerd op 19 mei 2026 met $1,50 input en $9 output per miljoen tokens. We bespraken de prestaties van dit model al uitgebreid in Gemini 3.5 Flash draait vier keer sneller dan de concurrentie. Tariefwijzigingen bij andere providers zijn er deze week niet. GPT-5.5 staat nog altijd zonder publiek API-tarief, net als vorige week.

Wat dit kost voor een Nederlandse developer

Concreet rekenvoorbeeld: een klantenservice-applicatie met 10.000 API-aanvragen per dag, gemiddeld 1.500 input-tokens en 500 output-tokens per aanvraag. Dat is 450 miljoen input-tokens en 150 miljoen output-tokens per maand. Maandelijkse kosten excl. btw (en incl. btw voor wie geen btw kan aftrekken):

  • GPT-5 nano: 450 x $0,05 + 150 x $0,40 = $82,50 - dat is €75,90 excl. btw of €91,84 incl. btw per maand
  • GPT-5 mini: $412,50 - €379,50 excl. / €459,20 incl.
  • Gemini 2.5 Flash: $510 - €469,20 excl. / €567,73 incl.
  • Gemini 3.5 Flash (nieuw): $2.025 - €1.863 excl. / €2.254 incl.
  • Claude Sonnet 4.6: $3.600 - €3.312 excl. / €4.007 incl.

Het verschil tussen de goedkoopste optie (GPT-5 nano) en Claude Sonnet 4.6 is een factor 44 per maand bij deze workload. Wie Claude gebruikt voor geautomatiseerde scripts, moet er bovendien rekening mee houden dat Anthropic vanaf 15 juni geautomatiseerde API-calls apart gaat afrekenen, wat de kosten voor scripting-workloads kan beinvloeden.

Wat we volgende week in de gaten houden

Volgende week kijken we of Gemini 3 Pro een officieel API-tarief krijgt en of OpenAI GPT-5.5 beschikbaar stelt met een publieke prijs. Beide staan in onze database maar hebben vooralsnog geen tarief. Ook volgen we of xAI aanpassingen doorvoert in de Grok 4-prijzen nu de competitie in het middensegment toeneemt door Gemini 3.5 Flash.

Michael Groeneweg
Geschreven door Michael Groeneweg AI-consultant bij Digital Impact en oprichter van UnicornAI.nl

Michael is AI-consultant bij Digital Impact in Rotterdam en oprichter van UnicornAI.nl, waar hij AI-oplossingen en SaaS-integraties bouwt voor bedrijven. Al tien jaar ondernemer, en sinds een paar jaar weigert hij iets te doen waar geen AI in verweven zit, zakelijk noch privé, tot mild ongenoegen van zijn omgeving. Zijn reizen door de wereld zijn inmiddels een serie experimenten in wat AI wel en niet kan vanaf een terrasje in Lissabon of een treinstation in Tokio. Hij test obsessief nieuwe tools, bouwt oplossingen voor klanten, en vindt dat niemand de hype moet geloven, maar ook niemand meer kan doen alsof AI niet alles verandert. Houdt van goede koffie, lange vluchten en mensen die met AI bouwen in plaats van er alleen over praten.

Gemaakt door een mens, met AI als assistent bij research en redactie. Meer over onze werkwijze in de AI-disclosure en het redactiestatuut.