Large Language Models

AI-prijzen juni 2026, wat kost een token voor NL bedrijven

· 5 min leestijd

In juni 2026 zijn er meer dan twintig actief geprijsde AI-modellen beschikbaar via de API. De spread is indrukwekkend: van GPT-5 nano op $0,40 per miljoen output-tokens tot GPT-5.4 Pro op $180 - een factor 450 verschil. Twee modellen kwamen er deze maand bij: Claude Opus 4.8 (gelanceerd 28 mei) en Gemini 3.5 Flash (19 mei), die beide de lat voor hun categorie opnieuw verleggen. Dit is het maandelijkse prijsoverzicht voor juni 2026 - met alle bedragen omgerekend naar euro's, exclusief en inclusief btw. Peilkoers: 1 USD = 0,92 EUR (4 juni 2026).

Prijzen per miljoen tokens, juni 2026

Onderstaande tabel toont alle modellen met een publieke API-prijs (status: current of preview). Prijzen zijn per miljoen tokens. EUR inclusief 21% btw berekend via 1 USD = 0,92 EUR (koers 4 juni 2026). Cache-read is de prijs voor het opnieuw lezen van eerder gecachte context.

Model Provider Input USD/1M Input EUR incl btw Output USD/1M Output EUR incl btw Cache-read USD
Claude Opus 4.8Anthropic$5,00€5,57$25,00€27,83$0,50
Claude Sonnet 4.6Anthropic$3,00€3,34$15,00€16,70$0,30
Claude Haiku 4.5Anthropic$1,00€1,11$5,00€5,57$0,10
DeepSeek V3.2DeepSeek$0,27€0,30$0,42€0,47-
Gemini 3.5 FlashGoogle$1,50€1,67$9,00€10,02$0,15
Gemini 3.1 Pro (preview)Google$2,00€2,23$12,00€13,36-
Gemini 3 Flash (preview)Google$0,50€0,56$3,00€3,34-
Gemini 2.5 ProGoogle$1,25€1,39$10,00€11,13$0,13
Gemini 2.5 FlashGoogle$0,30€0,33$2,50€2,78$0,03
GPT-5.4 ProOpenAI$30,00€33,40$180,00€200,38-
GPT-5.4 miniOpenAI$0,75€0,83$4,50€5,01$0,08
GPT-5.4 nanoOpenAI$0,20€0,22$1,25€1,39$0,02
o4-miniOpenAI$1,10€1,22$4,40€4,90$0,28
GPT-5.3 CodexOpenAI$1,75€1,95$14,00€15,58$0,18
o3OpenAI$2,00€2,23$8,00€8,91$0,50
GPT-5.2OpenAI$1,75€1,95$14,00€15,58$0,18
GPT-5.1OpenAI$1,25€1,39$10,00€11,13$0,13
GPT-5OpenAI$1,25€1,39$10,00€11,13$0,13
GPT-5 miniOpenAI$0,25€0,28$2,00€2,23$0,03
GPT-5 nanoOpenAI$0,05€0,06$0,40€0,45$0,005
Grok 4xAI$3,00€3,34$15,00€16,70-
Grok 4 FastxAI$0,20€0,22$0,50€0,56-

Goedkoopste en duurste modellen in juni

Gerangschikt op output-prijs per miljoen tokens - de meest representatieve kostenmaatstaf voor de meeste toepassingen:

Top 5 goedkoopste output-prijzen:

  1. GPT-5 nano - €0,45/miljoen incl btw ($0,40)
  2. DeepSeek V3.2 - €0,47/miljoen incl btw ($0,42)
  3. Grok 4 Fast - €0,56/miljoen incl btw ($0,50)
  4. GPT-5.4 nano - €1,39/miljoen incl btw ($1,25)
  5. GPT-5 mini - €2,23/miljoen incl btw ($2,00)

Top 3 duurste output-prijzen:

  1. GPT-5.4 Pro - €200,38/miljoen incl btw ($180,00)
  2. Claude Opus 4.8 - €27,83/miljoen incl btw ($25,00)
  3. Claude Sonnet 4.6 / Grok 4 - €16,70/miljoen incl btw ($15,00)

Prijs per intelligentiepunt

Op basis van GPQA Diamond-scores - een brede redeneertest die voor de meeste modellen in de database beschikbaar is. Bron: leveranciersdocumentatie en HuggingFace Open LLM Leaderboard (geraadpleegd 4 juni 2026). Let op: benchmark-dekking is niet volledig - niet alle modellen zijn op dezelfde tests beoordeeld, en GPQA Diamond meet specifiek wetenschappelijk redeneren, niet alle AI-toepassingen.

Top 5 beste prijs per GPQA Diamond-punt (output-prijs gedeeld door score):

  1. DeepSeek V3.2 - $0,0051/punt (score 82,4) - veruit de beste waarde
  2. Grok 4 Fast - $0,0058/punt (score 85,7)
  3. GPT-5 nano - $0,0059/punt (score 67,6)
  4. GPT-5 mini - $0,0243/punt (score 82,3)
  5. Gemini 2.5 Flash - $0,0302/punt (score 82,8)

GPT-5.4 Pro scoort het slechtst op deze maatstaf: $1,96 per GPQA-punt, bijna 385 keer duurder dan DeepSeek V3.2. Dat model is bedoeld voor professionele gebruikers die absolute topprestaties nodig hebben ongeacht de kosten - het is geen model voor bulk-verwerking.

Aangekondigd maar nog zonder publieke prijs

Drie modellen staan als actief geregistreerd maar hebben nog geen gepubliceerde API-prijs:

  • Gemini 3 Pro (Google, preview) - aangekondigd 15 maart 2026
  • Llama 4 Maverick (Meta, open source) - aangekondigd 15 januari 2026, gratis beschikbaar voor zelf-hosting
  • GPT-5.5 (OpenAI) - aangekondigd 23 april 2026, nog zonder publiek API-tarief

Wat veranderde ten opzichte van eerdere snapshots

Dit is de eerste editie van het maandelijkse prijsoverzicht. De wekelijkse snapshots van week 22 en 23 documenteerden de toevoeging van de twee modellen die deze maand het meest opvielen: Gemini 3.5 Flash als agressief geprijsd alternatief in het middensegment, en Claude Opus 4.8 met sterk verbeterde benchmarks op code en redeneren. Beide zijn nu voor het eerst opgenomen in een maandoverzicht.

Ten opzichte van begin 2026 is het totale aantal actief geprijsde modellen gestegen van circa twaalf naar meer dan twintig. De intrede van de GPT-5.4-serie (nano, mini, Pro), de Grok 4-familie en de Gemini 3-generatie hebben het aanbod verbreed - maar ook de vergelijking complexer gemaakt. GPT-5.4 Pro is daarbij een uitschieter: het is het duurste model in dit overzicht, meer dan zeven keer duurder dan de al dure Claude Opus 4.8.

Wat dit kost voor een NL developer of mkb-er

Stel: een content-applicatie verwerkt 10.000 berichten per dag, elk met gemiddeld 1.000 input-tokens en 300 output-tokens. Per maand (30 dagen) kom je dan op 300 miljoen input-tokens en 90 miljoen output-tokens.

Maandelijkse API-kosten in dat scenario, omgerekend naar euro incl btw:

  • GPT-5 nano: (300M x $0,05) + (90M x $0,40) = $51 - circa €57/maand
  • Gemini 2.5 Flash: $90 + $225 = $315 - circa €351/maand
  • Claude Sonnet 4.6: $900 + $1.350 = $2.250 - circa €2.505/maand
  • Claude Opus 4.8: $1.500 + $2.250 = $3.750 - circa €4.175/maand

De factor 73 tussen GPT-5 nano en Claude Opus 4.8 laat zien dat modelkeuze de grootste kostendriver is - ver voor hosting en infrastructuur. Voor eenvoudige classificatie of samenvattingen is een nano-model meer dan voldoende. Voor taken die redeneren, code-analyse of juridische verwerking vereisen, rechtvaardigt de kwaliteitssprong naar een middenklasse-model zoals Gemini 2.5 Flash of Claude Haiku 4.5 doorgaans de extra kosten. Caching kan de effectieve prijs verder verlagen: bij Anthropic en Google betaal je op gecachte context respectievelijk 10% en 12% van de normale input-prijs.

Wat we volgende maand in de gaten houden

In juli 2026 volgen we drie ontwikkelingen: of GPT-5.5 een publieke API-prijs krijgt (het model werd in april aangekondigd maar heeft nog geen tarief), of Gemini 3 Pro van preview naar algemene beschikbaarheid gaat met een eigen prijspunt, en of DeepSeek met een opvolger van V3.2 de druk op de markt verder opvoert. Meta's Llama 4 Maverick blijft gratis voor zelf-hosting - maar voor wie overweegt managed inference te kopen via cloud-providers, zijn de kosten per miljoen tokens inmiddels vergelijkbaar met de goedkoopste commerciele modellen.

Michael Groeneweg
Geschreven door Michael Groeneweg AI-consultant bij Digital Impact en oprichter van UnicornAI.nl

Michael is AI-consultant bij Digital Impact in Rotterdam en oprichter van UnicornAI.nl, waar hij AI-oplossingen en SaaS-integraties bouwt voor bedrijven. Al tien jaar ondernemer, en sinds een paar jaar weigert hij iets te doen waar geen AI in verweven zit, zakelijk noch privé, tot mild ongenoegen van zijn omgeving. Zijn reizen door de wereld zijn inmiddels een serie experimenten in wat AI wel en niet kan vanaf een terrasje in Lissabon of een treinstation in Tokio. Hij test obsessief nieuwe tools, bouwt oplossingen voor klanten, en vindt dat niemand de hype moet geloven, maar ook niemand meer kan doen alsof AI niet alles verandert. Houdt van goede koffie, lange vluchten en mensen die met AI bouwen in plaats van er alleen over praten.

Gemaakt door een mens, met AI als assistent bij research en redactie. Meer over onze werkwijze in de AI-disclosure en het redactiestatuut.