In juni 2026 zijn er meer dan twintig actief geprijsde AI-modellen beschikbaar via de API. De spread is indrukwekkend: van GPT-5 nano op $0,40 per miljoen output-tokens tot GPT-5.4 Pro op $180 - een factor 450 verschil. Twee modellen kwamen er deze maand bij: Claude Opus 4.8 (gelanceerd 28 mei) en Gemini 3.5 Flash (19 mei), die beide de lat voor hun categorie opnieuw verleggen. Dit is het maandelijkse prijsoverzicht voor juni 2026 - met alle bedragen omgerekend naar euro's, exclusief en inclusief btw. Peilkoers: 1 USD = 0,92 EUR (4 juni 2026).
Prijzen per miljoen tokens, juni 2026
Onderstaande tabel toont alle modellen met een publieke API-prijs (status: current of preview). Prijzen zijn per miljoen tokens. EUR inclusief 21% btw berekend via 1 USD = 0,92 EUR (koers 4 juni 2026). Cache-read is de prijs voor het opnieuw lezen van eerder gecachte context.
| Model | Provider | Input USD/1M | Input EUR incl btw | Output USD/1M | Output EUR incl btw | Cache-read USD |
|---|---|---|---|---|---|---|
| Claude Opus 4.8 | Anthropic | $5,00 | €5,57 | $25,00 | €27,83 | $0,50 |
| Claude Sonnet 4.6 | Anthropic | $3,00 | €3,34 | $15,00 | €16,70 | $0,30 |
| Claude Haiku 4.5 | Anthropic | $1,00 | €1,11 | $5,00 | €5,57 | $0,10 |
| DeepSeek V3.2 | DeepSeek | $0,27 | €0,30 | $0,42 | €0,47 | - |
| Gemini 3.5 Flash | $1,50 | €1,67 | $9,00 | €10,02 | $0,15 | |
| Gemini 3.1 Pro (preview) | $2,00 | €2,23 | $12,00 | €13,36 | - | |
| Gemini 3 Flash (preview) | $0,50 | €0,56 | $3,00 | €3,34 | - | |
| Gemini 2.5 Pro | $1,25 | €1,39 | $10,00 | €11,13 | $0,13 | |
| Gemini 2.5 Flash | $0,30 | €0,33 | $2,50 | €2,78 | $0,03 | |
| GPT-5.4 Pro | OpenAI | $30,00 | €33,40 | $180,00 | €200,38 | - |
| GPT-5.4 mini | OpenAI | $0,75 | €0,83 | $4,50 | €5,01 | $0,08 |
| GPT-5.4 nano | OpenAI | $0,20 | €0,22 | $1,25 | €1,39 | $0,02 |
| o4-mini | OpenAI | $1,10 | €1,22 | $4,40 | €4,90 | $0,28 |
| GPT-5.3 Codex | OpenAI | $1,75 | €1,95 | $14,00 | €15,58 | $0,18 |
| o3 | OpenAI | $2,00 | €2,23 | $8,00 | €8,91 | $0,50 |
| GPT-5.2 | OpenAI | $1,75 | €1,95 | $14,00 | €15,58 | $0,18 |
| GPT-5.1 | OpenAI | $1,25 | €1,39 | $10,00 | €11,13 | $0,13 |
| GPT-5 | OpenAI | $1,25 | €1,39 | $10,00 | €11,13 | $0,13 |
| GPT-5 mini | OpenAI | $0,25 | €0,28 | $2,00 | €2,23 | $0,03 |
| GPT-5 nano | OpenAI | $0,05 | €0,06 | $0,40 | €0,45 | $0,005 |
| Grok 4 | xAI | $3,00 | €3,34 | $15,00 | €16,70 | - |
| Grok 4 Fast | xAI | $0,20 | €0,22 | $0,50 | €0,56 | - |
Goedkoopste en duurste modellen in juni
Gerangschikt op output-prijs per miljoen tokens - de meest representatieve kostenmaatstaf voor de meeste toepassingen:
Top 5 goedkoopste output-prijzen:
- GPT-5 nano - €0,45/miljoen incl btw ($0,40)
- DeepSeek V3.2 - €0,47/miljoen incl btw ($0,42)
- Grok 4 Fast - €0,56/miljoen incl btw ($0,50)
- GPT-5.4 nano - €1,39/miljoen incl btw ($1,25)
- GPT-5 mini - €2,23/miljoen incl btw ($2,00)
Top 3 duurste output-prijzen:
- GPT-5.4 Pro - €200,38/miljoen incl btw ($180,00)
- Claude Opus 4.8 - €27,83/miljoen incl btw ($25,00)
- Claude Sonnet 4.6 / Grok 4 - €16,70/miljoen incl btw ($15,00)
Prijs per intelligentiepunt
Op basis van GPQA Diamond-scores - een brede redeneertest die voor de meeste modellen in de database beschikbaar is. Bron: leveranciersdocumentatie en HuggingFace Open LLM Leaderboard (geraadpleegd 4 juni 2026). Let op: benchmark-dekking is niet volledig - niet alle modellen zijn op dezelfde tests beoordeeld, en GPQA Diamond meet specifiek wetenschappelijk redeneren, niet alle AI-toepassingen.
Top 5 beste prijs per GPQA Diamond-punt (output-prijs gedeeld door score):
- DeepSeek V3.2 - $0,0051/punt (score 82,4) - veruit de beste waarde
- Grok 4 Fast - $0,0058/punt (score 85,7)
- GPT-5 nano - $0,0059/punt (score 67,6)
- GPT-5 mini - $0,0243/punt (score 82,3)
- Gemini 2.5 Flash - $0,0302/punt (score 82,8)
GPT-5.4 Pro scoort het slechtst op deze maatstaf: $1,96 per GPQA-punt, bijna 385 keer duurder dan DeepSeek V3.2. Dat model is bedoeld voor professionele gebruikers die absolute topprestaties nodig hebben ongeacht de kosten - het is geen model voor bulk-verwerking.
Aangekondigd maar nog zonder publieke prijs
Drie modellen staan als actief geregistreerd maar hebben nog geen gepubliceerde API-prijs:
- Gemini 3 Pro (Google, preview) - aangekondigd 15 maart 2026
- Llama 4 Maverick (Meta, open source) - aangekondigd 15 januari 2026, gratis beschikbaar voor zelf-hosting
- GPT-5.5 (OpenAI) - aangekondigd 23 april 2026, nog zonder publiek API-tarief
Wat veranderde ten opzichte van eerdere snapshots
Dit is de eerste editie van het maandelijkse prijsoverzicht. De wekelijkse snapshots van week 22 en 23 documenteerden de toevoeging van de twee modellen die deze maand het meest opvielen: Gemini 3.5 Flash als agressief geprijsd alternatief in het middensegment, en Claude Opus 4.8 met sterk verbeterde benchmarks op code en redeneren. Beide zijn nu voor het eerst opgenomen in een maandoverzicht.
Ten opzichte van begin 2026 is het totale aantal actief geprijsde modellen gestegen van circa twaalf naar meer dan twintig. De intrede van de GPT-5.4-serie (nano, mini, Pro), de Grok 4-familie en de Gemini 3-generatie hebben het aanbod verbreed - maar ook de vergelijking complexer gemaakt. GPT-5.4 Pro is daarbij een uitschieter: het is het duurste model in dit overzicht, meer dan zeven keer duurder dan de al dure Claude Opus 4.8.
Wat dit kost voor een NL developer of mkb-er
Stel: een content-applicatie verwerkt 10.000 berichten per dag, elk met gemiddeld 1.000 input-tokens en 300 output-tokens. Per maand (30 dagen) kom je dan op 300 miljoen input-tokens en 90 miljoen output-tokens.
Maandelijkse API-kosten in dat scenario, omgerekend naar euro incl btw:
- GPT-5 nano: (300M x $0,05) + (90M x $0,40) = $51 - circa €57/maand
- Gemini 2.5 Flash: $90 + $225 = $315 - circa €351/maand
- Claude Sonnet 4.6: $900 + $1.350 = $2.250 - circa €2.505/maand
- Claude Opus 4.8: $1.500 + $2.250 = $3.750 - circa €4.175/maand
De factor 73 tussen GPT-5 nano en Claude Opus 4.8 laat zien dat modelkeuze de grootste kostendriver is - ver voor hosting en infrastructuur. Voor eenvoudige classificatie of samenvattingen is een nano-model meer dan voldoende. Voor taken die redeneren, code-analyse of juridische verwerking vereisen, rechtvaardigt de kwaliteitssprong naar een middenklasse-model zoals Gemini 2.5 Flash of Claude Haiku 4.5 doorgaans de extra kosten. Caching kan de effectieve prijs verder verlagen: bij Anthropic en Google betaal je op gecachte context respectievelijk 10% en 12% van de normale input-prijs.
Wat we volgende maand in de gaten houden
In juli 2026 volgen we drie ontwikkelingen: of GPT-5.5 een publieke API-prijs krijgt (het model werd in april aangekondigd maar heeft nog geen tarief), of Gemini 3 Pro van preview naar algemene beschikbaarheid gaat met een eigen prijspunt, en of DeepSeek met een opvolger van V3.2 de druk op de markt verder opvoert. Meta's Llama 4 Maverick blijft gratis voor zelf-hosting - maar voor wie overweegt managed inference te kopen via cloud-providers, zijn de kosten per miljoen tokens inmiddels vergelijkbaar met de goedkoopste commerciele modellen.