OpenAI heeft GPT-5.6 aangekondigd, en voor het eerst krijgen de modellen een naam in plaats van alleen een nummer: Sol, Terra en Luna. De middelste, Terra, presteert volgens OpenAI gelijkwaardig aan GPT-5.5 maar kost de helft. Tegelijk is er iets ongemakkelijks aan de hand. Je kunt de modellen voorlopig namelijk niet gebruiken, want de Amerikaanse overheid bepaalt klant voor klant wie toegang krijgt. Wat de nieuwe namen betekenen, wat de drie versies straks kosten en wanneer je er zelf bij kunt: hieronder de uitleg voor iedereen die met de OpenAI-API of met Codex werkt.
Wat heeft OpenAI precies aangekondigd?
OpenAI brengt GPT-5.6 uit in drie modellen die elk een eigen rol hebben, zo maakte het bedrijf bekend. Sol is het vlaggenschip voor de zwaarste taken, Terra is de allrounder voor dagelijks werk en Luna is de snelle, goedkope variant. Het is dezelfde gedachte als bij de concurrentie, die al langer met een zware, een middel- en een lichte versie werkt.
Nieuw is vooral de naamgeving. Het getal staat voortaan voor de generatie, de naam voor het niveau. Vergelijk het met kledingmaten: het cijfer zegt welk seizoen, het label zegt hoe zwaar en hoe duur. OpenAI kan Sol, Terra en Luna nu apart laten doorgroeien, zodat je niet meer hoeft te puzzelen of "5.4 mini" nu sneller of slimmer is dan "5.4 pro".
Er komen ook twee nieuwe knoppen bij. Met de stand max geef je Sol de meeste tijd om diep na te denken over een probleem. Daarnaast is er een ultra-modus die niet één model laat werken, maar er meerdere als hulpjes naast zet om een complexe klus sneller af te krijgen. Op Terminal-Bench 2.1, een test voor lastige programmeertaken via de command line, haalt Sol 88,8 procent. In de ultra-modus loopt dat op naar 91,9 procent, waar GPT-5.5 op 88,0 procent bleef steken.
Even voor de beeldvorming hoe scherp die markt is geworden: zelfs de goedkoopste versie, Luna, scoort op dezelfde codeertest 84,3 procent. Dat is hoger dan de 78,9 procent van Claude Opus 4.8 en ruim boven de 70,7 procent van Gemini 3.1 Pro. Het instapmodel van OpenAI klopt op dit punt dus de topmodellen van twee concurrenten.
Waarom kun je GPT-5.6 nu nog niet gebruiken?
GPT-5.6 is voorlopig alleen beschikbaar voor een kleine groep vertrouwde partners, en de Amerikaanse overheid krijgt per klant inzage in wie dat zijn. OpenAI noemt het een "limited preview" en zegt dat het de namen en capaciteiten vooraf met de regering heeft gedeeld. Op verzoek van die regering start het bedrijf nu met een select groepje, voordat de modellen breder opengaan.
De reden zit in wat de modellen kunnen op het gebied van cybersecurity. GPT-5.6 Sol is volgens OpenAI het sterkste model tot nu toe voor het vinden en uitbuiten van kwetsbaarheden. In tests op Chromium en Firefox vond het model bugs en bouwstenen voor een aanval, maar zette het die niet zelfstandig om in een werkend, compleet wapen. Toch is dat genoeg reden om voorzichtig te zijn. Eerder liet ook GPT-5.5 al zien hoe vlot het door netwerken heen kwam, en met elke generatie schuift die grens op.
Even afstand nemen: dit is alsof je een nieuwe auto wel mag bestellen, maar de overheid eerst per klant beslist wie de sleutel krijgt. OpenAI is er zelf duidelijk niet blij mee.
"We geloven niet dat dit soort overheidstoegang de standaard voor de lange termijn moet worden. Het houdt de beste gereedschappen weg bij gebruikers, ontwikkelaars, bedrijven en verdedigers die ze nodig hebben."
OpenAI, in de aankondiging van GPT-5.6
Het bedrijf zegt de stap te zetten omdat het de snelste route naar bredere beschikbaarheid is, terwijl het met de Amerikaanse regering werkt aan een vast kader voor toekomstige releases. Internationale techmedia zoals The Verge houden de uitrol op de voet bij. Om de modellen veilig te houden zette OpenAI naar eigen zeggen meer dan 700.000 GPU-uren in op geautomatiseerd red-teaming, waarbij eigen AI-systemen zoeken naar manieren om de beveiliging te omzeilen.
Wat gaan de drie versies kosten?
Sol kost 5 dollar per miljoen input-tokens en 30 dollar per miljoen output-tokens, Terra de helft daarvan en Luna nog een flink stuk minder. Een token is ongeveer een woorddeel, dus een miljoen tokens staat grofweg voor een dik boek aan tekst. Hieronder de drie versies naast elkaar, met de prijs omgerekend naar euro bij de huidige koers.
| Kenmerk | Sol | Terra | Luna |
|---|---|---|---|
| Rol | Vlaggenschip, zwaarste taken | Allrounder, dagelijks werk | Snel en goedkoop |
| Prijs input (per 1 mln tokens) | 5 dollar (±€4,60) | 2,50 dollar (±€2,30) | 1 dollar (±€0,92) |
| Prijs output (per 1 mln tokens) | 30 dollar (±€27,60) | 15 dollar (±€13,80) | 6 dollar (±€5,50) |
| Terminal-Bench 2.1 (coderen) | 88,8% (91,9% in ultra) | 82,5% | 84,3% |
| Vergelijkbaar met | Claude Opus, Gemini Pro | Claude Sonnet, Gemini Flash | Claude Haiku-klasse |
| Beschikbaar | Komende weken | Komende weken | Komende weken |
De euro-bedragen zijn exclusief btw, die je als bedrijf via de verleggingsregeling meestal verrekent. De echte winst zit in Terra. Die levert volgens OpenAI dezelfde prestaties als GPT-5.5 voor de helft van de prijs. Draai je een toepassing die veel API-verkeer genereert, een chatbot, een samenvatter, een mailsorteerder, dan kan dat je rekening fors verlagen zonder dat je aan kwaliteit inlevert.
Hoe kies je straks tussen Sol, Terra en Luna?
De keuze draait om hoe zwaar je taak is, niet om het hoogste benchmarkcijfer. Sol bewaar je voor het echte denkwerk: ingewikkelde code, juridische analyses, onderzoek dat over veel stappen loopt. Voor de meeste bedrijfstaken is dat overkill, en betaal je voor diepgang die je niet gebruikt.
Terra is voor het overgrote deel van het dagelijkse werk het verstandigste vertrekpunt. Het zit qua positie tussen de zware en de lichte modellen in, vergelijkbaar met waar Claude Sonnet of Gemini Flash zitten, de modellen die veel Nederlandse ontwikkelaars nu al als werkpaard inzetten. Luna pak je voor simpel, hoogvolume-werk: korte antwoorden, classificatie, een eerste triage van inkomende berichten.
Let wel op bij de ultra-modus. Omdat die meerdere modellen tegelijk inzet, verbruikt hij ook meer tokens, en dus meer geld. Zet hem in voor een lastige eenmalige klus, een grote migratie of een taai onderzoek, niet als standaardstand voor elke binnenkomende vraag. Anders betaal je topprijzen voor werk dat een enkel model net zo goed had gedaan.
De praktische les is dezelfde als altijd bij AI: begin met het lichtste model dat de klus aankan en schaal pas op als je merkt dat het tekortschiet. Wie standaard het duurste model kiest, betaalt al snel het tien- of twintigvoudige voor een resultaat dat de lezer niet beter vindt.
Wat betekenen de nieuwe caching-regels voor je kosten?
OpenAI maakt het hergebruiken van prompts voorspelbaarder, en dat scheelt geld als je steeds dezelfde lange instructies meestuurt. Veel toepassingen sturen bij elke vraag hetzelfde grote stuk context mee, denk aan een systeemprompt, een handleiding of een setje bedrijfsregels. Met prompt-caching betaal je voor dat herhaalde deel maar één keer de volle prijs.
Concreet verandert er drie dingen. Je kunt nu zelf aangeven waar een cache-blok begint, een opgeslagen prompt blijft minimaal 30 minuten geldig, en het wegschrijven naar de cache kost 1,25 keer de gewone inputprijs. Daar staat tegenover dat je voor het teruglezen 90 procent korting houdt. Voor een chatbot of agent die de hele dag dezelfde basisinstructie hergebruikt, telt dat snel op.
Een voorbeeld maakt het tastbaar. Stel dat je toepassing bij elke vraag een vast blok van 20.000 tokens aan instructies en bedrijfsregels meestuurt, en dat er een paar honderd vragen per dag binnenkomen. Zonder caching betaal je dat grote blok elke keer opnieuw vol. Met caching reken je het in feite één keer per half uur af en lees je de rest met 90 procent korting terug. Op een goedkoop model als Terra kan dat het verschil zijn tussen een paar euro en een paar dubbeltjes per dag, en dat loopt over een maand op tot tientallen euro's.
En het gaat hard met de snelheid. OpenAI brengt Sol in juli ook uit op hardware van Cerebras, met tot 750 tokens per seconde. Dat is het verschil tussen wachten op een antwoord en het zien verschijnen zo snel als je kunt lezen.
Is dit relevant voor jouw bedrijf?
Op korte termijn vooral als plannings-informatie, op iets langere termijn als een kans om je AI-kosten te verlagen. Je kunt GPT-5.6 vandaag nog niet aanzetten, dus er is geen knop om op te drukken. Maar OpenAI mikt op brede beschikbaarheid "in de komende weken", en de prijzen staan al vast.
Houd vooral Terra in de gaten. Als die straks inderdaad GPT-5.5-prestaties levert voor de helft van de prijs, is het de moeite waard om je bestaande integraties tegen het licht te houden: draait er ergens nog een duurder model voor werk dat een goedkoper model net zo goed doet? Test dat dan zodra Terra opengaat, naast het Claude- of Gemini-model dat je nu gebruikt, op jouw eigen taken en niet op een benchmark.
ChatGPT heeft inmiddels meer dan 900 miljoen wekelijkse gebruikers, meldt OpenAI, en het bouwt steeds meer bedrijven hun toepassingen bovenop deze API. Hoe groot dat platform in Nederland is, lees je in de OpenAI-cijfers van TheAIDaily. Wil je het moment niet missen waarop Sol, Terra en Luna echt opengaan, dan houden we je op de hoogte via onze dagelijkse AI-nieuwsbrief.