ChatGPT Images 2.0 maakt tekst in afbeeldingen betrouwbaar

OpenAI lanceerde gisteren ChatGPT Images 2.0, aangedreven door het nieuwe gpt-image-2 model. De grootste verbetering zit in iets dat AI-beeldgeneratoren jarenlang niet voor elkaar kregen: leesbare tekst in afbeeldingen. Menukaarten, infographics, presentaties en social media-visuals komen er voor het eerst zonder spelfouten uit. Voor bedrijven die marketingmateriaal of visuele content produceren, is dat een stap van speelgoed naar serieuze tool.

Tekst die klopt, ook in het Nederlands

Wie eerder DALL-E 3 vroeg om een menukaart, kreeg woorden als "enchuita" en "churiros" terug. Dat probleem is structureel opgelost. In tests produceert gpt-image-2 tekst met circa 99 procent nauwkeurigheid, tegenover 90-95 procent bij het vorige model. Dat geldt voor Latijnse talen, maar ook voor Japans, Koreaans, Hindi en Bengali.

De verklaring zit in de architectuur. Diffusiemodellen verwerken tekst als pixels, een fractie van het totale beeld, en missen daardoor de context. gpt-image-2 combineert beeldbegrip met taalmodellen die semantiek begrijpen. Het resultaat: een bord met "Geopend" ziet er net zo overtuigend uit als een foto.

Thinking-modus en meerdere afbeeldingen tegelijk

Betalende ChatGPT-gebruikers (Plus, Pro, Business, Enterprise) krijgen toegang tot een zogenaamde thinking-modus. Daarin kan het model zelf websearch uitvoeren, meerdere afbeeldingen vanuit één prompt genereren en de eigen output controleren. Tot acht samenhangende afbeeldingen in een batch zijn mogelijk, met consistente personages en objecten over de hele set.

Dat opent de deur naar gepersonaliseerde marketingcampagnes: dezelfde visual in acht formaten (Instagram, LinkedIn, billboard, e-mail header) zonder dat een ontwerper elk formaat apart moet opmaken. De thinking-modus kost meer tijd, 15 tot 30 seconden per complexe prompt, maar levert visueel consistentere resultaten.

Resolutie en snelheid

De standaardresolutie is 1024x1024 pixels. Via de API zijn formaten tot 2K (2560x1440) beschikbaar, met experimentele 4K-opties bij externe providers. Het beeldverhoudings-bereik loopt van 3:1 (ultrabrede banners) tot 1:3 (verticale stories), wat het model geschikt maakt voor vrijwel elk publicatiekanaal.

De keerzijde is snelheid. Complexe taken, een meerdelige strip bijvoorbeeld, kosten enkele minuten in plaats van seconden. Voor een social media-visual of productfoto is dat geen probleem, voor een real-time chatbot-integratie wel.

API-prijzen omgerekend naar euro

gpt-image-2 is direct beschikbaar via de OpenAI API. De prijzen zijn gebaseerd op tokens, maar komen per afbeelding neer op:

Low quality (snelste, basis): circa 0,005 euro per afbeelding
Medium quality (productie, social media): circa 0,049 euro per afbeelding
High quality (print-ready): circa 0,195 euro per afbeelding

Duizend afbeeldingen op medium quality kosten een Nederlands bureau dus nog geen vijftig euro. Ter vergelijking: een freelance grafisch ontwerper rekent al gauw vijftig tot tachtig euro per uur, en maakt in die tijd misschien tien visuals. Dat maakt gpt-image-2 niet een vervanging van ontwerpers, het idee en de branding moeten ergens vandaan komen, maar wel een versneller van de productielijn.

Let op: de kenniscutoff staat op december 2025. Prompts die recente informatie of actueel beeldmateriaal nodig hebben, leveren mogelijk verouderde output.

Wat verandert dit voor Nederlandse bedrijven

De betrouwbare tekstweergave maakt drie scenario's concreet haalbaar die eerder niet werkten:

Meertalige marketingcampagnes. Een webshop die ook in het Duits en Frans verkoopt, kan visuele ads in drie talen genereren zonder ontwerpbureau. De tekstaccuratie is hoog genoeg om zonder correctieronde te publiceren.
Infographics en presentaties. Consultants en mkb'ers die klantpresentaties maken, kunnen grafieken en uitlegslides laten genereren inclusief correcte labels en cijfers.
Social media op schaal. Met acht consistente afbeeldingen per prompt kun je een week aan content in een kwartier klaarzetten, in je eigen huisstijl.

De beperkingen die ertoe doen

Wie gpt-image-2 voor merkgebonden materiaal wil inzetten, moet rekening houden met enkele beperkingen. Logo's worden onbetrouwbaar weergegeven, menselijke controle blijft nodig bij merkkritisch werk. Het verschil met concurrenten als Claude is dat OpenAI hier zwaar inzet op visuele output, terwijl Anthropic zich richt op tekstbegrip en codegeneratie.

Daarnaast geldt voor bedrijven die onder de AI Act vallen: gegenereerde afbeeldingen moeten herkenbaar zijn als AI-content wanneer ze in publiekscommunicatie worden gebruikt. De EU-verplichting om synthetisch beeldmateriaal te labelen geldt ook voor gpt-image-2 output.

Beschikbaar voor iedereen, geavanceerd voor betalend

Alle ChatGPT-gebruikers, inclusief de gratis laag, krijgen toegang tot Images 2.0. De thinking-modus, batchgeneratie en geavanceerde bewerkingen zijn voorbehouden aan betalende abonnementen. ChatGPT Plus kost momenteel circa 22 euro per maand inclusief btw. Voor ontwikkelaars is de API direct te gebruiken, met dezelfde token-gebaseerde pricing als de rest van het OpenAI-ecosysteem.

Op de Image Arena-benchmark pakte gpt-image-2 de eerste positie in elke categorie, met een voorsprong van 242 punten op de nummer twee. Dat is het grootste verschil dat die benchmark ooit heeft gemeten. Of dat zich vertaalt naar betere bedrijfsresultaten, hangt af van hoe je het inzet. De technologie is er. De vraag is of je workflow klaar is om er iets mee te doen.

ChatGPT Images 2.0 maakt leesbare tekst in afbeeldingen eindelijk betrouwbaar

Tekst die klopt, ook in het Nederlands

Thinking-modus en meerdere afbeeldingen tegelijk

Resolutie en snelheid

API-prijzen omgerekend naar euro

Wat verandert dit voor Nederlandse bedrijven

De beperkingen die ertoe doen

Beschikbaar voor iedereen, geavanceerd voor betalend

Misschien vind je dit ook leuk

ChatGPT verwerkt je gesprekken op de achtergrond en vergeet niets meer

Anthropic brengt Claude Design uit als Figma-uitdager

ChatGPT zit weer in je WhatsApp: gratis appen met de bot, zonder account