Gratis ChatGPT presteert beter dan artsen bij gezondheidsadvies
Large Language Models

Gratis ChatGPT presteert beter dan artsen bij gezondheidsadvies

· 8 min leestijd

Een panel van 260 artsen uit zestig landen beoordeelde de gezondheidsantwoorden van het gratis ChatGPT-model als nauwkeuriger, completer en duidelijker geformuleerd dan antwoorden die collega-artsen schreven. Dat is de opvallendste uitkomst van een reeks verbeteringen die OpenAI op 18 juni doorvoerde aan GPT-5.5 Instant, het model dat elke gratis ChatGPT-gebruiker standaard krijgt. De update raakt direct 230 miljoen mensen die wekelijks gezondheidsvragen stellen aan de chatbot.

Hoe goed is het gratis ChatGPT nu bij gezondheidsvragen?

GPT-5.5 Instant presteert nu op hetzelfde niveau als de duurste betaalde modellen van OpenAI voor gezondheidsantwoorden. Het aantal antwoorden met minstens een feitelijke fout daalde met 71 procent in twee maanden, gemeten over miljarden berichten per week.

Concreet verbeterde OpenAI vier dingen. Het model herkent nu beter wanneer je naar een arts moet, bijvoorbeeld bij symptomen die wijzen op een hartinfarct of een beroerte. Het stelt eerst de juiste vragen voordat het een antwoord geeft, in plaats van meteen een diagnose te suggereren op basis van een halve beschrijving. Het legt uit wat het niet zeker weet, zodat je weet wanneer je beter een professional kunt raadplegen. En het maakt complexe medische informatie begrijpelijker, zonder het te veel te vereenvoudigen.

Even voor de beeldvorming: 230 miljoen mensen per week stellen ChatGPT een gezondheidsvraag. Dat is meer dan de gehele bevolking van Brazilië. En al die mensen krijgen nu een gratis model dat op hetzelfde niveau zit als wat betalende klanten krijgen voor medische vragen. Die 230 miljoen is overigens een kwart van de totale wekelijkse gebruikers. Volgens de ChatGPT-gebruiksdata van TheAIDaily telt ChatGPT inmiddels meer dan 900 miljoen wekelijkse actieve gebruikers.

Hoe is dit getest?

OpenAI werkt met een netwerk van meer dan 260 artsen uit zestig landen. Samen beoordeelden zij meer dan 700.000 modelantwoorden tijdens de ontwikkeling. Voor de uiteindelijke vergelijking selecteerde het team 3.500 representatieve gezondheidsgesprekken.

Bij die 3.500 gesprekken legde een artsenpanel antwoorden van GPT-5.5 Instant naast antwoorden die artsen zelf hadden geschreven, zonder te weten welk antwoord van wie kwam. Het panel beoordeelde de AI-antwoorden hoger op drie criteria: nauwkeurigheid, communicatie en volledigheid.

GPT-5.5 Instant had minder gevallen waarin het een lokale zorgcontext miste, een alarmsignaal over het hoofd zag, of vergat om extra informatie te vragen aan de patiënt. Denk aan iemand die klaagt over hoofdpijn: het model vraagt nu eerder door naar bijkomende klachten als nekstijfheid of lichtgevoeligheid, voordat het een antwoord formuleert. Dat was niet alleen beter dan oudere modellen, maar ook beter dan de menselijke artsen in de vergelijking.

De prestatie is gemeten met HealthBench Professional, een benchmark die OpenAI ontwikkelde samen met hun artsennetwerk. Op die benchmark scoort GPT-5.5 Instant vergelijkbaar met de duurste reasoning-modellen van het bedrijf, modellen die tien keer zo veel rekenkracht nodig hebben.

Wat zijn de beperkingen van deze test?

De test komt van OpenAI zelf. HealthBench is ontwikkeld door OpenAI met hun eigen artsennetwerk. Er is geen onafhankelijke, peer-reviewed verificatie van het specifieke 71-procent-cijfer.

Vergelijk het met een restaurantrecensie die door de kok zelf is geschreven. De gerechten kunnen uitstekend zijn, maar je wilt het ook van een externe criticus horen. Onafhankelijk onderzoek, bijvoorbeeld in NEJM AI, bevestigt dat AI-modellen steeds beter worden bij medische taken. Maar OpenAI's specifieke claims over de gratis versie zijn vooralsnog alleen door het bedrijf zelf gevalideerd.

Daar staat tegenover dat de schaal van de evaluatie indrukwekkend is: 260 artsen, 700.000 beoordeelde antwoorden, zestig landen. Dat is geen snelle interne controle. Het is een serieuze evaluatieprocedure, maar het blijft een evaluatie waarvan OpenAI zelf de parameters bepaalt.

Bovendien is ChatGPT geen medisch hulpmiddel. OpenAI positioneert GPT-5.5 Instant expliciet als ondersteuning voor artsen, niet als vervanging. De chatbot mag dan hoger scoren in een gecontroleerde vergelijking, in de praktijk mist hij context die een huisarts wel heeft: je medische voorgeschiedenis, je medicijngebruik, hoe je erbij zit als je de spreekkamer binnenloopt.

AI stelde achttien zeldzame diagnoses die artsen misten

Op dezelfde dag publiceerde OpenAI onderzoek met het Boston Children's Hospital en Harvard. Onderzoekers gaven 376 geanonimiseerde kindergenomen, waarvoor eerder geen diagnose was gevonden, aan OpenAI's o3 Deep Research-model. Het resultaat: achttien nieuwe diagnoses van zeldzame genetische ziektes waar menselijke specialisten niet uitkwamen.

De gevonden aandoeningen varieerden van zeldzame neurologische stoornissen tot onverklaard plotseling overlijden bij kinderen. Elke uitkomst werd onafhankelijk bevestigd door minstens twee klinisch genetici en een CLIA-gecertificeerd laboratorium. Het onderzoek verscheen in NEJM AI, het AI-tijdschrift van de New England Journal of Medicine, een van de meest gerespecteerde medische publicaties ter wereld.

Het Boston Children's Hospital werkt al sinds begin 2025 met OpenAI samen. Het programma heeft inmiddels meer dan veertig diagnoses van zeldzame ziekten opgeleverd die eerder als onoplosbaar werden beschouwd. De samenwerking ontving vijftig miljoen dollar aan financiering.

Overigens was het niet de eerste keer dat AI artsen versloeg in een medische vergelijking. Eerder dit jaar publiceerde Harvard al een studie waarin een AI-model op de spoedeisende hulp in 67 procent van de gevallen de juiste diagnose stelde, terwijl de twee artsen op 55 en 50 procent bleven steken. Het patroon wordt moeilijk te negeren: AI wordt meetbaar beter in medische diagnostiek. Niet als vervanging van artsen, maar als tweede paar ogen dat patronen ziet die een mens over het hoofd kan zien.

Wat betekent dit voor de Nederlandse gezondheidszorg?

In Nederland zoeken tussen de 45.000 en 194.000 mensen naar een huisarts. Zestig procent van de huisartsenpraktijken hanteert een patiëntenstop. De Algemene Rekenkamer concludeerde in 2025 dat een op de twintig Nederlanders actief een andere huisarts zoekt, en de komende twintig jaar stopt naar verwachting 56 procent van de huidige huisartsen.

In die context is het niet verrassend dat mensen hun gezondheidsvragen aan ChatGPT stellen. De Newcom AI-Monitor 2026 telde 7,2 miljoen Nederlanders die regelmatig AI gebruiken. Volgens data van TheAIDaily groeit het AI-gebruik in de gezondheidszorg acht keer sneller dan in andere sectoren. De vraag is niet of mensen AI gebruiken voor gezondheidsadvies, maar hoe goed dat advies is.

De verbetering van GPT-5.5 Instant is in die context relevant. Als mensen toch al ChatGPT raadplegen voor hun gezondheid, is het goed nieuws dat de antwoorden 71 procent betrouwbaarder zijn geworden. Het is geen vervanging van je huisarts, maar het is niet meer zo onbetrouwbaar als twee maanden geleden.

De Nederlandse healthtech-sector ontving vorig jaar circa 162 miljoen euro aan financiering, blijkt uit data van Dealroom. De AI-trends in de zorg laten zien dat 93 procent van de ziekenhuizen wereldwijd inmiddels AI inzet. De combinatie van een groeiend huisartsentekort en steeds betere AI-tools voor gezondheid maakt dit een onderwerp waar Nederlandse ondernemers en zorgbestuurders niet omheen kunnen.

De kloof tussen gratis en betaald wordt kleiner

De bredere les voor werkgevers en ondernemers zit elders. ChatGPT Plus kost 22 euro per maand per medewerker. De gratis versie draait nu op GPT-5.5 Instant, en voor gezondheidsantwoorden levert dat vergelijkbare resultaten op als de krachtigste betaalde modellen.

Dat roept een strategische vraag op. Als de gratis versie steeds beter wordt voor specifieke taken, wanneer is het Plus-abonnement dan nog de investering waard? Het antwoord hangt af van je gebruik. Voor programmeren, lange documenten en geavanceerde analyses bieden betaalde modellen nog steeds meer. Maar voor dagelijkse vragen, inclusief gezondheid, is de gratis versie nu een serieus alternatief.

De cijfers zijn concreet. ChatGPT Plus kost 264 euro per medewerker per jaar. Als je een team van tien mensen hebt die ChatGPT vooral gebruiken voor dagelijkse vragen, zijn dat 2.640 euro per jaar. Volgens de AI-adoptiecijfers van TheAIDaily gebruikt 67 procent van de Nederlandse bedrijven inmiddels AI. Veel van die bedrijven betalen voor licenties die misschien niet allemaal nodig zijn.

Gezondheid is overigens niet het enige domein waar de gratis versie terrein wint. OpenAI heeft GPT-5.5 Instant eerder dit jaar al verbeterd voor wiskunde, programmeren en creatief schrijven. De trend is duidelijk: het bedrijf investeert structureel in de kwaliteit van de gratis versie, vermoedelijk om de gebruikersaantallen te laten groeien. Voor gebruikers is dat gunstig, voor bedrijven die per licentie betalen een reden om regelmatig te bekijken of die investering nog de moeite waard is.

De strategie die steeds meer bedrijven kiezen: betaalde licenties voor intensieve gebruikers die dagelijks complexe taken doen, de gratis versie voor de rest. Deze update van GPT-5.5 Instant versterkt dat argument.

Wat kun je hier deze week mee?

Als je werknemers hebt die ChatGPT gebruiken voor gezondheidsgerelateerde vragen, weet dan dat de antwoorden aanzienlijk beter zijn geworden. Dat is goed nieuws, maar het ontslaat je niet van de verantwoordelijkheid om duidelijk te maken dat ChatGPT geen arts is.

Vier concrete stappen voor deze week:

  • Breng in kaart welke medewerkers ChatGPT gebruiken en waarvoor. Het recente shadow-AI-onderzoek liet zien dat bijna de helft van het Nederlandse mkb bedrijfsdata deelt met gratis AI-tools, vaak zonder het te beseffen. Voor gezondheidsdata geldt dat extra, want die valt onder de AVG als bijzondere persoonsgegevens.
  • Heroverweeg je ChatGPT-licenties. Als je team het vooral gebruikt voor dagelijkse vragen en niet voor geavanceerde analyses, kan de gratis versie nu voldoende zijn. Dat bespaart tot 264 euro per medewerker per jaar.
  • Stel een korte interne richtlijn op over het gebruik van AI voor gezondheidsadvies. Niet om het te verbieden, maar om duidelijk te maken wat je er wel en niet van kunt verwachten. Een zin als "ChatGPT kan helpen bij het begrijpen van medische informatie, maar vervangt geen arts" is al genoeg.
  • Werk je in de zorg of met gezondheidsdata? Volg de AI-trends in de zorg en wees je ervan bewust dat patiënten steeds vaker met AI-gegenereerde vragen en interpretaties bij je aankloppen. Bereid je team voor op die gesprekken.
Michael Groeneweg
Geschreven door Michael Groeneweg AI-consultant bij Digital Impact en oprichter van UnicornAI.nl

Michael is AI-consultant bij Digital Impact in Rotterdam en oprichter van UnicornAI.nl, waar hij AI-oplossingen en SaaS-integraties bouwt voor bedrijven. Al tien jaar ondernemer, en sinds een paar jaar weigert hij iets te doen waar geen AI in verweven zit, zakelijk noch privé, tot mild ongenoegen van zijn omgeving. Zijn reizen door de wereld zijn inmiddels een serie experimenten in wat AI wel en niet kan vanaf een terrasje in Lissabon of een treinstation in Tokio. Hij test obsessief nieuwe tools, bouwt oplossingen voor klanten, en vindt dat niemand de hype moet geloven, maar ook niemand meer kan doen alsof AI niet alles verandert. Houdt van goede koffie, lange vluchten en mensen die met AI bouwen in plaats van er alleen over praten.

Gemaakt door een mens, met AI als assistent bij research en redactie. Meer over onze werkwijze in de AI-disclosure en het redactiestatuut.