AI-output controleren: vijf checks voor klantcommunicatie

Het beste AI-model dat vandaag beschikbaar is, verzint in 1,8 procent van de gevallen feiten, volgens metingen van onderzoeksplatform Vectara. Dat klinkt weinig. Bij een chatbot die duizend klantvragen per maand afhandelt, zijn het achttien antwoorden met fouten erin. Een rechtbank in München oordeelde eind mei dat zulke antwoorden gelden als de eigen woorden van het bedrijf, niet als een foutje van de technologie. De vraag voor elke ondernemer die AI inzet in klantcommunicatie is daarom niet óf het werkt, maar wie controleert óf het klopt.

Hoe vaak gaat AI-output echt mis?

Vaker dan de meeste ondernemers vermoeden. Wereldwijd zijn er inmiddels 1.348 gedocumenteerde rechtszaken waarin AI-hallucinaties (feiten die het model verzint) een rol speelden, blijkt uit de Charlotin AI Hallucination Cases Database. Alleen in Amerikaanse rechtbanken ging het 915 keer mis. Advocaten dienden verzonnen jurisprudentie in. Rapporten bevatten gefabriceerde bronvermeldingen. Medische dossiers kregen foutieve diagnoses.

Even voor de beeldvorming: KPMG publiceerde begin 2025 een rapport over de voordelen van AI. Van de 45 bronvermeldingen in dat rapport bleken er slechts vijf te kloppen. Vijf van de vijfenveertig. Het rapport is teruggetrokken. Een van de grote vier accountantskantoren, met duizenden compliance-specialisten in dienst, publiceerde AI-output zonder adequate controle.

Het probleem zit in de verdeling van fouten. Op alledaagse taken (een e-mail samenvatten, een notitie herformuleren) maakt AI zelden fouten. Maar zodra het gaat om specifieke feiten, namen, bedragen of regelgeving, stijgt het foutpercentage fors. Precies op de momenten waarop je klant op de informatie vertrouwt.

Wat oordeelde de rechtbank in München?

Het Landgericht München behandelde in mei een zaak tegen Google (zaaknummer 26 O 869/26). Google's AI Overviews hadden twee uitgevers ten onrechte geassocieerd met oplichting en dubieuze praktijken. De rechter maakte een onderscheid dat voor elk bedrijf relevant is: waar een zoekmachine bronnen opsomt, genereert AI onafhankelijke, nieuwe uitspraken. Die uitspraken zijn volgens de rechter de eigen woorden van het bedrijf dat de tool aanbiedt.

“De AI creëert uitspraken die niet eens in de zoekresultaten voorkomen, en die gelden daarom als eigen uitspraken van de verweerder.”
Landgericht München, zaak 26 O 869/26 (28 mei 2026)

Google verloor de zaak. Maar de redenering reikt verder dan zoekmachines. Elk bedrijf dat een chatbot, een AI-assistent of geautomatiseerde e-mails naar klanten stuurt, zit in dezelfde juridische positie. Wat je AI zegt, zeg jij.

Welke AI-taken hebben controle nodig?

Niet alle AI-output is even risicovol. De fout die veel bedrijven maken is alles over één kam scheren: of alle AI-toepassingen mogen zonder check, of ze worden collectief gewantrouwd. Een praktischer model werkt met drie risiconiveaus.

Laag risico: interne output. Samenvattingen van vergaderingen, brainstormsessies, conceptversies van teksten die nog bewerkt worden. Hier hoeft niemand mee te kijken. De output bereikt geen klant en een fout heeft geen gevolgen buiten je eigen team.

Midden risico: klantcontact zonder juridische lading. Klantenservice-e-mails, productomschrijvingen, social-media-posts, nieuwsbrieven. De output bereikt de klant, maar een fout is vervelend, niet catastrofaal. Hier past een steekproefsgewijze controle: check wekelijks tien willekeurige outputs en stuur bij als je patronen herkent.

Hoog risico: geld, recht, gezondheid. Juridisch advies, financiële berekeningen, medische informatie, offertes met prijsgaranties, klachtafhandeling. AI-output die hier fouten bevat, kan je geld kosten of je aansprakelijk maken. Hier mag output pas de deur uit na menselijke goedkeuring. Altijd.

Denk aan het verschil tussen een auto met cruise control en een zelfrijdende auto. Bij cruise control houd je je handen aan het stuur en kijk je mee. Bij volledig autonoom rijden vertrouw je blind op de technologie. De meeste bedrijven hebben cruise control nodig, niet autonomie.

Vijf checks voordat AI namens je bedrijf spreekt

Voor elke AI-output in de categorie midden- of hoog-risico doorloop je deze vijf vragen. Het kost twee minuten per bericht en voorkomt de fouten die uren aan herstelwerk opleveren.

1. Klopt het feitelijk?

Zoek in de AI-output naar concrete claims: getallen, namen, datums, productspecificaties, prijzen. Check elk feit apart. AI-modellen zijn bijzonder goed in het produceren van tekst die correct klinkt maar feitelijk niet klopt. Een chatbot die een klant vertelt dat je retourbeleid dertig dagen is terwijl het veertien dagen is, creëert een verwachting die je moet waarmaken. Of een juridische aansprakelijkheid, zoals de Münchense rechter bevestigde.

2. Past het bij je eigen beleid?

AI kent je huisregels niet, tenzij je ze expliciet meegeeft. Controleer of de output niet in strijd is met je eigen voorwaarden, prijsafspraken of merkbeloftes. Een AI-assistent die namens een accountantskantoor fiscaal advies geeft zonder voorbehoud, is een aansprakelijkheidsrisico. AI-spelregels voor je bedrijf opstellen helpt om die grenzen vooraf vast te leggen.

3. Zou je het op briefpapier durven zetten?

De briefpapier-test werkt verrassend goed als snelle kwaliteitscheck. Lees de AI-output en stel je voor dat het op je officiële briefpapier staat, met je naam eronder. Zou je het zo naar een klant sturen? Nee? Herschrijven. Het advocatenkantoor Sullivan & Cromwell diende in april een pleidooi in met 28 verzonnen bronverwijzingen, allemaal door AI gegenereerd. Die test hadden ze niet doorstaan.

4. Is de bron traceerbaar?

Als de AI een claim doet ("ons product bespaart gemiddeld dertig procent"), kun je dan achterhalen waar dat getal vandaan komt? AI-modellen zijn geneigd om statistieken te genereren die plausibel klinken maar nergens op gebaseerd zijn. Controleer of je elke claim in de output kunt herleiden tot een echte bron. Lukt dat niet? Schrap de claim.

5. Weet de klant dat het van AI komt?

Per 2 augustus 2026 verplicht de AI Act (artikel 50) dat bedrijven melden wanneer content AI-gegenereerd is. Dat geldt voor chatbots, maar ook voor geautomatiseerde e-mails en gegenereerde productbeschrijvingen. Begin er nu al mee, het wekt vertrouwen en het is over zes weken verplicht.

Wat zegt de AI Act over klantgerichte AI?

De Europese AI Act kent zeven verschillende deadlines. De transparantie-eis van artikel 50 is de eerste die direct relevant is voor bedrijven met klantgerichte AI-toepassingen. Per 2 augustus 2026 moet je aangeven dat je klant met een AI-systeem communiceert.

Concreet kan dat een label zijn ("Dit antwoord is opgesteld met behulp van AI"), een banner in je chatwidget, of een voetnoot in een geautomatiseerde e-mail. De wet schrijft niet voor hóe je het meldt, alleen dát je het doet.

De zwaardere verplichtingen voor hoog-risico AI-systemen, denk aan AI bij sollicitatie-screening of kredietbeoordelingen, volgen pas in december 2027 na het Omnibus-uitstel. Maar de transparantie-eis geldt al over enkele weken. De Autoriteit Persoonsgegevens heeft aangegeven dat handhaving prioriteit krijgt.

Overigens is transparantie niet alleen een wettelijke kwestie. Onderzoek laat zien dat klanten die weten dat ze met AI communiceren, vergevingsgezinder zijn bij fouten dan klanten die denken dat ze met een mens spraken. Eerlijkheid vooraf bespaart reputatieschade achteraf.

Hoe bouw je een check-routine die meegroeit?

De vijf checks hierboven werken voor incidentele output. Maar als je chatbot dagelijks honderden gesprekken voert, kun je niet elk antwoord handmatig nalopen. Drie principes helpen om de controle beheersbaar te houden.

Verdeel je controle op basis van risico. De driedeling van hierboven (laag, midden, hoog) bepaalt hoeveel aandacht elke output krijgt. Lage-risico-output laat je automatisch door. Midden-risico-output check je steekproefsgewijs. Hoge-risico-output gaat altijd langs een mens.

Gebruik een tweede AI-model als beoordelaar. Laat een tweede model de output van het eerste controleren op feitelijke claims en beleidsconflicten. Onderzoek van Anthropic laat zien dat een model dat specifiek geïnstrueerd is om fouten te vinden, daar beter in slaagt dan het model dat de oorspronkelijke tekst schreef. Het klinkt als een cirkelredenering, maar de resultaten zijn consistent.

Doe een wekelijkse audit. Pak elke week tien willekeurige chatbot-antwoorden of gegenereerde e-mails en loop ze handmatig na. Je vangt fouten die het systeem mist, en je bouwt een database van veelgemaakte fouten waarmee je de AI-instructies kunt bijstellen. Na een paar weken weet je precies waar de zwakke plekken zitten.

Wat kun je deze week al doen?

Je hoeft niet meteen een compleet kwaliteitssysteem op te tuigen. Begin met drie stappen die samen een middag kosten en die je direct inzicht geven in waar je risico's zitten.

Stap 1: maak een inventaris. Loop alle plekken na waar AI-output bij klanten terechtkomt. De chatbot op je website, automatische antwoorden in je ticketsysteem, AI-gegenereerde productbeschrijvingen, geautomatiseerde e-mails. Bij veel mkb-bedrijven is die lijst langer dan verwacht. 44 procent van het Nederlandse mkb deelt al bedrijfsdata met AI-tools, vaak zonder centraal overzicht van wat er naar buiten gaat.

Stap 2: ken elk kanaal een risiconiveau toe. Gebruik de driedeling: intern is laag risico, klantcontact zonder juridische lading is midden, en alles met geld, recht of gezondheid is hoog. Schrijf het op. Je wilt ook weten wat AI je kost, maar weten waar het risico zit is minstens zo belangrijk.

Stap 3: voeg voor hoog-risico-kanalen een goedkeuringsstap toe. Laat de chatbot bij gevoelige vragen doorschakelen naar een medewerker. Laat geautomatiseerde offertes eerst door een collega lopen. Het kost een kwartier per dag en voorkomt de ene fout die je weken kost om recht te zetten.

Volgens data van het CBS zetten inmiddels drie op de tien Nederlandse bedrijven automatisering in om personeelstekort op te vangen. Die trend versnelt. Hoe meer AI-output je bedrijf verlaat, hoe groter het belang van een systeem dat meekijkt. De bedrijven die het eerst hun kwaliteitscontrole op orde hebben, worden niet gezien als de voorzichtigste. Ze worden gezien als de meest betrouwbare. En in een markt waar 62 procent van de consumenten liever met een chatbot praat dan in de wacht te staan, is dat een concurrentievoordeel dat telt.

Wie checkt wat jouw AI tegen je klanten zegt

Hoe vaak gaat AI-output echt mis?

Wat oordeelde de rechtbank in München?

Welke AI-taken hebben controle nodig?

Vijf checks voordat AI namens je bedrijf spreekt

Wat zegt de AI Act over klantgerichte AI?

Hoe bouw je een check-routine die meegroeit?

Wat kun je deze week al doen?

Misschien vind je dit ook leuk

GPT-5.5 hackt je netwerk sneller dan je pen-tester

EU-icoon voor deepfakes komt eraan, dit moet je weten

NEC zet dertigduizend op Claude, jij kunt het bouwplan kopiëren