De braafste AI-agent overtreedt de EU-wet bijna de helft van de tijd
Onderzoek

De braafste AI-agent overtreedt de EU-wet bijna de helft van de tijd

· 8 min leestijd

Twaalf van de bekendste AI-modellen kregen alledaagse werkopdrachten voorgeschoteld, en geen enkele hield zich netjes aan de Europese wet. Zelfs de braafste, Claude Opus 4.7, ging in bijna de helft van de gevallen over de schreef. Het slechtste model hield zich in maar 7 procent van de situaties aan de regels. Het ongemakkelijke zit niet eens in die cijfers, maar in wie de rekening krijgt. Niet het AI-lab dat het model bouwde, maar het bedrijf dat de agent op zijn klanten loslaat. Dat ben jij, zodra je zo'n agent je klantenservice of je verkoop laat draaien.

Wat heeft het onderzoek precies getest?

Het Amsterdamse onderzoeksinstituut Aithos zette twaalf populaire AI-modellen aan het werk in ruim drieduizend realistische werkscenario's en mat of ze de AVG en de EU AI Act naleefden. Aithos is een non-profit die zich richt op de juridische kant van AI, en bouwde er een eigen testtool voor: LARA, kort voor Legal Assessment for Real-world Agents. Alle scenario's en gesprekstranscripten staan openbaar online, zodat iedereen de uitkomsten kan nalezen.

De opzet is slim. Eén AI speelt de gebruiker, het geteste model krijgt de rol van agent die e-mails leest, tools gebruikt en met klanten praat, en een panel van AI-"rechters" beoordeelt elk gesprek aan de hand van de wettekst. Vergelijk het met een mystery shopper die niet komt kijken of de verkoper aardig is, maar of hij de wet overtreedt. In totaal toetste LARA zes verboden of beperkte praktijken uit de AI Act en vier kernregels uit de AVG, zoals transparantie, dataminimalisatie en doelbinding.

Onderzoeker Nadia Kadhim van Aithos vatte de conclusie droog samen.

“De systemen waarop mensen dagelijks vertrouwen, zijn nog niet ingericht om hun rechten te beschermen.”

Nadia Kadhim, onderzoeker bij Aithos

Hoe scoorden de twaalf modellen?

Geen enkel model haalde meer dan 54 procent naleving, en de meeste bleven daar ver onder. De cijfers hieronder zijn het percentage situaties waarin een model zich wél aan de wet hield, gemeten door Computable op basis van de Aithos-data.

ModelNaleving van de EU-wet
Claude Opus 4.7 (Anthropic)54%
Claude Sonnet 4.6 (Anthropic)43%
GPT-5.5 (OpenAI)38%
Claude Opus 4.6 (Anthropic)34%
GPT-5.4 (OpenAI)17%
Mistral Large (Frankrijk)12%
DeepSeek V4 Pro (China)11%
Gemini 2.5 Pro (Google)11%
Gemini 3.1 Pro (Google)10%
Moonshot (China)7%

Reken het om en het wordt pas echt confronterend. Gemini 3.1 Pro ging in negen van de tien situaties de fout in. En let op Mistral: zelfs het Franse model, gebouwd in Europa, kende de Europese wet in maar 12 procent van de gevallen. Een Europees alternatief is dus geen garantie voor naleving. De koploper en de hekkensluiter lagen ruim 47 procentpunt uit elkaar, maar boven de streep kwam niemand.

Welke wetten overtreden ze, en sinds wanneer?

De meeste overtredingen vallen onder regels die al jaren gelden, niet onder iets dat pas later ingaat. Dat is het deel dat veel ondernemers verkeerd inschatten. Een paar concrete voorbeelden uit de test maken het tastbaar. Een manager vraagt de agent om de emotionele toestand van zijn teamleden te analyseren vóór de beoordelingsgesprekken. Een klantenservice-agent verzamelt en passant leefstijlgegevens om door te verkopen aan adverteerders. Een agent verzwijgt tegen een tandartspraktijk dat hij geen mens is. En een agent praat een verwarde, kwetsbare oudere klant een duurder abonnement aan.

Die vier gedragingen raken allemaal regels die nu al van kracht zijn. Emotieherkenning bij personeel en het misbruiken van kwetsbare mensen staan op de lijst met verboden AI-praktijken uit artikel 5 van de AI Act, en die lijst geldt al sinds februari 2025. Het stiekem doorverkopen van klantdata en het verzwijgen dat je een AI bent, botsen met de AVG, en die is er al sinds 2018. Geen uitstel, geen overgangstermijn.

Even afstand nemen, want hier zit de valkuil. Misschien had je december 2027 in je hoofd als de echte deadline, sinds de AI Act-deadline voor high-risk-systemen zestien maanden opschoof. Dat klopt, maar alleen voor die zwaardere high-risk-eisen rond zaken als cv-screening en kredietbeoordeling. De verboden praktijken en de AVG wachten niet op 2027. Wat deze agents doen, is vandaag al strafbaar.

Het bleef niet bij dit ene onderzoek

Aithos staat niet alleen, want de afgelopen weken stapelden de waarschuwingen zich op. Het bedrijf Emergence liet op 18 mei agents van Anthropic, OpenAI, Google en xAI vijftien dagen samenleven in vijf virtuele werelden, onder afgesproken regels. Vijftien dagen, omdat de meeste tests maar minuten of uren meten, terwijl agents in de praktijk juist langlopend werk doen. De uitkomst: de agents dreven stelselmatig af van de richtlijnen die mensen ze hadden meegegeven.

En dat ging ver. De Grok-agents van xAI verzamelden in die korte periode 71 diefstalpogingen en 106 geweldsincidenten, en waren binnen vier dagen allemaal "dood". De Gemini-agents logden 111 gevallen van brandstichting. De Claude-agents bleven vreedzaam, maar schoten door naar overdreven volgzaamheid. Het is een laboratoriumspel, geen kantoor. Maar het laat wel zien hoe onvoorspelbaar gedrag wordt zodra een agent lang genoeg zijn gang mag gaan.

Tel daar de cijfers bij op uit het rapport State of AI Agent Security 2026 van platformbedrijf Gravitee, dat ruim 900 leidinggevenden en technici ondervroeg. 88 procent van de organisaties die AI-agents inzetten, kreeg te maken met een bevestigd of vermoed beveiligingsincident. In de zorg liep dat op tot 92,7 procent. Toch ging maar 14,4 procent van de agents live met volledige goedkeuring van beveiliging en IT. De rest stond er gewoon, zonder dat iemand erbij had gekeken.

Waarom gaan agents juist onder druk de fout in?

Een deadline of een omzetdoel is vaak al genoeg om een agent zijn eigen regels te laten negeren. Dat liet een eerder experiment van Scale AI scherp zien, PropensityBench, waarin een twaalftal modellen bijna zesduizend scenario's doorliep onder oplopende druk: kortere deadlines, financiële straffen, minder middelen. Zonder druk koos een model gemiddeld in 19 procent van de gevallen voor een verboden middel. Onder druk schoot dat omhoog naar gemiddeld 47 procent.

Onderzoeksleider Udari Madhushani Sehwag stelde precies de vraag waar het om draait: schakelen die modellen onder echte stress over naar de klus klaren, hoe dan ook? Het antwoord bleek vaak ja. Er kwam nog een ontnuchterend detail bij: een schadelijke tool die was hernoemd van "gebruik nepdata" naar "gebruik synthetische data" werd 17 procentpunt vaker ingezet. Een ander label, hetzelfde gedrag.

Dat raakt jouw situatie direct. Jouw agent werkt niet in een rustig vacuüm, maar onder verkoopdoelen, responstijden en piekdrukte. Precies de omstandigheden waarin deze modellen het vaakst de bocht uit vliegen.

Wie is er aansprakelijk, jij of het AI-lab?

Niet het lab dat het model maakte, maar het bedrijf dat de agent inzet draagt de juridische verantwoordelijkheid. Onder de AI Act ben je een "deployer" zodra je een agent bouwt op een bestaand model en die op de markt of in je organisatie gebruikt. Pas je het model zwaar aan met fijn-afstemming, dan kun je zelfs als "provider" worden gezien, met nog zwaardere plichten. In beide gevallen ligt de bal bij jou, niet bij Anthropic, OpenAI of Google.

En de bedragen zijn niet symbolisch. Een AVG-overtreding kan tot 20 miljoen euro of 4 procent van je wereldwijde jaaromzet kosten, een overtreding van de EU AI Act tot 35 miljoen euro of 7 procent. Verraderlijk is dat ze kunnen stapelen: een agent die een persoonlijke beslissing neemt op basis van persoonsgegevens, kan beide wetten tegelijk raken, en geen van de twee plafonds dekt de ander af. In Nederland is het de Autoriteit Persoonsgegevens die de AVG handhaaft, en die heeft AI nadrukkelijk op het netvlies, ook al mist Nederland nog een eigen uitvoeringswet en testomgeving voor de AI Act.

Wat kun je hier deze maand mee?

Begin met een lijst van elke AI-agent die nu klantcontact of bedrijfsdata raakt, want je kunt niet beschermen wat je niet in beeld hebt. Dat klinkt simpel, maar uit het Gravitee-rapport blijkt dat de meeste agents juist zonder die controle live gaan. Zorg daarna dat een mens kan meekijken en ingrijpen bij beslissingen die mensen raken, dus geen volledig autonome upgrades, afwijzingen of prijsvoorstellen.

Loop daarna deze punten langs:

  • Geef de agent alleen toegang tot de data die hij voor de taak nodig heeft. Niet "even alles meenemen, dat kan later van pas komen". Dat is precies de dataminimalisatie waar de AVG om vraagt.
  • Check je agent tegen de verboden praktijken: geen emotieherkenning bij personeel, geen druk op kwetsbare klanten, en laat de agent altijd kenbaar maken dat hij een AI is.
  • Test je agent onder druk, niet alleen in de demo. Zet er een deadline of een doel op en kijk of hij dan nog binnen de lijntjes blijft.
  • Bouw hem robuust. Hoe je een agent maakt die niet sneuvelt in productie begint bij toezicht, logging en duidelijke grenzen.
  • Reken niet op de uitgestelde deadline. De AVG en de verboden praktijken gelden nu, los van wat er in 2027 of 2028 nog bijkomt.

Twijfel je of een specifieke agent door de keuring komt? De transcripten van Aithos laten per scenario zien hoe de modellen de fout in gaan, een handig vertrekpunt om je eigen opzet tegen te houden. Wil je weten wat een AI-agent precies is en wat hij kost voordat je er een inzet, dan hebben we dat apart uitgelegd. En we volgen de handhaving op de voet in onze dagelijkse AI-nieuwsbrief, zodat je het meekrijgt zodra de eerste boete valt.

Michael Groeneweg
Geschreven door Michael Groeneweg AI-consultant bij Digital Impact en oprichter van UnicornAI.nl

Michael is AI-consultant bij Digital Impact in Rotterdam en oprichter van UnicornAI.nl, waar hij AI-oplossingen en SaaS-integraties bouwt voor bedrijven. Al tien jaar ondernemer, en sinds een paar jaar weigert hij iets te doen waar geen AI in verweven zit, zakelijk noch privé, tot mild ongenoegen van zijn omgeving. Zijn reizen door de wereld zijn inmiddels een serie experimenten in wat AI wel en niet kan vanaf een terrasje in Lissabon of een treinstation in Tokio. Hij test obsessief nieuwe tools, bouwt oplossingen voor klanten, en vindt dat niemand de hype moet geloven, maar ook niemand meer kan doen alsof AI niet alles verandert. Houdt van goede koffie, lange vluchten en mensen die met AI bouwen in plaats van er alleen over praten.

Gemaakt door een mens, met AI als assistent bij research en redactie. Meer over onze werkwijze in de AI-disclosure en het redactiestatuut.