AI-releases week 19: Claude limieten, GPT-5.5 pentest, AP-deadline

Anthropic domineerde week 19. Op de Code w/ Claude conferentie kwamen tien finance-agent-templates, Claude Dreaming (agents die van hun eigen fouten leren) en een SpaceX-deal die Claude-limieten verdubbelt. OpenAI kreeg een Brits veiligheidsrapport waarin GPT-5.5 in twee van tien runs een bedrijfsnetwerk volledig compromitteerde. En de Autoriteit Persoonsgegevens herinnerde Nederland aan de 2-augustus-deadline voor AI in sollicitatieprocedures.

Wat lanceerde Anthropic op Code w/ Claude?

Op de eerste dag van Code w/ Claude lanceerde Anthropic tien finance-agent-templates voor maandafsluiting, KYC-screening, pitchdecks, model-builds en earnings-reviews. Daarbij komt een volledige Microsoft 365-integratie waarbij Claude context behoudt over Excel, PowerPoint, Word en Outlook tegelijk, en data-partners als Moody's, S&P Capital IQ, Verisk en Dun & Bradstreet hun feeds als native app in Claude beschikbaar maken. Claude Opus 4.7 zit op 64,37 procent op de Vals AI Finance Agent benchmark, hoog genoeg dat banken er pilots op draaien. Wij schreven dinsdag hoe NL-mkb deze agents binnen weken in een eigen workflow krijgt.

Een dag later lanceerde Anthropic Dreaming, een research-preview waarbij Claude-agents tussen sessies hun eigen werk terugkijken en de lessen opslaan in leesbare bestanden. Het model zelf verandert niet, alleen het geheugen erboven. Bij juridisch AI-platform Harvey werden agents zes keer effectiever na het inschakelen van Dreaming (VentureBeat). Voor de praktische uitleg en wanneer dit voor een NL-team interessant wordt, zie onze post van vanochtend.

Tot slot sloot Anthropic een deal met SpaceX voor toegang tot 220.000 GPU's. Claude-limieten voor Pro- en Max-abonnees zijn daardoor verdubbeld, zonder prijsverhoging. De volledige analyse staat hier.

GPT-5.5 hackt een bedrijfsnetwerk in een test

Het UK AI Security Institute publiceerde deze week zijn evaluatie van GPT-5.5. In twee van de tien testrondes wist GPT-5.5 een compleet bedrijfsnetwerk te hacken, van het eerste wachtwoord stelen tot het lekken van een afgeschermde database. Een menselijke hacker heeft daar normaal twintig uur voor nodig. De onderzoekers vonden ook een methode om de beveiligingsfilters te omzeilen die na zes uur testen alle gevaarlijke opdrachten doorliet. Lees in onze analyse wat dit voor de Nederlandse pen-test-markt en NIS2-verplichtingen betekent.

Eerder deze week publiceerde Science een Harvard-onderzoek waarin het AI-model o1 van OpenAI op de spoedeisende hulp vaker de juiste diagnose stelde dan twee ervaren artsen. Het onderzoek is onafhankelijk en peer-reviewed. Wij legden uit waarom dit raakt aan de AI-Act-deadline van 1 augustus voor zorgaanbieders en wat ziekenhuizen deze maand al moeten documenteren.

Granite 4.1: open-source model dat zijn voorganger verslaat

Strikt genomen viel Granite 4.1 in week 18 (release 1 mei), maar de impact werd pas deze week zichtbaar in de benchmarks die breed gedeeld werden op X en Hugging Face. Het 8B-instruct-model evenaart of verslaat IBM's eigen 32B mixture-of-experts uit Granite 4.0 op tool-calling, instruction-following en mathematische redeneer-taken. Het draait op consumer-hardware, kent een 512K-context, spreekt Nederlands en staat onder Apache 2.0. Voor Nederlandse mkb met data-soevereiniteit-eisen is dit het eerste open-source-model van een grote Westerse partij dat productie-rijp is op consumer-GPU's. Hier de NL-implicaties en hoe je het zelf draait.

Musk geeft toe dat Grok deels op OpenAI-modellen is getraind

Op 6 mei gaf Elon Musk onder ede in de rechtszaak tegen OpenAI toe dat xAI Grok 3 deels heeft getraind op output van een ander commercieel model. Dat betekent dat Grok mogelijk licentievoorwaarden schendt en niet zo onafhankelijk is als xAI beweert. Wat dat doet met de "open" framing van xAI en met je inkooprisico als je Grok als alternatief voor Claude of GPT-5 had ingeplanned.

Wat betekent de AP-deadline van 2 augustus?

De Autoriteit Persoonsgegevens publiceerde donderdag een overzicht van de regels die per 2 augustus 2026 gelden. AI in cv-screening, kandidaatranking en geautomatiseerde sollicitatiegesprekken valt onder de hoog-risico-categorie van de AI Act. Dat betekent verplichte transparantie naar kandidaten, documentatie van je systemen en aantoonbaar kwaliteitsmanagement. De Europese Digital Omnibus stelt sommige verplichtingen uit, maar niet de transparantie-eis. Lees onze volledige analyse voor de vier concrete alarmsignalen.

Wat kun je hier als Nederlands bedrijf mee?

Drie dingen om mee te nemen. Eén, de finance-agents zijn directer toepasbaar dan elke generieke Claude-feature van het afgelopen jaar. Wie maandafsluitingen, journaalposten of KYC-screening intern doet, kan deze maand een pilot draaien op een Pro-abonnement zonder enterprise-licentie of consultant-contract. Begin met de pitch-builder of de KYC-screener; die hebben de duidelijkste in- en outputs.

Twee, Dreaming is alleen interessant als je langlopende agents in productie hebt. Voor de meeste mkb-bedrijven is het nog te vroeg: de kosten zijn nog niet definitief en het is onduidelijk of de automatisch gegenereerde notities persoonsgegevens kunnen bevatten. Afwachten is hier de verstandige keuze.

Drie, de AP-deadline is geen grijs gebied meer. Wie HR-tools met AI inzet, moet voor 2 augustus van de vendor een AI-Act-compliance-pakket op tafel hebben: doelbinding, foutpercentages, bias-tests, menselijke tussenkomst-procedure. Zonder dat pakket kun je die tools niet blijven gebruiken. En aan vendor-zijde: wie als HR-tech-bouwer Nederlandse klanten heeft, moet diezelfde stack nu op orde hebben.

Volgende week op de AI-agenda

Code w/ Claude loopt door tot half mei, dus verwacht uit Anthropic-richting nog details over Managed Agents prijssetting en mogelijk een uitbreiding van Dreaming naar Claude Code. OpenAI heeft al gehint dat GPT-5.5 breder wordt uitgerold naar cyber-defenders, dus daar komt vermoedelijk een aparte API-tier of partnership-aankondiging. De Autoriteit Persoonsgegevens heeft laten doorschemeren dat ze niet wachten tot 2 augustus met handhaven. En IBM brengt naar verwachting deze maand nog een Granite 4.1 vision-variant uit.

AI-releases week 19: Claude verdubbelt limieten, GPT-5.5 hackt netwerken en de AP geeft een deadline

Wat lanceerde Anthropic op Code w/ Claude?

GPT-5.5 hackt een bedrijfsnetwerk in een test

Granite 4.1: open-source model dat zijn voorganger verslaat

Musk geeft toe dat Grok deels op OpenAI-modellen is getraind

Wat betekent de AP-deadline van 2 augustus?

Wat kun je hier als Nederlands bedrijf mee?

Volgende week op de AI-agenda

Misschien vind je dit ook leuk

Anthropic lanceert Fable 5 en Mythos 5, de krachtigste Claude ooit

Is Anthropic bang voor zijn eigen AI?

AI-releases week 26, GPT-5.6 in preview en hogere Claude API-limieten