← Alle edities

Claude Opus 4.8 herkent vier keer vaker fouten in je code

AI-agent bouwen die echt werkt: de 9 dimensies, elk een bestand, met een volledig uitgewerkt voorbeeld. Je agent gaat pas live als alle negen ingevuld zijn

Abonnees lezen dit 2 dagen eerder — schrijf je in
Claude Opus 4.8 herkent vier keer vaker fouten in je code
Claude Opus 4.8 herkent vier keer vaker fouten in je code
The AI Daily
vrijdag 29 mei
Goedemorgen! Vandaag lees je over dit, en meer:
Visa investeert in Replit zodat AI-agents straks zelfstandig betalingen afhandelen
Zo verschijn jij in de antwoorden van ChatGPT, Google AI en Perplexity
Google AI schrijft zijn eigen naam fout, een nuchtere reminder over hoe taalmodellen werken
Claude Opus 4.8 herkent vier keer vaker fouten in je code

Anthropic heeft vandaag Claude Opus 4.8 gelanceerd, de opvolger van Opus 4.7. Het model is vier keer minder geneigd om fouten in code te missen zonder ze te benoemen, en scoort 8,5 procentpunt hoger op Terminal-Bench 2.1.

Wat je moet weten:

  • De grootste sprong zit in agentic coding: het model scoort 74,6 procent op Terminal-Bench en 69,2 procent op SWE-Bench Pro, beide flink hoger dan Opus 4.7.
  • Adaptive thinking laat het model zelf beslissen wanneer het diep nadenkt en wanneer een snel antwoord volstaat, wat tokens en geld bespaart.
  • De prijs blijft gelijk: 5 dollar per miljoen input-tokens en 25 dollar output. Je Pro-abonnement van 20 euro per maand krijgt automatisch toegang.
Waarom dit relevant is
Je Claude-code-reviews en agentic workflows worden direct betrouwbaarder zonder dat je iets hoeft aan te passen of extra betaalt.

Visa heeft geïnvesteerd in Replit, het platform waarmee je met AI complete apps bouwt, en samen willen ze AI-agents zelf laten betalen. Concreet kan een agent straks een transactie starten en afronden zonder dat jij je creditcard pakt. Het is een van de eerste keren dat een betaalreus de infrastructuur levert waarmee software zelfstandig geld uitgeeft.

Wat je moet weten:

  • Visa koppelt zijn betaalsuite Intelligent Commerce en een nieuw Trusted Agent Protocol aan Replit, waarmee een AI-agent zich veilig identificeert en een betaling laat goedkeuren.
  • Ontwikkelaars en hun agents handelen betalingen voortaan binnen Replit zelf af, zonder over te stappen naar een externe betaaldienst.
  • Replit groeit hard en is inmiddels 9 miljard dollar waard, drie keer zoveel als afgelopen september, met ruim duizend Visa-medewerkers als gebruiker.
  • CEO Amjad Masad ziet de stap als bevestiging van Replits missie om veilig bouwen met AI mainstream te maken.
Waarom dit relevant is
Agentic betalen komt eraan. Bedenk nu al hoe je wilt dat AI-agents namens je bedrijf geld uitgeven en welke limieten en controles je daarvoor instelt.
Zo verschijn jij in de antwoorden van ChatGPT, Google AI en Perplexity

Google maakte vorige week AI-antwoorden de standaard in zijn zoekresultaten. DuckDuckGo-downloads stegen dezelfde week met 30 procent. Bijna de helft van alle Google-zoekopdrachten toont nu een AI-antwoord, en bij die zoekopdrachten klikt 38 procent minder mensen door naar websites.

Wat je moet weten:

  • Generative Engine Optimization (GEO) zorgt ervoor dat ChatGPT, Perplexity en Google AI jouw site citeren in hun antwoorden. Het vervangt SEO niet, maar voegt een extra laag toe.
  • De vijf stappen uit het artikel: zorg dat AI je site mag bezoeken, zet het antwoord in je eerste alinea, voeg gestructureerde code toe die AI begrijpt, bouw een kennispagina rond je expertise en meet je AI-zichtbaarheid.
  • Merken die geciteerd worden in AI-antwoorden krijgen 120 procent meer clicks dan niet-geciteerde concurrenten. De bedrijven die nu beginnen zijn over zes maanden de bronnen die AI citeert.
Waarom dit relevant is
Bijna de helft van alle Google-zoekopdrachten toont een AI-antwoord, en met vijf aanpassingen aan je site bepaal je of AI jou citeert of je concurrent.

Anthropic heeft Claude Code, zijn AI-codeerassistent in de terminal, een gratis beveiligingsplugin gegeven die meekijkt terwijl je bouwt. Zodra de plugin een riskant patroon ziet, zoals een SQL-injectie of een hardcoded wachtwoord, stelt Claude meteen in dezelfde sessie een verbetering voor. Je hoeft dus niet meer naar een aparte beveiligingsscanner over te schakelen.

Wat je moet weten:

  • De plugin herkent zo'n 25 veelvoorkomende kwetsbaarheden, waaronder SQL-injectie, command-injectie, cross-site scripting en per ongeluk in de code achtergelaten API-sleutels en geheimen.
  • Je installeert hem rechtstreeks vanuit de marktplaats in Claude Code met het commando /plugins, en hij werkt op alle abonnementen.
  • Volgens Anthropic daalde het aantal beveiligingsopmerkingen op pull requests sinds de invoering met 30 tot 40 procent.
  • In dezelfde update zitten een vloeiender beeld zonder geflikker, snellere antwoorden en verdubbelde limieten voor Pro-abonnees.
Waarom dit relevant is
Laat je code deels door AI schrijven? Deze gratis plugin onderschept de klassieke beveiligingsfouten voordat ze live gaan, zonder dat je een extra tool nodig hebt.
Zo bouw je een AI-agent die niet sneuvelt in productie

Een AI-agent bouwen die echt werkt, begint niet bij de tool maar bij negen vragen die je beantwoordt voordat je iets bouwt. In mijn werk bij Digital Impact en UnicornAI leg ik elke vraag vast in een eigen bestand, en een agent gaat pas live als alle negen ingevuld zijn. Deze tutorial loopt ze alle negen langs en werkt een complete retour-agent voor je uit.

Wat je moet weten:

  • De negen dimensies vallen in drie groepen: wat doet 'ie (job, inputs, state), wat mag 'ie (tools, boundaries, failure path) en hoe weet je dat 'ie werkt (evidence, evaluation, ownership).
  • Elke dimensie wordt een concreet bestand, met in het artikel een volledig ingevuld voorbeeld van een retour-agent voor een webshop.
  • De belangrijkste regel: zet een agent pas live als alle negen vakken ingevuld zijn. Boundaries leeg is een ongecontroleerde agent, evaluation leeg is een blinde agent, ownership leeg is een agent die niemand fixt.
Waarom dit relevant is
Leg deze negen vragen vast voordat je bouwt, dan gaat je agent live als een productie-systeem in plaats van als een demo die bij de eerste echte klant omvalt.

Google's AI Overviews wordt razendsnel slimmer, maar struikelt opvallend genoeg over iets simpels: losse letters. Het systeem schrijft zijn eigen naam met een extra p, maakt van journalism journaldism en van Trump Trpum. De oorzaak zit in hoe taalmodellen werken, en het is een nuchtere reminder dat AI woorden begrijpt zonder ze letter voor letter te zien.

Wat je moet weten:

  • AI-modellen lezen geen losse letters maar hele woordstukken, tokens genoemd, waardoor ze de spelling binnen een woord niet betrouwbaar kunnen volgen.
  • Google bevestigt tegenover techmedia dat het een bekend probleem is van deze generatie modellen.
  • Juist bij teksten in afbeeldingen, logo's en korte koppen gaat het zichtbaar mis.
  • Voor wie AI inzet voor publicatieklare content blijft een menselijke eindcontrole dus onmisbaar.
Waarom dit relevant is
Gebruik je AI voor teksten, beeld of logo's? Controleer namen en spelling altijd zelf voordat iets naar buiten gaat, want zelfs topmodellen maken hier nog basale fouten.

Het Amsterdamse onderzoeksinstituut Aithos toetste de bekende commerciële AI-modellen op de Europese AI Act en de privacywet AVG, en geen enkel model komt door de test. Anthropic's Claude Opus 4.7 deed het met zo'n 54 procent nog het beste, terwijl Google's Gemini 3.1 Pro bleef steken op 10 procent. De onderzoekers waarschuwen dat juist het bedrijf dat zo'n model inzet aansprakelijk is als het misgaat.

Wat je moet weten:

  • Aithos gebruikte een eigen toets genaamd Lara, die nagaat of een model voldoet aan eisen rond gegevensbescherming, manipulatie, emotieherkenning en menselijk toezicht.
  • De scores liepen sterk uiteen: GPT-5.5 kwam op ongeveer 38 procent, Claude Sonnet 4.6 op 43 procent, terwijl DeepSeek en Mistral rond 11 à 12 procent bleven hangen.
  • Een overtreding van de AI Act kan oplopen tot 35 miljoen euro of 7 procent van de wereldwijde omzet, bij de AVG gaat het om maximaal 20 miljoen euro of 4 procent.
  • Directeur Nadia Kadhim benadrukt dat het niet om papieren regels gaat maar om echte schade aan privacy en autonomie van mensen.
Waarom dit relevant is
Zet je een AI-model in een klantproces? Dan ben jij aansprakelijk, niet de leverancier. Vraag na welke waarborgen rond privacy en menselijk toezicht zijn ingebouwd voordat je live gaat.

De Nederlandsche Bank waarschuwt in haar nieuwste rapport dat AI en cyberaanvallen samen een risico vormen voor het financiële systeem. Een zorg die ook gewone bedrijven raakt: steeds meer organisaties leunen op dezelfde handvol cloud- en AI-aanbieders, waardoor één grote storing of hack in één klap heel veel partijen tegelijk treft. Tegelijk gaan aanvallers dankzij krachtige AI sneller te werk dan instellingen hun lekken kunnen dichten.

Wat je moet weten:

  • DNB ziet dat de tijd tussen het ontdekken en misbruiken van een kwetsbaarheid korter wordt en dringt aan op snellere herstelcapaciteit.
  • Volgens de toezichthouder onderschatten beleggers de risico's van de enorme AI-investeringen bij techbedrijven.
  • Op de private-kredietmarkt gaat inmiddels een vijfde van de leningen naar softwarebedrijven, een opvallende concentratie.
  • Ook de groeiende afhankelijkheid van een klein aantal cloud- en AI-leveranciers noemt DNB een kwetsbaarheid voor het hele systeem.
Waarom dit relevant is
Breng in kaart van welke AI- en clouddiensten je bedrijf echt afhankelijk is. Eén leverancier die uitvalt of gehackt wordt, kan je hele bedrijfsvoering platleggen.
Verdere korte updates uit de AI-wereld.
Release: Claude Code 2.1.152 brengt /code-review --fix: past reviewbevindingen automatisch toe in jouw working tree voor snellere code-verbeteringen. (github.com)
Tools: GA4 kan al AI-zoekverkeer meten: ChatGPT, Claude en Gemini referrals zijn zichtbaar in bestaande Analytics-rapportages zonder extra tools. (emerce.nl)
Feature: HubSpot lanceert vernieuwd Smart CRM in public beta: AI-kolominzichten via Breeze, inline rapporten en collapsible filters — opt-in nu beschikbaar. (hubspot.com)
Pricing: DeepSeek maakt 75% korting op V4-Pro API permanent: outputprijs daalt van $3,48 naar $0,87 per miljoen tokens. (apidog.com)
Integratie: Slack Workflow Builder heeft nu een AI-stap die automatisch samenvat, vertaalt en opstelt — geen code nodig, gewoon kennis selecteren. (slack.com)
Tools: OpenAI API ondersteunt nu workload identity federation: externe tokens inwisselen voor tijdelijk API-token zonder langdurige sleutels op te slaan. (developers.openai.com)
Tot morgen!
Heb je opmerkingen over deze editie? Ideeën, correcties, of iets dat je miste? Reageer op deze mail of stuur een bericht naar info@theaidaily.nl. Elke reactie wordt gelezen.
Michael Groeneweg
Ken je iemand die deze briefing ook zou waarderen?
Mail doorsturen · Aanmeldpagina delen
Je ontvangt deze mail omdat je je hebt aangemeld op theaidaily.nl.
Uitschrijven · Redactiestatuut · AI-disclosure
Deze nieuwsbrief voor je hele team? Bekijk de zakelijke variant.

Uitgever: Unicorn Media (KvK 67073255) · Hoofdredacteur: Michael Groeneweg