|
Goedemorgen! Vandaag lees je over dit, en meer: |
|
→ AI scoort 67 procent juist bij spoeddiagnoses, twee internisten haalden 55 en 50 procent
→ 90 procent van NL-directeuren zet al AI-agents op schaal in, meer dan het Europese gemiddelde
→ Albert Heijn bespaart twee miljoen kilo brood per jaar met AI-vraagvoorspelling per filiaal
|
|
De Britse AI Security Institute (AISI) liet GPT-5.5 en Claude Mythos los op een nagebouwd bedrijfsnetwerk. Beide modellen halen nu expert-niveau in offensive cyber, een sprong van twintig procentpunt in een halfjaar tijd. Voor een Nederlandse mkb-er betekent dit dat een aanvaller met beperkte skills en een API-abonnement opeens evenveel werk kan verzetten als een team van vijf seniors twee jaar geleden.
Wat je moet weten:
- GPT-5.5 scoort 71,4 procent op expert-CTF-taken, Claude Mythos 68,6 procent. Een halfjaar geleden zaten de toppers nog rond de 50 procent.
- Op een 32-stappen-aanval die een mens twintig uur kost, lukt het GPT-5.5 in twee van tien runs end-to-end. Mythos deed het in drie van tien.
- Een rode-team-effort van zes uur vond een universele jailbreak. OpenAI heeft sindsdien gepatcht, maar de techniek is bekend.
- Onder de AI-verordening (vanaf 2 augustus van kracht voor high-risk) verandert je risicodossier: GPAI-modellen met cyber-capabilities staan straks onder strenger toezicht.
- Praktisch: vraag bij je volgende pen-test om AI-assisted red teaming, en herzie je AI Act-dossier voor producten die op GPT-5.5 of Mythos draaien.
Waarom dit relevant is Een ransomware-bende met API-toegang kan nu evenveel werk doen als een team senior pen-testers, dus je standaard-pen-test en je AI Act-dossier moeten allebei naar de werkbank. |
|
Onderzoekers van Harvard Medical School en Beth Israel Deaconess Medical Center lieten het o1-model van OpenAI los op 76 echte spoedgevallen. Het model stelde in 67 procent van de gevallen de juiste diagnose bij triage, tegenover 55 en 50 procent bij twee ervaren internisten. Twee onafhankelijke artsen beoordeelden blind wie het beter deed.
Wat je moet weten:
- Het verschil was het grootst bij de eerste beoordeling, wanneer er nog weinig informatie beschikbaar is. Precies het moment waarop overbelaste SEH-artsen de meeste druk voelen.
- De onderzoekers benadrukken zelf dat dit geen bewijs is dat AI klaar is voor de kliniek. Ze roepen op tot prospectieve trials in echte zorgomgevingen.
- SEH-arts Kristen Panthagani plaatst een kanttekening: de AI werd vergeleken met internisten, niet met spoedeisendehulp-specialisten. Een eerlijkere wedstrijd was spannender geweest.
- Voor zorgorganisaties en medtech-bedrijven is de les helder: AI-triage verdient een plek in je innovatieagenda, maar verwacht geen autonome diagnoses op korte termijn.
Waarom dit relevant is Als je in de zorg of medtech werkt, is dit het hardste bewijs tot nu toe dat AI-triage serieus genomen moet worden. Begin met een pilot bij intake, niet bij behandeling. |
|
Albert Heijn zet vanaf vandaag een eigen AI-systeem in om broodverspilling tegen te gaan. Het algoritme voorspelt per winkel hoeveel brood er die dag over de toonbank gaat en past de productie daarop aan. Wat toch overblijft krijgt later op de dag automatisch tot 70 procent korting.
Wat je moet weten:
- Het systeem bespaart naar eigen zeggen meer dan twee miljoen kilo brood per jaar, verspreid over alle Nederlandse filialen.
- De basis werd vorig jaar gelegd met de Bak-app voor bakkerijmedewerkers. De nieuwe AI-laag voegt vraagvoorspelling en dynamische prijzen toe.
- Voor retailers en horecaondernemers is het een concreet voorbeeld van hoe je demand forecasting direct koppelt aan prijsbeleid, zonder extra personeel.
Waarom dit relevant is Als de grootste supermarkt van Nederland zijn broodafdeling laat aansturen door AI, is dat het bewijs dat demand forecasting klaar is voor de winkelvloer. Kijk eens naar je eigen voorraadbeheer. |
|
Nebius, het grootste AI-cloudbedrijf van Nederland met hoofdkantoor op de Zuidas, neemt het Amerikaanse Eigen AI over voor 643 miljoen dollar. Eigen AI optimaliseert de hele keten van AI-modellen, van natraining tot productie. De overname integreert die technologie in Nebius Token Factory, het platform waarop klanten hun eigen modellen draaien.
Wat je moet weten:
- Nebius ontstond uit de afsplitsing van het Russische Yandex in 2024 en heeft inmiddels contracten van 46 miljard dollar met Meta en Microsoft, plus twee miljard aan Nvidia-investering.
- Inferentie, het moment dat een getraind model daadwerkelijk antwoorden geeft, vreet naar verwachting dit jaar tweederde van alle AI-rekenkracht op. Optimalisatie daar is goud waard.
- Eigen AI werd opgericht door MIT-onderzoekers en lost problemen op als geheugenbeheer en realtime workloadplanning die de meeste teams niet zelf kunnen tackelen.
Waarom dit relevant is Nederland heeft met Nebius een serieuze speler in AI-infrastructuur. Als je overweegt welke cloudpartij je AI-workloads draait, is dit een naam om in de gaten te houden. |
|
Het aantal organisaties dat door ransomware wordt getroffen is het afgelopen jaar met 389 procent gestegen, en de oorzaak is vertrouwd: aanvallers gebruiken dezelfde AI-tools als jij, maar dan om je netwerk binnen te komen. Tools als WormGPT en FraudGPT automatiseren phishing-mails, scannen kwetsbaarheden en genereren malware sneller dan menselijke hackers ooit konden.
Wat je moet weten:
- Aanvallers verschuiven van breed schieten naar gericht inbreken. Met gestolen inloggegevens uit eerdere datalekken en AI-gestuurde analyses zijn er minder pogingen nodig voor een succesvolle hack.
- De enorme hoeveelheid gelekte data die rondgaat in criminele netwerken maakt elke aanval gerichter en moeilijker te detecteren.
- Het rapport is globaal, maar de trend raakt ook NL-bedrijven direct. De Autoriteit Persoonsgegevens kondigde recent al aan ICT-leveranciers preventief te gaan controleren op hun beveiliging.
Waarom dit relevant is Vraag je IT-leverancier deze week wat hij doet tegen AI-gestuurde aanvallen. De AP controleert straks mee, en jij bent als verwerkingsverantwoordelijke mede-aansprakelijk. |
|
Het jaarlijkse CEO-onderzoek van IBM zegt dat 90 procent van de Nederlandse directeuren AI-agents op schaal inzet, meer dan het Europees gemiddelde van 83 procent en ruim boven de 75 procent wereldwijd. 88 procent van de ondervraagde NL-bestuurders integreert eigen data en intellectueel eigendom in aangepaste AI-modellen.
Wat je moet weten:
- 58 procent van de Nederlandse CEO's voelt zich comfortabel om grote strategische beslissingen te nemen op basis van AI-gegenereerde input. Wereldwijd is dat 64 procent, wat suggereert dat NL-bestuurders enthousiast adopteren maar voorzichtiger sturen.
- De helft verwacht dat AI in 2030 zo'n vijftig procent van de operationele beslissingen autonoom neemt. Bijna een derde zegt dat medewerkers tussen nu en 2028 omgeschoold moeten worden voor een andere functie.
- 76 procent van de ondervraagde organisaties heeft inmiddels een Chief AI Officer, tegenover 26 procent in 2025. Dat ambt groeit sneller dan welke andere C-suite-rol dan ook.
Waarom dit relevant is Als negen van de tien grote NL-bedrijven al AI-agents op schaal draaien, is de vraag niet meer of je erin stapt, maar hoe snel. Benchmark jezelf tegen deze cijfers. |
|
|
|
DeepSeek verlaagde vorige week zijn cache-tarief naar een tiende. Het frontier-veld bewoog niets. We rekenen door wat dat betekent voor je AI-budget van mei.
|
|
Verdere korte updates uit de AI-wereld.
|
|
Tot morgen!
Heb je opmerkingen over deze editie? Ideeën, correcties, of iets dat je miste? Reageer op deze mail of stuur een bericht naar info@theaidaily.nl. Elke reactie wordt gelezen.
Michael Groeneweg
|
|